CN101174316A - 一种基于案例树进行案例推理的装置及方法 - Google Patents

一种基于案例树进行案例推理的装置及方法 Download PDF

Info

Publication number
CN101174316A
CN101174316A CNA2006101437073A CN200610143707A CN101174316A CN 101174316 A CN101174316 A CN 101174316A CN A2006101437073 A CNA2006101437073 A CN A2006101437073A CN 200610143707 A CN200610143707 A CN 200610143707A CN 101174316 A CN101174316 A CN 101174316A
Authority
CN
China
Prior art keywords
node
case
similarity
characteristic
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101437073A
Other languages
English (en)
Other versions
CN100592332C (zh
Inventor
孟德香
方力
沈忱
李秋中
高鹏
周胜
詹义
赵培
程楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing P & T Consulting & Design Institute Co Ltd
China Mobile Communications Group Co Ltd
Original Assignee
Beijing P & T Consulting & Design Institute Co Ltd
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing P & T Consulting & Design Institute Co Ltd, China Mobile Communications Group Co Ltd filed Critical Beijing P & T Consulting & Design Institute Co Ltd
Priority to CN200610143707A priority Critical patent/CN100592332C/zh
Publication of CN101174316A publication Critical patent/CN101174316A/zh
Application granted granted Critical
Publication of CN100592332C publication Critical patent/CN100592332C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于案例树进行案例推理的装置及方法,所述装置包括案例树存储模块、信息输入模块、检索模块、信息输出模块。所述方法,其步骤包括:步骤一,判断案例树的根节点与问题的特征信息的相似度是否符合设定值,若符合,则执行步骤二;否则,执行步骤四;步骤二,依次判断案例树中各子节点的相似度是否符合设定值,若符合,则进一步判断其下属各子节点与问题的特征信息的相似度是否符合设定值;否则,结束对其下属各子节点相似度的判断;步骤三,重复执行步骤二,直至判断出所有相似度符合的节点;步骤四,输出上述各节点中相似度符合设定呈现门限值的节点所对应的问题原因和解决方案。应用本发明,大大提高了推理的速度和方便性。

Description

一种基于案例树进行案例推理的装置及方法
技术领域
本发明涉及一种案例推理的装置及方法,尤其涉及一种基于案例树进行案例推理的装置及方法。
背景技术
案例式推理是人工智能领域中重要的一个范畴,旨在采用曾经解决过旧问题的答案或积累的问题解决经验来解决新的问题。
所述案例,即是经验的表达,一个案例可能是一个时间、一种情况、或一些记录。案例的内容至少可以分为两大部分:问题情况的描述(即特征值,也就是案例特征项的取值),以及问题原因和解决的方案。
案例式推理将过去所发生的案例或经验储存于案例库中,当有新的问题发生时,便在案例库中寻找相似的案例,以取得解决方案。当问题的解决方案经验证为正确后,再将此案例重新存储到案例库中。随着案例库中案例数量的增加,案例式推理所能涵盖的解决问题的范围也就随之增加,其提供的问题解决方案也就越正确。
案例式推理可分为如下四个步骤:
步骤A,案例检索,即从案例库中检索出与目前待解决问题最相似的一个或多个案例;
步骤B,案例再用,即尝试使用检索到的案例解决目前问题;
步骤C,案例修订,即修订检索到的案例,使之更适合目前待解决的问题;
步骤D,案例回存,将目前问题的解决方案储存至案例库,形成新的案例。
在上述案例式推理的四个步骤中,步骤A,即案例检索是进行案例式推理的基础,该步骤的实现直接影响了案例式推理中对目前问题分析和解决的效率和能力。
目前案例检索的方法有两种:最邻近检索法和归纳检索法。
所述最邻近检索法,即是根据案例之间的相似程度来选取案例。将目前案例属性与案例库中的案例属性加以比较,并加入案例属性的权重,计算目前案例与案例库中案例的相似性总权重值。上述相似性程度通常会被正规化成0到1之间的数字,0代表完全不同,1代表完全相同;相似性程度也可以采用百分比的形式,100%代表完全相同,0%代表完全不同。该最邻近检索的优点是实现方便,是大多数的案例式推理系统都采用的案例检索方法。
所述归纳检索法,即是从过去数据中提取规则,构件决策树。通过规则或决策树来分类或指引检索案例。归纳检索法中最关键的是规则提取算法,或决策树构建算法。案例式推理系统最常使用的归纳算法是ID3。ID3算法以信息论为基础,以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类。相对于最邻近检索法,归纳检索法的优点是检索速度快。
目前案例式推理系统用的最多的是最邻近检索法,当检索时间是案例式推理系统所考虑的重点时,才考虑使用归纳检索法。
在最邻近检索法中,欲检索的案例直接存储于案例库中,当案例库成长到一定规模时,或案例的索引属性非常多时,采用该搜索方法的效率就会很差。
而归纳检索法的基础是基于规则构建决策树,在实际中,基于规则构建决策树需要大量、全面、完备的规则,而从案例中提取完备的规则比较困难;另外,当案例和规则有新的增加时,就需要重新构建决策树;在实际的检索过程中,如果有某些数据遗失或无法取得,则会导致无法进行检索。
由以上分析可以看出,现有技术的基于上述检索方法而进行的案例推理过程中,由于检索的不利而导致了案例推理无法快速、方便的进行。
发明内容
本发明针对现有技术的缺点,提供一种基于案例树进行案例推理的装置及方法,可以方便、快速的完成案例的推理。
本发明所述的基于案例树进行案例推理的装置,在案例树中,每个节点对应一个案例,该案例树包括案例根节点及其下属的各个子节点案例,子节点案例具备父亲节点案例的所有特征,且各子节点仅记载其相对于父亲节点新增的特征信息;
所述装置包括:
案例树存储模块,用于存储案例树信息;
信息输入模块,用于输入当前问题的特征信息。
检索模块,用于根据信息输入模块输入的问题特征信息,检索案例树存储模块中存储的案例树上与问题的特征信息之间相似度符合设定值的节点。
信息输出模块,用于整合检索模块检索到的节点所对应的问题原因及解决方案,并输出。
上述信息输出模块将相似度大于呈现门限值,且问题原因及解决方案相同的各节点进行合并后按相似度顺序输出。
上述检索模块包括:
节点案例检索模块,用于自案例树的根节点开始,依次检索案例树中各子节点及其下属的节点,若某个节点的与问题特征之间的相似度不符合设定值,则结束对该节点及其下属节点的判断;否则,直至检索出所有相似度符合设定值的节点为止;
节点集更新模块,用于根据节点案例检索模块的检索结果,对节点集进行更新;
节点案例修正模块,用于对当前问题的原因和解决方案进行修正,并将修正后的问题原因和解决方案作为前述检索到的相似度为100%的节点的新增子节点。
上述节点案例检索模块计算某个节点与问题特征之间的相似度的公式为:
M = ( 1 - W ) · M father + W · M new = ( 1 - W ) · M father + W · Σ i = 1 N c i m i
设该子节点的新增特征中具有N个变量,上述公式中,Mfather为该子节点对应的父亲节点与问题特征之间的相似度,Mnew为该子节点新增特征与问题特征之间的相似度,W为新增特征的总权重,mi为该子节点的第i个特征变量与问题特征变量的匹配程度,ci是为第i个特征变量的匹配权重,且匹配权重满足 Σ i = 1 N c i = 1 .
本发明还提供一种基于案例树进行案例推理的方法,所述案例树中,每个节点对应一个案例,该案例树包括案例根节点及其下属的各个子节点案例,子节点案例具备父亲节点案例的所有特征,且各子节点仅记载其相对于父亲节点新增的特征信息;
其步骤包括:
步骤一,判断案例树的根节点与问题的特征信息的相似度是否符合设定值,若符合,则执行步骤二;否则,执行步骤四;
步骤二,依次判断案例树中各子节点的相似度是否符合设定值,若符合,则进一步判断其下属各子节点与问题的特征信息的相似度是否符合设定值;否则,结束对其下属各子节点相似度的判断;
步骤三,重复执行步骤二,直至判断出所有相似度符合的节点;
步骤四,输出上述各节点中相似度符合设定呈现门限值的节点所对应的问题原因和解决方案。
上述步骤二中,判断案例树中各子节点的相似度的公式为:
M = ( 1 - W ) · M father + W · M new = ( 1 - W ) · M father + W · Σ i = 1 N c i m i
设该子节点的新增特征中具有N个变量,上述公式中,Mfather为该子节点对应的父亲节点与问题特征之间的相似度,Mnew为该子节点新增特征与问题特征之间的相似度,W为新增特征的总权重,mi为该子节点的第i个特征变量与问题特征变量的匹配程度,ci是为第i个特征变量的匹配权重,且匹配权重满足 Σ i = 1 N c i = 1 .
上述步骤三之后进一步包括:对未知重要变量集内中的未知重要变量进行赋值,再执行步骤二,直至未知重要变量集内无未知重要变量或不再对未知重要变量进行赋值为止。
上述步骤四中,将相似度大于呈现门限值,且问题原因及解决方案相同的各节点进行合并后按相似度顺序输出。
上述步骤四之后进一步包括:对当前问题的原因和解决方案进行修正,并将修正后的问题原因和解决方案作为案例树中与当前问题相似度为100%的节点的新增子节点。
本发明中,对案例树中各子节点逐级判断,若子节点符合相似度判断条件,再进一步判断其下属的子节点的相似度;若子节点不符合相似度判断条件,则不再对其下属的子节点进行进一步的相似度判断。因此,本发明所述的案例推理方法,相对于现有技术中采用最邻近检索法进行案例推理的方法,由于省去了对不符合要求的子节点的下属子节点进一步判断的过程,从而提高了推理的速度;相对于采用归纳检索法进行案例推理的方法,本发明中的案例树结构简单,维护方便,这也使得整个推理过程更加方便。
附图说明
图1为本发明中案例树的构建方法流程图;
图2为本发明中构建的案例树结构示意图;
图3为本发明中案例树构建的装置结构示意图;
图4为本发明中基于案例树进行案例推理的方法流程图;
图5为本发明中基于案例树进行案例推理的装置结构示意图;
图6为本发明中案例推理装置内检索模块的结构示意图。
具体实施方式
本发明中,通过对案例树中各节点依次进行相似度判断,对于不符合相似度判断条件的节点,不再继续判断其对应下属节点的相似度,从而提高了案例推理的效率。
本发明中所述的案例推理方法是基于案例树进行的。
如图1所示,所述案例树构建的方法,包括如下步骤:
步骤101,根据至少一个案例的属性中的相同特征构建上述各案例对应的总结案例。
本发明中,所述案例的属性包括案例的特征、问题原因及对应的解决方案。其中,特征是表征案例的一组变量,所述案例包含多个特征。
上述表征特征的变量可分为三种,现分别说明如下:
逻辑类变量,即表示案例是否具备相应的特征。逻辑类变量的取值范围包括:“是”、“否”、“未知”。当案例具备相应的特征时,逻辑类变量的取值为“是”;当案例不具备相应的特征时,逻辑类变量的取值为“否”;当无法确定案例是否具备相应的特征时,逻辑类变量的取值为“未知”。
数值类变量,即表示案例中某个数值的高低。数值类变量的取值范围包括:“偏高”、“正常”、“偏低”、“未知”。当案例中某个数值高于相应的参考数值时,数值类变量的取值为“偏高”;当案例中某个数值低于相应的参考数值时,数值类变量的取值为“偏低”;当案例中某个数值等于相应的参考数值时,数值类变量的取值为“正常”;当案例中某个数值与相应的参考数值的大小关系无法确定时,数值类变量的取值为“未知”。
枚举类变量,即表示案例中某个数值的变化趋势。枚举类变量的取值范围包括:“上升”、“下降”、“变化剧烈”、“正常”、“未知”。当案例中某个数值变大时,枚举类变量的取值为“上升”;当案例中某个数值变小时,枚举类变量的取值为“下降”;当案例中某个数值的变化超出设定的数值范围时,枚举类变量的取值为“变化剧烈”;当案例中某个数值的变化无法确定时,枚举类变量的取值为“未知”。
与上述案例的属性相对应,案例的结构可分为索引、新特征集、新特征参数总权重、问题原因、和解决方案五部分。
其中:
索引为案例对应的检索号,根据该索引值可以确定案例;
新特征集是指节点案例中具有的且其父节点不具有的特征集合。在案例树中,各子节点只记载其与父亲节点不相同的特征,因此新特征也就是在本节点案例中记载的那些特征,新特征集即本节点案例中记载的特征集。
新特征参数总权重指相似度匹配计算时,本节点案例所有新特征的相似度在案例在总相似度中的权重。
问题原因指造成案例现象(即各案例各特征值)的原因,每个原因对应一个原因代码。
解决方案指针对问题原因提供的问题解决方案。
各原始的案例的属性中包含的特征不尽相同,因此,本步骤中,以各个原始的案例的属性中的相同特征为依据,构建各个原始案例对应的总结案例。该构建的总结案例的属性仅包括上述的相同的特征,以及与这些相同特征对应的问题原因和解决方案。当原始的案例只有一个时,构建的总结案例与原始的案例相同。
例如,结合逻辑类变量来判断各案例是否具有相同的特征,若各案例的同一逻辑类变量L取值均为“是”,则可以确定,这些案例具有相同的特征L。
结合图2中的虚线框1中所示,设节点案例15属性中包含的特征为A、B、 C、D、E,设节点案例16属性中包含的特征为A、B、C、X、Y,此时,二者均具有的相同特征为A、B、C。根据二者具备的相同特征,构建一个新的总结案例,该新的总结案例具有上述相同的特征,再根据该特征输入对应的问题原因和解决方案,即对应于图2中的节点案例12,该节点案例12仅具有特征A、B、C。
同理,可构建节点案例13、节点案例14的总结案例,即对应于图2中的节点案例6;可构建节点案例7、节点案例8的总结案例,即对应于图2中的节点案例2;可构建节点案例17、节点案例18的总结案例,即对应于图2中的节点案例9;可构建节点案例19、节点案例20的总结案例,即对应于图2中的节点案例10。
上述节点案例15、节点案例16、节点案例13、节点案例14对应于本发明中构建的案例树的子节点,根据上述子节点案例构建的总结案例对应于本发明中构建的案例树的父亲节点。
在构建的案例树中,每个节点均对应唯一的一个案例,也就是说,该节点具有对应案例的全部特征。同时,子节点具有父亲节点的所有特征,还具有父亲节点不具备的一些其他特征,而父亲节点则不具备子节点的所有特征。在实际的构建案例树过程中,为了方便起见,可以使子节点只记录新特征,与父亲节点相同的特征不做记录,待需要时从父亲节点读取。例如,父亲节点的包含的特征为A、B、C,对应的一个子节点包含的全部特征为A、B、C、D、E,另一个子节点包含的全部特征为A、B、C、X、Y,则此时,两个子节点可分别记录的新特征为D、E和新特征X、Y。
步骤102,根据构建的至少一个总结案例属性中的相同特征,或至少一个案例与构建的至少一个总结案例属性中的相同特征,构建对应的上层的总结案例。
在上述步骤101中,根据各个案例属性中的相同特征构建若干个总结案例,这些构建得到的总结案例的属性中同样具有相同的特征,于是,本步骤中,可根据这些总结案例的属性中的相同特征继续构建对应的上层的总结案例,构建得到的上层的总结案例的属性仅包括上述的相同的特征,以及与这些相同特征对应的问题原因和解决方案。
例如,图2中虚线框3内所示,节点案例9是节点案例17和节点案例18的总结案例,节点案例10是节点案例19和节点案例20的总结案例。现在假设,节点案例17的属性中具有的特征为A、P、S、F,节点案例18的属性中具有的特征为A、P、S、U,则构建的总结案例(即节点案例9)具有上述二个节点案例中的相同特征A、P、S。同样,假设构建得到的节点案例19和节点案例20的总结案例(即节点案例10)具有的特征为A、P、N。这样,根据本步骤102所述,可继续构建节点案例9和节点案例10的上层的总结案例,即节点案例3,该节点案例3仅具有节点案例9和节点案例10属性中相同的特征A、P。
本步骤中,也可根据步骤101中构建的总结案例与原始案例的属性中的相同特征构建对应的上层的总结案例。例如,图2中虚线框2内所示,节点案例12是节点案例15和节点案例16的总结案例,该节点案例12具有特征A、B、C。现在假设,节点案例11为原始案例,其具有的特征为A、B、K,则可构建节点案例11与节点案例12的总结案例,即节点案例4,该节点案例4仅具有特征A、B。
对应于本发明中的案例树,上述总结案例对应了该案例树上的各个父亲节点或爷爷节点。
步骤103,重复步骤102,直至构建的上层的总结案例数量为一个。
上述步骤102中,可以构建多个上层的总结案例,本步骤中,重复执行步骤102,即构建各节点案例对应的上层的总结案例,之后,在这些构建得到的总结案例的基础上,继续构建所述总结案例对应的更上一层的总结案例,如此循环,最终必将会得到且只会得到一个总结案例,该总结案例所具有的特征最少,而且,这些特征是其他所有案例都具有的,此构建得到的总结案例属性中还包含了与其特征对应的问题原因和解决方案。对应于本发明中构建的案例树,上述最终得到的总结案例即是案例树的根节点,至此,构建案例树的过程结束。
例如,图2中所示,经过重复执行步骤102,可以得到一些上层的总结案例,对应于图2中的节点案例1、节点案例2、节点案例3、节点案例4,假设节点案例1的属性中具有特征A、M,节点案例2的属性中具有特征A、N,结合本步骤103所述,重复执行步骤102,可以继续构建节点案例1、节点案例2、节点案例3、节点案例4的总结案例,即对应于图2中的案例根节点,该案例根节点仅具有特征A,且经过步骤103后,最终构建得到的总结案例数量仅有一个。
上述的案例树构建方法中,各案例对应于案例树中的节点,提取各个原始案例的相同特征构建对应的总结案例,再进一步构建总结案例的上层的总结案例,直至构建得到的总结案例数量为一个时,构建过程结束。相对于现有技术,本发明所述构建方法不需要从案例中提取更多的构建规则,而只是根据各案例是否具有相同的特征来构建对应的总结案例,整个案例树的构建过程更加简单、快捷。
本发明还提供一种案例树的构建装置,如图3所示,该装置包括:案例特征提取模块、案例特征分析模块、案例构建模块。下面对各模块进行详细介绍。
案例特征提取模块,用于提取各案例属性中的特征信息,并将提取到的特征信息发送至案例特征分析模块。所述案例的属性包括案例的特征、问题原因及对应的解决方案。其中,特征是表征案例的一组变量,所述案例包含多个特征。具体来说,表征特征的变量可分为三种,即逻辑类变量、数值类变量、枚举类变量。
逻辑类变量,即表示案例是否具备相应的特征。逻辑类变量的取值范围包括:“是”、“否”、“未知”。当案例具备相应的特征时,逻辑类变量的取值为“是”;当案例不具备相应的特征时,逻辑类变量的取值为“否”;当无法确定案例是否具备相应的特征时,逻辑类变量的取值为“未知”。
数值类变量,即表示案例中某个数值的高低。数值类变量的取值范围包括:“偏高”、“正常”、“偏低”、“未知”。当案例中某个数值高于相应的参考数值时,数值类变量的取值为“偏高”;当案例中某个数值低于相应的参考数值时,数值类变量的取值为“偏低”;当案例中某个数值等于相应的参考数值时,数值类变量的取值为“正常”;当案例中某个数值与相应的参考数值的大小关系无法确定时,数值类变量的取值为“未知”。
枚举类变量,即表示案例中某个数值的变化趋势。枚举类变量的取值范围包括:“上升”、“下降”、“变化剧烈”、“正常”、“未知”。当案例中某个数值变大时,枚举类变量的取值为“上升”;当案例中某个数值变小时,枚举类变量的取值为“下降”;当案例中某个数值的变化超出设定的数值范围时,枚举类变量的取值为“变化剧烈”;当案例中某个数值的变化无法确定时,枚举类变量的取值为“未知”。
案例的结构可分为索引、新特征集、新特征参数总权重、问题原因和解决方案五部分,
其中:
索引为案例对应的检索号,根据该索引值可以确定案例;
新特征集是指节点案例中具有的且其父节点不具有的特征集合。在案例树中,各子节点只记载其与父亲节点不相同的特征,因此新特征也就是在本节点案例中记载的那些特征,新特征集即本节点案例中记载的特征集。
新特征参数总权重指相似度匹配计算时,本节点案例所有新特征的相似度在案例在总相似度中的权重。
问题原因指造成案例现象(即各案例各特征值)的原因,每个原因对应一个原因代码。
解决方案指针对问题原因提供的问题解决方案。
所述案例特征提取模块根据上述案例的结构特点,可以提取出各案例属性中的特征信息。
案例特征分析模块,用于分析其接收到的各案例特征信息,并将相同的特征信息发送至案例树构建模块。所述的案例特征分析模块接收到案例特征提取模块发送来的各个案例的特征信息后,对各个案例的特征信息进行分析,将各个案例的相同的特征信息发送至案例树构建模块。案例特征分析模块在分析其接收到的各个案例的特征信息时,可根据案例的特征信息将所有案例分成若干组,之后,分析每个组内案例的特征信息。
仍以图2为例,如虚线框1中所示,设节点案例15属性中包含的特征为A、B、C、D、E,设节点案例16属性中包含的特征为A、B、C、X、Y,则案例特征分析模块分析可知二者具有相同的特征A、B、C,于是,将此相同的特征A、B、C发送至案例树构建模块。
又例如,图2中虚线框3内所示,假设节点案例17的属性中具有的特征为A、P、S、F,节点案例18的属性中具有的特征为A、P、S、U,则案例特征分析模块分析可知二者具有相同的特征A、P、S。于是,将此相同的特征A、P、S发送至案例树构建模块。
由上述示例可以看出,案例特征分析模块将若干案例分组进行分析,可以提取出各案例之间具有的更多的相同特征。
案例树构建模块,用于根据其接收到的各案例的相同特征信息构建案例树中对应的节点。案例树中的节点对应于案例的特征、问题原因及解决方案。该案例树构建模块接收到的各案例的相同特征信息后,构建具备上述相同特征的案例树节点,并记载该节点对应的案例的问题原因及解决方案。
案例树构建模块根据若干原始案例(即对应于案例树中的子节点)所具有的相同的特征信息构建对应的总结案例(即对应于案例树中的父亲节点),之后,还可以根据若干个总结案例(即对应于案例树中的父亲节点)所具有的相同的特征信息构建对应的上层的总结案例(即对应于案例树中的爷爷节点),如此类推,最终必将且只能获得一个总结案例,该总结案例即对应了案例树的根节点,至此,案例树的构建过程完成。
仍以图2为例,案例树构建模块接收到案例特征分析模块发送来的节点案例15和节点案例16具有的相同特征A、B、C后,构建一个总结案例,即图2中的节点案例12,也即案例树中的父亲节点。同样,案例树构建模块也可构建节点案例17和节点案例18的总结案例,即图2中的节点案例9,该节点案例9也对应于案例树中的父亲节点。案例树构建模块可在上述基础上继续构建案例树中的节点,例如,根据节点案例11与节点案例12具有的相同的特征A、B,构建二者的总结案例,即对应于图2中的节点案例4,该节点案例4也即案例树中的爷爷节点。重复上述的构建过程,最终可获得案例树的根节点,此时,案例树构建完成。
本发明还提供一种基于上述构建的案例树进行案例推理的方法,在该案例树中,每个节点对应一个案例,该案例树包括案例根节点及其下属的各个子节点案例,子节点案例具备父亲节点案例的所有特征,且各子节点仅记载其相对于父亲节点新增的特征信息。如图4所示,案例推理方法包括如下步骤:
步骤101,判断案例树的根节点与问题的特征信息的相似度是否符合设定值,若符合,则执行步骤102;否则,执行步骤104。
本发明所述案例推理的方法先从对案例树的根节点检索开始。
本步骤中,根据问题的特征信息与案例树的根节点的相似度,来判断案例树的根节点是否是符合的案例。
上述的判断案例树中根节点的相似度过程中,是利用问题特征与根节点所对应的案例特征之间的匹配程度来确定。
根据前面所述,案例的特征由一个变量表示,因此,确定了变量之间的相似度,也就确定了特征之间的相似度,进而确定了问题与案例树根节点对应案例的相似度。
本发明中,可以采用下面几种方式来确定问题特征中包含的变量与案例中包含的变量之间的相似度。
一、以逻辑类变量的匹配程度来确定相似度,具体如下表:
Figure A20061014370700161
即当问题特征中的逻辑变量为“是”时,若案例特征中逻辑变量也同时为“是”,则可以确定此时问题与案例之间的相似度为100%;若案例特征中逻辑变量为“否”,则可以确定此时问题与案例之间的相似度为0%。问题特征中逻辑类变量取其他值时的判定原则与上述类似。当问题特征中逻辑类变量的取值为“未知”时,不论案例特征中逻辑类变量的取值如何,均设定此时问题与案例之间的相似度为50%。
二、以数值类变量的匹配程度来确定相似度,具体如下表:
Figure A20061014370700162
由上表中可以看出,当问题特征中数值类变量为“偏高”时,若案例特征中数值类变量也同时为“偏高”,则可以确定此时问题与案例之间的相似度为100%;若案例特征中数值类变量取值为“正常”,则此时问题与案例之间的相似度为50%;若案例特征中数值类变量取值为“偏低”,则此时问题与案例之间的相似度为“0”。问题特征中数值类变量取其他值时的判定原则与上述类似。当问题特征中数值类变量的取值为“未知”时,若案例特征中数值类变量的取值为“偏高”,则此时问题与案例之间的相似度为50%;若案例特征中数值类变量的取值为“正常”,则此时问题与案例之间的相似度为66.7%;若案例特征中数值类变量的取值为“偏低”,则此时问题与案例之间的相似度为50%。
三、以枚举类变量的匹配程度来确定相似度,具体如下表:
Figure A20061014370700171
如上表中所示,当问题特征中枚举类变量为“上升”时,若案例特征中枚举类变量的取值也为“上升”,则可以确定此时问题与案例之间的相似度为100%;若案例特征中枚举类变量的取值为“下降”,则可以确定此时问题与案例之间的相似度为0;若案例特征中枚举类变量的取值为“变化剧烈”,则可以确定此时问题与案例之间的相似度为30%;若案例特征中枚举类变量的取值为“正常”,则可以确定此时问题与案例之间的相似度为10%。当问题特征中枚举类变量的取值为“未知”时,不论案例特征中枚举类变量的取值如何,问题与案例之间的相似度均为25%。
为便于描述本发明,下面定义几个名词。
1、幸存节点和幸存节点集:
所谓幸存节点,即进行案例树检索过程中,案例树中与问题特征之间相似度大于或等于幸存门限值的节点。若检索得到的幸存节点还存在其对应的子节点,则所述子节点是进一步检索的对象。
所谓幸存节点集,即是上述幸存节点的集合。
2、搜索源节点和搜索源节点集:
所谓搜索源节点,即案例树中包含对应子节点的幸存节点。在每个检索过程中,搜索源节点都是进行检索的出发节点。
所谓搜索源节点集,即上述搜索源节点的集合。
3、当前搜索源节点:
所谓当前搜索源节点,即搜索源节点集中与输入问题相似度最大的节点,该节点是进一步检索的出发节点。
4、解决方案节点和解决方案节点集:
所谓解决方案节点,即为与问题最匹配、问题的发生原因及解决方案提供最详细的节点。该解决方案节点与问题的相似度大于或等于设定的解决方案相似度门限值。同时,该解决方案节点应为无对应子节点的当前幸存节点,或者,曾经为幸存节点,但该幸存节点的子节点均不是幸存节点。
所谓解决方案节点集,即是解决方案节点的集合。
5、未知变量、未知重要变量、以及未知重要变量集:
所谓未知变量,即案例检索和相似度计算中涉及到的、输入问题中但并未赋值的变量。
所谓未知重要变量,即案例检索过程中,未知变量的相似度权重达到重要变量权重门限值的未知变量。
所谓未知重要变量集,即所有未知重要变量的集合。
6、未知节点和未知节点集:
所谓未知节点,即进行相似度计算时,对应节点包含有未知重要变量,且该未知重要变量满足“绝对数值准则”和“相对百分比准则”的节点。
所述绝对数值准则,用公式可以表示为:
0<n<Nunknown
其中,n是节点中未知重要变量的数目,Nunknown是未知节点重要变量数量门限。
所述相对百分比准则,用公式可以表示为:
0 < n N sum _ imp < T unknown
其中n是节点中未知重要变量的数目,Nsum_imp是节点重要变量总数,Tunknown是未知节点重要变量百分比门限。
所谓未知节点集,即所有未知节点的集合。
根据上面所述,在判断问题的特征信息与案例树的根节点之间的相似度是否符合设定值时,将案例树的根节点作为当前幸存节点集和搜索源节点集中的唯一节点,也就是说,先认为案例树中的根节点是满足相似度条件的,在此基础上,再继续判断根节点的相似度是否符合设定值。此时,根节点即为当前搜索源节点,而解决方案节点集、未知重要变量集、未知节点集均为空。若判断确定根节点的相似度符合设定值,则继续进行步骤102;若判断确定根节点的相似度不符合设定值,则执行步骤104。
在判断确定根节点的相似度符合设定值的基础上,需要对各节点集进行更新,以利于提高后续检索的速度。各节点集的更新过程包括:
幸存节点集的更新:将根节点自当前幸存节点集中移出;
搜索源节点集的更新:将根节点自搜索源节点集中移出。
在节点对应的案例的各个特征中,有一些特征被标记为关键特征,若问题不满足该特征,那么,问题与该节点的相似度就很低,该节点也不能列入到幸存节点中;若问题满足该特征,则可以进一步判断相似度是否符合设定值的要求。
步骤102,依次判断案例树中各子节点的相似度是否符合设定值,若符合,则进一步判断其下属各子节点与问题的特征信息的相似度是否符合设定值;否则,结束对其下属各子节点相似度的判断。
本发明中所述案例树根节点下包含若干子节点,在这些子节点之下还可以进一步包括下属的若干节点,因此,本步骤中,需要依次判断这些子节点与问题特征之间的相似度是否符合设定值,若符合,再进一步判断其下属节点与问题的特征信息的相似度是否符合设定值;若不符合,则结束对其下属各子节点相似度的判断。
相对于案例树中各子节点来说,根节点可能是这些子节点的父亲节点,或是更上一层的爷爷节点。根据前面所述,子节点包含了父亲节点的全部特征,且有一些父亲节点不具备的特征,在记载这些特征时,与父亲节点相同的特征不再记载,而是在需要时从父亲节点处读取。因此,在判断各子节点的相似度时,也相应的分成两部分进行判断。与父亲节点相同特征的相似度计算在父亲节点完成,子节点新增特征的相似度计算在子节点处单独完成。
计算子节点新增特征与问题特征之间的相似度方法如下:
设该子节点的新增特征中具有N个变量,则该子节点与问题特征之间的相似度为各个变量与问题特征变量的匹配程度和对应的匹配权重的乘积之和,用公式可以表示为:
M new = &Sigma; i = 1 N c i m i
其中,mi是第i个特征变量与问题特征变量的匹配程度,ci是为该特征变量的匹配权重。上述的匹配权重满足 &Sigma; i = 1 N c i = 1 , 表示mi对总相似度的贡献。
计算子节点与问题特征之间的总相似度方法如下:
设该子节点对应父亲节点与问题特征之间的相似度为Mfather,子节点新增特征与问题特征之间的相似度为Mnew,新增特征的总权重为W,则该子节点与问题特征之间的总相似度M可以表示为:
M = ( 1 - W ) &CenterDot; M father + W &CenterDot; M new = ( 1 - W ) &CenterDot; M father + W &CenterDot; &Sigma; i = 1 N c i m i
依次对案例树中各子节点进行相似度计算,相似度大于或等于设定值的节点即为符合判断条件的节点。
在本步骤中,同样存在节点集的更新过程。具体包括幸存节点集的更新、搜索源节点集的更新、以及解决方案节点集的更新。
对于幸存节点集来说,需要将当前的不符合相似度判断条件的搜索源节点从幸存节点集中移出;将当前的符合相似度判断条件的节点加入到幸存节点集中。
对于搜索源节点集来说,需要将当前搜索源节点从搜索源节点集中移出;将当前搜索节点中符合搜索源节点条件的子节点加入到幸存节点集中。
对于解决方案节点集来说,若当前搜索节点中有幸存节点,且该节点没有对应的子节点,同时该节点符合相似度判断条件,则将该节点加入到解决方案节点集中;若当前搜索节点都不是幸存节点,且当前搜索源节点符合相似度判断条件,则将当前搜索源节点加入到解决方案节点集中。
步骤103,重复执行步骤102,直至判断出所有相似度符合的节点。
在上述步骤102中,依次判断案例树中各子节点的相似度,对于符合相似度判断条件的子节点,再进一步判断其下属的子节点的相似度,而对于不符合相似度判断条件的子节点,则不必再判断其下属的子节点的相似度。本步骤中,重复执行步骤102的操作,即对这些下属子节点的相似度进行判断,若符合相似度判断条件,再继续判断该下属子节点的子节点;若不符合相似度判断条件,则结束对该下属子节点的子节点的相似度判断。重复执行步骤102,直至判断出所有符合相似度判断条件的子节点为止。至此,根据问题特征在案例树中搜索符合相似度判断条件的节点的过程结束,搜索到的节点属性中包含了问题的原因及解决方案等信息。
在每次完成对案例树中各子节点的相似度判断后,都需要进行节点集的更新,具体过程与上述步骤102中相同,在此不再赘叙。
前述表征案例特征的变量中包含未知变量,因此,本发明所述的根据问题的特征对案例树检索的过程中,也可以通过对问题的特征中未知变量进行赋值,从而完成对案例树中符合判断条件的节点的检索。
在上述对各节点进行相似度判断时,如果存在未知重要变量,则将这些未知重要变量加入到未知重要变量集中,而包含未知重要变量的未知节点也相应的加入到未知节点集中。
在按照上述步骤101、步骤102、步骤103对案例树进行检索后,若未知重要变量集内存在未知重要变量,则可通过对这些未知重要变量进行赋值,再重新根据这些赋值后的变量对案例树进行检索,直至未知重要变量集内无未知重要变量或不再对未知重要变量进行赋值。在根据赋值后的未知重要变量进行搜索时,应该将未知重要变量从未知重要变量集中移出,而对应的未知重要节点也应该移到搜索源节点集中。由于未知变量的引入,使得可以根据未知变量进行模糊检索,克服了某些数据遗失或无法取得的情况下无法继续进行检索的弊端。在每次完成对案例树中各子节点的相似度判断后,同样需要进行节点集的更新,具体过程与上述步骤102中相同,在此不再赘叙。
步骤104,输出上述各节点中相似度符合设定呈现门限值的节点所对应的问题原因和解决方案。
上述检索到的符合相似度判断条件的节点,均位于解决方案节点集中,在检索完成后,需要将这些节点所对应的问题原因及解决方案输出。在解决方案节点集中各个节点对应的案例特征不同,但其代表的问题原因及对应解决方案可能相同,因此,需要将这些节点进行合并,只输出一个问题原因及解决方案即可。
在实际输出问题原因和解决方案时,需满足对应节点特征与问题特征之间的相似度大于或等于设定的呈现门限值。本步骤中,可按照各节点特征与问题特征之间的相似度大小顺序输出各节点对应的问题原因及解决方案,例如,按照相似度由高到低的顺序输出。
本发明中,还可根据当前的问题原因和解决方案对案例树进行更新。由于实际检索到的节点所包含的问题原因及解决方案与当前欲解决的问题的原因及解决方案不是完全匹配,因此,可以对当前问题的原因和解决方案进行修正,并将修正后的问题原因和解决方案作为前述检索到的相似度为100%的节点的新增子节点。
本发明中,对案例树中各子节点采用逐级判断,若子节点符合相似度判断条件,再进一步判断其下属的子节点的相似度;若子节点不符合相似度判断条件,则不再对其下属的子节点进行进一步的相似度判断,最后再将符合条件的节点所代表的问题原因和解决方案进行合并输出。相对于现有技术中的最邻近检索法,本发明所述的推理方法省去了对不符合要求的子节点的下属子节点进一步判断的过程,从而提高了检索的速度;相对于现有技术中的归纳检索法,本发明中的案例树结构简单,维护方便,这也使得整个检索过程更加方便。
本发明还提供一种基于上述构建的案例树进行案例推理的装置,如图5所示,包括信息输入模块、检索模块、案例树存储模块、以及信息输出模块。
其中,案例树存储模块用于存储案例树信息。
所述案例树包括案例根节点及其下属的各个节点案例,各个节点案例构成了案例树中对应的子节点、父亲节点、爷爷节点等。如图2所示,节点案例6有两个下属的节点案例,分别为节点案例13、节点案例14,可将节点案例13、节点案例14视为案例树中的子节点,于是,节点案例6即可视为案例树中对应的父亲节点;节点案例6又从属于节点案例1,于是,节点案例1可视为案例树中对应的爷爷节点。
在上述案例树中,各节点包含了对应案例的特征、问题原因及对应的解决方案等信息。其中,特征是表征案例的一组或多组变量,所述案例用一组或多组中的一个或多个变量表示其特征。
上述表征特征的变量可分为三种,现分别说明如下:
逻辑类变量,即表示案例是否具备相应的特征。逻辑类变量的取值范围包括:“是”、“否”、“未知”。当案例具备相应的特征时,逻辑类变量的取值为“是”;当案例不具备相应的特征时,逻辑类变量的取值为“否”;当无法确定案例是否具备相应的特征时,逻辑类变量的取值为“未知”。
数值类变量,即表示案例中某个数值的高低。数值类变量的取值范围包括:“偏高”、“正常”、“偏低”、“未知”。当案例中某个数值高于相应的参考数值时,数值类变量的取值为“偏高”;当案例中某个数值低于相应的参考数值时,数值类变量的取值为“偏低”;当案例中某个数值等于相应的参考数值时,数值类变量的取值为“正常”;当案例中某个数值与相应的参考数值的大小关系无法确定时,数值类变量的取值为“未知”。
枚举类变量,即表示案例中某个数值的变化趋势。枚举类变量的取值范围包括:“上升”、“下降”、“变化剧烈”、“正常”、“未知”。当案例中某个数值变大时,枚举类变量的取值为“上升”;当案例中某个数值变小时,枚举类变量的取值为“下降”;当案例中某个数值的变化超出设定的数值范围时,枚举类变量的取值为“变化剧烈”;当案例中某个数值的变化无法确定时,枚举类变量的取值为“未知”。
在上述案例树中,每个节点均对应唯一的一个案例的信息,也就是说,该节点具有对应案例的全部特征。同时,子节点具有父亲节点的所有特征,还具有父亲节点不具备的一些其他特征,而父亲节点则不具备子节点的所有特征。在实际构建的案例树中,为了方便起见,可以使子节点只记录新特征,与父亲节点相同的特征不做记录,待需要时从父亲节点读取。
所述信息输入模块用于输入当前问题的特征信息。由于特征是用变量来表征的,因此,信息输入模块输入的可以为表征特征的变量,例如,逻辑类变量、或是数值类变量、或是枚举类变量。
所述检索模块用于根据信息输入模块输入的问题特征信息,检索案例树存储模块中存储的案例树上与问题的特征信息之间相似度符合设定值的节点。
该检索模块可具体包括节点案例检索模块、节点集更新模块、以及节点案例修正模块。
所述节点案例检索模块自案例树的根节点开始,依次检索案例树中各子节点及其下属的节点,若某个节点的与问题特征之间的相似度不符合设定值,则结束对该节点及其下属节点的判断;否则,直至检索出所有相似度符合设定值的节点为止。
判断案例树中根节点的相似度过程中,是利用问题特征与根节点所对应的案例特征之间的匹配程度来确定。
根据前面所述,案例的特征由一个变量表示,因此,确定了变量之间的相似度,也就确定了特征之间的相似度,进而确定了问题与案例树根节点对应案例的相似度。
本发明中,可以采用下面几种方式来确定问题特征中包含的变量与案例中包含的变量之间的相似度。
一、以逻辑类变量的匹配程度来确定相似度,具体如下表:
Figure A20061014370700241
即当问题特征中的逻辑变量为“是”时,若案例特征中逻辑变量也同时为“是”,则可以确定此时问题与案例之间的相似度为100%;若案例特征中逻辑变量为“否”,则可以确定此时问题与案例之间的相似度为0%。问题特征中逻辑类变量取其他值时的判定原则与上述类似。当问题特征中逻辑类变量的取值为“未知”时,不论案例特征中逻辑类变量的取值如何,均设定此时问题与案例之间的相似度为50%。
二、以数值类变量的匹配程度来确定相似度,具体如下表:
Figure A20061014370700251
由上表中可以看出,当问题特征中数值类变量为“偏高”时,若案例特征中数值类变量也同时为“偏高”,则可以确定此时问题与案例之间的相似度为100%;若案例特征中数值类变量取值为“正常”,则此时问题与案例之间的相似度为50%;若案例特征中数值类变量取值为“偏低”,则此时问题与案例之间的相似度为“0”。问题特征中数值类变量取其他值时的判定原则与上述类似。当问题特征中数值类变量的取值为“未知”时,若案例特征中数值类变量的取值为“偏高”,则此时问题与案例之间的相似度为50%;若案例特征中数值类变量的取值为“正常”,则此时问题与案例之间的相似度为66.7%;若案例特征中数值类变量的取值为“偏低”,则此时问题与案例之间的相似度为50%。
三、以枚举类变量的匹配程度来确定相似度,具体如下表:
Figure A20061014370700252
如上表中所示,当问题特征中枚举类变量为“上升”时,若案例特征中枚举类变量的取值也为“上升”,则可以确定此时问题与案例之间的相似度为100%;若案例特征中枚举类变量的取值为“下降”,则可以确定此时问题与案例之间的相似度为0;若案例特征中枚举类变量的取值为“变化剧烈”,则可以确定此时问题与案例之间的相似度为30%;若案例特征中枚举类变量的取值为“正常”,则可以确定此时问题与案例之间的相似度为10%。当问题特征中枚举类变量的取值为“未知”时,不论案例特征中枚举类变量的取值如何,问题与案例之间的相似度均为25%。
所述节点案例检索模块在检索案例树中各子节点时,判断这些子节点与问题特征之间的相似度是否符合设定值,若符合,再进一步判断其下属节点的相似度是否符合设定值;若不符合,则结束对其下属各子节点相似度的判断。
相对于案例树中各子节点来说,根节点可能是这些子节点的父亲节点,或是更上一层的爷爷节点。根据前面所述,子节点包含了父亲节点的全部特征,且有一些父亲节点不具备的特征,在记载这些特征时,与父亲节点相同的特征不再记载,而是在需要时从父亲节点处读取。因此,在判断各子节点的相似度时,也相应的分成两部分进行判断。与父亲节点相同特征的相似度计算在父亲节点完成,子节点新增特征的相似度计算在子节点处单独完成。
计算子节点新增特征与问题特征之间的相似度方法如下:
设该子节点的新增特征中具有N个变量,则该子节点与问题特征之间的相似度为各个变量与问题特征变量的匹配程度和对应的匹配权重的乘积之和,用公式可以表示为:
M new = &Sigma; i = 1 N c i m i
其中,mi是第i个特征变量与问题特征变量的匹配程度,ci是为该特征变量的匹配权重。上述的匹配权重满足 &Sigma; i = 1 N c i = 1 , 表示mi对总相似度的贡献。
计算子节点与问题特征之间的总相似度方法如下:
设该子节点对应父亲节点与问题特征之间的相似度为Mfather,子节点新增特征与问题特征之间的相似度为Mnew,新增特征的总权重为W,则该子节点与问题特征之间的总相似度M可以表示为:
M = ( 1 - W ) &CenterDot; M father + W &CenterDot; M new = ( 1 - W ) &CenterDot; M father + W &CenterDot; &Sigma; i = 1 N c i m i
依次对案例树中各子节点进行相似度计算,相似度大于或等于设定值的节点即为符合判断条件的节点,直至检索出所有相似度符合的节点。
所述节点集更新模块用于根据节点案例检索模块的检索结果,对节点集进行更新。
在根节点符合相似度判断条件时,更新的内容具体包括:
幸存节点集的更新:将根节点自当前幸存节点集中移出;
搜索源节点集的更新:将根节点自搜索源节点集中移出。
在检索过程中,更新的内容具体包括:
对于幸存节点集来说,需要将当前的不符合相似度判断条件的搜索源节点从幸存节点集中移出;将当前的符合相似度判断条件的节点加入到幸存节点集中。
对于搜索源节点集来说,需要将当前搜索源节点从搜索源节点集中移出;将当前搜索节点中符合搜索源节点条件的子节点加入到幸存节点集中。
对于解决方案节点集来说,若当前搜索节点中有幸存节点,且该节点没有对应的子节点,同时该节点符合相似度判断条件,则将该节点加入到解决方案节点集中;若当前搜索节点都不是幸存节点,且当前搜索源节点符合相似度判断条件,则将当前搜索源节点加入到解决方案节点集中。
所述节点案例修正模块,用于对当前问题的原因和解决方案进行修正,并将修正后的问题原因和解决方案作为前述检索到的相似度为100%的节点的新增子节点。
所述信息输出模块用于整合检索模块检索到的节点所对应的问题原因及解决方案,并输出。节点案例检索模块检索到的符合相似度判断条件的节点,均位于解决方案节点集中,在检索完成后,需要将这些节点所对应的问题原因及解决方案输出。在解决方案节点集中各个节点对应的案例特征不同,但其代表的问题原因及对应解决方案可能相同,因此,需要将这些节点进行合并,只输出一个问题原因及解决方案即可。在实际输出问题原因和解决方案时,需满足对应节点特征与问题特征之间的相似度大于或等于设定的呈现门限值。所述信息输出模块可按照各节点特征与问题特征之间的相似度大小顺序输出各节点对应的问题原因及解决方案,例如,按照相似度由高到低的顺序输出。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (10)

1.一种基于案例树进行案例推理的装置,其特征在于,所述案例树中,每个节点对应一个案例,该案例树包括案例根节点及其下属的各个子节点案例,子节点案例具备父亲节点案例的所有特征,且各子节点仅记载其相对于父亲节点新增的特征信息;
所述装置包括:
案例树存储模块,用于存储案例树信息;
信息输入模块,用于输入当前问题的特征信息。
检索模块,用于根据信息输入模块输入的问题特征信息,检索案例树存储模块中存储的案例树上与问题的特征信息之间相似度符合设定值的节点。
信息输出模块,用于整合检索模块检索到的节点所对应的问题原因及解决方案,并输出。
2.如权利要求1所述案例推理的装置,其特征在于,所述信息输出模块将相似度大于呈现门限值,且问题原因及解决方案相同的各节点进行合并后按相似度顺序输出。
3.如权利要求1所述案例推理的装置,其特征在于,所述检索模块包括:
节点案例检索模块,用于自案例树的根节点开始,依次检索案例树中各子节点及其下属的节点,若某个节点的与问题特征之间的相似度不符合设定值,则结束对该节点及其下属节点的判断;否则,直至检索出所有相似度符合设定值的节点为止;
节点集更新模块,用于根据节点案例检索模块的检索结果,对节点集进行更新;
节点案例修正模块,用于对当前问题的原因和解决方案进行修正,并将修正后的问题原因和解决方案作为前述检索到的相似度为100%的节点的新增子节点。
4.如权利要求3所述案例推理的装置,其特征在于,所述节点案例检索模块计算某个节点与问题特征之间的相似度的公式为:
M = ( 1 - W ) &CenterDot; M father + W &CenterDot; M new = ( 1 - W ) &CenterDot; M father + W &CenterDot; &Sigma; i = 1 N c i m i
设该子节点的新增特征中具有N个变量,上述公式中,Mfather为该子节点对应的父亲节点与问题特征之间的相似度,Mnew为该子节点新增特征与问题特征之间的相似度,W为新增特征的总权重,mi为该子节点的第i个特征变量与问题特征变量的匹配程度,ci是为第i个特征变量的匹配权重,且匹配权重满足 &Sigma; i = 1 N c i = 1 .
5.一种基于案例树进行案例推理的方法,其特征在于,所述案例树中,每个节点对应一个案例,该案例树包括案例根节点及其下属的各个子节点案例,子节点案例具备父亲节点案例的所有特征,且各子节点仅记载其相对于父亲节点新增的特征信息;
其步骤包括:
步骤一,判断案例树的根节点与问题的特征信息的相似度是否符合设定值,若符合,则执行步骤二;否则,执行步骤四;
步骤二,依次判断案例树中各子节点的相似度是否符合设定值,若符合,则进一步判断其下属各子节点与问题的特征信息的相似度是否符合设定值;否则,结束对其下属各子节点相似度的判断;
步骤三,重复执行步骤二,直至判断出所有相似度符合的节点;
步骤四,输出上述各节点中相似度符合设定呈现门限值的节点所对应的问题原因和解决方案。
6.如权利要求5所述案例推理的方法,其特征在于,所述步骤二中,判断案例树中各子节点的相似度的公式为:
M = ( 1 - W ) &CenterDot; M father + W &CenterDot; M new = ( 1 - W ) &CenterDot; M father + W &CenterDot; &Sigma; i = 1 N c i m i
设该子节点的新增特征中具有N个变量,上述公式中,Mfatfer为该子节点对应的父亲节点与问题特征之间的相似度,Mnew为该子节点新增特征与问题特征之间的相似度,W为新增特征的总权重,mi为该子节点的第i个特征变量与问题特征变量的匹配程度,ci是为第i个特征变量的匹配权重,且匹配权重满足 &Sigma; i = 1 N c i = 1 .
7.如权利要求5所述的案例推理方法,其特征在于,所述步骤二之后进一步包括,
将当前的不符合相似度判断条件的搜索源节点从幸存节点集中移出,将当前的符合相似度判断条件的节点加入到幸存节点集中;
将当前搜索源节点从搜索源节点集中移出,将当前搜索节点中符合搜索源节点条件的子节点加入到幸存节点集中;
若当前搜索节点中有幸存节点,且该节点没有对应的子节点,同时该节点符合相似度判断条件,则将该节点加入到解决方案节点集中;若当前搜索节点都不是幸存节点,且当前搜索源节点符合相似度判断条件,则将当前搜索源节点加入到解决方案节点集中。
8.如权利要求5所述的案例推理方法,其特征在于,所述步骤三之后进一步包括:对未知重要变量集内中的未知重要变量进行赋值,再执行步骤二,直至未知重要变量集内无未知重要变量或不再对未知重要变量进行赋值为止。
9.如权利要求5所述的案例推理方法,其特征在于,所述步骤四中,将相似度大于呈现门限值,且问题原因及解决方案相同的各节点进行合并后按相似度顺序输出。
10.如权利要求5所述的案例推理方法,其特征在于,所述步骤四之后进一步包括:对当前问题的原因和解决方案进行修正,并将修正后的问题原因和解决方案作为案例树中与当前问题相似度为100%的节点的新增子节点。
CN200610143707A 2006-11-02 2006-11-02 一种基于案例树进行案例推理的装置及方法 Active CN100592332C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610143707A CN100592332C (zh) 2006-11-02 2006-11-02 一种基于案例树进行案例推理的装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610143707A CN100592332C (zh) 2006-11-02 2006-11-02 一种基于案例树进行案例推理的装置及方法

Publications (2)

Publication Number Publication Date
CN101174316A true CN101174316A (zh) 2008-05-07
CN100592332C CN100592332C (zh) 2010-02-24

Family

ID=39422813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610143707A Active CN100592332C (zh) 2006-11-02 2006-11-02 一种基于案例树进行案例推理的装置及方法

Country Status (1)

Country Link
CN (1) CN100592332C (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537010A (zh) * 2014-12-17 2015-04-22 温州大学 基于决策树的网构软件中的构件分类方法
CN104573062A (zh) * 2015-01-23 2015-04-29 桂林电子科技大学 基于描述逻辑和案例推理的智能学习方法
CN104598766A (zh) * 2015-03-05 2015-05-06 成都理工大学 面向油气储层综合评价的空间案例推理方法
CN105741218A (zh) * 2016-03-04 2016-07-06 公安部道路交通安全研究中心 应急预案生成服务器、方法、系统以及客户端
CN105844401A (zh) * 2016-03-22 2016-08-10 北京工商大学 基于案例推理的湖库水华治理复杂动态关联模型与决策方法
CN108234868A (zh) * 2017-12-26 2018-06-29 五邑大学 一种基于案例推理的智能拍摄系统及方法
CN110263119A (zh) * 2019-07-01 2019-09-20 西北师范大学 一种案例推理分类器案例检索方法
CN111858550A (zh) * 2020-07-07 2020-10-30 北京工业大学 一种固件系统特征数据库的构建及更新方法
CN111858549A (zh) * 2020-07-07 2020-10-30 北京工业大学 一种数据对象特征数据库的构建及更新方法
CN113901070A (zh) * 2021-09-29 2022-01-07 汪鑫 基于微信小程序的自然资源信息交互系统
CN118762199A (zh) * 2024-08-30 2024-10-11 全芯智造技术有限公司 图像处理方法、电子设备、存储介质及计算机程序产品

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537010A (zh) * 2014-12-17 2015-04-22 温州大学 基于决策树的网构软件中的构件分类方法
CN104573062B (zh) * 2015-01-23 2018-01-23 桂林电子科技大学 基于描述逻辑和案例推理的智能学习方法
CN104573062A (zh) * 2015-01-23 2015-04-29 桂林电子科技大学 基于描述逻辑和案例推理的智能学习方法
CN104598766A (zh) * 2015-03-05 2015-05-06 成都理工大学 面向油气储层综合评价的空间案例推理方法
CN104598766B (zh) * 2015-03-05 2017-11-24 成都理工大学 面向油气储层综合评价的空间案例推理方法
CN105741218A (zh) * 2016-03-04 2016-07-06 公安部道路交通安全研究中心 应急预案生成服务器、方法、系统以及客户端
CN105844401B (zh) * 2016-03-22 2019-04-12 北京工商大学 基于案例推理的湖库水华治理复杂动态关联模型与决策方法
CN105844401A (zh) * 2016-03-22 2016-08-10 北京工商大学 基于案例推理的湖库水华治理复杂动态关联模型与决策方法
CN108234868A (zh) * 2017-12-26 2018-06-29 五邑大学 一种基于案例推理的智能拍摄系统及方法
CN108234868B (zh) * 2017-12-26 2020-10-16 五邑大学 一种基于案例推理的智能拍摄系统及方法
CN110263119A (zh) * 2019-07-01 2019-09-20 西北师范大学 一种案例推理分类器案例检索方法
CN111858550A (zh) * 2020-07-07 2020-10-30 北京工业大学 一种固件系统特征数据库的构建及更新方法
CN111858549A (zh) * 2020-07-07 2020-10-30 北京工业大学 一种数据对象特征数据库的构建及更新方法
CN111858550B (zh) * 2020-07-07 2022-05-24 北京工业大学 一种固件系统特征数据库的构建及更新方法
CN113901070A (zh) * 2021-09-29 2022-01-07 汪鑫 基于微信小程序的自然资源信息交互系统
CN118762199A (zh) * 2024-08-30 2024-10-11 全芯智造技术有限公司 图像处理方法、电子设备、存储介质及计算机程序产品

Also Published As

Publication number Publication date
CN100592332C (zh) 2010-02-24

Similar Documents

Publication Publication Date Title
CN100592332C (zh) 一种基于案例树进行案例推理的装置及方法
CN107066553B (zh) 一种基于卷积神经网络与随机森林的短文本分类方法
CN104765769B (zh) 一种基于词矢量的短文本查询扩展及检索方法
CN111597347B (zh) 知识嵌入的缺陷报告重构方法及装置
CN102567464B (zh) 基于扩展主题图的知识资源组织方法
WO2017193685A1 (zh) 社交网络中数据的处理方法和装置
CN105830064A (zh) 情态生成装置以及用于其的计算机程序
CN106104519A (zh) 短语对收集装置以及用于其的计算机程序
CN102117281A (zh) 一种构建领域本体的方法
CN103412878B (zh) 基于领域知识地图社区结构的文档主题划分方法
CN103116657A (zh) 一种网络教学资源的个性化搜索方法
CN106104524A (zh) 复杂谓语模板收集装置以及用于其的计算机程序
CN104239553A (zh) 一种基于Map-Reduce框架的实体识别方法
CN105787097A (zh) 一种基于文本聚类的分布式索引构建方法及系统
CN105279264A (zh) 一种文档的语义相关度计算方法
CN108241713A (zh) 一种基于多元切分的倒排索引检索方法
CN102750286A (zh) 一种处理缺失数据的新型决策树分类器方法
Saravanan et al. Video image retrieval using data mining techniques
CN102314464B (zh) 歌词搜索方法及搜索引擎
CN105447104A (zh) 一种知识地图生成方法及装置
CN107133274B (zh) 一种基于图知识库的分布式信息检索集合选择方法
CN100573574C (zh) 一种案例树构建的装置及方法
CN118445406A (zh) 一种基于海量多态丝路遗产信息的整合系统
CN118093860A (zh) 一种基于文本嵌入向量聚类的多层次科研主题挖掘方法
JPH0785244B2 (ja) 対角交換連想ル−プメモリを利用した知識検索人口知能システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant