CN101930437B

CN101930437B - 在语义网进行查询的不确定与不一致本体推理方法和设备

Info

Publication number: CN101930437B
Application number: CN200910146323.0A
Authority: CN
Inventors: 刘博�; 李建强; 赵彧
Original assignee: NEC China Co Ltd
Current assignee: NEC China Co Ltd; Renesas Electronics China Co Ltd
Priority date: 2009-06-19
Filing date: 2009-06-19
Publication date: 2014-08-13
Anticipated expiration: 2029-06-19
Also published as: JP2011008782A; CN101930437A; JP5191064B2

Abstract

本发明提供了一种在语义网进行查询的本体的推理方法和设备。根据本发明的本体推理方法可以包括如下步骤：a.输入本体与查询；b.利用选择函数选择本体中与查询相关的元素集合；c.检测利用所选元素集合能否推理出查询结果；以及d.如果不能推理出任何查询结果，则递增所述选择函数的相关度并重复上述步骤b和c，如果能够推理出查询结果，则输出查询结果和相应推理路径。在一个实施例中，本发明的方法还可以根据本体元素的可信因子计算各个查询结果的置信度。根据本发明，用户无需修改原始本体就能够针对不确定和不一致本体得到尽可能正确的查询结果。

Description

在语义网进行查询的不确定与不一致本体推理方法和设备

技术领域

本发明一般地涉及语义web和本体推理领域，更具体而言，涉及用于解决知识和本体的不确定与不一致问题的推理方法和设备。

背景技术

本体(Ontology)是对真实世界中的实体以及实体之间的关系的描述。语义web很大程度上依赖于本体的质量和正确性。然而，现实中的知识和信息常常是不确定的，从而导致本体也具有不确定性。所谓不确定的本体(uncertain ontology)指的是本体的正确性是不确定的。本体的不确定性也可能由多种原因引起，例如专家在主观上的不确定性、来自原始本体的不确定性、自动本体学习工具的不确定性等等。本体的不确定性越高，其不正确的可能性越大。

本体的不确定性也常导致本体的不一致性。所谓不一致的本体(inconsistent ontology)指的是该本体中存在错误或冲突，从而导致本体中的某些概念无法被正确地解释。本体的不一致可能由多种原因引起，例如错误表示、一词多义、从其它形式的转换、来自多个源的集成等等。在进行本体推理时，不一致的本体将导致错误的回答，还会导致错误的语义理解和知识表达。

由于在语义web中大量存在不确定且不一致的本体，并且通常难以确保本体的质量，使得对本体的查询得到错误结果或者无法得到结果。

尽管修改这种不完备的本体是一种有效的策略，但是修改本体代价较高、不易操作，而且修改之后容易引起其它关联的问题，所以开发一种针对不确定与不一致本体的推理方法有时更加有效并易于执行。就是说，在不修改原始本体的情况下，采用一种非标准的推理方法，以得到尽可能正确的查询结果。

当前，本体推理主要是基于逻辑推理(logical reasoning)的。随着本体描述语言(例如web本体语言(OWL))的出现及其与描述逻辑(DL)的紧密关系，新型的DL推理机可以有效地检测出不一致的本体。

在现有技术中，已有一些研究者对本体的不确定性和不一致性加以研究。

例如，在Guilin Qi、Jeff Z.Pan和Qiu Ji所发表的文章“ExtendingDescription Logics with Uncertainty Reasoning in Possibilistic Logic”(Proceedings of the 9th European Conference on Symbolic and QuantitativeApproaches to Reasoning with Uncertainty--ECSQARU 2007)(下称“对比文献1”)中，对描述逻辑作了概率扩展，从而对不确定本体进行推理。但是该方法通过一个递减函数从所有本体元素中逐步删除可信度低的元素，效率较低。此外，它仅对查询为“真”的情况作了判断，没有对查询为“假”的情况作处理。

另外，在Z.Huang、F.van Harmelen和A.ten Teije所发表的文章“Reasoning with inconsistent ontologies”(Proceedings of the InternationalJoint Conference on Artificial Intelligence-IJCAI’05，2005)中提出一种线性扩展策略，用于对不一致的本体进行推理而没有对原始本体进行修改。但是该方法没有考虑本体的不确定性。

还有，在Silvia Calegari和Elie Sanchez所发表的文章“A FuzzyOntology-Approach to improve Semantic Information Retrieval”(Proceedings of URSW，2007)中定义了一种模糊本体用于语义信息检索，其中考虑了本体的不确定问题，但没有提出具体的解决方案。

综上所述，传统的推理方法对不确定与不一致本体很难得到正确的查询结果，而且处理效率很低。因此，需要一种新型推理方法，能够同时考虑到本体的不确定及不一致问题，并具有较高的处理效率。

发明内容

鉴于现有技术中存在的上述问题而研制了本发明。

本发明提出了一种对不确定及不一致本体的推理方法与设备。首先，本发明使用概率扩展方法，用于得到所有本体元素的可信因子(confidence factor，CF)。之后采用一递增选择函数逐步选择与查询相关的本体元素，并同时判断查询为“真”和“假”的情况，从而在不修改本体的前提下得到尽可能正确的查询结果。该方法的效率较高，同时考虑了本体的不确定及不一致问题，并可以将查询的所有回答(即查询结果)、相应推理路径、以及回答的置信度返回给用户，使用户可以更加方便地选择最可信的结果。

根据本发明第一方面，提出一种在语义网进行查询的不确定本体的推理方法与设备，根据该方法和设备可以在不修改现有本体的基础上，针对用户提出的查询，得到尽可能正确的推理结果。具体而言，该本体推理方法包括如下步骤：a.输入本体与查询；b.利用选择函数选择本体中与查询相关的元素集合；c.检测利用所选元素集合能否推理出查询结果；以及d.如果不能推理出任何查询结果，则递增选择函数的相关度并重复上述步骤b和c，如果能够推理出查询结果，则输出查询结果和相应推理路径。另外，该方法还可以包括对不确定本体进行概率扩展，以为每个本体元素赋予一个可信因子，用于表示该元素的可信程度，并根据查询结果所涉及的推理路径上的各个本体元素的可信因子来计算相应查询结果的置信度。

相应地，本发明还提出一种在语义网进行查询的不确定本体的推理设备，其包括：本体输入装置，用于输入本体；查询输入装置，用于输入查询；递增选择装置，用于利用选择函数选择所输入的本体中与查询相关的元素集合；查询结果检测装置，用于检测利用递增选择装置所选的元素集合能否推理出查询结果；推理路径记录装置，用于在查询结果检测装置确定能够推理出查询结果的情况下，记录与查询结果相对应的推理路径；以及输出装置，用于输出推理出的查询结果和相应的推理路径。其中，在查询结果检测装置确定利用递增选择装置所选的元素集合不能推理出任何查询结果的情况下，递增选择装置递增选择函数的相关度以更新元素集合，并且查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结果。

根据本发明第二方面，在上述不确定本体推理方法的基础上，本发明还进一步提出了在语义网进行查询的针对不确定和不一致本体的推理方法。该方法可同时判断查询的“真”回答和“假”回答，从而得到不一致本体的所有查询结果。最后将查询结果根据置信度大小排序，使用户可以方便选择最可信的结果。具体而言，该不确定和不一致本体的推理方法还包括如下步骤：a.输入本体与查询；b.利用选择函数选择本体中与查询相关的元素集合；c.检测利用所选元素集合能否推理出查询结果；d.如果不能推理出任何查询结果，则递增选择函数的相关度并重复上述步骤b和c，如果能够推理出查询结果，则记录查询结果和相应推理路径，并递增选择函数的相关度并重复上述步骤b和c；以及e.当所选元素集合已经包含本体的所有元素或者选择函数无法再选出与查询相关的元素时，输出所记录的所有查询结果和相应推理路径。类似地，该方法也可以包括对不确定本体进行概率扩展，以为每个本体元素赋予一个可信因子，用于表示该元素的可信程度的步骤。并且，根据查询结果所涉及的推理路径上的各个本体元素的可信因子，可以计算出相应查询结果的置信度，并根据不同结果置信度的大小对查询结果进行排序。

相应地，本发明所提出的在语义网进行查询的不确定和不一致本体推理设备包括：本体输入装置，用于输入本体；查询输入装置，用于输入查询；递增选择装置，用于利用选择函数选择所输入的本体中与查询相关的元素集合；查询结果检测装置，用于检测利用递增选择装置所选的元素集合能否推理出查询结果；查询结果记录装置，用于在查询结果检测装置确定能够推理出查询结果的情况下，记录查询结果；推理路径记录装置，用于记录与查询结果相对应的推理路径；以及输出装置，用于输出所记录的查询结果和相应推理路径，其中，无论查询结果检测装置确定能否推理出查询结果，递增选择装置都要递增选择函数的相关度以更新元素集合，并且查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结果，直到当所选元素集合已经包含本体中的所有元素或者选择函数无法再选出与查询相关的元素时，输出装置输出所记录的所有查询结果和相应推理路径。

与现有技术相比，本发明的主要优势在于：

1.根据本发明，能够针对不确定和不一致本体得到尽可能正确的查询结果。这使得用户不需要花费较大代价修改本体。

2.本发明的推理方案采用了递增选择函数，该函数能选择与特定查询相关的元素，从而能够最快地得到推理所需元素并得到查询结果。此外，该函数仅选取了与查询相关的元素，不涉及不相关的元素，因此最大程度上避免了其他不确定、不一致元素的干扰。

3.利用本发明所得到的查询结果不仅包括对“真”、“假”回答的判断，而且包括具体的推理路径以及每一回答对应的置信度。从而，用户能够得到更多有用信息，并可方便地根据置信度大小选择最可信的查询结果。

从下面结合附图的详细描述中，可以看出本发明的其他特征和优点。注意，本发明的范围并不限于图中所示的示例或者任何具体的实施例。

附图说明

结合附图，从下面对本发明实施例的详细描述，将更好地理解本发明，附图中类似的参考标注指示类似的部分，其中：

图1是示出根据本发明第一实施例的不确定本体推理设备100的内部结构的框图；

图2是示出图1所示不确定本体推理设备100的具体操作的流程图；

图3是示出根据本发明第二实施例的不确定与不一致本体推理设备300的内部结构的框图；

图4是示出图3所示不确定与不一致本体推理设备300的具体操作的流程图；以及

图5是被用于实现本发明的计算机系统的示意性框图。

具体实施方式

首先，本发明提供了一种针对不确定本体的推理方法与设备，根据该方法和设备可以在不修改现有本体的基础上，针对用户提出的查询，得到尽可能正确的推理结果。同时该推理结果包括了每一回答的推理路径及其置信度，用户可得到更多有用的信息，并根据置信度判断选取哪一个回答。

另外，在上述不确定本体推理方法的基础上，本发明的改进实施例可以同时应对不确定与不一致本体。具体而言，其查询结果检测装置可同时判断查询的“真”回答和“假”回答，从而得到不一致本体的所有查询结果，根据置信度大小排序后的查询结果为用户进行选择提供了更多方便。

为了便于说明，以下首先对本发明中所使用的术语进行简要介绍。

不确定的本体：所谓“不确定的本体”指的是本体的正确性不是固定的，而是具有一定概率。

不一致的本体：所谓“不一致的本体”指的是该本体中存在错误或冲突(矛盾)，从而导致本体中的某些概念不能被正确解释。虽然本体的不一致是用户不希望看到的，但是其存在往往难以避免。

不可满足的概念：所谓“不可满足的概念”表示该概念在本体中不存在合理解释。每个概念都有一个解释函数，而对于“不可满足的概念”，其解释函数为空。

可信因子：本发明所定义“可信因子”(CF)用于表征本体及其包含元素(例如概念、公理、实例、关系等)的不确定性。可信因子可以表示为一种得分，用于指示本体中元素的正确性的可信程度。CF值越高，则表示该元素正确的概率越高。CF值可以在专家建立本体时根据专家建议获得，或者利用某些预定算法来计算。例如，CF可以被表示为0和1之间的数字，即被表示为：CF：N→[0，1]，其中N表示本体中所有可能元素的集合。

直接相关：给定本体中的两个元素Φ和Ψ，如果在Φ和Ψ中同时出现一个相同的名称(如：实例名、概念名、关系名称等)，则称Φ和Ψ直接相关。

K相关：给定本体中的两个元素Φ和Φ’，如果存在一组元素Ψ0，...，Ψk∈O并且Φ和Ψ0直接相关，Ψ0和Ψ1直接相关，...，Ψk和Φ’直接相关，则称Φ和Φ’K相关，或者Φ和Φ’的相关度为K。

查询：一个本体∑的查询φ可以表示为对本体中某些概念、实例、关系、公理的描述。查询一般有两种回答：如果从∑可以推理出φ，则回答“真”，说明该查询语句是成立的，表示为如果从∑可以推理出φ 不成立，则回答“假”，表示为

推理路径：推理路径表示为一个集合R，该集合记录了能够推理出查询φ所需的所有本体元素，即：如果删除集合R的任意元素，则不能得到查询φ的回答。表示为：且

回答的置信度(Certainty degree of the answer，CDA)：置信度可以表示为一种得分，用于指示本体中某个查询的回答的可信程度。置信度分值越高，该回答正确的概率越大。例如，CDA可以被表示为0和1之间的数字，即被表示为：CDA：A→[0，1]，其中A表示查询所有回答的集合。

下面将参考附图来具体描述根据本发明第一和第二实施例的针对不确定和不一致本体的推理方法和设备。

<第一实施例>

首先，图1是示出根据本发明第一实施例的不确定本体推理设备100的内部结构的框图，图2是示出图1所示不确定本体推理设备100的具体操作的流程图。

如图1所示，根据该实施例，不确定本体推理设备100可以包括本体输入装置101、概率扩展装置102、递增选择装置103、查询结果检测装置104、推理路径记录装置105、置信度计算装置106、查询输入装置107和输出装置108。另外，图1还示出了相关存储设备，即本体存储器109、概率本体存储器110、查询存储器111以及用于存储查询结果、相应推理路径以及结果置信度的存储器112。

下面将参考图2来具体描述图1所示不确定本体推理设备100的操作。首先，在步骤201中，本体输入装置101和查询输入装置107可以分别从本体存储器109和查询存储器111输入用于推理的本体B以及感兴趣的查询φ，即需要判断从B能否得到φ的查询结果：其中本体B包含概念、实例、公理、关系等，表示为：B＝(T，A)，其中T＝{φ_i，i＝1，2，..，n}，A＝{c_j，j＝1，2，..，m}，其中T表示公理集，A表示断言集，φ表示公理，c表示概念。

在步骤202中，概率扩展装置102可以对通过本体输入装置101输入的本体B进行概率扩展，以得到概率扩展本体B^*。该概率扩展本体B^*可以被存储在概率本体存储器110中。所谓概率扩展就是给本体中的每个元素赋予一个概率值，以用于表示该元素的可信程度，记作可信因子(CF)。表示为：B＝(T，A)→B^*＝(T^*，A^*)。其中B^*表示概率本体，它包含概念、实例、公理、关系等。T^*表示概率公理集，T^*＝{(φ_i，α_i)，i＝1，2，..，n}。A^*表示概率断言集，A^*＝{(c_j，α_j)，j＝1，2，..，m}。α表示可信因子。关于可信因子的计算方法，可以使用本领域中的任何公知技术，例如可以采用对比文献1中所描述的方法。鉴于可信因子的计算方法不是本发明所关注的重点，这里不对此进行赘述。

接下来，在涉及步骤203-210的循环过程中，递增选择装置103、查询结果检测装置104、推理路径记录装置105和置信度计算装置106将根据从概率本体存储器110输入的概率本体B^*和用户给定的查询φ，来计算查询结果、推理路径以及回答的置信度。

首先，递增选择装置103通过一个选择函数来递增地选择与查询φ相关度为k的元素。选择函数s可以利用句法相似度对查询语句加以扩展。包含三个参数，第一个∑表示所有供选择的元素集合；φ表示初始查询；k表示相关度，初始值为1，每递增选择一次相关度加一。

在步骤203中，首先定义初始选择函数为查询语句φ，即k＝1时，

当k＝1时，选择函数选择∑中与查询φ直接相关的元素作为工作集合(步骤204)，并利用查询结果检测装置104来检测这一集合能否得出查询结果。具体而言，在步骤205中，查询结果检测装置104首先判断集合∑′能否得到查询φ的“真”回答，即判断φ是否为真。如果可以(步骤205中的“是”)，则在步骤207中，可以直接利用推理路径记录装置105和置信度计算装置106来计算并记录该回答的推理路径与置信度。推理路径包含能够推出该回答所需要的本体中的元素(如公理、实例等)，去掉任何元素都不能得到该推理结果。置信度的计算方法例如可以将推理路径中所有元素的可信因子(CF)的值相乘。相反，如果在步骤205中不能得到“真”回答，查询结果检测装置104则进而判断集合∑′能否得到查询φ的“假”回答(步骤206)，即如果能够推断出与φ相反的结论，则判断φ为假。如果在步骤206中可以判断出φ为假，则推理路径记录装置105和置信度计算装置106可以计算并记录该回答的推理路径与置信度(步骤207)。计算方法与前述相同。

在步骤208中，判断针对查询φ是否有回答，如果有(或者为“真”回答或者为“假”回答)，在步骤211中，输出装置108则可以输出分别由查询结果检测装置104、推理路径记录装置105和置信度计算装置106得到的查询结果、每个结果的推理路径以及相应的置信度。如果没有(步骤208中的“否”)，即现有元素集合不足以作出判断，则转到下一步骤209。

在步骤209中，判断集合∑′是否等于本体B^*(说明现有集合已经选取了本体中的所有元素，因此没有新的元素可以加入)或者集合∑′是否等于∑(说明本轮选择函数没有选择新的元素加入，即不再有与∑′相关的元素)。如果判断条件成立，则在步骤212中输出“没有结果”，即根据本体B不能对查询φ作出判断。如果条件不成立，则转到步骤210。在步骤210中，递增选择装置103将k值加1，即使得选择函数的相关度加1，并将集合∑′赋予∑。然后，过程返回步骤204，继续循环，直到找到相关的查询结果或作出“没有结果”的判断。

为了更好地说明本发明第一实施例的原理，下面给出一具体示例。

例如：已有本体

B = {A &SubsetEqual; B, A &Subset; C, C &Subset; B, D &Subset; E, E &Subset; B, A (a)},

经过概率扩展装置102之后得到概率本体B^*为：

B^{*} = {(A &SubsetEqual; B, 0.7), (A &Subset; C, 0.8), (C &Subset; B, 0.6), (D &Subset; E, 0.8), (E &Subset; B, 0.4), (A (a), 0.5)} .

再假设输入查询φ为：“概念A包含于B吗？

A &Subset; B

？”。

根据图2所示算法，首先选择函数初始化为：k＝1，

然后，计算元素集合：

，也即选择所有与概念A、B直接相关的本体元素。

判断是否可由集合∑′推理出查询φ，即是否存在“真”回答：

根据推理，发现有两条推理路径都可以得到回答为“真”，记录这两条推理路径并计算其置信度。

然后，判断是否有回答。由于结果为“是”，因此可以输出查询结果为：

查询结果

{(A &Subset; C, 0.8), (C &Subset; B, 0.6)}, 0.48}} .

其中，因为回答1的推理路径只包含一条公理，所以其置信度等于该公理的可信因子0.7；对于回答2，其推理路径报告2条公理，其置信度等于2条公理的可信因子的乘积，即：0.8×0.6＝0.48

由于这一计算过程能够更有效更快速地得到结果，而且查询结果反映了具体的推理路径及其置信度，因此用户能够得到更多的有用信息，并根据置信度选择更可信的回答。

<第二实施例>

图3是示出根据本发明第二实施例的不确定与不一致本体推理设备300的内部结构的框图，图4是示出图3所示不确定与不一致本体推理设备300的具体操作的流程图。与第一实施例相比，第二实施例的区别在于其提供了可针对不确定与不一致本体的推理方法与设备。

由于现实中的本体大多是既不确定又不一致的，并且由本体的不确定性也常常带来不一致的问题，因此有必要提出一种推理方法，对于输入的查询，即使对于不确定和不一致的本体，也能得到尽可能合理的回答。

根据第二实施例，本发明的方法不需要修改原始本体，在保留不确定性与不一致性的情况下给出所有的“真”和“假”回答，以及每个回答的推理路径及其置信度。用户可以选择置信度最大的回答，也可以根据查询结果的集合选择其认为最适合的回答。

在第二实施例中仍然使用第一实施例所采用的选择函数来搜索与查询相关的本体元素。由于本体的不一致性，可能同时存在“真”和“假”回答，因此系统需要记录每个回答并计算他们的置信度。最后，通过将所有回答根据置信度从大到小排序，可以得到最可信的回答。

如图3所示，类似于第一实施例，不确定与不一致本体推理设备300也包括本体输入装置101、概率扩展装置102、递增选择装置103、查询结果检测装置104、推理路径记录装置105、置信度计算装置106、查询输入装置107和输出装置108。不同于第一实施例，不确定与不一致本体推理设备300还包括查询结果记录装置301和查询结果排序装置302。

下面将参考图4来详细描述图3所示不确定与不一致本体推理设备300的操作过程。

首先，在步骤401中，类似于第一实施例，本体输入装置101和查询输入装置107可以分别从本体存储器109和查询存储器111输入用于推理的本体B以及感兴趣的查询φ。在步骤402中，概率扩展装置102可以对通过本体输入装置101输入的本体B进行概率扩展，以得到概率扩展本体B^*。该概率扩展本体B^*可以被存储在概率本体存储器110中。

在步骤403中，递增选择装置103初始化k等于1，k用于选择函数相关度的递增计数。初始化选择函数s为查询φ，并将该集合赋予∑，即：然后，在步骤404中，通过选择函数s计算与查询φ相关度为k的元素集合，记为∑′，即：

接下来，在步骤405中，查询结果检测装置104判断集合∑′能否得到查询φ的“真”回答，即判断φ是否为真。如果可以(步骤405中的“是”)，推理路径记录装置105和置信度计算装置106则分别计算出该回答的推理路径与置信度，并且查询结果记录装置301将该回答记录到结果集合A中，表示为：{回答ID：真，路径{...}，置信度}...(步骤406)。如果不能得到“真”回答，则转到下一步骤407。

在步骤407中，查询结果检测装置104继续判断集合∑′能否得到查询φ的“假”回答，即如果能够推断出与φ相反的结论，则判断φ为假。同样地，如果可以判断φ为假，推理路径记录装置105和置信度计算装置106则分别计算出该回答的推理路径与置信度，并且查询结果记录装置301将该回答同样记录到结果集合A中，表示为：{回答ID：假，路径{...}，置信度}...(步骤408)。如果不能，则转到下一步骤409。

在步骤409中，判断集合∑′是否等于本体B^*(说明现有元素集合已经选取了本体中的所有元素，因此没有新的元素可以加入)或者集合∑′是否等于∑(说明本轮选择函数没有选择新的元素加入，即不再有与∑′相关的元素)。如果判断条件成立，则转到步骤411。如果不成立，则转到步骤410。

在步骤411中，判断针对查询φ是否有回答，即查询结果记录装置301是否记录有任何关于查询φ的回答。如果有(可能同时包含“真”和“假”)，则转到步骤413。如果没有，则在步骤412中输出“没有结果”，即根据本体B不能对查询φ作出判断。

在步骤410中，当在步骤409的判断条件不成立的情况下，递增选择装置103将k值加1，即表示相关度加1，并将集合∑′赋予∑。然后，过程返回步骤404，继续循环。

在步骤413中，查询结果排序装置302对查询结果记录装置301所记录的所有查询结果(可能同时包含“真”和“假”回答)进行排序，默认排序方式是根据置信度从大到小。然后，在步骤414中，输出装置108输出排序后的查询结果、每个结果对应的推理路径与置信度。

为了更好地说明本发明第二实施例的原理，下面给出一具体示例。

例如：已有本体

B = \{\begin{matrix} A &SubsetEqual; B, A &Subset; C, A &Subset; D \cap Q, A (a), B &SubsetEqual; G, \\ C &Subset; B, D &Subset; E, E &Subset; B, G &Subset; H \cap K, H &Subset; A, Q (q) \end{matrix}\},

经过概率扩展装置得到概念本体B^*为

B^{*} = \{\begin{matrix} (A &SubsetEqual; B, 0.7), (A &Subset; C, 0.8), (A &Subset; D \cap Q, 0.9), (A (a), 0.5), (B &SubsetEqual; G, 0.3), \\ (C &Subset; B, 0.6), (D &Subset; E, 0.8), (E &Subset; B, 0.7), (G &Subset; H \cap K, 0.5), (H &Subset; A, 0.6), (Q (q), 0.5) \end{matrix}\}

假设输入查询φ为：“概念A包含于B吗？

A &Subset; B

？”。

根据图4所示算法，初始化k＝1，

之后计算元素集合：

也即选择所有与概念A、B直接相关的本体元素。

判断是否可由集合∑′推出查询φ为真，即：

根据推理，发现有两条推理路径可以得到回答为“真”，记录这两条推理路径并计算其置信度为：

回答集合

{(A &Subset; C, 0.8), (C &Subset; B, 0.6)}, 0.48}} .

判断是否可由集合∑′推出查询φ为假，即：经判断不能得到。

继续判断是否满足∑′等于B^*或者∑′等于∑，发现两者均不满足，于是k值加1，变为k＝2，同时将集合∑′赋给∑。

此时，选择函数再次选择元素集合，

判断是否可由集合∑′推出查询φ为真，即：

根据推理，发现又有一条推理路径可以得到回答为“真”，将其加入回答集合为：

回答集合

判断是否可由集合∑′推出查询φ为假，即：

据推理得到一条推理路径，计算其置信度并将其加入回答集合A，表示为：

判断是否满足∑′等于B^*或者∑′等于∑。发现前者满足，即当前工作集合已经包含所有的本体元素，于是继续判断是否有回答。由于回答集合中“有”回答，因此对所有查询结果进行排序。

通过根据置信度大小进行排序，从而得到的最终输出结果为：查询结果

{(B &SubsetEqual; G, 0.3), (G &Subset; H \cap K, 0.5), (H &Subset; A, 0.6)}, 0.09}} .

以上分别参考图1、图2、图3和图4详细描述了根据本发明第一和第二实施例的本体推理设备及其操作原理。

图5是被用于实现本发明的计算机系统的示意性框图。

如图5所示，该计算机系统500包括CPU 501、用户接口502、外围设备503、存储器505、永久存储设备506以及将它们彼此相连的总线504。存储器505中包含语义web应用5051、本体推理模块5052、本体编辑应用5053、本体学习应用5054、其他应用5055和操作系统(OS)5056等等。本发明的核心功能主要与本体推理模块5052相关，其例如是图1或图3所示的不确定本体推理设备100或不确定与不一致本体推理设备300。存储器505中的各个应用可以并行运行，以提供多种不同的功能。永久存储设备506可以包含本发明所涉及的各种存储器，例如本体存储器、概念本体存储器、查询存储器、查询结果/推理路径/置信度存储器等等。

根据上述描述可以看出，本发明具有以下效果：

根据本发明，能够针对不确定和不一致本体得到尽可能正确的查询结果。这使得用户不需要花费较大代价修改本体。

并且，本发明的推理方案采用了递增选择函数，该函数能选择与特定查询相关的元素，从而能够最快地得到推理所需元素并得到查询结果。此外，该函数仅选取了与查询相关的元素，不涉及不相关的元素，因此最大程度上避免了其他不确定、不一致元素的干扰。

利用本发明所得到的查询结果不仅包括对“真”、“假”回答的判断，而且包括具体的推理路径以及每一回答对应的置信度。从而，用户能够得到更多有用信息，并可方便地根据置信度大小选择最可信的查询结果。

上面已经参考附图描述了根据本发明的具体实施例。但是，本发明并不限于图中示出的特定配置和处理。并且，为了简明起见，这里省略对已知方法技术的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本发明的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本发明的精神之后，作出各种改变、修改和添加，或者改变步骤之间的顺序。

本发明的元素可以实现为硬件、软件、固件或者它们的组合，并且可以用在它们的系统、子系统、部件或者子部件中。当以软件方式实现时，本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路，等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

本发明可以以其他的具体形式实现，而不脱离其精神和本质特征。例如，特定实施例中所描述的算法可以被修改，而系统体系结构并不脱离本发明的基本精神。因此，当前的实施例在所有方面都被看作是示例性的而非限定性的，本发明的范围由所附权利要求而非上述描述定义，并且，落入权利要求的含义和等同物的范围内的全部改变从而都被包括在本发明的范围之中。

Claims

1.一种在语义网进行查询的不确定与不一致本体推理方法，包括：

a.输入本体与查询；

b.利用选择函数选择所述本体中与所述查询相关的元素集合；

c.检测利用所选元素集合能否推理出查询结果；以及

d.如果不能推理出任何查询结果，则递增所述选择函数的相关度并重复上述步骤b和c，如果能够推理出查询结果，则输出所述查询结果和相应推理路径；

对于每个所述查询结果，利用相应推理路径所包含元素的可信因子值计算该查询结果的置信度。

2.如权利要求1所述的方法，还包括：

对所述本体进行概率扩展，以对所述本体中的每个元素计算一个可信因子值。

3.如权利要求2所述的方法，其中计算所述查询结果的置信度包括计算相应推理路径所包含元素的可信因子值的乘积。

4.如权利要求1所述的方法，其中所述查询结果是“真”回答或“假”回答。

5.如权利要求1所述的方法，其中所述元素包括概念、公理、实例和关系。

6.一种在语义网进行查询的不确定与不一致本体推理方法，包括：

a.输入本体与查询；

c.检测利用所选元素集合能否推理出查询结果；

d.如果不能推理出任何查询结果，则递增所述选择函数的相关度并重复上述步骤b和c，如果能够推理出查询结果，则记录所述查询结果和相应推理路径，并递增所述选择函数的相关度并重复上述步骤b和c；以及

e.当所选元素集合已经包含所述本体的所有元素或者所述选择函数无法再选出与所述查询相关的元素时，输出所记录的所述查询结果和相应推理路径；

对于每个所述查询结果，利用相应推理路径所包含元素的可信因子值计算该查询结果的置信度；以及

按照置信度的大小，对所记录的所有查询结果进行排序。

7.如权利要求6所述的方法，还包括：

8.如权利要求6所述的方法，其中所述查询结果包括“真”回答和“假”回答。

9.一种在语义网进行查询的不确定与不一致本体推理设备，包括：

本体输入装置，用于输入本体；

查询输入装置，用于输入查询；

递增选择装置，用于利用选择函数选择所输入的本体中与所述查询相关的元素集合；

查询结果检测装置，用于检测利用所述递增选择装置所选的元素集合能否推理出查询结果；

推理路径记录装置，用于在所述查询结果检测装置确定能够推理出查询结果的情况下，记录与所述查询结果相对应的推理路径；以及

输出装置，用于输出推理出的所述查询结果和相应的推理路径，

其中，在所述查询结果检测装置确定利用所述递增选择装置所选的元素集合不能推理出任何查询结果的情况下，所述递增选择装置递增所述选择函数的相关度以更新所述元素集合，并且所述查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结果；以及

置信度计算装置，用于对于每个所述查询结果，利用相应推理路径所包含元素的可信因子值计算该查询结果的置信度，

其中所述输出装置输出所述查询结果的置信度。

10.如权利要求9所述的设备，还包括：

概率扩展装置，用于对所述本体进行概率扩展，以对所述本体中的每个元素计算一个可信因子值。

11.一种在语义网进行查询的不确定与不一致本体推理设备，包括：

本体输入装置，用于输入本体；

查询输入装置，用于输入查询；

查询结果记录装置，用于在所述查询结果检测装置确定能够推理出查询结果的情况下，记录所述查询结果；

推理路径记录装置，用于记录与所述查询结果相对应的推理路径；以及

输出装置，用于输出所记录的所有查询结果和相应推理路径，

其中，无论所述查询结果检测装置确定能否推理出查询结果，所述递增选择装置都要递增所述选择函数的相关度以更新所述元素集合，并且所述查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结果，直到当所选元素集合已经包含所述本体的所有元素或者所述选择函数无法再选出与所述查询相关的元素时，所述输出装置输出所记录的所述查询结果和相应推理路径；

置信度计算装置，用于对于每个所述查询结果，利用相应推理路径所包含元素的可信因子值计算该查询结果的置信度；以及

查询结果排序装置，用于按照置信度的大小，对所记录的所有查询结果进行排序，

其中所述输出装置输出经排序的查询结果、相应的推理路径以及相应的置信度。

12.如权利要求11所述的设备，还包括：