CN101266660A

CN101266660A - 基于描述逻辑的本体不一致性分析方法

Info

Publication number: CN101266660A
Application number: CNA2008101044105A
Authority: CN
Inventors: 范玉顺; 刘博�
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2008-04-18
Filing date: 2008-04-18
Publication date: 2008-09-17

Abstract

基于描述逻辑的本体不一致性分析方法属于语义及本体分析领域，其特征在于，在计算机上建立本体仓库、缓冲本体库、本体不一致性分析模块、逻辑推理机RACER和本体工具Protégé；该方法通过本体不一致性分析模块来分析缓冲本体库中存储的不一致的本体，计算该本体的最小不一致公理集合、命中集合，最后得到最小错误集合，该最小错误集合即产生本体不一致性的根源，通过删除或修改该最小错误集合可以有效恢复原本体的一致性。根据本发明，能够在语义不一致情况下对本体进行分析，找到产生本体不一致性的根源，从而有效恢复本体的一致性。

Description

基于描述逻辑的本体不一致性分析方法

技术领域

本发明属于语义及本体分析领域，旨在为人们提供一种在语义不一致的情况下，对本体进行分析并解决本体的不一致性的方法。

背景技术

语义网是由WWW的创始人Tim Berners-Lee在2001年正式提出的，它的主要任务是使数据能被计算机自动的处理和理解，其最终目标是让计算机可以在这些海量信息中找到人所需要的任何信息。它研究的主要目的就是扩展当前的万维网，使得网络中的信息具有语义，能够被计算机理解。语义网主要是通过本体来实现的。

本体(ontology)用于对一些主题作清晰而规范的描述，能够澄清领域知识的结构，获得统一的术语和概念，并使知识的共享成为可能。面向各专业领域建立的领域本体，能够提供该领域中知识概念的词表以及概念之间的关系，并实现领域知识的重用。

现有的对本体进行描述的方法主要是基于描述逻辑(Description Logic，DL)的。描述逻辑是基于对象的知识表示的形式化，也是一阶谓词逻辑的一个可判定子集。描述逻辑的优点是很强的表达能力和可判定性，它能保证推理算法总能停止，并返回正确的结果。近些年来，描述逻辑逐渐成为语义网表达的语义理论基础。

描述逻辑中最基本的两个术语是概念(concept)和角色(role)。概念是一类事物的抽象，通常用A，B，C，D，…来表示；而角色则刻画了事物之间的各种联系，通常用P，Q，R，S，…来表示。描述逻辑中的真假分别用丅和丄来表示，析取和合取分别用∪和∩来表示，蕴含和等价分别用

和≡来表示，关系“非”用

来表示，存在量词和全称量词分别用

和

来表示。例如：C∩D表示概念C和D的交，C∪D表示概念C和D的并，

表示所有概念中除去C的概念，

表示存在概念C的实例满足角色R，

表示任意概念C的实例满足角色R。

本发明中提到的本体均根据描述逻辑构建。一个本体通常由四部分组成：(1)概念，用于表示一组或一类实例，一般用来表示具有共同性质的一类事物。(2)关系，用于表示概念或其属性之间的关联。(3)公理，用于对概念或实例的值进行约束，表示一些永真式。(4)实例，用于表示类的一个具体的个体，对本体而言不是必需的。

语义网技术的飞速发展在很大程度上依赖于本体的正确性及质量，因此保证本体的一致性至关重要。对本体的一致性定义如下：

如果一个本体中的所有概念都存在可满足的解释，则说明这个本体是一致的。反之，如果本体中任何一个概念不存在可满足的解释，则该本体是不一致的。一个不一致的本体意味着本体中的某些部分与其他部分产生冲突。

本体的最小不一致公理集合(Minimal Inconsistent Subset，MIS)是指该集合是本体的不一致子集，而该集合的任何真子集都是一致的。

最小错误集合(Minimal Error Set)是导致本体产生不一致的最小集合。即产生本体不一致现象的根源。通过删除或修改最小错误集合，即可有效恢复整个本体的一致性。

尽管本体的一致性非常重要，但是现实生活中的本体却常常是不一致的。这种不一致可能来源于：1)本体构建者的错误，即由于建立本体的人知识不足或者发生错误而使本体在建立之初就是不一致的；2)一词多义现象，即一个词根据语境不同具有多种含义，因此容易发生混淆；3)格式转换，由于本体具有多种表达方式，例如RDF(Resource DescriptionFramework)、OWL(Web Ontology Language)等，当本体从一种表达方式转换为另一种表达方式时也容易产生不一致；4)本体集成，即一个本体是由多个小本体集成而来的，由于各个小本体的构造方式不同，集成得到的本体往往很难达到一致。

已有很多研究者考虑了本体的不一致问题，但是其研究和应用还很不完善。Schlobach等人在SEKT(Semantically Enabled Knowledge Technologies)项目中研究了不一致本体的诊断和修复问题，提出Pinpoint的概念作为本体的诊断集，但是作者采用了启发式算法，因此无法保证算法的完备性(Schlobach S，HUANG Zhisheng.Inconsistent ontology diagnosisand repair[EB/OL].2007.http://wasp.cs.vu.nl/sekt/dion/sekt363.pdf)。Huang等人提出线性扩展战略，以从不一致的本体中推出有意义的结论，但是其应用还具有一定的局限性(HUANG Zhisheng，Harmelen VF，Teije AT.Reasoning with inconsistent ontologies[C].//Proc IJCAI’05.Edinburgh，UK：Professional Book Center，2005：254-259.)。Deng等人利用博弈论中的谢普利值(Shapley value)计算本体中每条公理的错误程度，通过删除Shapley值最大的公理解决不一致问题，但是其计算复杂度是指数级的，不便执行(DENG Xi，Haarslev V，Shiri N.Measuring inconsistencies in ontologies[J].Lecture Notes inComputer Science，2007，4519：326-340.)。

因此，有必要提出一种更加有效的对本体的不一致性进行分析的方法，从而恢复本体的一致性，保证语义理解的正确性。

发明内容

针对现有技术中存在的问题，本发明的目的是提出一种基于描述逻辑的本体不一致性分析方法，能够通过修改或去除本体中的最小错误集合，有效恢复本体的一致性，从而保证语义理解的正确性，实现基于语义的知识共享与信息交换。

本发明的特征在于，所述方法是依次按以下步骤实现的：

步骤(1)，初始化

安装本体建模工具Protégé，用以建立、删除、修改本体，并把本体存储为网络本体语言OWL的格式，

构建本体仓库，用于存储用所述Protégé构建的本体文件，

安装本体不一致性分析系统，其中包括：缓冲本体库、逻辑推理机RACER、以及本体不一致性分析模块，其中：

缓冲本体库，存储从所述本体仓库中提取到的需要分析本体不一致性的本体，

逻辑推理机RACER，是一个基于描述逻辑的推理机，用于获取需要分析本体不一致性的文件中存在着不一致的概念集合，

本体不一致性分析模块，用于从所述缓冲本体库中提取不一致的本体，并借助所述逻辑推理机RACER，求得本体的最小错误集合；

步骤(2)，按以下步骤进行本体不一致性分析：

步骤(2.1)，用本体不一致性分析模块从缓冲本体库中提取待分析的本体O；

步骤(2.2)，该本体不一致性分析模块把步骤(2.1)所述的本体O送往逻辑推理机RACER，判断本体O是否描述逻辑一致：

若：一致，则分析结束，返回步骤(2.1)，

若：不一致，则计算不一致的概念集合，并保存；

步骤(2.3)，该本体不一致性分析模块得到步骤(2.2)中所述的不一致的概念集合后，利用MUPS_bottomup算法(参见文献：Schlobach S，HUANG Zhisheng.Inconsistent ontologydiagnosis and repair[EB/OL].2007.http://wasp.cs.vu.nl/sekt/dion/sekt363.pdf)求得最小不一致公理集合，表示为MIS＝{S₁，S₂，...，S_n}，其中S₁，S₂，...，S_n均为本体O的最小不一致公理集合，每个集合中包含若干条不一致的公理；

步骤(2.4)，从步骤(2.3)得到的集合S₁，S₂，...，S_n中各任意选取一条公理加入集合H_k；

步骤(2.5)，若步骤(2.4)得到的集合H_k中存在重复的公理，则删去重复的公理，得到一个命中集合H；

步骤(2.6)，重复执行步骤(2.4)到步骤(2.5)，一直到不存在新的集合H_k为止，再执行下一个步骤；

步骤(2.7)，计算步骤(2.5)中所述命中集合H中至少一个H包含的公理数最少的集合，并保存；

步骤(2.8)，把步骤(2.7)得到的集合赋给最小错误集合D，并把其返回给用户；

步骤(3)，用户得到步骤(2.8)所述的最小错误集合D后，用本体建模工具Protégé删除或修改所述集合D，从而得到一致的本体O’；

步骤(4)，把步骤(3)得到的本体O’存入所述本体仓库中。

本发明通过对不一致的本体进行分析，求得本体的最小错误集合，用户可以进一步分析该最小错误集合中的公理，对其进行删除或修改，从而恢复整个本体的一致性，保证语义的正确理解，并支持协同过程中的信息与知识共享。和其他方法相比，本发明提出的方法能够更加简单有效的解决本体的不一致问题，同时给出了所有的最小错误集合，能够由用户根据实际情况有选择性的进行删除或修改，更加适合实际应用。

附图说明

图1是一个描述了基于描述逻辑的本体不一致性分析系统的详细结构图；

图2是一个描述了基于描述逻辑的本体不一致性分析方法具体步骤的图；

图3是一个描述了本体不一致性分析模块的算法流程图。

具体实施方式

为了实现上述目的，本发明所采用的技术方案如下：

1.建立基于描述逻辑的本体不一致性分析系统的运行环境，参阅图1，该系统的主要构件及建立过程如下：

(1)在计算机上安装操作系统。操作系统可选用微软公司的视窗(Windows)系列操作系统中的Windows 2000及以上版本；

(2)在计算机上安装本体工具Protégé。Protégé是斯坦福大学开发的开源的本体建模工具，目前已经得到广泛的应用。该工具可以建立、删除、修改本体，并将本体存储为OWL(WebOntology Language，网络本体语言，参考资料可从万维网http://www.w3.org/TRlowl-ref上得到)的格式。Protégé可从万维网http://protege.stanford.edu/download/download.html上下载，其参考资料可从万维网http ://protege.stanford.edu/doc/users_guide/上得到；

(3)在计算机上构建本体仓库，用于存储本体文件。所述本体文件采用标准格式描述，并通过本体工具构造而成。所述标准格式采用OWL格式。所述本体工具采用步骤2中所述的Protégé；

(4)在计算机上安装本体不一致性分析系统，该系统主要包含如下三个部分：

(4.1)缓冲本体库：存储需要分析本体不一致性的本体，该本体是从本体仓库中提取出来的、OWL格式的本体文件；

(4.2)逻辑推理机RACER：是一个基于描述逻辑的推理机，可以从万维网http://www.racer-systems.com/上下载得到。该推理机通过DIG接口(描述逻辑推理接口DIG，Description Logic Reasoner Interface)提供推理服务，可通过HTTP或TCP访问。将本体文件输入RACER，经过推理可获得该本体中不一致的概念集合。

(4.3)本体不一致性分析模块：用于从缓冲本体库中提取不一致的本体，并借助逻辑推理机RACER的功能，求得本体的最小错误集合。该最小错误集合即产成本体不一致现象的症结所在，通过删除或修改该最小错误集合可以恢复整个本体的一致性。

2.一种能够分析并解决本体的不一致性的方法，该方法采用的具体方案参阅图2和图3，运行过程包括如下的步骤：

步骤1，用户在所述本体仓库中存储需要使用的本体，所述的本体可以通过本体工具Protégé建立，也可以通过其他本体建模工具建立，所述的本体以标准格式OWL存储；

步骤2，当用户需要分析某个或某些本体的不一致性时，从所述本体仓库中提取需要分析不一致性的本体，并存入所述的缓冲本体库中；

步骤3，所述的本体不一致性分析模块按照以下步骤对不一致的本体进行分析：

步骤3.1，用本体不一致性分析模块从缓冲本体库中提取待分析的本体O；

步骤3.2，该本体不一致性分析模块把步骤3.1所述的本体O送往逻辑推理机RACER，判断本体O是否描述逻辑一致：

若：一致，则分析结束，返回步骤3.1，

若：不一致，则计算不一致的概念集合，并保存；

步骤3.3，该本体不一致性分析模块得到步骤3.2中所述的不一致的概念集合后，利用MUPS_bottomup算法(参见文献：Schlobach S，HUANG Zhisheng.Inconsistent ontologydiagnosis and repair[EB/OL].2007.http://wasp.cs.vu.nl/sekt/dion/sekt363.pdf)求得最小不一致公理集合，表示为MIS＝{S₁，S₂，...，S_n}，其中S₁，S₂，...，S_n均为本体O的最小不一致公理集合，每个集合中包含若干条不一致的公理；

步骤3.4，从步骤3.3得到的集合S₁，S₂，...，S_n中各任意选取一条公理加入集合H_k；

步骤3.5，若步骤3.4得到的集合H_k中存在重复的公理，则删去重复的公理，得到一个命中集合H；

步骤3.6，重复执行步骤3.4到步骤3.5，一直到不存在新的集合H_k为止，再执行下一个步骤；

步骤3.7，计算步骤3.5中所述命中集合H中至少一个H包含的公理数最少的集合，并保存；

步骤3.8，把步骤3.7得到的集合赋给最小错误集合D，并把其返回给用户；

步骤4，用户得到步骤3.8所述的最小错误集合D后，用本体建模工具Protégé删除或修改所述集合D，从而得到一致的本体O’；

步骤5，把步骤4得到的本体O’存入所述本体仓库中。

下面以一个不一致的本体T为例(如表1所示)，说明上述的分析过程：

将T作为待分析的本体，从本体仓库提取到缓冲本体库中。

T包含7条公理ax₁，ax₂，...，ax₇，其中A₁，A₂，A₃，A₄，B₁，B₂，B₃，C₁，C₂表示概念，t和r表示角色。经步骤3.2判断，T是不一致的本体。例如ax₁中定义A₁与B₁不相交，ax₂中定义A₂与B₁相交，那么显然A₁和A₂是不相交的，但是ax₁中又定义A₁与A₂相交，解释无法满足，因此T是不一致的。进一步说，ax₁和ax₂构成T的一个不一致子集，去掉这个子集中任何一条公理(ax₁或ax₂)该集合都是一致的，因此{ax₁，ax₂}又构成了T的最小不一致公理集合。经过步骤3.3的计算，得到T中包含三个最小不一致公理集合，即：

MIS(T)＝{{ax₁，ax₂}，{ax₃，ax₄，ax₅}，{ax₄，ax₇}}

从MIS的三个子集中各取一条公理、最后再删除重复的公理所组成的集合即为命中集合，经步骤3.4-3.6的计算得到T的命中集合为：

HS (T) = \{\begin{matrix} {{ax}_{1}, {ax}_{3}, {ax}_{7}}, {{ax}_{1}, {ax}_{4}}, {{ax}_{1}, {ax}_{5}, {ax}_{7}}, \\ {{ax}_{2}, {ax}_{3}, {ax}_{7}}, {{ax}_{2}, {ax}_{4}}, {{ax}_{2}, {ax}_{5}, {ax}_{7}} \end{matrix}\}

考虑到对本体的影响最小，选取其中包含公理数最少的集合作为最小错误集合。因此经步骤3.7和3.8计算得到最小错误集合为：

D＝{{ax₁，ax₄}，{ax₂，ax₄}}

从本体中删除或修改ax₁和ax₄(或者ax₂和ax₄)都可以恢复本体T的一致性。

按照发明内容中的初始化设定中的步骤依次完成系统的部署和设定，根据发明内容中的本体不一致性分析方法来得到不一致本体的最小错误集合，求解过程中要用到逻辑推理机RACER。用广根据返回的最小错误集合进行分析，可以通过去除或修改最小错误集合中的公理恢复本体的一致性。

附表

表1不一致的本体T

Claims

1.基于描述逻辑的本体不一致性分析方法，其特征在于，所述方法是在计算机中依次按以下步骤实现的：

步骤(1)，初始化

构建本体仓库，用于存储用所述Protégé构建的本体文件，

步骤(2)，按以下步骤进行本体不一致性分析：

若：一致，则分析结束，返回步骤(2.1)，

若：不一致，则计算不一致的概念集合，并保存；

步骤(2.3)，该本体不一致性分析模块得到步骤(2.2)中所述的不一致的概念集合后，利用MUPS_bottomup算法求得最小不一致公理集合，表示为MIS＝{S₁，S₂，...，S_n}，其中S₁，S₂，...，S_n均为本体O的最小不一致公理集合，每个集合中包含若干条不一致的公理；

步骤(4)，把步骤(3)得到的本体O’存入所述本体仓库中。