CN111241296A

CN111241296A - 一种基于重写技术的完整性约束验证方法

Info

Publication number: CN111241296A
Application number: CN202010009817.0A
Authority: CN
Inventors: 崔仙姬; 姜雨蒙
Original assignee: Dalian Minzu University
Current assignee: Dalian Minzu University
Priority date: 2020-01-06
Filing date: 2020-01-06
Publication date: 2020-06-05

Abstract

一种基于重写技术的完整性约束验证方法，属于语义网络数据处理技术领域。技术要点是：将IC公理转化为连接查询与not的结合，其中not在连接查询中表示否定；将查询主体中的分离词分解为具有相同头部的不同查询，进而转化为连接查询；重写IC验证；根据转换规则对DL‑LiteR知识库进行规范化；使用算法检验DL‑LiteR知识库是否满足完整性约束。有益效果：本发明所述的基于重写技术的完整性约束验证方法能得到完整性约束的推理，从而改进DL‑LiteR的完整性约束验证效果，得到更直观的完整性约束验证结果；该方法可应用于基于本体的软件工程中的需求获取、工作流模型验证和基于本体的科技文献检索过程等本体应用中，可以进一步提高其验证和检索效率。

Description

一种基于重写技术的完整性约束验证方法

技术领域

本发明属于语义网络数据处理技术领域，尤其涉及一种基于重写技术的完整性约束验证方法。

背景技术

语义网是万维网的延伸，在万维网中，信息以智能形式表达，使计算机能够更好地理解。本体作为语义Web中表示数据的概念模式，Web本体语言(OWL)是W3C推荐的候选本体语言。社交计算是一种智能的计算模式，它允许用户以社交标签的形式提供简短而丰富的个性化标签，从而参与管理网络数据。它可以在不需要任何专业知识的情况下提高资源检索和识别的效率。

但是，这些被标记的数据不能保证是正确的，所以有需要验证这些被标记的数据的正确性。目前针对解决语义网络中的一般语法错误和逻辑冲突有几种成熟的工具。但是对于大多数以数据为中心的应用程序，还需要考虑用户的约束。以微信为例，需要限制人的数量、单词的数量等。这些约束需要以规则的形式表示，并在其他社会计算应用程序中自动验证和修复。因此，需要在本体中引入完整性约束。完整性约束最初是在数据库和人工智能知识表示语言中提出的，以保证知识库可以接受的合法状态。可以将它们添加到本体中，以保证OWL本体中数据的合法状态。

这项工作有很长研究时间。现有的一些方法是使用具有认知算子和非单调规则的公式来对完整性约束建模。然而，这些建模方式修改了标准DL知识库的语法，所以不再适合在DL知识库中进行标准推理。基于此，研究人员想要在DL知识库中修改公理的语义来满足完整性约束的语义，并使用最小模型来定义完整性约束的满足度。最近的相关工作由陶^[1]等人提出，基于将完整性约束验证转换为用SPARQL查询答案的想法。然而，由于标准DL知识库的特点，标SPARQL查询只关注ABox实例而忽略了标准推理。所以它可能会丢失在完整性约束验证中很重要的DL知识库中的标准推理结果。

[1]Tao,J.,Sirin,E.,Bao,J.,McGuinness,D.:Integrity constraints inOWL.In:AAAI,pp.11–15(2010)

发明内容

为了解决上述现有技术中存在的问题，本发明提出一种基于重写技术的完整性约束验证方法，该方法能得到完整性约束的推理，从而改进DL-LiteR的完整性约束验证效果。

技术方案如下：

一种基于重写技术的完整性约束验证方法，步骤如下：

S1、将IC公理转化为连接查询与not的结合，其中not在连接查询中表示否定；

S2、将查询主体中的分离词分解为具有相同头部的不同查询，进而转化为连接查询；

S3、重写IC验证；

S4、根据转换规则对DL-LiteR知识库进行规范化；

S5、使用算法检验DL-LiteR知识库是否满足完整性约束。

进一步的，步骤S1中，对于一个KB，

的连接查询的原子at定义如下:

其中A和Ra分别是

的原子概念和原子角色，zi是

中的常数或变量；

进一步的，步骤S2中，用DL表示的完整性约束公理捕捉完整性约束的含义，翻译规则如下：

其中π_c、π_r、π分别表示翻译概念、角色和公理，主要遵循的思路是，将一个IC公理转换为一个并集的连接查询，当关于

的查询为空时，则IC公理被满足，反之，则违背IC公理。

进一步的，步骤S3中，重写IC验证步骤如下：

首先，在

中的一个标准公理β适用于查询q的原子g，如果标准公理β的和g右侧具有相同概念或作用的谓词名称，用gr(g,β)通过使用合适的公理β来指示从原子g得到的原子，

重写规则如下：

1、关于概念包含公理：

-如果β的左边是一个谓词,则gr(g,β)＝A(x)；

-如果

则gr(g,β)＝P(x,y)；

-如果

则gr(g,β)＝P(x,y)；

2、关于角色包含公理：

-如果g＝P(x1,x2)而且β也是

或者

则gr(g,β)＝P₁(x₁,x₂)；

-如果g＝P(x1,x2)而且β也是

或者

则gr(g,β)＝P₁(x₁,x₂)；

然后，对于

中的每一个连接查询q和标准公理β，如果q中存在一个满足β的原子并且适用于g，则用gr(g,β)代替g，对于q中的每个原子g₁,g₂，如果g₁与g2统一，则g1与g2之间对q的统一作用最为普遍，迭代地应用这个规则，直到

中没有公理适用于查询q中的g。

进一步的，步骤S4中，每一个包含有连接概念的正包含通过规则的迭代应用来重写:

如果

发生在

中，那么用两个断言

和

来代替；

中的标准公理通过以下推理规则计算所有负包含展开：

1.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

2.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

3.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

4.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

进一步的，步骤S5中，通过对算法IC_SATISFY

进行如下描述，输入一组标准公理

一组断言

一组IC公理

如果输出的satis满足每个IC-axiom

返回true,否则返回false。具体步骤如下：

S5.1、将satis初始化为true；

S5.2、标准化

S5.3、如果

为空,返回satis,对每个IC-axiom

S5.4、将α转化为连接查询CQ；

S5.5、如果CQ为空，转到步骤S5.3，对于每个cq∈CQ的查询,CQ←CQ\cq；

S5.6、如果

为空，转到步骤S5.5，用T中的公理重写所有cq以获得新增查询Qr,Qr←Qr\{α}，如果Qr为空则返回false；

S5.7、如果Qr为空，则进入步骤S5.5，对于每个qr∈Qr的查询，Qr←Qr\{Qr}；

S5.8、如果

为空，转到步骤S5.7，否则返回false。

本发明所述的基于重写技术的完整性约束验证方法能得到完整性约束的推理，从而改进DL-LiteR的完整性约束验证效果，得到更直观的完整性约束验证结果；该方法可应用于基于本体的软件工程中的需求获取、工作流模型验证和基于本体的科技文献检索过程等本体应用中，可以进一步提高其验证和检索效率。

具体实施方式

下面对基于重写技术的完整性约束验证方法做进一步说明。

实施例1

本发明定义了满足完整性约束的最小模型，提出了一种基于重写技术的完整性约束机制，来得到完整性约束的推理，从而改进DL-LiteR的完整性约束验证。描述逻辑(DLs)作为OWL的逻辑基础，为知识库中的标准推理提供了一种完善的推理算法。为了扩展带有完整性约束的标准描述逻辑知识库，声明了如下定义。

定义1.将扩展描述逻辑知识库

称为完整性约束知识库(IC-KB)，其中

是表示兴趣域的标准知识库，而

是用于检查

的完整性约束公理的集合。

本发明主要研究了DL-LiteR知识库的完整性约束验证方法。DL-Lite系列描述逻辑是一组易于处理的描述逻辑，其设计的具体目标是允许对大量实例数据进行推理，而DL-LiteR是DL-Lite系列一种包含角色包体的描述逻辑。在此基础上，基于最小模型的思想，定义了DL-LiteR本体中完整性约束的满足度，即所有最小模型都满足约束公理。

的最小模型集的表示形式如下：

定义2.设

是一个IC-KB，对于每一个IC公理

满足α时，当且仅当对于

的每一个最小模型

用

表示。更进一步来讲，如果

对于每一个IC-axiom有

则

满足

技术方案如下：

一种基于重写技术的完整性约束方法，步骤如下：

S1、将IC公理转化为连接查询与“not”的结合

S2、将查询主体中的分离词分解为具有相同头部的不同查询，进而转化为连接查询

S3、重写IC验证

S4、根据转换规则对DL-LiteR知识库进行规范化

S5、使用算法检验DL-LiteR知识库是否满足完整性约束

进一步的，步骤S1中，为了在完整性约束验证中坚持封闭世界语义，Glimm等人在连接查询中加入了以“not”表示的否定。在这种查询的概念下，对于一个KB

的连接查询的原子定义如下:

其中A和Ra分别是

的原子概念和原子角色，zi是

中的常数或变量。

定义3.设q是一个连接查询，a是

中出现的约束元组。称

如果，对于每个原子at_i∈q，都存在

那么，对于每个

的模型

都有：

定义4.给定一个查询q和一个KB

q在

上的查询结果为使得对于

的每个模型

都有

的元组a的约束集合

(没有为空)

同时注意，元组a可以是空元组。在这种情况下q在

上的查询结果是空的，用

表示。

进一步的，步骤S2中，众所周知，现在DL语言都是DL

的子集。因此，用表现力强的DL

表示的完整性约束公理(IC-axiom)可以更好地捕捉完整性约束的含义。翻译规则显示如下：

表1，其中π_c、π_r、π分别用于表示翻译概念、角色和公理。主要遵循的思路是，将一个IC公理转换为一个并集的连接查询，这样当关于

的查询为空时，则IC公理被满足，反之，违背IC公理。

根据IC公理转化为连接查询的原理，证明了在封闭世界假设下将完整性约束验证转换为连接查询是完全可行的。

定理1.给定一个

对于每一个

当且仅当

时

进一步的，步骤S3中，重写是自动推理中的一项重要技术。它将查询应答简化为对一组数据库实例的ABox

求值的属性。给定用DL-LiteR表示的标准公理

重写算法使用TBox将一个查询q编译成一个有限的查询集，通过计算这些重写查询对初始ABox的求值，来模拟对整个知识库

的查询求值。

查询重写过程如下所示。

首先，在

中的一个标准公理β适用于查询q的原子g，如果标准公理β的和g右侧具有相同的谓词(概念或作用)名称。用gr(g,β)通过使用合适的公理β来指示从原子g得到的原子。

重写规则如下：

1、关于概念包含公理

-如果β的左边是一个谓词,则gr(g,β)＝A(x)

-如果

则gr(g,β)＝P(x,y)。

-如果

则gr(g,β)＝P(x,y)。

2、关于角色包含公理

-如果g＝P(x1,x2)而且β也是

或者

则gr(g,β)＝P1(x1,x2)。

-如果g＝P(x1,x2)而且β也是

或者

则gr(g,β)＝P1(x1,x2)。

然后，对于

中的每一个连接查询q和标准公理β，如果q中存在一个满足β的原子并且适用于g，则用gr(g,β)代替g。此外，还要消除多余的原子。也就是说，对于q中的每个原子g1,g2，如果g1与g2统一，则g1与g2之间对q的统一作用最为普遍。迭代地应用这个规则，直到

中没有公理适用于查询q中的g。

进一步的，步骤S4中，由于

中的所有公理都属于主连接范式，因此每一个包含有连接概念的正包含都可以通过规则的迭代应用来重写:如果

发生在

中，那么用两个断言

和

来代替。

中的标准公理通过以下推理规则计算所有负包含展开：

1.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

2.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

3.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

4.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

进一步的，步骤S5中，通过对算法IC_SATISFY

进行如下描述，输入一组标准公理

一组断言

一组IC公理

如果输出的satis满足每个IC-axiom

返回true,否则返回false。具体步骤如下：

步骤1、将satis初始化为true

步骤2、标准化

步骤3、如果

为空,返回satis,对每个IC-axiom

步骤4、将α转化为连接查询CQ

步骤5、如果CQ为空，转到步骤3。对于每个cq∈CQ的查询,CQ←CQ\cq

步骤6、如果

为空，转到步骤5。用T中的公理重写所有cq以获得新增查询Qr,Qr←Qr\{α}，如果Qr为空则返回false。

步骤7、如果Qr为空，则进入第5步，对于每个qr∈Qr的查询，Qr←Qr\{Qr}

步骤8、如果

为空，转到步骤7，否则返回false。

下面给出了两个引理和主要定理，来说明在ABox上将完整性约束验证转化为重写的连接查询的原理。

引理1.设

为DL-LiteR的知识库，q为关于

的连接查询的集合，则有

引理2.设

为用DL-LiteR表示的一组标准公理，q为关于

的一个连接查询，PRQ为通过查询重写得到的连接查询的并集。对于每一个用DL-LiteR表示的ABox

有

上面引理的证明类似于Ref中的证明。基于定理1和两个以上的引理，用下面的定理来证明算法1的正确性。

定理2.设

是一个IC-KB，其中

对于每一个IC公理

当且仅当算法IC_SATISFY

时返回真有

证明。如果

那么从定理1可以看到

进一步地，从引理1知道每一个关于

的连接查询的并集的答案与每一个关于

的连接查询的答案的并集是相同的。因此，对于每个查询q∈π(α)，

成立。而且，根据引理2，很明显

因此，对于每个查询q∈PRQ，

成立。它意味着要么所有查询q∈π(α)，

是空的，要么存在一些查询q'∈Q'使得

不是空的，而所有重写后的q'对

的查询的答案都是空的，其中

第一个情况，算法1可以迭代地转到第3步到第6步，在步骤3中处理IC为空，然后返回true。对于第二种情况，只考虑q'。因为对于每个重写的查询rq∈Qr，其中Qr表示rq的重写查询的集合，

是空的，算法1可以转到步骤5，并继续在CQ中检查以下的查询。因此，在这种情况下，它也可以进行步骤3，并返回真。反之亦然。

实施例2

一个DL-LiteR的知识库

它由ABox

{GraduateStudent(John),Professor(Mary),teachTo(Mary,John)}，

TBox

包含

包含ax4：

Student。

IC公理(IC-axiom)ax4被转换成一个连接查询q7的并集。

q7:Professor(x)∧(not teachTo(x,y)∨not Student(y))。

消除分离，获取关联查询。

q8:Professor(x)∧not teachTo(x,y)。

q9:Professor(x)∧not Student(y)。

根据Tao的方法,ABox

上的查询评估被直接使用。

违反了IC的公理3,这时个体mary被侵犯。

然而，事实上，根据标准公理

和GraduateStudent(John)的断言可以推测Student(John)是满意的。在使用本发明的方法时，必须重写q9，因为Tbox公理的右边

和q9有相同的概念“Student”。重写的查询如下：

q10:Professor(x)∧not GraduateStudent(y)。

而且

所以，断言满足IC-axiom ax4，本发明得到了更直观的完整性约束验证结果。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于重写技术的完整性约束验证方法，其特征在于，步骤如下：

S3、重写IC验证；

S4、根据转换规则对DL-LiteR知识库进行规范化；

S5、使用算法检验DL-LiteR知识库是否满足完整性约束。

2.如权利要求1所述的基于重写技术的完整性约束验证方法，其特征在于，步骤S1中，对于一个KB，

的连接查询的原子at定义如下:

其中A和Ra分别是

的原子概念和原子角色，zi是

中的常数或变量。

3.如权利要求1所述的基于重写技术的完整性约束验证方法，其特征在于，步骤S2中，用DL表示的完整性约束公理捕捉完整性约束的含义，翻译规则如下：

的查询为空时，则IC公理被满足，反之，则违背IC公理。

4.如权利要求1所述的基于重写技术的完整性约束验证方法，其特征在于，步骤S3中，重写IC验证步骤如下：

首先，在

重写规则如下：

1、关于概念包含公理：

-如果β的左边是一个谓词,则gr(g,β)＝A(x)；

-如果

则gr(g,β)＝P(x,y)；

-如果

则gr(g,β)＝P(x,y)；

2、关于角色包含公理：

-如果g＝P(x1,x2)而且β也是

或者

则gr(g,β)＝P₁(x₁,x₂)；

-如果g＝P(x1,x2)而且β也是

或者

则gr(g,β)＝P₁(x₁,x₂)；

然后，对于

中没有公理适用于查询q中的g。

5.如权利要求1所述的基于重写技术的完整性约束验证方法，其特征在于，步骤S4中，每一个包含有连接概念的正包含通过规则的迭代应用来重写:

如果

发生在

中，那么用两个断言

和

来代替；

中的标准公理通过以下推理规则计算所有负包含展开：

1.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

2.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

3.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

4.如果

发生在

中，并且

或者

也发生在

中,则将

添加到

。

6.如权利要求1所述的基于重写技术的完整性约束验证方法，其特征在于，步骤S5中，通过对算法IC_SATISFY

进行如下描述，输入一组标准公理

一组断言

一组IC公理

如果输出的satis满足每个IC-axiom

返回true,否则返回false。具体步骤如下：

S5.1、将satis初始化为true；

S5.2、标准化

S5.3、如果

为空,返回satis,对每个IC-axiom

S5.4、将α转化为连接查询CQ；

S5.6、如果

S5.8、如果

为空，转到步骤S5.7，否则返回false。