CN111241296A - 一种基于重写技术的完整性约束验证方法 - Google Patents
一种基于重写技术的完整性约束验证方法 Download PDFInfo
- Publication number
- CN111241296A CN111241296A CN202010009817.0A CN202010009817A CN111241296A CN 111241296 A CN111241296 A CN 111241296A CN 202010009817 A CN202010009817 A CN 202010009817A CN 111241296 A CN111241296 A CN 111241296A
- Authority
- CN
- China
- Prior art keywords
- axiom
- query
- integrity constraint
- verification
- rewriting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于重写技术的完整性约束验证方法,属于语义网络数据处理技术领域。技术要点是:将IC公理转化为连接查询与not的结合,其中not在连接查询中表示否定;将查询主体中的分离词分解为具有相同头部的不同查询,进而转化为连接查询;重写IC验证;根据转换规则对DL‑LiteR知识库进行规范化;使用算法检验DL‑LiteR知识库是否满足完整性约束。有益效果:本发明所述的基于重写技术的完整性约束验证方法能得到完整性约束的推理,从而改进DL‑LiteR的完整性约束验证效果,得到更直观的完整性约束验证结果;该方法可应用于基于本体的软件工程中的需求获取、工作流模型验证和基于本体的科技文献检索过程等本体应用中,可以进一步提高其验证和检索效率。
Description
技术领域
本发明属于语义网络数据处理技术领域,尤其涉及一种基于重写技术的完整性约束验证方法。
背景技术
语义网是万维网的延伸,在万维网中,信息以智能形式表达,使计算机能够更好地理解。本体作为语义Web中表示数据的概念模式,Web本体语言(OWL)是W3C推荐的候选本体语言。社交计算是一种智能的计算模式,它允许用户以社交标签的形式提供简短而丰富的个性化标签,从而参与管理网络数据。它可以在不需要任何专业知识的情况下提高资源检索和识别的效率。
但是,这些被标记的数据不能保证是正确的,所以有需要验证这些被标记的数据的正确性。目前针对解决语义网络中的一般语法错误和逻辑冲突有几种成熟的工具。但是对于大多数以数据为中心的应用程序,还需要考虑用户的约束。以微信为例,需要限制人的数量、单词的数量等。这些约束需要以规则的形式表示,并在其他社会计算应用程序中自动验证和修复。因此,需要在本体中引入完整性约束。完整性约束最初是在数据库和人工智能知识表示语言中提出的,以保证知识库可以接受的合法状态。可以将它们添加到本体中,以保证OWL本体中数据的合法状态。
这项工作有很长研究时间。现有的一些方法是使用具有认知算子和非单调规则的公式来对完整性约束建模。然而,这些建模方式修改了标准DL知识库的语法,所以不再适合在DL知识库中进行标准推理。基于此,研究人员想要在DL知识库中修改公理的语义来满足完整性约束的语义,并使用最小模型来定义完整性约束的满足度。最近的相关工作由陶[1]等人提出,基于将完整性约束验证转换为用SPARQL查询答案的想法。然而,由于标准DL知识库的特点,标SPARQL查询只关注ABox实例而忽略了标准推理。所以它可能会丢失在完整性约束验证中很重要的DL知识库中的标准推理结果。
[1]Tao,J.,Sirin,E.,Bao,J.,McGuinness,D.:Integrity constraints inOWL.In:AAAI,pp.11–15(2010)
发明内容
为了解决上述现有技术中存在的问题,本发明提出一种基于重写技术的完整性约束验证方法,该方法能得到完整性约束的推理,从而改进DL-LiteR的完整性约束验证效果。
技术方案如下:
一种基于重写技术的完整性约束验证方法,步骤如下:
S1、将IC公理转化为连接查询与not的结合,其中not在连接查询中表示否定;
S2、将查询主体中的分离词分解为具有相同头部的不同查询,进而转化为连接查询;
S3、重写IC验证;
S4、根据转换规则对DL-LiteR知识库进行规范化;
S5、使用算法检验DL-LiteR知识库是否满足完整性约束。
at←A(z)|Ra(z1,z2)|not A(z)|not Ra(z1,z2)|z1,z2|not z1=z2
进一步的,步骤S2中,用DL表示的完整性约束公理捕捉完整性约束的含义,翻译规则如下:
进一步的,步骤S3中,重写IC验证步骤如下:
重写规则如下:
1、关于概念包含公理:
-如果β的左边是一个谓词,则gr(g,β)=A(x);
2、关于角色包含公理:
然后,对于中的每一个连接查询q和标准公理β,如果q中存在一个满足β的原子并且适用于g,则用gr(g,β)代替g,对于q中的每个原子g1,g2,如果g1与g2统一,则g1与g2之间对q的统一作用最为普遍,迭代地应用这个规则,直到中没有公理适用于查询q中的g。
进一步的,步骤S4中,每一个包含有连接概念的正包含通过规则的迭代应用来重写:
S5.1、将satis初始化为true;
S5.4、将α转化为连接查询CQ;
S5.5、如果CQ为空,转到步骤S5.3,对于每个cq∈CQ的查询,CQ←CQ\cq;
S5.7、如果Qr为空,则进入步骤S5.5,对于每个qr∈Qr的查询,Qr←Qr\{Qr};
本发明所述的基于重写技术的完整性约束验证方法能得到完整性约束的推理,从而改进DL-LiteR的完整性约束验证效果,得到更直观的完整性约束验证结果;该方法可应用于基于本体的软件工程中的需求获取、工作流模型验证和基于本体的科技文献检索过程等本体应用中,可以进一步提高其验证和检索效率。
具体实施方式
下面对基于重写技术的完整性约束验证方法做进一步说明。
实施例1
本发明定义了满足完整性约束的最小模型,提出了一种基于重写技术的完整性约束机制,来得到完整性约束的推理,从而改进DL-LiteR的完整性约束验证。描述逻辑(DLs)作为OWL的逻辑基础,为知识库中的标准推理提供了一种完善的推理算法。为了扩展带有完整性约束的标准描述逻辑知识库,声明了如下定义。
本发明主要研究了DL-LiteR知识库的完整性约束验证方法。DL-Lite系列描述逻辑是一组易于处理的描述逻辑,其设计的具体目标是允许对大量实例数据进行推理,而DL-LiteR是DL-Lite系列一种包含角色包体的描述逻辑。在此基础上,基于最小模型的思想,定义了DL-LiteR本体中完整性约束的满足度,即所有最小模型都满足约束公理。的最小模型集的表示形式如下:
技术方案如下:
一种基于重写技术的完整性约束方法,步骤如下:
S1、将IC公理转化为连接查询与“not”的结合
S2、将查询主体中的分离词分解为具有相同头部的不同查询,进而转化为连接查询
S3、重写IC验证
S4、根据转换规则对DL-LiteR知识库进行规范化
S5、使用算法检验DL-LiteR知识库是否满足完整性约束
at←A(z)|Ra(z1,z2)|not A(z)|not Ra(z1,z2)|z1,z2|not z1=z2
根据IC公理转化为连接查询的原理,证明了在封闭世界假设下将完整性约束验证转换为连接查询是完全可行的。
进一步的,步骤S3中,重写是自动推理中的一项重要技术。它将查询应答简化为对一组数据库实例的ABox求值的属性。给定用DL-LiteR表示的标准公理重写算法使用TBox将一个查询q编译成一个有限的查询集,通过计算这些重写查询对初始ABox的求值,来模拟对整个知识库的查询求值。
查询重写过程如下所示。
重写规则如下:
1、关于概念包含公理
-如果β的左边是一个谓词,则gr(g,β)=A(x)
2、关于角色包含公理
然后,对于中的每一个连接查询q和标准公理β,如果q中存在一个满足β的原子并且适用于g,则用gr(g,β)代替g。此外,还要消除多余的原子。也就是说,对于q中的每个原子g1,g2,如果g1与g2统一,则g1与g2之间对q的统一作用最为普遍。迭代地应用这个规则,直到中没有公理适用于查询q中的g。
进一步的,步骤S4中,由于中的所有公理都属于主连接范式,因此每一个包含有连接概念的正包含都可以通过规则的迭代应用来重写:如果发生在中,那么用两个断言和来代替。中的标准公理通过以下推理规则计算所有负包含展开:
步骤1、将satis初始化为true
步骤4、将α转化为连接查询CQ
步骤5、如果CQ为空,转到步骤3。对于每个cq∈CQ的查询,CQ←CQ\cq
步骤7、如果Qr为空,则进入第5步,对于每个qr∈Qr的查询,Qr←Qr\{Qr}
下面给出了两个引理和主要定理,来说明在ABox上将完整性约束验证转化为重写的连接查询的原理。
上面引理的证明类似于Ref中的证明。基于定理1和两个以上的引理,用下面的定理来证明算法1的正确性。
证明。如果那么从定理1可以看到进一步地,从引理1知道每一个关于的连接查询的并集的答案与每一个关于的连接查询的答案的并集是相同的。因此,对于每个查询q∈π(α),成立。而且,根据引理2,很明显因此,对于每个查询q∈PRQ,成立。它意味着要么所有查询q∈π(α),是空的,要么存在一些查询q'∈Q'使得不是空的,而所有重写后的q'对的查询的答案都是空的,其中第一个情况,算法1可以迭代地转到第3步到第6步,在步骤3中处理IC为空,然后返回true。对于第二种情况,只考虑q'。因为对于每个重写的查询rq∈Qr,其中Qr表示rq的重写查询的集合,是空的,算法1可以转到步骤5,并继续在CQ中检查以下的查询。因此,在这种情况下,它也可以进行步骤3,并返回真。反之亦然。
实施例2
IC公理(IC-axiom)ax4被转换成一个连接查询q7的并集。
q7:Professor(x)∧(not teachTo(x,y)∨not Student(y))。
消除分离,获取关联查询。
q8:Professor(x)∧not teachTo(x,y)。
q9:Professor(x)∧not Student(y)。
和GraduateStudent(John)的断言可以推测Student(John)是满意的。在使用本发明的方法时,必须重写q9,因为Tbox公理的右边和q9有相同的概念“Student”。重写的查询如下:
q10:Professor(x)∧not GraduateStudent(y)。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于重写技术的完整性约束验证方法,其特征在于,步骤如下:
S1、将IC公理转化为连接查询与not的结合,其中not在连接查询中表示否定;
S2、将查询主体中的分离词分解为具有相同头部的不同查询,进而转化为连接查询;
S3、重写IC验证;
S4、根据转换规则对DL-LiteR知识库进行规范化;
S5、使用算法检验DL-LiteR知识库是否满足完整性约束。
4.如权利要求1所述的基于重写技术的完整性约束验证方法,其特征在于,步骤S3中,重写IC验证步骤如下:
重写规则如下:
1、关于概念包含公理:
-如果β的左边是一个谓词,则gr(g,β)=A(x);
2、关于角色包含公理:
6.如权利要求1所述的基于重写技术的完整性约束验证方法,其特征在于,步骤S5中,通过对算法IC_SATISFY进行如下描述,输入一组标准公理一组断言一组IC公理如果输出的satis满足每个IC-axiom返回true,否则返回false。具体步骤如下:
S5.1、将satis初始化为true;
S5.4、将α转化为连接查询CQ;
S5.5、如果CQ为空,转到步骤S5.3,对于每个cq∈CQ的查询,CQ←CQ\cq;
S5.7、如果Qr为空,则进入步骤S5.5,对于每个qr∈Qr的查询,Qr←Qr\{Qr};
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010009817.0A CN111241296A (zh) | 2020-01-06 | 2020-01-06 | 一种基于重写技术的完整性约束验证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010009817.0A CN111241296A (zh) | 2020-01-06 | 2020-01-06 | 一种基于重写技术的完整性约束验证方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111241296A true CN111241296A (zh) | 2020-06-05 |
Family
ID=70870810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010009817.0A Pending CN111241296A (zh) | 2020-01-06 | 2020-01-06 | 一种基于重写技术的完整性约束验证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111241296A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101093493A (zh) * | 2006-06-23 | 2007-12-26 | 国际商业机器公司 | 数据库查询语言转换方法、转换装置、数据库查询系统 |
CN101996208A (zh) * | 2009-08-31 | 2011-03-30 | 国际商业机器公司 | 用于数据库语义查询回答的方法及系统 |
CN109784491A (zh) * | 2018-12-15 | 2019-05-21 | 中国人民解放军陆军工程大学 | 基于描述逻辑的服务编导模型形式化验证方法 |
-
2020
- 2020-01-06 CN CN202010009817.0A patent/CN111241296A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101093493A (zh) * | 2006-06-23 | 2007-12-26 | 国际商业机器公司 | 数据库查询语言转换方法、转换装置、数据库查询系统 |
CN101996208A (zh) * | 2009-08-31 | 2011-03-30 | 国际商业机器公司 | 用于数据库语义查询回答的方法及系统 |
CN109784491A (zh) * | 2018-12-15 | 2019-05-21 | 中国人民解放军陆军工程大学 | 基于描述逻辑的服务编导模型形式化验证方法 |
Non-Patent Citations (1)
Title |
---|
XIANJI CUI等: "Integrity Constraint Validation in DL-LiteR Based Ontology Using Rewriting", 2016国际青年计算机大会 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Knorr et al. | Local closed world reasoning with description logics under the well-founded semantics | |
Kalfoglou et al. | Ontology mapping: the state of the art | |
Bienvenu et al. | Inconsistency-tolerant querying of description logic knowledge bases | |
CN107844482A (zh) | 基于全局本体的多数据源模式匹配方法 | |
CN112559766B (zh) | 一种法律知识图谱构建系统 | |
Franconi et al. | Exact query reformulation over databases with first-order and description logics ontologies | |
Anand et al. | Uncertainty analysis in ontology-based knowledge representation | |
Orgun et al. | Approaches for semantic interoperability between domain ontologies | |
Fahad | Merging of axiomatic definitions of concepts in the complex OWL ontologies | |
Yin et al. | A deep natural language processing‐based method for ontology learning of project‐specific properties from building information models | |
Gogacz et al. | Datalog rewritability and data complexity of ALCHOIF with closed predicates | |
CN116561264A (zh) | 一种基于知识图谱的智能问答系统的构建方法 | |
Gómez et al. | An argumentative approach to reasoning with inconsistent ontologies | |
Sangeetha et al. | Information retrieval system for laws | |
CN111241296A (zh) | 一种基于重写技术的完整性约束验证方法 | |
Tulasi et al. | Survey on techniques for ontology interoperability in semantic web | |
Du et al. | A new matchmaking approach based on abductive conjunctive query answering | |
Wang | A framework and architecture for quality assessment in data integration | |
Groza et al. | Fact-checking with explanations | |
Blass | Symbioses between mathematical logic and computer science | |
KR20210033345A (ko) | 지식 베이스 보강을 위한 시스템 및 방법 | |
Buccella et al. | A federated layer to integrate heterogeneous knowledge | |
Ivanova | Managing uncertainty in ontology mapping in e-learning context | |
Fahad | Toward analyzing impact of disjoint axioms for merging heterogeneous ontologies | |
Ma et al. | A formal framework for ontology integration based on a default extension to ddl |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |