CN109829056A - 谓词解释模板驱动的事实溯因推理方法 - Google Patents

谓词解释模板驱动的事实溯因推理方法 Download PDF

Info

Publication number
CN109829056A
CN109829056A CN201811356079.6A CN201811356079A CN109829056A CN 109829056 A CN109829056 A CN 109829056A CN 201811356079 A CN201811356079 A CN 201811356079A CN 109829056 A CN109829056 A CN 109829056A
Authority
CN
China
Prior art keywords
fact
explanation
template
knowledge mapping
predicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811356079.6A
Other languages
English (en)
Inventor
杜剑峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Foreign Studies
Original Assignee
Guangdong University of Foreign Studies
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Foreign Studies filed Critical Guangdong University of Foreign Studies
Priority to CN201811356079.6A priority Critical patent/CN109829056A/zh
Publication of CN109829056A publication Critical patent/CN109829056A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种针对附带OWL 2 DL本体的知识图谱的谓词解释模板驱动的事实溯因推理方法,属于人工智能领域。本发明的主要特征在于生成本体中每个谓词的解释模板,并利用这些解释模板对给定的新事实进行溯因推理,返回匹配解释模板的所有最小溯因解释。发明内容主要包括交替产生可推断事实的解释及其所属谓词的解释模板、引入个体重写机制抽取包含解释全集的知识图谱模块以加速解释模板的生成,以及基于解释模板计算给定事实的最小溯因解释。本发明为附带复杂本体的知识图谱提供了一种实用的溯因推理方法,适用于知识图谱的事实验证,保证知识图谱的构建质量。

Description

谓词解释模板驱动的事实溯因推理方法
技术领域
本发明涉及一种针对附带OWL 2 DL本体的知识图谱的谓词解释模板驱动的事实溯因推理方法,属于人工智能领域。该方法适用于知识图谱的事实验证,保证知识图谱的构建质量。
背景技术
知识图谱(Knowledge Graph)是目前人工智能领域的研究热点之一。它旨在描述客观世界的概念、实体、事件及其之间的关系,可以简单地表示为(实体,关系,实体)三元组的集合。2012年5月,谷歌公司发布谷歌知识图谱(Google Knowledge Graph),并宣布以此为基础构建下一代智能化搜索引擎。这是“知识图谱”名称的由来,也标志着大规模知识图谱在语义搜索中的成功应用。谷歌知识图谱在2012年发布后一石激起千层浪,微软必应、搜狗、百度等搜索引擎公司在短短一年内纷纷宣布了各自的知识图谱产品,如百度“知心”、搜狗“知立方”(现改名为“立知”)等。随后,以社交为主战场的腾讯利用其数据优势构建了自己的社交知识图谱,以电商为主战场的阿里巴巴也基于自身的数据库建立起了知识图谱。根据“甲子光年”机构的报道(http://www.sohu.com/a/207179127_100016644),国内除了BAT三大巨头外,不少知识图谱创业公司在近年也逐步发展起来,立足于智能客服、金融、法律、公安、航空和医疗等知识密集型领域。
知识图谱在学术界也受到了越来越多的关注,研究工作的重点逐步从小规模的人工构建知识图谱转变为大规模的自动/半自动构建知识图谱。以国内为例,早期的中文知识图谱主要采用人工编辑的方式进行构建,其特点是规模相对较小、知识质量高、但领域限定性较强,例如中国科学院计算机语言信息中心的知网(Hownet)项目。随着大规模知识图谱在业界需求的增长,国内不少学术团体都发起了知识图谱相关的研究项目。比如,清华大学建成了第一个大规模中英文跨语言知识图谱XLore;中国科学院计算技术研究所基于开放知识网络建立了“人立方、事立方、知立方”原型系统;中国科学院数学与系统科学研究院陆汝钤院士提出了知件概念;上海交通大学构建并发布了中文知识图谱研究平台Zhishi.me;复旦大学知识工场实验室推出了CN-DBPedia和CN-Probase等中文知识图谱项目;中文开放知识图谱联盟组织OpenKG.CN发布了上百个不同领域的知识图谱,开放了数十个知识图谱构建与管理的工具。
为了实现知识图谱的最大价值,知识图谱应能随着大数据的演化而演化,不断自我扩张、消化吸收新数据,持续完善知识体系。为了保证自我演化的知识图谱的质量,我们需要人工判定新增三元组的真实性。由于在不少领域,每天都会出现大量的新事实,可以往知识图谱中添加的三元组是很多的,因此降低人工判定三元组真实性的成本是保证知识图谱质量的关键。
辅助人工判定三元组真实性需要使用逻辑信息。基于逻辑的溯因推理(logic-based abductive reasoning),简称溯因推理(abductive reasoning),可以实现三元组真实性验证的推理过程。溯因推理根据给定三元组和背景知识库,计算能在背景知识库中添加的三元组,以推断出给定的三元组,这里的背景知识库由当前知识图谱及其附带的本体所构成。我们将这种在背景知识库中添加的三元组集合称作给定三元组的溯因解释。然后,我们就可以根据溯因解释从固定的数据源或者万维网中检索相关的证据资料。但是,计算溯因解释本身是一个难题,因为溯因解释由背景知识库外的事实所构成,搜索空间非常庞大。因此,我们需要面对的挑战性问题是如何快速计算溯因解释。本发明立足于解决这个挑战性问题,提出计算溯因解释的实用近似方法,目标是快速找出有限多个具备一定合理性的溯因解释。
发明内容
在国家自然科学基金项目(编号61876204)和广州市科技计划项目(编号201804010496) 的联合资助下,本发明提出一种基于解释模板的近似溯因推理方法,解决在复杂本体下高效计算最小溯因解释的难题。
为了保证发明的方法适用于尽可能复杂的本体,我们假定知识图谱附带的本体可以使用 OWL 2 DL语言来表达。OWL 2 DL是万维网联盟(W3C)推荐的最新版本体表示语言,是目前业界和学术界广泛使用的一阶谓词逻辑语言的最大可判定子集,能保证传统的演绎推理 (deductive reasoning)在有限时间内完成。此外,为了定义合理的溯因解释,我们假定合理的溯因解释必须沿用演绎推理的模板;也就是说,给定新事实在当前知识图谱及其附带本体下的最小溯因解释E应该跟在附带本体下当前知识图谱能够推断的含有相同谓词的事实的某个解释E*匹配共同的模板。其中,新事实α的最小溯因解释是添加到当前知识图谱中的最小事实集合,其在附带本体下能够使扩展的知识图谱推断出α;可推断事实α的解释是在附带本体下能够推断α的最小知识图谱事实子集;模板是将个体替换为变量的新事实集合表示;最小溯因解释E匹配某个模板P是指E是通过将模板P中不同变量替换为不同个体后得到的某个事实集合的子集;而可推断事实的解释E匹配某个模板P则是指E是通过将模板P中不同变量替换为不同个体后得到的某个事实集合。
基于上述假设,本发明提出一种两阶段的近似溯因推理方法,针对附带OWL 2 DL本体的知识图谱和给定的新事实,计算沿用演绎推理模板的最小溯因解释全集。阶段1根据知识图谱中的事实和附带的OWL 2 DL本体,计算本体中每个谓词即类或属性对应的可推断事实集合,并基于这些可推断事实集合计算每个谓词的解释模板,其中解释模板是将解释中不同个体替换为不同变量后得到的事实集合。阶段2针对给定的新事实,根据阶段1得到的解释模板计算匹配解释模板的所有最小溯因解释,其中溯因解释匹配解释模板是指该溯因解释是通过将解释模板中不同变量替换为不同个体后得到的某个事实集合的子集。
上述方法的性能瓶颈在于阶段1。为此,本发明采用模块优化技术和交替计算可推断事实解释及其所属谓词解释模板的方式来生成给定谓词的所有解释模板。这里的模块化技术用于抽取包含给定可推断事实所有解释的知识图谱模块,其中知识图谱模块是指由知识图谱中部分事实构成的集合。模块化的大致做法是将知识图谱及其附带本体一起近似成datalog程序,计算该程序的最小不动点,并利用该最小不动点抽取包含给定可推断事实所有解释的知识图谱模块,其中datalog程序的最小不动点是该程序可能推断的所有事实的集合。采用交替计算可推断事实解释及其所属谓词解释模板的方式可以大大加速解释模板的生成过程。大致的做法是:在处理含有给定谓词的每个可推断事实时,利用上述的模块优化技术抽取包含该事实所有解释的知识图谱模块,并在该模块上计算该事实的解释;利用解释集合与其最小碰撞集的对偶关系,递增计算可推断事实的新解释,并将该解释中不同的个体替换为不同的变量,得到新的解释模板,其中解释集合的最小碰撞集是指与每个解释都有非空交集的最小集合;得到新的解释模板后,将匹配该解释模板的可推断事实的所有解释添加到解释集合中。上述所有的推断判定过程都通过调用OWL 2 DL推理机HermiT来实现。
上面阐述的模块化技术是提高可推断事实解释全集计算效率的关键,因为OWL 2DL推理机HermiT只能在内存中进行推理,它难以处理知识图谱中的全部事实。虽然模块抽取的过程不调用OWL 2 DL推理机,但它的计算代价还是相当高的。特别是当附带本体包含数量约束公理比如函数性属性定义时,最小不动点的计算过程会产生可能推断的个体相等事实。基于OWL 2 DL本体通常采纳的开放世界假设,我们需要利用相等谓词的公理化语义,从个体相等事实推断出更多的个体相等事实和其他类从属关系或属性从属关系事实。这样必然会产生规模很大的最小不动点,导致很高的时间复杂度和空间复杂度。为了解决个体相等事实带来的效率问题,本发明进一步引入个体重写技术来优化最小不动点的计算和使用过程。大致做法是:在最小不动点计算过程中,每当产生一个可能推断的个体相等事实,则产生一条将相等事实中较大编号个体替换为相等事实中较小编号个体的重写规则,并将该重写规则应用于当前的最小不动点;此外,利用压缩的最小不动点抽取包含所有解释的知识图谱模块后,将知识图谱中能够通过重写规则转换成模块内事实的所有事实都加入到模块中。
附图说明
附图1是本发明提出的近似溯因推理方法的整体流程图,其中上半部分概述了阶段1的解释模板计算过程,下半部分概述了阶段2的最小溯因解释计算过程。附图2给出了阶段1 算法流程的实现伪代码。附图3给出了阶段2算法流程的实现伪代码。下面的具体实施方式将会给出这些伪代码中特定函数和未定义符号的详细说明。
具体实施方式
本发明包括两个阶段,阶段1是解释模板计算过程,阶段2是最小溯因解释计算过程。
阶段1的总体流程可以参见附图2给出的算法ComputeJustificationPatterns的伪代码。调用该算法前,我们假定输入的知识图谱中所有三元组都转换为对应的事实形式,即 (h,type,t)形式的实体类型定义三元组转换为类从属关系事实t(h),而其他形式的三元组 (h,r,t)转换为属性从属关系事实r(h,t)。注意OWL 2 DL本体由三个互不相交的元素集合所构成,包括类(class)、属性(property)和个体(individual)。该算法首先列出附带OWL 2 DL本体中所有的谓词即类或者属性(见行1),然后针对每个谓词p的谓词模板p(vec{x}),计算它的解释模板集(见行3到行17的循环体),其中vec{x}表示变量向量,当谓词p是类时vec{x}由一个变量构成,而当谓词p是属性时vec{x}由两个变量构成。
在计算给定谓词模板p(vec{x})的解释模板集时,算法先计算匹配该谓词模板的在附带本体下知识图谱能够推断的事实集合(见行4),然后针对该事实集合中每个事实p(vec{t}),交替计算该事实的解释全集以及由解释提升得到的解释模板集合(见行6到行15的循环体)。在计算p(vec{t})的解释全集时,算法先根据当前已经得到的解释模板集合SP调用函数 RetrieveJustifications(G,T,SP,vec{x}→vec{t})提取匹配SP中某个解释模板的所有解释 (见行7)。该函数寻找作用于SP中每个解释模板P的所有{vec{x}→vec{t}}-扩展的区别替换θ,构成能作为候选解释的知识图谱G的子集Pθ,其中作用于P的{vec{x}→vec{t}}-扩展的区别替换是指将P中vec{x}包含变量替换为vec{t}而其他不同变量替换为其他不同个体的替换(subsitution)。然后,该函数仅保留满足T∪Pθ|=p(vec{t})但对于Pθ任意真子集 P*都不满足T∪P*|=p(vec{t})的候选解释Pθ作为p(vec{t})的解释,其中K|=α表示知识库 K能够推断出事实α。上述针对OWL 2 DL知识库的推断判定和谓词实例检索都采用开源的OWL 2 DL推理机HermiT来实现。
在提取了匹配解释模板的解释集合SE后,算法调用函数ComputeNewJustification (G,T,SE,p(vec{t}))计算在本体T下p(vec{t})在知识图谱G中的新解释E,即不在SE中的解释。该函数调用是阶段1的效率瓶颈,本发明引入模块优化技术来提高该函数的执行效率。
针对p(vec{t})新解释的计算,阶段1事先计算包含p(vec{t})所有解释的知识图谱模块。该知识图谱模块的计算步骤如下。
步骤1:通过标准的描述逻辑结构转换(description logic structuraltransformation) 过程、消除存在约束量词的Skolemization过程,以及标准的个体相等谓词公理化过程,将输入的附带OWL 2 DL本体T转换为仅有全称约束量词的一阶谓词逻辑规则集合。在该规则集合中,含有函数符号的规则头形式必然是r(x,f(x))、r(f(x),x)和A(f(x))之一,其中r是属性名、A是类名、x是规则体中出现的个体变量。
步骤2:将知识图谱和附带本体中出现的个体映射为从0开始的自然数,构成以自然数构成的原始个体域{0,…,N-1},其中N是个体总数。根据步骤1中得到的一阶谓词逻辑规则的函数符号,将形式为fi(a)的个体映射为自然数iN+ma,其中fi表示第i个函数符号,ma是个体 a的映射自然数。这样将原始个体域扩展为{0,…,MN-1},其中M是函数符号的总数。
步骤3:通过将规则头r(x,f(x))改写成r(x,xf)、r(f(x),x)改写成r(xf,x)以及A(f(x))改写成A(xf),将步骤1中得到的所有一阶谓词逻辑规则近似成datalog规则,其中xf是对应 f(x)的新变量。若某个datalog规则的规则头变量x不在规则体中出现,则在规则体中添加原子dom(x),变成安全(safe)的datalog规则,其中dom是不在附带本体中出现的新谓词。将知识图谱中的三元组看成datalog事实,得到原始的datalog事实集,并添加所有形式为 dom(a)的事实,得到扩展的datalog事实集,其中个体a是原始个体或形式为bf的个体(b也是原始个体)。我们将datalog事实看作规则体为空的datalog规则,并将由安全的datalog 规则集和扩展的datalog事实集的并集看成一个datalog程序(datalogprogram)。
步骤4:在扩展个体域{0,…,MN-1}下,计算步骤3得到的datalog程序P的最小不动点。我们将规则R中规则头的原子集合记作head(R)、规则体的原子集合记作body(R)。则P的最小不动点为下面集合序列的收敛结果:S(0)=φ且对于t>0, 其中map(S)是将事实集合S中形式为afi的个体映射成自然数iN+(mamod N)而其他个体a映射成ma后得到的事实集合,其中fi表示第i个函数符号,ma是个体a在扩展个体域{0,…,MN-1}中的映射值。上述最小不动点的计算方式保证最小不动点由扩展个体域和步骤1得到的一阶谓词逻辑规则集中的谓词所构成。
步骤5:针对给定的可推断事实p(vec{t}),计算步骤4得到的最小不动点Slfp中map({p(vec{t})})的可达知识图谱模块M=ReachableModule(map({p(vec{t})}),Slfp)。其中,对于事实集合S,函数ReachableModule(S,Slfp)定义为下面集合序列的收敛结果:S(0)=S且对于t>0,
步骤6:如果步骤3得到的datalog程序含有析取规则即规则头是由多个原子的或关系构成的规则,则计算对于S中的某个事实集合 map(bodyθ(R)),计算其可达知识图谱模块M*=ReachableModule(map(bodyθ(R))),Slfp);若M与M*的交集非空,则将M*添加到M中。
步骤7:返回事实集合它就是在附带本体T下包含p(vec{t})所有解释的知识图谱G的子集即知识图谱模块。
虽然上述知识图谱模块的抽取过程不调用OWL 2 DL推理机,但它的计算代价还是相当高的。特别是当附带本体包含数量约束公理比如函数性属性定义时,最小不动点的计算过程会产生可能推断的个体相等事实。我们需要利用相等谓词的公理化语义,从个体相等事实推断出更多的个体相等事实和其他类从属关系或属性从属关系事实。这样必然会产生规模很大的最小不动点,导致很高的时间复杂度和空间复杂度。为了解决个体相等事实带来的效率问题,本发明进一步引入个体重写技术来优化最小不动点的计算和使用过程。
在datalog程序最小不动点Slfp的计算过程即上述的步骤4中,我们将datalog程序中用于公理化个体相等谓词的datalog规则删掉。为了达到与公理化个体相等谓词同等的效果,我们对扩展个体域中每个元素m都引入其代表值rep(m),并初始化rep(m)为m。每当往S(t)中添加形式为ma≈mb的个体相等事实时,若rep(ma)<rep(mb),则我们建立形式为mb→ma的重写规则,否则若rep(mb)<rep(ma),则我们建立形式为ma→mb的重写规则。一旦产生重写规则 ma1→ma2,则将原来等于rep(ma1)的所有扩展个体域元素的代表值修改为rep(ma2),并将该规则应用于当前得到的S(t),即将S(t)中出现的所有个体映射值ma1替换为ma2。此外,针对规则头中包含个体相等原子的datalog规则R,我们可以进一步优化寻找满足的替换θ的过程。
在删除那些用于公理化个体相等谓词的datalog规则后,在规则头中包含个体相等原子的datalog规则仅有下面四种形式。
形式1:
形式2:
形式3:
形式4:
由于满足rep(ma)=rep(mb)的规则头事实ma≈mb不需要处理,我们可以限定替换形式1或2 中yi的扩展个体域元素序列以及替换形式3或4中xi的扩展个体域元素序列m1,…,mk满足 rep(m1)=rep(m2)=…=rep(mt),并且对于符合t≤i<j≤k的任意i和j,满足rep(mi)<rep(mj),其中t=min(k-1,tmax),而对于形式1或形式2,tmax是满足的代表值等于rep(y1θ)的扩展个体域元素个数,对于形式3或形式4,tmax是满足的代表值等于rep(x1θ)的扩展个体域元素个数。上述限定能大幅度减少有效替换θ的个数,进一步加快最小不动点的计算过程。
在datalog程序最小不动点Slfp的应用过程即上述的步骤7中,由于Slfp已经被压缩,其中出现的扩展个体域元素可能代表多个不同的扩展个体域元素,因此我们需要扩展返回的知识图谱模块。由于代表值相同的扩展个体域元素会在未压缩的最小不动点中任何对应的事实内一起出现,即若rep(ma)=rep(mb),则未压缩的最小不动点Slfp+中任意含有ma的事实p(vec{t}) 在Slfp+中必有对应的事实p(vec{t}|{ma→mb}),其中vec{t}|{ma→mb}表示将vec{t}中ma替换为mb的个体向量,因此返回的知识图谱模块扩展为其中 rep(map({α}))表示将map({α})中每个扩展个体域元素m替换为rep(m)后得到的事实。
在得到包含p(vec{t})所有解释的知识图谱模块M后,函数ComputeNewJustification(G, T,SE,p(vec{t}))在M中而不是在G中计算p(vec{t})的新解释,即不在当前解释集合SE内的解释。这个新解释的计算依赖于当前解释集合SE的最小碰撞集,其中SE的每个最小碰撞集都是与SE中每个解释有非空交集的最小集合。在枚举SE的最小碰撞集时,若发现某个最小碰撞集H相对于M的补集即M-H能在附带本体T下推断出p(vec{t}),则说明M-H包含p(vec{t}) 的新解释,这时就可以通过从M-H开始逐个减少M-H内事实的策略计算推断p(vec{t})的新解释E,并将E作为函数的返回值;若对于SE的所有最小碰撞集H,M-H都不能在附带本体T 下推断p(vec{t}),则将null作为函数的返回值,表示不能找到p(vec{t})的新解释。上述所有推断判定过程都采用开源的OWL 2 DL推理机HermiT来实现。
若函数ComputeNewJustification(G,T,SE,p(vec{t}))返回了p(vec{t})的新解释E,则阶段1算法通过将E中不同个体替换为不同变量(其中vec{t}必须替换为vec{x})得到新的解释模板P(见行10)。然后调用函数RetrieveJustifications(G,T,{P},vec{x}→vec{t}) 计算匹配解释模板P的所有解释(包括E),并将这些解释添加到SE中(见行11)。接着,算法继续调用函数ComputeNewJustification(G,T,SE,p(vec{t}))寻找p(vec{t})的新解释,并重复上述步骤,直到不能找到新解释为止(见行9到行14的循环体)。
对于谓词模板p(vec{x}),在计算了所有可推断实例p(vec{t})的所有解释及其对应的解释模板后,算法就得到了该谓词模板对应的解释模板全集。最后,算法将该谓词模板与对应解释模板全集构成的二元组添加到算法的返回结果中(见行16)。
阶段2的总体流程可以参见附图3给出的算法ComputePatternBasedExplanations的伪代码。该算法假定待计算溯因解释的事实p(vec{t})不能被知识图谱G及其附带本体T的并集T∪G所推断,不然p(vec{t})只有唯一的等于空集的最小溯因解释,我们不需要利用算法来寻找p(vec{t})的溯因解释。
在算法执行过程中,谓词模板p(vec{x})对应的解释模板P是逐个处理的。由于基于解释模板的最小溯因解释定义为解释模板某个实例的子集,因此算法考虑了P的所有二分结果(P1,P2),其满足P1∩P2=φ且P1∪P2=P,其中P1用于生成解释模板实例中能被T∪G推断的部分,而P2用于生成解释模板实例中作为最小溯因解释的部分。由于最小溯因解释非空,所以P2不能为空。对于作用于P1的所有替换θ,算法仅考虑P1θ能被T∪G所推断的{vec{x}→vec{t}} 扩展的区别替换({vec{x}→vec{t}}-extended differentiatedsubstitution),它是将P1中vec{x}包含变量替换为vec{t}而其他不同变量替换为其他不同个体的替换。算法继而考虑作用于P2的θ扩展的区别替换σ,即由替换θ扩展得到的将不同变量替换为不同个体的替换。如果P2σ中任意事实都不能被T∪G所推断(这是保证P2σ最小性的必要条件),T∪G∪P2σ逻辑一致(记作T∪G∪P2σ|≠⊥)且能推断p(vec{t}),并且比P2σ少一个元素的任意集合 P*即任意P*∈sub1(P2σ)都不能使p(vec{t})被T∪G∪P*所推断(这是保证P2σ最小性的充要条件),那么P2σ就是一个针对p(vec{t})的基于谓词模板的最小溯因解释。算法将按照上述过程产生的所有P2σ添加到返回结果中(见行3)。上述所有推断判定过程和逻辑一致判定过程都采用开源的OWL 2 DL推理机HermiT来实现。
以上实施仅为本发明的其中一种实施方式,其描述较为具体详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的情况下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种针对附带OWL 2 DL本体的知识图谱的谓词解释模板驱动的事实溯因推理方法,其特征在于该方法包括以下两个阶段:
阶段1根据知识图谱中的事实和附带的OWL 2 DL本体,计算本体中每个谓词即类或属性对应的可推断事实集合,并基于这些可推断事实集合计算每个谓词的解释模板,其中给定事实的解释是指在附带本体下能够推断出给定事实的最小的知识图谱事实子集,解释模板是将解释中不同个体替换为不同变量后得到的事实集合;
阶段2针对给定的新事实,根据阶段1得到的解释模板计算匹配解释模板的所有最小溯因解释,其中给定事实的最小溯因解释是在附加本体下添加到知识图谱中可以推断出给定事实的最小事实集合,而我们称溯因解释匹配解释模板,当且仅当该溯因解释是通过将解释模板中不同变量替换为不同个体后得到的事实集合的子集。
2.根据权利要求1中提出的阶段1解释模板计算方法,其特征在于采用模块优化技术和交替计算可推断事实解释及其所属谓词解释模板的方式来生成给定谓词的所有解释模板。
3.根据权利要求2中提出的模块优化技术,其特征在于将知识图谱及其附带本体一起近似成datalog程序,计算该程序的最小不动点,并利用该最小不动点抽取包含给定可推断事实所有解释的知识图谱模块,其中datalog程序的最小不动点是该程序可能推断的所有事实的集合,而知识图谱模块是指由知识图谱中部分事实构成的集合。
4.根据权利要求2中提出的交替计算可推断事实解释及其所属谓词解释模板的方式,其特征在于在处理含有给定谓词的每个可推断事实时,利用权力要求3中给出的模块优化技术抽取包含该事实所有解释的知识图谱模块,并在该模块上计算该事实的解释;利用解释集合与其最小碰撞集的对偶关系,递增计算可推断事实的新解释,并将该解释中不同的个体替换为不同的变量,得到新的解释模板,其中解释集合的最小碰撞集是指与每个解释都有非空交集的最小集合;得到新的解释模板后,将匹配该解释模板的可推断事实的所有解释添加到解释集合中,其中我们称可推断事实的某个解释匹配解释模板,当前仅当该解释是将解释模板中不同变量替换为不同个体后得到的事实集合。
5.根据权利要求3中提出的最小不动点计算方法,其特征在于使用个体重写技术压缩不动点,加速不动点的计算过程。
6.根据权利要求5中提出的个体重写技术,其特征在于在最小不动点计算过程中,每当产生一个可推断的个体相等事实,则产生一条将相等事实中较大编号个体替换为相等事实中较小编号个体的重写规则,并将该重写规则应用于当前的最小不动点;利用压缩的最小不动点抽取包含所有解释的知识图谱模块后,将知识图谱中能够通过重写规则转换成模块内事实的所有事实都加入到模块中。
CN201811356079.6A 2018-11-09 2018-11-09 谓词解释模板驱动的事实溯因推理方法 Pending CN109829056A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811356079.6A CN109829056A (zh) 2018-11-09 2018-11-09 谓词解释模板驱动的事实溯因推理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811356079.6A CN109829056A (zh) 2018-11-09 2018-11-09 谓词解释模板驱动的事实溯因推理方法

Publications (1)

Publication Number Publication Date
CN109829056A true CN109829056A (zh) 2019-05-31

Family

ID=66859739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811356079.6A Pending CN109829056A (zh) 2018-11-09 2018-11-09 谓词解释模板驱动的事实溯因推理方法

Country Status (1)

Country Link
CN (1) CN109829056A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263083A (zh) * 2019-06-20 2019-09-20 北京百度网讯科技有限公司 知识图谱的处理方法、装置、设备和介质
CN110516697A (zh) * 2019-07-15 2019-11-29 清华大学 基于证据图聚合与推理的声明验证方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263083A (zh) * 2019-06-20 2019-09-20 北京百度网讯科技有限公司 知识图谱的处理方法、装置、设备和介质
CN110263083B (zh) * 2019-06-20 2022-04-05 北京百度网讯科技有限公司 知识图谱的处理方法、装置、设备和介质
CN110516697A (zh) * 2019-07-15 2019-11-29 清华大学 基于证据图聚合与推理的声明验证方法及系统
CN110516697B (zh) * 2019-07-15 2021-08-31 清华大学 基于证据图聚合与推理的声明验证方法及系统

Similar Documents

Publication Publication Date Title
CN106055549B (zh) 利用加速器的概念分析操作的方法和系统
Horrocks et al. Practical reasoning for expressive description logics
Kumar Kaliyar Graph databases: A survey
CN111026874A (zh) 知识图谱的数据处理方法及服务器
San Martın et al. SNQL: A social networks query and transformation language
EP3387525B1 (en) Learning from input patterns in programing-by-example
WO2023274059A1 (zh) 交替序列生成模型训练方法、从文本中抽取图的方法
Métivier et al. A constraint programming approach for mining sequential patterns in a sequence database
CN109829056A (zh) 谓词解释模板驱动的事实溯因推理方法
Park et al. On the power of gradual network alignment using dual-perception similarities
CN102708285B (zh) 基于复杂网络模型并行化PageRank算法的核心药物挖掘方法
CN111897911B (zh) 一种基于次级属性图的非结构化数据查询方法及系统
CN115440387A (zh) 基于人工智能的居民呼吸道传染病监测预警系统及方法
Chen et al. Email visualization correlation analysis forensics research
Capra et al. A tool for symbolic manipulation of arc functions in symmetric net models
Paredes et al. Leveraging Probabilistic Existential Rules for Adversarial Deduplication.
CN108804788B (zh) 一种基于数据细胞模型的Web服务演化方法
Xu Deep mining method for high-dimensional big data based on association rule
Yang et al. KDK based double-basis fusion mechanism and its process model
Zhang et al. Stable Subgraph Isomorphism Search in Temporal Networks
CN114741526B (zh) 一种网络空间安全领域知识图谱云平台
Zhang et al. Constraint-based automatic symmetry detection
Nicolescu et al. Towards structured modelling with hyperdag P systems
Zhang et al. The incremental knowledge acquisition based on hash algorithm
Vychodil Pseudovarieties of algebras with fuzzy equalities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190531