CN112231422B - 一种图数据合成方法、装置、计算机设备和存储介质 - Google Patents

一种图数据合成方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112231422B
CN112231422B CN202011480983.5A CN202011480983A CN112231422B CN 112231422 B CN112231422 B CN 112231422B CN 202011480983 A CN202011480983 A CN 202011480983A CN 112231422 B CN112231422 B CN 112231422B
Authority
CN
China
Prior art keywords
assertion
ontology
axiom
representation
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011480983.5A
Other languages
English (en)
Other versions
CN112231422A (zh
Inventor
刘斌
陈航
陆敏
朱席席
姚莉
丁兆云
朱承
朱先强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202011480983.5A priority Critical patent/CN112231422B/zh
Publication of CN112231422A publication Critical patent/CN112231422A/zh
Application granted granted Critical
Publication of CN112231422B publication Critical patent/CN112231422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种图数据合成方法、装置、计算机设备和存储介质。所述方法包括:获取预设领域知识体系,根据该知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得描述类表示以及类表示与类表示间联系的公理集和描述关系表示与关系表示间联系的规则集,将公理集和规则集合并得到本体公理集,根据本体公理集生成实例、实例的扩展断言集、实例的属性断言和实例间的关系断言;根据扩展断言集、属性断言和关系断言得到本体断言集;根据本体推理机对公理集与本体断言集进行一致性检测,根据一致性检测结果和规则集,获得合成图数据。本方法可将正例与负例数据分开,提高数据合成速度,合成图数据与领域知识体系保持一致。

Description

一种图数据合成方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据合成技术领域,特别是涉及一种图数据合成方法、装置、计算机设备和存储介质。
背景技术
合成数据是指通过程序自动生成而非实际采集的数据。在隐私、安全、保密、数据采集成本等因素导致真实数据缺乏时,合成数据被广泛应用于机器学习训练、模型测试、仿真实验等方面。图数据是一种采用节点和边的结构表示的数据, 被广泛应用于语义Web、社交网络、复杂网络、基因交互、分子交互等领域。受隐私、安全、保密、数据采集成本等因素制约,机器学习训练、模型测试、仿真实验等无法获得真实图数据作为输入时,要获得高质量的输出结果,需要依赖于数据合成技术生成的高质量合成图数据及其负例,特别是与领域的知识体系保持一致的合成图数据,以及合成图数据的真负例。
现有图数据合成和负例生成的研究方面已经取得一定的成果。文献公开了:一种基于本体中所定义的模式,生成类的实例及实例之间关系的工具TOntoGen;一种可用于不同词汇集的合成链接数据(一种图数据)生成器LinkGen。TOntoGen和LinkGen均缺乏对生成数据与本体知识体系保持一致性的控制手段,所得到的合成图数据与模式存在冲突,且不区分真正例和真负例,因此,不能保障数据质量,难以适用于机器学习训练和仿真实验。文献还公开了:一种合成资源描述框架(RDF,ResourceDescriptionFramework)数据的生成器BGen;一种基于种群分布生成公共交通RDF数据的方法。上述两种方法中,参数约束和分布都蕴含着领域知识,可以控制合成图数据与领域知识尽量相符,然而,在合成图数据的过程中采用了随机性,不能保证所产生的图数据与领域知识完全一致而不存在冲突。
目前的图数据合成方法不能得到与领域知识体系一致的合成图数据。
发明内容
基于此,有必要针对上述技术问题,提供一种能够得到与领域知识体系一致的合成图数据的图数据合成方法、装置、计算机设备和存储介质。
一种图数据合成方法,所述方法包括:
获取预设领域中的知识体系。
根据所述预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示。
获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集。
根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集所述属性断言以及所述关系断言,得到本体断言集。
根据本体推理机对所述公理集与所述本体断言集的并集进行一致性检测,获得一致性检测结果。
根据所述一致性检测结果和所述规则集,获得合成图数据。
一种图数据合成装置,所述装置包括:
知识体系获取模块:获取预设领域中的知识体系。
本体表示确定模块:根据所述预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示。
本体公理集确定模块:获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集。
本体断言集确定模块:根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集所述属性断言以及所述关系断言,得到本体断言集。
一致性检测模块:根据本体推理机对所述公理集与所述本体断言集进行一致性检测,获得一致性检测结果。
合成图数据确定模块:根据所述一致性检测结果和所述规则集,获得合成图数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取预设领域中的知识体系。
根据所述预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示。
获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集。
根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集所述属性断言以及所述关系断言,得到本体断言集。
根据本体推理机对所述公理集与所述本体断言集的并集进行一致性检测,获得一致性检测结果。
根据所述一致性检测结果和所述规则集,获得合成图数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取预设领域中的知识体系。
根据所述预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示。
获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集。
根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集所述属性断言以及所述关系断言,得到本体断言集。
根据本体推理机对所述公理集与所述本体断言集的并集进行一致性检测,获得一致性检测结果。
根据所述一致性检测结果和所述规则集,获得合成图数据。
上述一种图数据合成方法,通过获取预设领域中的知识体系,根据预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示;获得描述类表示以及类表示与类表示之间联系的公理集和描述关系表示与关系表示之间联系的规则集,将公理集和规则集合并得到本体公理集,根据本体公理集生成实例,以及根据本体公理集确定实例的扩展断言集、实例的属性断言和实例之间的关系断言,根据扩展断言集、属性断言以及关系断言,得到本体断言集;根据本体推理机对公理集与本体断言集进行一致性检测,获得一致性检测结果;根据所述一致性检测结果和规则集,获得合成图数据。上述方法利用领域知识构建本体,查找与公理集不一致的断言,将合成图数据与负例数据分开,获得与领域知识体系保持一致性的合成图数据。
附图说明
图1为一个实施例中图数据合成方法的流程示意图;
图2为另一实施例中本体类表示、属性表示和关系表示生成的流程示意图;
图3为另一个实施例中本体公理集生成的流程示意图;
图4为另一个实施例本体断言集生成的流程示意图;
图5为另一个实施例中图数据合成方法具体实现的流程示意图;
图6为另一个实施例中一致性检测及检测结果一致时合成图数据确定的流程示意图;
图7为另一个实施例中一致性检测结果不一致时合成图数据确定的流程示意图;
图8为另一个实施例中基于familiy.swrl.owl中的领域知识构建家庭本体,采用本发明的方法和缺少本发明第三步的方法生成家庭关系图,两种方法平均耗时比较图;
图9和图10为另一个实施例中采用本发明基于familiy.swrl.owl中的领域知识构建家庭本体数据合成结果的可视化工具显示图;
图11为另一个实施例中图合成数据装置的结构框图;
图12为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如图1所示,在一个实施例中提供了一种图数据合成方法,包括以下步骤:
步骤102,获取预设领域中的知识体系。
预设领域是不同本体的领域,可以是家庭、语义Web、社交网络、复杂网络、基因交互、分子交互等领域。
知识体系是无数个关联的标准知识的集合。知识是人类在实践中认识客观世界(包括人类自身)的成果,它包括事实、信息的描述或在教育和实践中获得的技能。它可以是关于理论的,也可以是关于实践的。
步骤104,根据预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示。
根据预设领域中的知识体系建立本体,本体是对特定领域概念和概念之间关系的形式化表达,本体是知识的抽象。
本体的组成包括:个体(实体)、类、关系和属性。
个体是基础的或者说“底层的”对象;类是集合、概念、对象类型或者说事物的种类;属性是对象(和类)可能具有的属性、特征、特性、特点和参数;关系是类与个体之间的彼此关联可能具有的方式。
采用本体编程工具将类、关系、属性进行形式化表示,获得预设领域中类表示、关系表示和属性表示。形式化表示是指采用计算机可读的方式进行表示。
步骤106,获得描述类表示以及类表示与类表示之间联系的公理集和描述关系表示与关系表示之间联系的规则集,将公理集和规则集合并得到本体公理集。
根据类表示、关系表示及属性表示获得类表示以及类表示与类表示之间联系的公理集和描述关系表示与关系表示之间联系的规则集,将公理集和规则集合并得到本体公理集。
公理集:对领域内类以及类表示与类表示之间联系的集合,它包含的是领域知识中的一些永真断言,如概念之间的继承、等价和不相交及属性之间的继承、等价。
规则集:用于描述可以依据特定形式的某项断言所能够得出的逻辑推论的。
本体公理集是公理集和规则集的并集,定义了特定知识领域的结构并包含一系列公理,可以通过已有概念构成新的概念。本体公理集具有分类的能力,分类是系统化建立知识的第一步,通过分类的动作可以将事物的本体集合成共通的概念,这些概念又可组合成更广泛的概念。
步骤108,根据本体公理集生成实例,以及根据本体公理集确定实例属于类的扩展断言集、实例的属性断言和实例之间的关系断言集,根据扩展断言、属性断言以及关系断言集,得到本体断言集。
扩展断言集:所有类断言集合并的断言集合与规则集和断言集合进行分类推理获取的推理结果中的所有断言合并的集合的并集。
属性断言集:实例的属性取值的断言。
关系断言集:表示实例间的关系的断言。
本体断言集是实例断言的集合,用于指明实例的属性或实例之间的关系。由概念断言和关系断言组成,概念断言包括了实例的扩展断言集和实例的属性断言集。简单的讲,本体断言集是将与本体公理集中的类相对应的实例填入,所建立的实例要符合本体公理集中类设计的限制和属性,这些类的实体称为实例,由这些实例可以将原来只具有概念的架构,组合为可以表现实体知识关系的架构。
步骤110,根据本体推理机对公理集与本体断言集的并集进行一致性检测,获得一致性检测结果。
一致性:一个本体应该是一致的,也就是说,由他推断出来的概念定义应该与本体的概念定义一致,至少,所有的公理应该具有逻辑一致性。
一致性检测:当存在一种解释既是本体公理集的模型同时也是本体断言集的模型,则称本体公理集与本体断言集是一致的。
步骤112,根据一致性检测结果和规则集,获得合成图数据。
一致性检测结果为一致、非一致,规则集的状态包括空、非空。
根据检测结果的两种情况结合规则集的状态来确定如何从本体断言集、公理集和规则集中获取与预设领域的知识体系一致的合成图数据。
上述图数据合成方法,通过获取预设领域中的知识体系,根据预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示;获得描述类表示以及类表示与类表示之间联系的公理集和描述关系表示与关系表示之间联系的规则集,将公理集和规则集合并得到本体公理集,根据本体公理集生成实例,以及根据本体公理集确定实例的扩展断言集、实例的属性断言和实例之间的关系断言,根据扩展断言集、属性断言以及关系断言,得到本体断言集;根据本体推理机对公理集与本体断言集进行一致性检测,获得一致性检测结果;根据所述一致性检测结果和规则集,获得合成图数据。上述方法利用领域知识构建本体,查找与公理集不一致的断言,将合成图数据与负例数据分开,获得与领域知识体系保持一致性的合成图数据。
对于步骤102,在一个实施例中,从知识体系的数据模式中提取类概念,使用本体编程工具表示预设领域的知识体系中描述的类概念类之间的父类-子类关系,获得分类体系表示。
从知识体系的数据模式中提取关系概念,根据预设领域的知识体系对关系概念的定义域和值域的描述,使用本体编程工具获得关系表示。
从知识体系的数据模式中提取属性概念,根据预设领域的知识体系对属性概念的定义域和值域的描述,使用本体编程工具获得属性表示。
在本体编程工具中创建数据保留属性,根据数据保留属性得到数据保留属性表示;数据保留属性的定义域为本体编程工具自动生成的顶层类,值域为不小于1的整数型数据范围。
根据预设领域的知识体系以及数据保留属性,使用本体编程工具对分类体系中的每一个类进行表示,获得类表示。
如图2所示,在一个具体实施例中,具体实施步骤如下:
第一步,根据领域中的知识体系,在本体开发工具Protégé5.5中,使用OWL2语言和SWRL语言形式化表示领域中概念(包括类、关系和属性)及其之间关系,形成本体即本体公理集TBox(以下简称TBox)。
步骤1.1从合成图数据的数据模式中提取“类”概念,根据合成图数据所处领域的知识体系中描述的类之间的“父类-子类”关系,在本体编辑工具Protégé5.5上,通过“SubClassOf”按钮建立类之间“父类-子类”的关系,形成分类体系Taxo的OWL2表示。
步骤1.2从合成图数据的数据模式中提取“关系”概念,对每一个“关系”概念,利用Protégé5.5的添加“ObjectProperty”功能创建该关系,并根据合成图数据所处领域的知识体系对“关系”概念的定义域和值域的描述,在Taxo中的类或OWL2的基于Taxo中类构建的复合类选择两个类,分别添加为每一个关系的定义域和值域,形成关系定义的OWL2表示。
步骤1.3从合成图数据的数据模式中提取“属性”概念,对每一个属性概念,利用Protégé5.5的添加“DataProperty”功能创建该属性,并根据合成图数据所处领域的知识体系对“属性”概念的定义域和值域的描述,在Taxo中的类或OWL2基于Taxo中类构建的复合类中,选择一个类添加为该属性的定义域;选择OWL2的数据类型(Datatype)或数据范围(DataRange),添加为该属性的定义域,形成属性定义的OWL2表示。
步骤1.4在Protégé5.5中创建数据属性maxIndNum作为保留属性,其定义域为Protégé5.5自动生成的顶层类“Thing”,值域为OWL2的不小于1的整数型数据范围,形成保留属性maxIndNum定义的OWL2表示。
步骤1.5在Protégé5.5中根据合成图数据所处领域的知识体系,对分类体系Taxo中的每一个类cls,使用OWL2语义本体语言(简称OWL2)进行描述,具体方法如下:
步骤1.5.1如果知识体系中存在cls的定义,则在Protégé5.5中为cls创建等价类公理,形成cls定义的OWL2表示。
步骤1.5.2如果知识体系中存在cls的关系约束,则在Protégé5.5中为cls创建子类公理,子类公理中,cls为子类,关系约束为超类,形成cls关系约束的OWL2表示。
步骤1.5.3如果知识体系中存在cls的属性约束,则在Protégé5.5中为cls创建子类公理,子类公理中,cls为子类,属性约束为超类,形成cls属性约束的OWL2表示。
步骤1.5.4如果知识体系中存在cls的补类,则在Protégé5.5中使用DisjointWith为cls创建不相交公理,形成cls不相交公理的OWL2表示。
步骤1.5.5设合成图数据中对cls实例数目的需求为整数x,则在Protégé5.5中使用创建子类公理“clsSubClassOf (maxIndNumvalue x)”,表示“cls的maxIndNum属性取值为x”,记为cls的实例数约束,形成cls实例数约束的OWL2表示。
对于步骤104,在其中一个实施例中,根据预设领域中类表示、关系表示和属性表示的知识组成类表示及类表示与类表示之间联系的公理集。
根据知识体系,对关系表示之间的推导知识或关系表示的定义,采用和本体编程工具对应的描述推理规则的语言表示,得到规则集。
将公理集和规则及合并形成本体公理集。
如图3所示,在一个具体实施例中,具体实施步骤如下:
步骤1.7将类、关系和属性用Protégé5.5创建的OWL2表示公理形成公理集dlSet。
步骤1.8根据合成图数据所处领域的知识体系,对关系之间的推导知识或关系的定义,采用语义Web规则语言(简称SWRL)表示,形成规则集ruleSet。
步骤1.9将ruleSet和dlSet合并形成本体公理集TBox,即TBox=ruleSet∪dlSet。
对于步骤106,在其中一个实施例中,根据本体公理集中对类的实例数量描述,为每一类创建相应数量的实例,根据实例构成实例集合,根据实例集合构建类断言集,将所有类断言集合并,得到本体类断言集。
根据本体推理机对公理集与本体类断言集并集进行分类推理,得到推理结果中的断言表示,根据断言构成断言集合,将本体类断言集与断言集合进行合并,得到扩展断言集。
根据本体公理集中对于每一个关系的定义创建实例间的定义关系断言集。
根据本体公理集中对于每一个类的关系约束创建实例间的约束关系断言集。
根据本体公理集中对属性的定义创建实例的定义属性断言集。
根据本体公理集中对类的属性约束创建实例的约束属性断言集。
将扩展断言集、实例间的定义关系断言集、实例间的约束关系断言集、实例的定义属性断言集、实例的约束属性断言集合并,获得本体断言集。
如图4所示,在一个实施例中,具体实施步骤如下:
第二步:基于TBox中对类的实例数量描述,使用一种本体编程工具(包括但不限于OWL-API、Jena、PyPI、rdflib等本体编程工具),为每一类创建相应数量的实例,基于TBox中类的关系约束,为类的实例与约束的实例添加关系,基于TBox中对类的属性约束描述,设置类的实例的属性取值。实例属于类、实例间存在关系和实例属性取值设置,共同构成本体断言集ABox。
步骤2.1对TBox中的每一个类cls,根据cls的实例数约束获得其maxIndNum属性取值x,使用本体编程工具创建x个cls的实例,这x个实例构成集合Ind;使用本体编程工具创建断言,构成断言集{cls(ind)| ind∈Ind}。将构建的所有类断言集合并,形成cls_ABox1。
步骤2.2使用HermiT推理机对dlSet∪cls_ABox1进行分类推理,使用本体编程工具获取推理结果中的所有断言,构成集合cls_ABox1_ext,将cls_ABox1与cls_ABox1_ext合并,构成扩展断言集cls_ABox2。
步骤2.3基于关系的定义,使用本体编程工具创建实例间的关系断言集rel_ABox1,具体如下:
步骤2.3.1创建一个空集rel_ABox1。
步骤2.3.2对于其中一个实施例中的步骤1.2中创建的每一个关系rel,使用本体编程工具查询dlSet,获取rel的定义域rel_domain和值域rel_range。使用本体编程工具在rel_domain的实例和rel_range的实例之间创建rel关系获得断言并加入到rel_ABox1中,具体如下:
步骤2.3.2.1使用本体编程工具查询cls_ABox2,获取rel_domain的所有实例构成集合inds_rel_d,获取rel_range的所有实例构成集合inds_rel_r。
步骤2.3.2.2对于inds_rel_d中的每一个实例y,对inds_rel_r中的实例用洗牌算法进行排列,选取排第一的实例z,使用本体编程工具建立关系断言rel(y,z)后,将rel(y,z)添加到rel_ABox1中。
步骤2.4基于类的关系约束,使用本体编程工具创建实例间的关系断言集rel_ABox2,具体步骤如下:
步骤2.4.1创建一个空集rel_ABox2。
步骤2.4.2对于每一个类cls,使用本体编程工具查询dlSet,获取cls的所有关系约束。基于cls的关系约束创建其实例与其它实例之间的关系,形成关系断言并加入到rel_ABox2,具体步骤如下:
步骤2.4.2.1使用本体编程工具查询cls_ABox2,以获取cls的所有实例构成集合inds_rel_d。
步骤2.4.2.2对cls的每一个关系约束,使用本体编程工具从关系约束中获得关系概念,设为rel,根据关系约束的类型,使用本体编程工具创建关系断言并加入到rel_ABox2,具体步骤如下:
步骤2.4.2.2.1如果关系约束为量词约束,则获取其约束,设为cls1;使用本体编程工具查询cls_ABox2,以获取cls1的所有实例构成集合inds_rel_r;对于inds_rel_d中的每一个实例y,对inds_rel_r中的实例用洗牌算法进行排列,选取排第一的实例z,使用本体编程工具建立关系断言rel(y,z)。将rel(y,z)添加到rel_ABox2中。
步骤2.4.2.2.2如果关系约束为基数约束,则使用本体编程工具获取其约束和基数,设分别为cls1和x;使用本体编程工具查询cls_ABox2,获取cls1的所有实例构成集合inds_rel_r;对于inds_rel_d中的每一个实例y,对inds_rel_r中的实例用洗牌算法进行排列,选取前(x-1)个实例构成集合Z,使用本体编程工具建立断言集{rel(y,z)|z∈Z}。将{rel(y,z)|z∈Z}的所有元素添加到rel_ABox2中。
步骤2.5基于属性的定义,使用本体编程工具创建实例的属性断言集attr_ABox1,具体如下:
步骤2.5.1创建一个空集attr_ABox1。
步骤2.5.2对于每一个属性attr,使用本体编程工具查询dlSet,获取attr的定义域attr_domain和值域attr_range,然后进行如下操作:
步骤2.5.2.1使用本体编程工具查询cls_ABox2,获取attr_domain的所有实例构成集合inds_attr_d。
步骤2.5.2.2对于inds_rel_d中的每一个实例y,在attr_range范围内使用伪随机算法生成一个值z,使用本体编程工具创建属性断言attr(y,z) ,并将attr(y,z)添加到attr_ABox1中。
步骤2.6基于类的属性约束,使用本体编程工具创建实例的属性断言集attr_ABox2,具体如下:
步骤2.6.1创建一个空集attr_ABox2。
步骤2.6.2对于每一个类cls,使用本体编程工具查询dlSet,获取cls的所有属性约束,创建属性断言并加入到attr_ABox2,具体如下:
步骤2.6.2.1使用本体编程工具查询cls_ABox2,获取cls的所有实例构成集合inds_cls。
步骤2.6.2.2对cls的每一个属性约束,使用本体编程工具从属性约束中获得属性概念,设为attr,根据属性约束的类型,使用本体编程工具创建属性断言并加入到attr_ABox2,具体如下:
步骤2.6.2.2.1如果属性约束为量词约束,则使用本体编程工具获取其约束,设为dataRange;对于inds_cls中的每一个实例y,在dataRange范围内使用伪随机算法生成一个值z,使用本体编程工具创建属性断言attr(y,z) 后,将attr(y,z)添加到attr_ABox2中。
步骤2.6.2.2.2如果属性约束为基数约束,则使用本体编程工具获取其约束和基数,设分别为dataRange和x;对于inds_cls中的每一个实例y,从dataRange范围内使用伪随机算法生成(x-1)个值构成集合Z,使用本体编程工具构建属性断言集{attr(y,z)|z∈Z}后,将{attr(y,z)|z∈Z}的所有元素添加到attr_ABox2中。
步骤2.7将ABox设为cls_ABox2、rel_ABox1、rel_ABox2、attr_ABox1、attr_ABox2的并集,即ABox= cls_ABox2∪rel_ABox1∪rel_ABox2∪attr_ABox1∪attr_ABox2。
步骤2.2利用本体的公理体系对生成的类断言进行推理扩展,并在步骤2.3~2.6中创建关系断言和属性断言时加以利用,与现有的“基于本体的图数据合成方法”仅基于定义域和值域创建关系断言和属性断言相比,创建断言时考虑更全面,因此产生的断言更准确。
步骤1.5.5描述类的实例数约束、步骤2.1基于类的实例数约束创建约定数目的实例,使得合成图数据中实例以用户定义的形式分布,可拟合任意分布,可克服合成图数据中实例产生只能基于解析随机分布函数的不足。
对于步骤110,在其中一个实施例中,根据HermiT本体推理机对公理集与本体断言集的并集进行一致性检测,获得一致性检测结果。
对于步骤112,在其中一个实施例中,合成图数据包括正例数据集和负例数据集。
设置初始状态为空集的断言提取集合。
当一致性检测结果一致时,以及若规则集为空时,将本体断言集除去断言提取集合后的集合作为正例数据集、断言提取集合作为负例数据集输出。
当一致性检测结果一致时,若规则集为非空时,对本体公理集和本体断言集的并集除去断言提取集合后进行一致性检测,如果一致,则将本体断言集除去断言提取集合后的集合作为正例数据集、断言提取集合作为负例数据集输出。
当一致性检测的结果不一致时,则找出公理集与本体断言集并集中所有最小不一致集并选取最小不一致集中的断言添加到断言提取集合,并对本体公理集和本体断言集的并集除去断言提取集合后进行一致性检测,如果一致,则将本体断言集除去断言提取集合后的集合作为所述正例数据集、断言提取集合作为负例数据集输出;如果不一致,找出本体公理集和本体断言集的并集除去断言提取集合后的集合中所有最小不一致集并选取最小不一致集中的断言添加到断言提取集合,则将本体断言集除去断言提取集合后的集合作为正例数据集、断言提取集合作为负例数据集输出。
如图5至图7所示,在一个具体实施例中,具体实施步骤如下:
第三步,创建断言提取集合counterABox。对dlSet∪ABox进行一致性检测,如果dlSet∪ABox一致,则判断规则集ruleSet是否为空,如果ruleSet为空,则进入第五步,如果ruleSet非空,则进入第四步;如果dlSet∪ABox不一致,则找出dlSet∪ABox中所有最小不一致集并选取最小不一致集中的断言添加到counterABox,counterABox即负例集,然后进入第四步。具体流程如图6所述,具体步骤如下。
步骤3.1创建一个断言提取集合counterABox,设置为空集。
步骤3.2使用HermiT推理机对dlSet∪ABox进行一致性检测,如果检测结果为“一致”,则判断规则集ruleSet是否为空,如果ruleSet为空,则进入第五步,如果ruleSet非空,则进入第四步;如果检测结果为“不一致”,进入步骤3.3。
步骤3.3使用文献“Horridge M, Parsia B, Sattler U. Explaininginconsistencies in OWL ontologies[C]//International Conference on ScalableUncertainty Management. Springer, Berlin, Heidelberg, 2009: 124-137.”(解释OWL本体中的不一致性)的ComputeAllJustifications方法和HermiT推理机,获得dlSet∪ABox中的所有最小不一致集,这些最小不一致集构成集InconSets。
步骤3.4对InconSets中的每一个元素即一个最小不一致集inconSet,按如下顺序选取一个断言添加到counterABox中:
3.4.1获取inconSet中所有关系断言构成集合r_ABox,如果r_ABox为空,则进入3.4.2,否则,从r_ABox随机选取一个关系断言添加到counterABox中。
3.4.2获取inconSet中所有属性断言构成集合a_ABox,如果a_ABox为空,则进入3.4.3,否则,从a_ABox随机选取一个关系断言添加到counterABox中。
步骤3.4.3获取inconSet中所有类断言构成集合c_ABox,从c_ABox随机选取一个类断言添加到counterABox中。
第四步,对TBox∪ABox\counterABox即本体公理集与本体断言集的并集除去负例集后进行一致性检测,如果一致,则进入第五步;否则,找出TBox∪ABox\counterABox中所有最小不一致集并选取最小不一致集中的断言添加到counterABox,然后进入第五步。
第四步的具体流程如图7所述,具体步骤如下。
步骤4.1使用Pellet推理机,对TBox∪ABox\counterABox进行一致性检测。如果一致,则进入第五步;否则,进入步骤4.2。
步骤4.2ComputeAllJustifications方法和Pellet推理机,获得TBox∪ABox\counterABox中的所有最小不一致集,这些最小不一致集构成集合InconSets。
步骤4.3对InconSets中的每一个元素即每一个最小不一致集inconSet,按如下顺序选取一个断言添加到counterABox中后进入第五步:
步骤4.3.1获取inconSet中所有关系断言构成集合r_ABox,如果r_ABox为空,则进入4.3.2,否则,从r_ABox随机选取一个关系断言添加到counterABox中。
步骤4.3.2获取inconSet中所有属性断言构成集合a_ABox,如果a_ABox为空,则进入4.3.3,否则,从a_ABox随机选取一个关系断言添加到counterABox中。
步骤4.3.3获取inconSet中所有类断言构成集合c_ABox,从c_ABox随机选取一个类断言添加到counterABox中。
第五步,将ABox除去counterABox后的的作为合成图数据的正例数据集、counterABox作为负例数据集输出,结束合成图数据的正例数据集与负例数据集的生成。
通过第三步和第四步查找与公理集不一致的断言,将合成图数据的正例数据集与负例数据分开,第五步输出的合成图数据与公理集具有一致性,本发明的合成图数据完全符合领域公理集的规范,数据质量更高;第五步输出的负例数据集counterABox中,所有元素均为真负例,而背景技术“基于封闭世界假设的负例生成方法”通过随机产生实例之间的关系,所获得的负例中包含假负例。因此,本发明的合成图数据质量更高。
在第三步中,使用表达能力简单的公理集dlSet和断言集进行推理,其推理复杂度为PSpace,可快速找出与dlSet中公理冲突的断言集;第四步对TBox∪ABox\counterABox进行推理,在使用最复杂SWRL表达能力的情况下,推理复杂度为NP-Hard,由于排除了第三步中发现与dlSet中公理冲突的断言,最小不一致公理集的数量减少,推理时间变少。通过第三步和第四步两次对公理体系与数据进行一致性处理,与跳过第三步直接对公理体系与数据进行一致性处理相比,可缓解TBox中存在复杂表达能力的公理导致推理速度缓慢的症状,加速了图数据的合成。
在其中一个实施例中,本体编程工具是在本体开发工具Protégé5.5中,使用OWL2语言。
Protégé是一个本体建模工具软件,由斯坦福大学基于java语言开发的,属于开放源代码软件。软件主要用于语义网中本体的构建和基于本体的知识应用,是本体构建的核心开发工具。Protégé5.5是比较新的版本。
OWL(Web Ontology Language)是一种用于编写本体声明的语言。OWL的发展继承了RDF和RDFS以及一些早期的本体语言项目,包括本体推理层、DARPA智能体标记语言(DARPA Agent Markup Language,DAML)以及DAMLplusOIL。OWL旨在应用于万维网之上;而且,其构成要素(类、属性和个体)均被定义为RDF资源,并采用URI加以标识。
本发明基于OWL2表示的本体合成图数据,输出的合成图数据与语义Web社区主流的文档格式兼容,可以被保存为Turtle、OWL/XML、RDF/XML、JSON-LD、N-Triples、N-Quad、N3等标准格式的存储数据,与背景技术中LinkGen工具仅支持N-Triples和N-Quad格式保存数据相比,兼容范围更广。
如图8所示,其中一个实施例中是基于familiy.swrl.owl本体的领域知识,采用本发明的方法构建家庭本体,以Java实现的本发明的方法和缺少本发明第三步的方法合成家庭关系图,在外星人Alienwarearea-51m笔记本(硬件:Inteli9-10900KCPU、32GRAM、2TSSD硬盘;软件:Windows10操作系统、OpenJDK11 Java运行环境)上,两种方法生成不同数量实例时的平均耗时比较图。图8的横轴是合成家庭关系图中每类实例的最大数目,纵轴是三次合成家庭关系图的平均耗时;红线为本发明的方法三次合成家庭关系图的平均耗时;蓝线为缺少本发明第三步的方法三次合成家庭关系图的平均耗时。如图8所示,通过第三步和第四步两次对公理体系与数据进行一致性处理,本发明合成图数据的平均耗时随着每类实例的最大数目线性增长,而缺少本发明第三步的方法耗时随每类实例最大数目呈指数增长,因此,本发明加速了图数据的合成。
如图9和图10所示,在其中一个实施例中采用本发明基于familiy.swrl.owl本体的领域知识构建家庭本体,合成家庭关系图及其负例数据集,存储为N-Triples格式的数据文件后,在Protégé5.5的可视化插件OntoGraph上显示的合成图数据。图9为合成家庭关系图,图10为合成家庭关系图为负例数据;图9和图10的图例表示家庭关系图中不同的边(线条)代表不同的关系。由图9可见,father_0_mFk与parent_3_HSr存在hasConsort关系,即father_0_mFk 是parent_3_HSr的配偶;由图10可见,child_0_Cwl、aunt_2_zMc和aunt_1_Psm分别与father_0_mFk存在hasConsort关系,即child_0_Cwl、aunt_2_zMc和aunt_1_Psm都是father_0_mFk的配偶;由于家庭本体中定义了配偶关系是对称、一个人最多只有一个配偶,可以推导出矛盾,即“child_0_Cwl是father_0_mFk 的配偶”、“aunt_2_zMc是father_0_mFk 的配aunt_1_Psm是father_0_mFk 的配偶”均为图数据“father_0_mFk 是parent_3_HSr的配偶”的真负例。因此,通过比较图9和图10可见,本发明输出的负例数据为输出的合成图数据的真负例。
在其中一个实施例中,采用本发明基于familiy.swrl.owl中的领域知识构建家庭本体,设置每类实例的最大数目为4,合成的家庭关系图及其负例数据集,在Protégé5.5中对合成的家庭关系图及其负例数据集进行统计的图。合成家庭关系图中的断言总数统计数为494(其中,ObjectPropertyAssertion即关系断言362条,DataPropertyAssertion即属性断言65条,ClassAssertion即类断言67条);负例数据集中的断言总数统计数为494(其中,关系断言621条,类断言1条)。随机生成的关系断言中,包含大量(621比362)与领域知识体系及合成图数据相矛盾的断言即负例,这表明,本发明能将与领域知识体系及合成图数据相矛盾的断言从合成图数据中剔除,提高了合成图数据的质量。
应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种图数据合成装置,包括:知识体系获取模块、本体表示确定模块、本体公理集确定模块、本体断言集确定模块、一致性检测模块和合成图数据确定模块,其中:
知识体系获取模块:获取预设领域中的知识体系。
本体表示确定模块:根据预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示。
本体公理集确定模块:获得描述类表示以及类表示与类表示之间联系的公理集和描述关系表示与关系表示之间联系的规则集,将公理集和规则集合并得到本体公理集。
本体断言集确定模块:根据本体公理集生成实例,以及根据本体公理集确定实例的扩展断言集、实例的属性断言和实例之间的关系断言,根据扩展断言集、属性断言以及关系断言,得到本体断言集。
一致性检测模块:根据本体推理机对公理集与本体断言集进行一致性检测,获得一致性检测结果。
合成图数据确定模块:根据一致性检测结果和规则集,获得合成图数据。
关于图数据合成装置的具体限定可以参见上文中对于图数据合成方法的限定,在此不再赘述。上述图数据合成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储合成图数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图数据合成方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
步骤102、步骤104、步骤106、步骤108、步骤110以及步骤112。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
步骤102、步骤104、步骤106、步骤108、步骤110以及步骤112。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种图数据合成方法,其特征在于,所述方法包括:
获取预设领域中的知识体系;
根据所述预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示;
获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集;
根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集、所述属性断言以及所述关系断言,得到本体断言集;
根据本体推理机对所述公理集与所述本体断言集的并集进行一致性检测,获得一致性检测结果;
根据所述一致性检测结果和所述规则集,获得合成图数据;
根据所述一致性检测结果和所述规则集,获得合成图数据,包括:
所述合成图数据包括正例数据集和负例数据集;
设置初始状态为空集的断言提取集合;
当所述一致性检测结果一致时,以及当所述规则集为空时,将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为所述负例数据集输出;
当所述一致性检测结果一致时,以及当所述规则集为非空时,对所述本体公理集和本体断言集的并集除去所述断言提取集合后的集合进行一致性检测,如果一致,则将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为所述负例数据集输出;
当所述一致性检测的结果不一致时,则找出所述公理集与所述本体断言集并集中所有最小不一致集并选取最小不一致集中的断言添加到所述断言提取集合,并对所述本体公理集和本体断言集的并集除去所述断言提取集合后的集合进行一致性检测,如果一致,则将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为负例数据集输出;如果不一致,找出所述本体公理集和本体断言集的并集除去所述断言提取集合后的集合中所有最小不一致集并选取最小不一致集中的断言添加到所述断言提取集合,则将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为所述负例数据集输出。
2.根据权利要求1所述的方法,其特征在于,根据所述预设领域中的知识体系,在本体开发工具中,使用本体编程语言表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示,包括:
从所述知识体系的数据模式中提取类概念,使用所述本体编程工具表示预设领域的知识体系中描述的所述类概念类之间的父类-子类关系,获得分类体系表示;
从所述知识体系的数据模式中提取关系概念,根据预设领域的知识体系对所述关系概念的定义域和值域的描述,使用所述本体编程工具获得关系表示;
从所述知识体系的数据模式中提取属性概念,根据预设领域的知识体系对所述属性概念的定义域和值域的描述,使用本体编程工具获得属性表示;
在所述本体编程工具中创建数据保留属性,根据所述数据保留属性得到数据保留属性表示;所述数据保留属性的定义域为所述本体编程工具自动生成的顶层类,值域为不小于1的整数型数据范围;
根据预设领域的知识体系以及所述数据保留属性,使用所述本体编程工具对所述分类体系中的每一个类进行表示,获得类表示。
3.根据权利要求1所述的方法,其特征在于,获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集,包括:
根据所述预设领域中类表示、关系表示和属性表示的知识组成所述类表示及类表示与类表示之间联系的公理集;
根据预设领域中的知识体系,对所述关系表示之间的推导知识或关系表示的定义,采用和所述本体编程工具对应的描述推理规则的语言表示,得到规则集;
将所述公理集和所述规则及合并形成本体公理集。
4.根据权利要求1所述的方法,其特征在于,根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集、所述属性断言以及所述关系断言,得到本体断言集,包括:
根据所述本体公理集中对类的实例数量描述,为每一类创建相应数量的实例,根据所述实例构成实例集合,根据所述实例集合构建类断言集,将所有所述类断言集合并,得到本体类断言集;
根据所述本体推理机对所述公理集与所述本体类断言集并集进行分类推理,得到推理结果中的断言表示,根据所述断言构成断言集合,将所述本体类断言集与所述断言集合进行合并,得到扩展断言集;
根据所述本体公理集中对于每一个关系的定义创建实例间的定义关系断言集;
根据所述本体公理集中对于每一个类的关系约束创建实例间的约束关系断言集;
根据所述本体公理集中对属性的定义创建实例的定义属性断言集;
根据所述本体公理集中对类的属性约束创建实例的约束属性断言集;
将所述扩展断言集、实例间的定义关系断言集、实例间的约束关系断言集、实例的定义属性断言集、实例的约束属性断言集合并,获得本体断言集。
5.根据权利要求1所述的方法,其特征在于,根据本体推理机对所述公理集与所述本体断言集的并集进行一致性检测,获得一致性检测结果,包括:
根据HermiT本体推理机对所述公理集与所述本体断言集的并集进行一致性检测,获得一致性检测结果。
6.根据权利要求1-5中任一所述的方法,其特征在于,所述本体编程工具是在本体开发工具Protégé5.5中,使用OWL2语言。
7.一种图数据合成装置,其特征在于,所述装置包括:
知识体系获取模块:获取预设领域中的知识体系;
本体表示确定模块:根据所述预设领域中的知识体系,使用本体编程工具表示预设领域中类、关系和属性,获得预设领域中类表示、关系表示和属性表示;
本体公理集确定模块:获得描述所述类表示以及类表示与类表示之间联系的公理集和描述所述关系表示与关系表示之间联系的规则集,将所述公理集和所述规则集合并得到本体公理集;
本体断言集确定模块:根据所述本体公理集生成实例,以及根据所述本体公理集确定所述实例的扩展断言集、所述实例的属性断言和所述实例之间的关系断言,根据所述扩展断言集、所述属性断言以及所述关系断言,得到本体断言集;
一致性检测模块:根据本体推理机对所述公理集与所述本体断言集的并集
进行一致性检测,获得一致性检测结果;
合成图数据确定模块:根据所述一致性检测结果和所述规则集,获得合成图数据;
合成图数据确定模块还用于:所述合成图数据包括正例数据集和负例数据集;设置初始状态为空集的断言提取集合;当所述一致性检测结果一致时,以及当所述规则集为空时,将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为所述负例数据集输出;当所述一致性检测结果一致时,以及当所述规则集为非空时,对所述本体公理集和本体断言集的并集除去所述断言提取集合后的集合进行一致性检测,如果一致,则将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为所述负例数据集输出;当所述一致性检测的结果不一致时,则找出所述公理集与所述本体断言集并集中所有最小不一致集并选取最小不一致集中的断言添加到所述断言提取集合,并对所述本体公理集和本体断言集的并集除去所述断言提取集合后的集合进行一致性检测,如果一致,则将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为负例数据集输出;如果不一致,找出所述本体公理集和本体断言集的并集除去所述断言提取集合后的集合中所有最小不一致集并选取最小不一致集中的断言添加到所述断言提取集合,则将所述本体断言集除去所述断言提取集合后的集合作为所述正例数据集、所述断言提取集合作为所述负例数据集输出。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202011480983.5A 2020-12-16 2020-12-16 一种图数据合成方法、装置、计算机设备和存储介质 Active CN112231422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011480983.5A CN112231422B (zh) 2020-12-16 2020-12-16 一种图数据合成方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011480983.5A CN112231422B (zh) 2020-12-16 2020-12-16 一种图数据合成方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112231422A CN112231422A (zh) 2021-01-15
CN112231422B true CN112231422B (zh) 2021-02-26

Family

ID=74123981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011480983.5A Active CN112231422B (zh) 2020-12-16 2020-12-16 一种图数据合成方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112231422B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976031A (zh) * 2015-03-13 2016-09-28 思科技术公司 多个语义推理引擎对数据的并行处理
CN111930932A (zh) * 2020-09-25 2020-11-13 中国人民解放军国防科技大学 网络空间安全领域知识图谱表示学习方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9104779B2 (en) * 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US8656356B2 (en) * 2010-07-02 2014-02-18 Infosys Limited Method and system for creating OWL ontology from java
US8959041B2 (en) * 2011-12-14 2015-02-17 Emilio Patrick Shironoshita Hypothesis verification using ontologies, belief axioms, belief assertions, premise axioms, and premise assertions
CN102682122B (zh) * 2012-05-15 2014-11-26 北京科技大学 基于本体构建材料科学领域语义数据模型的方法
CN110023851B (zh) * 2016-11-23 2023-04-21 开利公司 具有知识库的建筑管理系统
CN106844718B (zh) * 2017-02-08 2022-04-26 腾讯科技(深圳)有限公司 数据集合的确定方法和装置
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN109344454B (zh) * 2018-09-11 2023-04-18 桂林电子科技大学 一种基于本体规则描述的基准体系合理性自动检验方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976031A (zh) * 2015-03-13 2016-09-28 思科技术公司 多个语义推理引擎对数据的并行处理
CN111930932A (zh) * 2020-09-25 2020-11-13 中国人民解放军国防科技大学 网络空间安全领域知识图谱表示学习方法和装置

Also Published As

Publication number Publication date
CN112231422A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
Alzahrani et al. Community detection in bipartite networks: Algorithms and case studies
Triboan et al. A semantics-based approach to sensor data segmentation in real-time activity recognition
Figueiredo et al. Breaking into pieces: An ontological approach to conceptual model complexity management
Ding et al. On homeland security and the semantic web: A provenance and trust aware inference framework
Park et al. Multi-Entity Bayesian Networks learning for hybrid variables in situation awareness
CN115757804A (zh) 一种基于多层路径感知的知识图谱外推方法及系统
Herzig et al. Bayesian Reasoning Over Models.
Liu et al. Structure learning of conditional preference networks based on dependent degree of attributes from preference database
Wang et al. RETRACTED ARTICLE: Intrusion detection and performance simulation based on improved sequential pattern mining algorithm
CN112231422B (zh) 一种图数据合成方法、装置、计算机设备和存储介质
Hamdi et al. Querying of several DL-Lite knowledge bases from various information sources-based polynomial response unification approach
Shu A practical approach to modelling and validating integrity constraints in the Semantic Web
Omitola et al. Social semantic web mining
Vahedian Khezerlou et al. A new model for discovering process trees from event logs
D'Onofrio et al. Striving for semantic convergence with fuzzy cognitive maps and graph databases
CN113052712B (zh) 社交数据的分析方法、系统及存储介质
KR101231804B1 (ko) 온톨로지 기반의 임포트 그래프 생성 방법과 임포트 그래프를 이용한 질의 처리 장치 및 방법
Rizzo A novel structured argumentation framework for improved explainability of classification tasks
Lebese et al. Proof extraction for logical neural networks
Pahal et al. Extending mowl for event representation (e-mowl)
Umuhoza et al. Trustworthiness assessment of knowledge on the semantic sensor web by provenance integration
Merilinna A mechanism to enable spatial reasoning in jboss drools
CN114461815B (zh) 家谱知识图谱的噪音检测方法及其装置、电子设备
Hasan et al. A brief review of explanation in the Semantic Web
Long Qualitative spatial and temporal representation and reasoning: efficiency in time and space

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant