CN114328965A - 知识图谱更新方法、装置及计算机设备 - Google Patents
知识图谱更新方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN114328965A CN114328965A CN202111655790.3A CN202111655790A CN114328965A CN 114328965 A CN114328965 A CN 114328965A CN 202111655790 A CN202111655790 A CN 202111655790A CN 114328965 A CN114328965 A CN 114328965A
- Authority
- CN
- China
- Prior art keywords
- target
- query
- graph
- entity
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出了一种知识图谱更新方法、装置及计算机设备,本申请从本体层面建立本体之间的类和关系的映射,配置至少包含原知识图谱的原本体文件与目标本体文件之间的实体类别映射和关系映射的配置规则文件,降低了规则编写复杂度,增强了图更新功能的鲁棒性。且按照图像查询模板,至少依据该配置规则文件内容,生成图查询语句来对原知识图谱进行查询,依据图查询结果,准确获得目标本体下的目标实体信息和目标关系信息,生成该领域的目标知识图谱,实现了从本体层面完成对数据的操控,无需专业技术人员编写目标知识图谱的代码,节约了人力成本,缩短了迭代周期,且降低了实现门槛。
Description
技术领域
本申请主要涉及计算机技术领域,更具体地说是涉及一种知识图谱更新方法、装置及计算机设备。
背景技术
随着互联网及人工智能技术的发展及应用,面对网络数据内容呈现爆炸式增长的态势,知识图谱(Knowledge Graph)凭借其卓越的语义处理技术和开放处理能力,已被广泛运用于智能搜索、智能问答、信息推荐、内容分发、数据分析和挖掘等领域,以各种图形方式显示知识发展进程与结构关系。
其中,知识图谱通常是基于目标领域的数据,构建该目标领域的本体模型,即由类、关系和属性这三部分构成的语义数据模型,从而据此实现知识图谱的创建。因此,一旦本体模型发生结构性变化,为了保证图谱数据与本体模型相匹配,通常需要依据变化后的本体模型,重新创建知识图谱。
可见,目前这种通过重新创建知识图谱的对原知识图谱更新的处理方式,过程繁琐,费时费力,更新效率低且会资源浪费。
发明内容
有鉴于此,本申请提出了一种知识图谱更新方法,包括:
获取任一领域的原知识图谱、目标本体文件以及配置规则文件;其中,所述配置规则文件至少包含所述原知识图谱的原本体文件与所述目标本体文件之间的实体类别映射和关系映射;
按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句;
执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息;
依据所述目标实体信息和所述目标关系信息,生成所述领域的目标知识图谱。
可选的,所述按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句,包括:
调取图查询模板;其中,所述图查询模板依据图查询语言配置,且包含有多个待定查询条件的待写入区域;所述待定查询条件用于指示在所述待定写入区域写入的所述配置规则文件中对应的本体信息,所述本体信息至少包括所述实体类别映射和所述关系映射,且所述多个待定查询条件至少包括待定查询属性条件和待定查询关系条件;
依据所述多个待定查询条件各自指示的所述配置规则文件包含的本体信息,获得针对所述原知识图谱对应的目标查询条件;所述目标查询条件至少包括目标查询属性条件和目标查询关系条件,
利用获得的所述目标查询条件,生成针对所述原知识图谱的图查询语句。
可选的,若所述多个待定查询条件还包括用于指示查询结果是否去重的待去重条件和/或待查询约束条件,所述依据所述多个待定查询条件各自指示的所述配置规则文件包含的本体信息,获得针对所述原知识图谱对应的目标查询条件,包括:
依据所述实体类别映射和所述关系映射,分别获得针对所述原知识图谱的目标查询属性条件和目标查询关系条件;其中,所述实体类别包含有至少一个属性;以及,
依据所述配置规则文件中的查询结果去重字段,获得针对所述原知识图谱的目标去重条件;和/或
依据所述实体类别映射以及所述关系映射,获得针对所述原知识图谱的目标查询约束条件;所述目标查询约束条件能够表征属性维度、实体类别维度以及关系维度的约束。
可选的,所述依据所述实体类别映射以及所述关系映射,获得针对所述原知识图谱的目标查询约束条件,包括:
依据所述实体类别映射,获得第一约束条件和第二约束条件;其中,所述第一约束条件用于指示所查询不同类中的实体在所述原本体文件中的相应实体名称;所述第二约束条件用于指示所述目标本体文件中各类的属性来自所述原本体文件中具有该属性的第一类;
依据所述关系映射中的类间关系,获得第三约束条件;所述第三约束条件用于指示查询具有所述类间关系的实体对;
由所述第一约束条件、所述第二约束条件和所述第三约束条件,构成针对所述原知识图谱的目标查询约束条件。
可选的,所述图查询语句包含实体查询语句和关系查询语句;所述执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息,包括:
执行所述实体查询语句,得到实体查询结果;
依据所述实体查询结果,获得所述目标本体文件下的目标实体信息;
执行所述关系查询语句,得到关系查询结果;
依据所述关系查询结果和所述目标实体信息,获得所述目标本体文件下的目标关系信息。
可选的,在所述依据所述实体查询结果,获得所述目标本体文件下的目标实体信息过程中,还包括:
依据所述实体查询结果,获得待生成的目标知识图谱与所述原知识图谱之间的实体关键数据;所述实体关键数据包括所述目标知识图谱与所述原知识图谱之间的实体映射;
缓存所述实体关键数据和所述目标实体信息;
所述依据所述关系查询结果和所述目标实体信息,获得所述目标本体文件下的目标关系信息,包括:
调取所述实体关键数据和所述目标实体信息;
依据所述关系查询结果、所述目标实体信息及所述实体关键数据,生成所述目标本体文件下的目标关系信息。
可选的,所述依据所述关系查询结果和所述目标实体信息,获得所述目标本体文本下的目标关系信息,还包括:
若所述关系查询结果表征原知识图谱中存在所述符合所述目标查询约束条件的实体对,依据缓存的所述实体关键数据中相应的所述实体映射,得到该实体对之间的第一关系信息;
若所述关系查询结果表征所述目标本体文件中第二关系依赖所述原知识图谱中的实体类别,将所依赖的实体类别中的实体映射至被依赖的相应所述第二关系;
利用所述目标查询约束条件,获得映射处理后的实体对之间的第二关系信息;
由得到的所述第一关系信息和所述第二关系信息,构成所述目标本体文本下的目标关系信息。
可选的,所述按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句,包括:
获取所述原本体文件和/或所述目标文本文件中的本体标识信息;
按照图查询模板,依据所述实体类别映射、所述关系映射以及所述本体标识信息,生成针对所述原知识图谱的图查询语句;
和/或,所述配置规则文件的生成方法包括:
响应任一领域的原本体文件的结构更新请求,依据所述原本体文件以及更新后的目标本体文件,生成配置规则文件;
将所述配置规则文件发送至服务器或指定终端设备。
本申请还提出了一种知识图谱更新装置,包括:
数据获取模块,用于获取任一领域的原知识图谱、目标本体文件以及配置规则文件;其中,所述配置规则文件至少包含所述原知识图谱的原本体文件与所述目标本体文件之间的实体类别映射和关系映射;
图查询语句生成模块,用于按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句;
目标知识数据获得模块,用于执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息;
目标知识图谱生成模块,用于依据所述目标实体信息和所述目标关系信息,生成所述领域的目标知识图谱。
本申请还提出了一种计算机设备,包括:
通信接口;
存储器,用于存储实现如上述的知识图谱更新方法的程序;
处理器,用于加载执行所述存储器存储的所述程序,实现如上述的知识图谱更新方法。
由此可见,本申请提供了一种知识图谱更新方法、装置及计算机设备,在任一领域的本体文件发生结构变化,需要更新原知识图谱的场景下,本申请将获得至少包含原知识图谱的原本体文件与目标本体文件之间的实体类别映射和关系映射的配置规则文件,相对于从数据层面编写业务规则,本申请从本体层面建立本体之间的类和关系的映射,降低了规则编写复杂度,增强了图更新功能的鲁棒性。之后,将按照图像查询模板,至少依据该配置规则文件内容,生成图查询语句来对原知识图谱进行查询,依据图查询结果,准确获得目标本体下的目标实体信息和目标关系信息,生成该领域的目标知识图谱,实现了从本体层面完成对数据的操控,无需编写目标知识图谱的代码,缩短了迭代周期,且降低了实现门槛。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为适用于本申请提出的知识图谱更新方法的计算机设备的一可选示例的硬件结构示意图;
图2为适用于本申请提出的知识图谱更新方法的一可选应用场景的系统架构示意图;
图3为本申请提出的知识图谱更新方法的一可选示例的流程示意图;
图4为本申请提出的知识图谱更新方法的又一可选示例的流程示意图;
图5为本申请提出的知识图谱更新方法的又一可选示例的流程示意图;
图6为本申请提出的知识图谱更新装置的一可选示例的结构示意图。
具体实施方式
针对背景技术部分描述的内容,在面对任一领域的本体文件发生结构变化,需要更新原知识图谱的场景,不希望耗费大量人力和时间资源,重新创建新本体下的知识图谱,提出编写业务规则,来实现图谱的转化,即通过添加逻辑规则,直接对原知识图谱中的实体和关系进行变动。但这种更新方式仅适用于本体变化幅度较小的情况下,其相对于重新创建知识图谱,能够降低人力和时间资源。然而,在本体变化幅度较大时,所需业务规则的复杂度将会指数增加,导致编写业务规则的成本高于重新创建知识图谱。
为了进一步改善上述知识图谱更新方法,能够在任一领域的本体无论变化较小还是变化较大的场景下,都能够快速且准确地获得本体结构变化后知识图谱。因此,本申请提出分析本体文件的变化情况,将本体映射在概念层描述原知识图谱与所需要的目标知识图谱之间的关系、变迁,在数据层将本体概念级别的变化精准落实在每一个实体、每一条关系上,保证依据原知识图谱向目标知识图谱转换的准确性。
其中,针对本体文件的结构性变化,本申请可以采用简单语法结构和本体映射方式,来预先编写记录本体文件变化情况的配置规则文件,使得配置规则文件内容相对于直接编写完整的业务规则内容要少很多,减轻了编写配置规则文件的人力和时间成本消耗,且可读性更强。
而且,在知识图谱变换过程中使用的图查询语句,本申请可以调用预设通用的图查询模板,依据预设的配置规则文件包含的内容,自动填写到该图查询模板中的对应空槽,自动生成所需的图像查询语句,相对于人工针对当前领域的原知识图谱,有针对性地编写图查询语句的实现方式,本申请这种利用通用图查询模板,执行程序自动生成图查询语句的实现方式,只需要关注映射规则,与具体场景项目、业务无关,更具有通用性,且零代码实现了整个数据层的转化,极大降低了人工编写大量图查询语句所消耗的人力和时间资源,避免了人工编写图查询语句产生错误,导致更新失败的问题,提高了更新效率和可靠性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参照图1,为适用于本申请提出的知识图谱更新方法的计算机设备的一可选示例的硬件结构示意图,在实际应用中,该计算机设备可以是具有数据处理能力的终端设备,也可以是服务器。其中,该终端设备可以包括但并不局限于:智能手机、平板电脑、机器人、台式计算机等电子设备;服务器可以是独立的物理服务器,也可以是多台物理服务器构成的服务集群,还可以是支持云计算服务的云服务器。本申请对计算机设备的产品类型不做限制,可以依据场景需求灵活选择执行该知识图谱更新方法的计算机设备的产品。
如图1所示,该计算机设备可以包括但并不局限于:通信接口11、存储器12和处理器13,其中:
通信接口11、存储器12和处理器13各自的数量可以为至少一个,可以依据应用场景对计算机设备的功能需求,来确定这些组成部件的数量和类型等,通常情况下,通信接口11、存储器12、处理器13均可以连接通信总线,以实现相互之间的数据通信,本申请对各组成部件的具体连接方式不做限制,可视情况而定。
通信接口11可以包括能够利用无线通信网络实现数据交互的通信模块的数据接口,该通信模块可以包括但并不局限于WIFI模块、5G/6G(第五代移动通信网络/第六代移动通信网络)模块、GPRS模块、GSM模块等;以使得计算机设备依据应用需求,可以通过合适的通信模块实现与其他设备的通信连接,实现不同设备之间的数据交互;当然,该通信接口11还可以包括如USB接口、串/并口等接口,用于实现计算你设备内部组成部件之间的数据交互,本申请实施例在此不做详述。
存储器12可以用于存储实现本申请提出的知识图谱更新方法的程序,根据需要还可以存储知识图谱更新过程中产生的中间参量或更新结果数据、从其他设备获得的数据等。可以理解,如图2所示的应用场景系统架构示意图,对于这些数据也可以发送至独立的数据库进行存储,本申请对数据存储实现方式不做限制。处理器13可以加载执行存储器12中存储的程序,实现本申请提出的知识图谱更新方法,实现过程可以参照下文相应方法实施例的描述,本实施例在此不做详述。
在本申请实施例中,存储器12可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。处理器13,可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路(application-specificintegrated circuit,ASIC)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。本申请对计算机设备所需要的各存储器12和各处理器13的类型不做限制,可视情况而定。
应该理解的是,图1所示的计算机设备的结构并不构成对本申请实施例中计算机设备的限定,在实际应用中,计算机设备可以包括比图1所示的更多的部件或者组合某些部件,如显示模组、天线、电源模组等,可以依据功能需求确定,本申请在此不做一一列举。
参照图3,为本申请提出的知识图谱更新方法的一可选示例的流程示意图,在实际应用中,可以由服务器或终端设备执行该知识图谱更新方法,在某些应用场景下,也可以由服务器和终端设备配合实现。如图3所示,该方法可以包括:
步骤S31,获取任一领域的原知识图谱、目标本体文件以及配置规则文件;
结合上文对本申请技术方案的相关描述,在任一领域的业务规划、应用等发生变化,使得其原本体文件(即本体模型)发生结构性改变,如实体类别发生变化、类别属性发生变化、实体关系发生变化等,得到新结构的目标本体文件后,为了获得新的知识图谱,据此更好地提供该领域的业务服务,业务人员或开发人员等可以按照规则文件编写要求,基于新旧本体之间的概念层映射关系,来编写配置规则文件,编写实现方法不做限制。
由于知识图谱是由实体和关系组成,变换后的目标知识图谱需要按照实体、关系的顺序生成。因此,在编写配置规则文件时,本申请可以无需考虑原本体文件中类与关系是如何变换的,来明确新旧本体在概念层的映射关系,如基于已知的结构性变化,定义新旧本体实体类别、关系的映射,这样,在将原知识图谱变换成目标原知识图谱的过程中,就可以依据该映射溯源,获得构成目标知识图谱所需的实体、关系。
因此,本申请预先编写的配置规则文件至少可以包含:原知识图谱的原本体文件与目标本体文件之间的实体类别映射和关系映射,关于这两种映射各自的内容,可以基于该领域本体的变化内容确定,本申请实施例在此不做详述。需要说明,关于配置规则文件还可以包含基于业务需求等确定的其他内容,本申请对配置规则文件的内容及其表示形式不做限制。
结合上文对本申请技术方案的相关描述,上述实体类别映射即新旧本体之间的类映射,以及新旧本体之间的关系映射可以包括多个维度的约束,来说明目标本体文件中的类和关系,在原本体文件中是否有对应的存在,存在的形式是什么,使得后续可以据此内容生成的图查询语句,精准定位到数据层的实体和关系,实现从本体层面完成对数据的操控。所以说,本申请获得的包含本体概念层映射到配置规则文件具有数据指导能力,实现过程可以参照下文相应部分的描述。
而且,对于上述配置规则文件的编写,在理解原本体文件是如何变换的情况下,不具有专业程序编写能力的人都可以完成,如由业务人员、管理人员等直接编写后上报计算机设备,可以说基本无技术性,为结构端复杂本体文件编写、修改工作预留出更多时间。相对于专业技术人员花费很长时间,从数据层面编写整个目标本体文件的业务规则,本申请是从本体文件入手,建立本体间类与关系的映射,可以不用定义增加、删除、修改等操作,降低了配置规则文件编写的复杂度的同时增加了变形功能的鲁棒性,使得编写人员可以在非常短的时间(如一天等)内完成配置规则文件的编写,达到节约人力和时间成本,提升了敏捷性,降低了规则编写门槛的效果。
步骤S32,按照图查询模板,至少依据配置规则文件,生成针对原知识图谱的图查询语句;
由于正确的查询语句是图变形可靠性的保障,而知识图谱包含的内容非常多,为了实现对原知识图谱的变换,需要构建多个如实体查询语句、关系查询语句等图查询语句,来确定目标知识图谱中的各实体信息和各关系信息。对于这些图查询语句,若由开发人员人工编写,很容易因编写错误造成知识图谱更新失败或不准确,所以,为了提高图查询语句的生成效率、准确性和可靠性,本申请希望尽可能少的规则信息,自动拼装出准确、无歧义的图查询语句。
依据上述分析,本申请可以依据各种图查询语句的组成特点,以及图查询要求等,预先配置具有通用特性,即能够适用于任一领域的图查询模板,本申请对该图查询模板的内容及其表示形式不做限制。在需要生成针对某一原知识图谱的图查询语句时,可以直接调用该图像查询模板,之后,可以将针对该原知识图谱所属领域的本体变化而构建的配置规则文件的内容,直接填写到该图查询模板中对应位置,也可以基于配置规则文件的内容,来获得图查询模板对应位置所需的内容后进行填写,从而得到针对当前领域的原知识图谱的图查询语句,无需人工编写,极大节省了人力和时间资源,保证了生成的图查询语句的准确性和可靠性。
可以理解,为了查询原知识图谱包含的每一类实体、每一种关系等图信息,可以按照生成多个图查询语句,在生成每一个图查询语句时,都可以调用图查询模板生成,区别在于生成过程中所依据配置规则文件中的内容不同,本申请在此不做一一举例详述。
另外,为了标识需要查询的图信息是某企业定义的,在生成图查询语句时,还可以获取能够达到该标识目的的信息,将其作为图查询语句的前缀信息,结合配置规则文件包含的本体映射内容来生成图查找语句。其中,该前缀信息可以从原本体文件或目标本体文件中提取,也可以在编写配置规则文件时,将其写入配置规则文件,这种在生成图查询语句时,可以直接依据配置规则文件和图查询模板生成,不需要提取本体文件的内容,但并不局限于本申请提出的这两种实现方式。
在又一些实施例中,某企业也可以开发适用于该企业的各种业务的图查询模板,相对于适用于各企业的各领域的图查询模板,本实施例可以在该企业的图查询模板中添加固定内容的上述前缀信息,这样,在该企业的某业务的本体文件发生变化,需要对原知识图谱进行变换处理,得到目标知识图谱的过程中,也可以直接依据预先编写的包含新旧本体映射的配置规则文件和该企业的图查询模板,生成针对该企业提供的某领域业务的原知识图谱的图查询语句,实现过程本申请实施例不做详述。可见,这种针对不同企业配置对应的图查询模板的处理方式,相对于人工编写图查询语句的处理方式,也能够达到提高处理效率、准确性和可靠性的技术效果。
步骤S33,执行该图查询语句,依据所得到的图查询结果,获得目标本体文件下的目标实体信息和目标关系信息;
步骤S34,依据目标实体信息和目标关系信息,构成该领域的目标知识图谱。
继上文描述,本申请实施例实现对原知识图谱的变换,需要准备一份配置规则文件,直接调用通用的图查询模板实现,使得对原知识图谱的查询与目标实体信息、目标关系信息的生成不随具体任务的不同而额外增改,节约人力成本,每次更新只需要更新配置规则文件,提高了代码重用率,在本体更新后,能够快速完成知识图谱数据的迭代,即缩短迭代周期。另外,在需要记录迭代过程时,本申请可以备份每次更新使用的本体文件和配置规则文件,即实现了轻量化备份,占用空间小且冗余度低,同时实现了程序与数据的分离。
在本申请实施例中,通过执行实现知识图谱更新方法的程序,自动生成针对原知识图谱的所有图查询语句,自动执行该图查询语句,对原知识图谱进行图信息查询,得到每一个图查询语句的图查询结果的实现过程,可以通过不同线程都执行上述步骤S32,同步生成多个图查询语句,提高效率;当然,这多个图查询语句也可以顺次生成,本申请对多个图查询语句的生成顺序不做限制;后续对于多个图查询语句执行,也可以同步执行来提高效率,也可以按照顺序每次执行一个或部分图查询语句执行等,可视情况而定,如结合计算机设备的可用资源确定等。
其中,在执行每一个图查询语句对原知识图谱进行查询,所得到的图查询结果通常是采用字符串的方式表示目标实体信息或目标关系信息,需要将其转换成目标本体文件下的目标实体信息或目标关系信息,以构成目标知识图谱。关于图查询结果的转换处理方法本申请不做详述。
综上,在本体文件发生变化的情况下,本申请可以通过本体文件,以及用于说明原本体文件与目标本体文件之间的概念层映射的配置规则文件,实现原知识图谱到目标知识图谱的转化,提高知识图谱更新效率和可靠性。
参照图4,为本申请提出的知识图谱更新方法的又一可选示例的流程示意图,本实施例可以是对上文描述的知识图谱更新方法的一可选细化实现方法,但并不局限于本实施例描述的细化实现方法,且该方法仍可以由计算机设备执行,如图4所示,该方法可以包括:
步骤S41,获取任一领域的原知识图谱、目标本体文件以及配置规则文件;
其中,配置规则文件至少可以包含原知识图谱的原本体文件与目标本体文件之间的实体类别映射和关系映射等。关于步骤S41的实现方法可以参照上文实施例相应部分的描述,本实施例不做赘述。
结合上文对配置规则文件的相关描述,由于其实依据溯源思想编写,相当于是编写一份本体文件及其简单批注,使其文件规模量级与本体文件规模量级相当,若直接对知识图谱编写的业务规则,不仅要考虑本体概念层的映射,还需要考虑数据层面,实体间是否存在本体文件中定义的关系,据此判断后续执行什么操作,导致条件分支复杂,不仅导致编写的业务规则繁多,阅读和后期维护成本也会很高。本申请获得的配置规则文件内容,实现了本体与数据解耦,仅关注本体层面,极大降低了配置规则文件的编写难度及花费的人力和时间成本。
在一些实施例中,上述配置规则文件的生成方法可以包括但并不局限:终端设备响应任一领域的原本体文件的结构更新请求,依据原本体文件以及更新后的目标本体文件,生成配置规则文件,将该配置规则文件发送至服务器或指定终端设备。本申请对生成的配置规则文件的存储位置及方式不做限制,可以直接发送至上述计算机设备,也可以上传至企业系统平台上的其他设备或在该终端设备本地存储,以使计算机设备从中调取所需的配置规则文件。
步骤S42,调取图查询模板;
本申请实施例中,具有通用特性的图查询模板可以依据图查询语言配置,为了保证据此生成的图查询语句能够相对全面且准确地,从原知识图谱中查询到目标知识图谱的目标实体信息和目标关系信息,该图查询模板可以包含有多个待定查询条件的待写入区域。其中,该待定查询条件可以用于指示在对应待定写入区域写入的配置规则文件中对应的本体信息,即指示将配置规则文件中的哪些内容写入哪个待定查询条件的待写入区域,或指示基于哪些内容得到的待写入内容等,以便后续能够据此自动生成图查询语句。
其中,上述待定查询条件指示的本体信息至少可以包括上述实体类别映射和关系映射,且图查询模板中的多个待定查询条件至少可以包括待定查询属性条件和待定查询关系条件,分别用于指示依据配置规则文件中的对应类型的本体映射,来确定对应待写入区域需要填写的内容,本申请对上述多个待定查询条件以及相互之间的关系、对应待写入区域对写入内容的格式要求等不做限制,可视情况而定。
示例性的,假设配置规则文件的基本组成内容的一可选实例如下:
可见,上述实例是采用yaml格式的配置规则文件,来定义目标本体文件下,如何生成ProductLine这一类实体。其中,class可以表示目标本体下的类,上述实例中说明其描述的配置规则文件内容都围绕ProductLine类进行定义。data_property可以表示目标本体文件的该类下拥有的所有属性,以及该属性与原本体文件中属性之间的映射,且data_property的全部键值组成了<property_list>。如上述实例,ProductLine类有两个属性:brand和productLine,brand属性来自原本体文件中Brand类下的brand属性;productLine属性来自原本体文件中ProductLine类下的productLine属性,两者虽然同名,但存在于不同本体文件,所表征含义不同。
在实际应用中,对于上述图查询模板可以预先存储在数据库或其他共享设备中,这样,在任一企业需要对其拥有的任一领域业务的本体文件发生变化的场景下,可以由计算机设备直接从共享设备中直接调取通用的图查询模板。
步骤S43,依据图查询模板包含的多个待定查询条件各自指示的配置规则文件中本体信息,获得针对原知识图谱对应的目标查询条件;
继上文对图查询模板的分析,由图查询模板包含的每个待定查询条件的内容,可以得知需要从配置规则文件中提取哪些本体信息,写入该待定查询条件的待写入区域,得到对应的目标查询条件。由上文对待定查询条件的类型可知,所得目标查询条件至少可以包括目标查询属性条件和目标查询关系条件,当然,根据应用需求,还可以包含其他查询条件,如查询原知识图谱的查询约束条件等,可以依据图查询模板以及配置规则文件的内容确定。
在一些实施例中,本申请可以依据配置规则文件包含的实体类别映射和关系映射,分别获得针对原知识图谱的目标查询属性条件和目标查询关系条件,实现过程本申请不做详述。
可以理解,对于图查询模板包含的各待定查询条件,并不一定都能够生成针对原知识图谱对应的目标查询条件,按照上文描述的查询条件生成方式,若配置规则文件中未包含某一个或多个待定查询条件所指示内容,无法向该待定查询条件中的待写入区域填写内容,也就无法得到对应的目标查询条件。
步骤S44,利用获得的目标查询条件,生成针对原知识图谱的实体查询语句和关系查询语句;
结合上文对图查询语句的相关描述,在执行程序自动生成实体查询语句和关系查询语句这两种图查询语句的过程中,可以结合生成的一个或多个目标查询条件以及上述前缀信息,按照查询语句的格式要求,构成对应的实体查询语句或关系查询语句。本申请各图查询语句的生成过程不做详述,可以理解,对于不同的图查询语句所利用的目标查询条件内容往往不同,生成的实体查询语句和关系查询语句各自的数量往往是多个,可视情况而定。
结合上文对前缀信息的描述可知,其可以是原本体文件和/或目标文本文件中的本体标识信息,所以,在生成图查询语句时,可以获取该本体标识信息,按照图查询模板,依据上述实体类别映射、关系映射以及本体标识信息,生成针对原知识图谱的图查询语句,如上述多个实体查询语句和多个关系查询语句,本申请对获取的本体标识信息的内容不做限制,示例性的,如http://example.org,还可以通过onto_srcsuo表示原本体文件的URI前缀,又rdf.type表示W3C标准谓词(predicate)等,
需要说明,本申请对上述实体查询语句和关系查询语句的生成顺序不做限制,由于知识图谱的关系查询,需要使用知识图谱的实体查询结果,这就需要先执行实体查询语句,所以,为了提高处理效率,本申请可以先生成实体查询语句后直接执行,在该过程中,可以生成关系查询语句后直接执行。当然,也可以同时生成各图查询语句。
步骤S45,执行实体查询语句,得到实体查询结果;
由于实体查询语句可以是依据上述一个或多个目标查询属性条件构成,该目标查询属性条件可以是依据配置规则文件中的实体类别映射获得的,该实体类别映射是指新旧本体之间的类映射,由于实体的类(class)是由属性(attribution/datatype property)组成,类映射本质可以是属性的映射,对于新本体(即目标本体)下类的每一个属性,可以依据新旧本体的变化情况,定义该属性是从旧本体(即原本体文件)的哪一个或哪一类的属性变换而来;对于新生成的类及其包含的属性,可以说明该类是如何生成的等。
因此,执行基于上述实体类别映射生成的实体查询语句,通常包括用于查询原知识图谱中符合该实体类别映射的各实体对应的多个实体查询语句,这样,执行所生成的所有实体查询语句,可以得到各自的实体查询结果,也就是图查询语言的返回结果,可以是所定义的全变量的值(如类、属性等)组成的列表,即<preproty_list>和<class_list>。
其中,<preproty_list>可以是属性变量,可以按照顺序写入配置规则文件的data_property的键,加上前缀区分class,对于上文示例,可以生成“<prop_brand>prop_productLine”字符串写入图查询模板。<class_list>可以是类变量,是按照顺序写入配置规则文件的data_property的值的前半部分(即→之前的部分),若某个原本体文件的类出现多次,需要重复写入,保证<class_list>变量个数与<preproty_list>保持一致,可以加上前缀区分property。对于示例,可以生成”<cls_Brand>cls_ProductLine”这一字符串写入图查询模板。
基于上文分析,执行包含上述内容的图查询语句,所得到的实体查询结果可以为:
步骤S46,依据实体查询结果,获得待生成的目标知识图谱与原知识图谱之间的实体关键数据,以及目标本体文件下的目标实体信息;
本申请实施例中,继上文示例,可以依据一组<preproty_list>返回结果,可以生成目标知识图谱中的目标实体,依据<class_list>返回结果可以表示该目标实体是由原知识图谱中的实体参与生成,据此生成原知识图谱与目标知识图谱之间的实体映射,如实体URI(Uniform Resource Identifier,统一资源标识符)映射,作为实体关键数据进行存储记录,同时,也可以确定所需目标知识图谱中的目标实体信息。
可见,按照上述对原知识图谱的查询方式,通过一条实体查询语句,可以生成目标本体文件下的一个类的所有目标实体信息,实现过程本申请不做详述。且需要说明,关于依据实体查询结果,获得目标本体文件下的目标实体信息的实现方法,包括但并不局限于本实施例步骤46记载的实现方法,可以依据不同领域业务需求进行适应性调整,本申请在此不做举例详述。
步骤S47,缓存实体关键数据和目标实体信息;
对于实体关键数据和目标实体信息的缓存,可以由计算机设备自身存储器实现,也可以是计算机设备将其发送至数据库进行存储,本申请对数据存储实现方法不做限制。
步骤S48,执行关系查询语句,得到关系查询结果;
本申请实施例中,关系查询语句可以由一个或多个目标查询关系条件构成,而该目标查询关系条件可以依据上述配置规则文件包含的关系映射确定。其中,为了获得目标本体文件下的目标关系信息,该关系映射定义目标关系信息在原本体文件下的关系名称,或在原本体文件中涉及到的类。若定义原本体文件中关系的名称,说明这与上述实体类别映射规则相同,该关系在原本体文件和目标本体文件之间也存在映射,这样就可以通过生成目标实体信息的步骤,来生成该类型的目标关系信息。
若定义的规则是有类,说明原知识图谱中不存在该关系,这种情况下,可能是原知识图谱某类的实体分裂成多个类别,也可能是纯粹新添加的关系。需要通过原知识图谱与目标知识图谱之间的实体URI映射(其保存了目标知识图谱URI的生成是由原知识图谱中哪些URI参与,已经原知识图谱中某一个URI参与了哪些目标知识图谱URI的建立),来确定要建立关系的实体对(即头尾实体)。
因此,本申请在依据上述关系映射,可以保证关系查询语句包含的各目标查询关系条件,可以准确且完整地说明如何基于原知识图谱的数据,获得目标知识图谱的目标关系信息。而执行该关系查询语所得到的关系查询结果,是直接从原知识图谱中获得的,但如上述分析,目标本体文件中的某一类关系可能并未存在于原本体文件,这就可以执行后续步骤,即结合实体查询得到的实体URI映射,来更精准地获得目标关系信息。
需要说明,在得到关系查询结果后,本申请如何依据关系查询结果和目标实体信息,获得目标本体文件下的目标关系信息的实现方法不做限制,包括但并不局限于下文步骤记载的实现方法,可以依据不同应用需求进行适应性调整。
步骤S49,调取实体关键数据和目标实体信息;
步骤S410,依据关系查询结果、目标实体信息及实体关键数据,生成目标本体文件下的目标关系信息;
继上文对原本体的变化情况的相关描述可知,目标本体文件与原本体文件之间的关系存在映射。示例性的,如下所述的关系映射内容:
目标关系信息与目标实体信息的查询类似,为了在目标知识图谱中建立名称为hasProductProject的关系,在查询过程中,需要从原知识图谱中查询满足该关系的全部头尾实体对。对此,在配置文件文件定义关系映射时,通常会先定义hasProductProject关系来源于原本体文件的hasProductSeries,这样,通过解析配置规则文件中关系映射,可以生成用于实现hasProductProject关系查询的图查询语句,此处可以是关系查询语句,如下所示:
SELECT<cls_ProductLine>cls_ProductSeries WHERE{
<cls_ProductLine rdf:type onto_src:ProductLine>
<cls_ProductSeries rdf:type onto_src:ProductSeries>
<cls_ProductLine onto_src:has ProductSeries>cls_ProductSeries
}
之后,执行上述示例的关系查询语句所得到的关系查询结果可以包括:原知识图谱中存在hasProductSeries关系的头尾实体对。结合上文对关系映射内容的相关描述,本申请还可以依据实体查询过程中构建的实体关键数据(即实体URI映射),将查找到的头尾实体对映射成目标知识图谱中的头尾实体对,即获得目标知识图谱中的目标关系。
可以理解,上述示例中,由于原知识图谱的hasProductSeries类实体不仅映射到目标知识图谱中的ProductProject类实体,还可能映射到目标知识图谱中的其他类实体,所以,本申请需要对获得的实体对进行类别筛选,将筛选后的目标知识图谱的头尾实体对,建立名称为hasProductProject的目标关系,直至获得所有的目标关系信息。
在又一些实施例中,目标知识图谱定义的目标关系可能并未存在于原知识图谱,针对这种情况,本申请定义的配置规则文件中的关系映射可以包括:
由上述示例描述的关系映射内容可知,其并未包含“src_relation”字段,仅存在“src_class”字段,说明该关系的头尾实体对仅依赖于类。如示例内容表面目标本体文件下的ProductProject类实体和ProductSeries类实体均来自原本体文件下的ProductSeries实体,这种情况下,所生成的关系查询语句可以为:
SELECT<cls_ProductSeries>cls_ProductSeries WHERE{
<cls_ProductSeries rdf:type onto_src:ProductSeries>
<cls_ProductSeries rdf:type onto_src:ProductSeries>
}
可见,执行示例的关系查询语句得到关系查询结构,即返回的<class_list>可以是原知识图谱下的所有ProductSeries实体自身与自身构成的实体对,再映射到目标知识图谱的实体URI时,第一个cls_ProductSeries变量对应的结果映射到目标知识图谱类别为ProductSeries的实体,再对筛选后的目标知识图谱的头尾实体对建立名为hasProductSeries的关系,完成目标关系信息的建立,保证所得目标关系信息的完整性和准确性。
步骤S411,由目标实体信息和目标关系信息,构成该领域的目标知识图谱,输出该目标知识图谱。
按照上文描述的方法,获得目标实体信息和目标关系信息后,可以直接构成目标本体下的目标知识图谱,如将目标实体信息和目标关系信息转换成知识图谱格式后导出,如根据实际需求,将如csv、nt、ttl等格式的目标知识图谱的文件发送至数据库中存储,以便后续客户端可以依据该目标知识图谱获得所需业务查询结果,本申请对目标知识图谱的文件格式及其存储方式不做限制,可视情况而定。
参照图5,为本申请提出的知识图谱更新方法的又一可选示例的流程示意图,本实施例可以是对上文描述的知识图谱更新方法的又一可选细化实现方法,包括对图查询模板内容,以及图查询语句的获取过程的细化描述,包括但并不局限于本实施例描述的实现方法。如图5所示,该方法可以包括:
步骤S51,获取任一领域的原知识图谱、目标本体文件以及配置规则文件,调取图查询模板;
关于配置规则文件包含的实体类别映射和关系映射的内容,可以参照上文实施例相应部分的描述,本实施例不做赘述。
对于通用的图查询模板,结合上下文描述内容,其包含的多个待定查询条件可以包括待定查询属性条件和待定查询关系条件,此外,还可以包括用于指示查询结果是否去重的待去重条件,和/或待查询约束条件。本申请实施例以图查询模板中的多个待定查询条件包括这四种条件为例进行说明,对于其他条件组合构成的图查询模板,应用其自动生成图查询语句的实现过程类似,本申请不做一一举例详述。
基于此,示例性的,上述图查询模板可以采用sparql语言等图查询语言制定,可以按照但并不局限于如下内容图查询模板:
SELECT<ifDistinct><preproty_list><class_list>WHERE{<condition_list>}
其中,<ifDistinct>可以表示上述待去重条件,说明执行由此生成的图查询语句所得到的图查询结果是否需要去重;<preproty_list>可以表示该图查询结果必须返回所有属性列表;<class_list>可以表示该图查询结果须返回所有类实体URI列表;<condition_list>可以表示执行该图查询语句,对原知识图谱进行查询的约束条件列表。
步骤S52,依据配置规则文件包含的实体类别映射和关系映射,确定图查询模板包含的待定属性条件和待定查询关系条件各自的待写入区域的待写入内容,得到针对原知识图谱的目标查询属性条件和目标查询关系条件;
关于步骤S52的实现过程,可以参照上文实施例相应部分的描述,本实施例在此不做详述。其中,对于实体类别映射中的实体类别(即类)可以包括至少一个属性,关于实体类别映射和关系映射的构建方法及其内容,可以参照上文实施例对应部分描述。
步骤S53,依据配置规则文件包含的查询结果去重字段,确定图查询模板包含的待去重条件的待写入区域的待写入内容,得到针对原知识图谱的目标去重条件;
步骤S54,依据配置规则文件包含的实体类别映射和关系映射,确定图查询模板包含的待查询约束条件的待写入区域的待写入内容,得到针对原知识图谱的目标查询约束条件;
仍以上文列举的配置规则文件和图查询模板示例为例进行解释,在目标去重条件的获得过程中,可以根据配置规则文件中distinct字段内容,来确定执行由此生成的图查询语句,得到图查询结果时,是否需要对直接查询结果进行去重。若该distinct字段为true,可以在图查询模板中待去重条件的待写入区域写入“DISTINCT”;若该distinct字段为false,意味着不需要去重,可以在该待去重条件的待写入区域写入空字符串。
同理,在目标查询约束条件的获得过程中,可以依据实际情况,从多方面确定生成查询变量的约束条件。可选的,本申请可以依据实体类别映射,获得第一约束条件和第二约束条件;其中,该第一约束条件可以用于指示所查询不同类中的实体在原本体文件中的相应实体名称,也就是说,在目标查询约束条件中可以指名所查询类变量(如上述<class_list>)在原本体文件中的完整名称(其可以是URI格式)。示例性,若有两个类变量,生成的目标查询约束条件中的第一约束条件可以如下字符串内容:
<cls_Brand rdf:type onto_src:Brand>
<cls_ProductLine rdf:type onto_src:ProductLine>
其中,onto_srcsuo表示原本体文件的URI前缀,又rdf.type表示W3C标准谓词(predicate)。所以,后续依据这两个字符串表示的两个目标查询约束条件进行原知识图谱查询时,可以在原知识图谱中查找类别为Brand的全部实体和类别为ProductLine的全部实体,cls_Brand和cls_ProductLine返回结果均可以为URI格式。
对于上述第二约束条件可以用于指示目标本体文件中各类的属性来自原本体文件中具有该属性的第一类,也就是说,在对原知识图谱查询过程中,需要根据属性变量,反推出是哪些类变量应具备哪些数学,且它们的属性值作为结果返回。如,在已知目标本体文件下的ProductLine类的brand属性应该来自原本体文件中的Brand类下的Brand属性,productLine属性应该来自原本体文件中ProductLine类下的productLine属性,可以由此生成的第二约束条件为:
<cls_Brand onto_src:brand>pror_brand
<cls_ProductLine onto_src:ProductLine>pror_productLine
此外,在获得目标查询约束条件过程中,本申请还可以依据关系映射中的类间关系,获得第三约束条件;该第三约束条件可以用于指示查询具有该类间关系的实体对,用于补充上述第一约束条件和第二约束条件。示例性的,若原本体文件中存在Brand-[hasProductLine]→ProductLine这一关系,即原知识图谱中,一个Brand实体和一个ProductLine实体之间,可能存在hasProductLine关系,且由Brand指向ProductLine,对此构建的第三约束条件可以包括:<cls_Brand onto_src:hasProductLine>cls_productLine。这就意味着返回的属性变量,在原始图谱中一定满足如上约束关系,不能时单纯的笛卡尔积组合。这样,将由上述第一约束条件、第二约束条件和第三约束条件,构成针对原知识图谱的目标查询约束条件,将其作为构成图查询语句的一个查询条件,执行该内容的图查询语句,能够极大减少查询结果数据量,提高查询效率和准确性。
步骤S55,依据获得的目标查询属性条件、目标查询关系条件、目标去重条件和目标查询约束条件,构成生成针对原知识图谱的图查询语句;
结合上文对图查询语句的相关描述,结合上文实施例所举例的配置规则文件的描述内容,目标本体文件的ProductLine类由原知识图谱中两个类的实体信息组合而成,若在构架图查询语句中不添加目标查询约束条件,假设原始知识图谱数据有m个Brand实体,n个ProductLine实体,经过笛卡尔乘积运算,目标知识图谱将会查询m*n个ProductLine实体,这并不符合实际情况。所以,本申请提出依据原本体文件中存在Brand到ProductLine的关系,将其约束添加至图查询语句后执行查询步骤,查询结果可以是<preproty_list>返回结果,即一组(brand,productLine)是目标知识图谱ProductLine类应生成的所有实体。
需要说明,对于目标查询约束条件“src_relation”通常是客观存在的,并非是人为确定是否添加,在图查询模板存在待查询约束条件的待写入区域,就可以按照上文描述的方法,对配置规则文件内容进行分析,确定该待写入区域的内容,得到目标查询约束条件。
可选的,若确定目标本体文件下的某个类来自原本体文件中的多个类,可以自动遍历原本体文件的这些类,将存在的关系添加至待查询约束条件的待写入区域。若无任何关系,目标本体文件存在多个类,那么这些类的目标知识图谱中的实体数量,将会是原知识图谱中各个相关实体类别数量的笛卡尔积。
示例性的,程序根据配置规则文件和本体标识信息,生成的图查询语句可以如下字符串内容,但并不局限于此:
SELECT<prop_brand>prop_ProductLine<cls_Brand>cls_ProductLine WHERE{
<cls_Brand rdf:type onto_src:Brand>
<cls_ProductLine rdf:type onto_src:ProductLine>
<cls_Brand onto_src:brand>prop_brand
<cls_ProductLine onto_src:ProductLine>prop_productLine
<cls_Brand onto_src:hasProductLine>cls_ProductLine
}
步骤S56,执行该图查询语句,依据所得到的图查询结果,获得目标本体文件下的目标实体信息和目标关系信息;
步骤S57,依据目标实体信息和目标关系信息,生成该领域的目标知识图谱。
关于步骤S55-步骤S57的实现过程,可以参照上文实施例相应部分的描述,本实施例在此不做赘述。
在一些实施例中,结合上文对关系映射以及目标约束条件的相关描述,对于上述目标关系信息的获取方法可以包括:
若上述获得的关系查询结果表征原知识图谱中存在符合目标查询约束条件的实体对,可以依据缓存的实体关键数据中相应的实体映射,得到该实体对之间的第一关系信息;若关系查询结果表征目标本体文件中第二关系依赖原知识图谱中的实体类别,将赖的实体类别中的实体映射至被依赖的相应第二关系。之后,可以利用目标查询约束条件,获得映射处理后的实体对之间的第二关系信息;由得到的第一关系信息和第二关系信息,构成目标本体文本下的目标关系信息,实现过程本申请不再赘述。
综上,本申请实施例在依据配置规则文件以及通用的图查询模板,生成针对原知识图谱的图查询语句过程中,充分考虑到原本体文件与目标本体文件之间的映射所存在的查询约束条件,提高了对原知识图谱的查询效率和准确性。
参照图6,为本申请提出的知识图谱更新装置的一可选示例的结构示意图,如图6所示,该装置可以包括:
数据获取模块61,用于获取任一领域的原知识图谱、目标本体文件以及配置规则文件;其中,所述配置规则文件至少包含所述原知识图谱的原本体文件与所述目标本体文件之间的实体类别映射和关系映射;
图查询语句生成模块62,用于按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句;
目标知识数据获得模块63,用于执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息;
目标知识图谱生成模块64,用于依据所述目标实体信息和所述目标关系信息,生成所述领域的目标知识图谱。
可选的,上述图查询语句生成模块62可以包括:
图查询模板调取单元,用于调取图查询模板;
其中,所述图查询模板依据图查询语言配置,且包含有多个待定查询条件的待写入区域;所述待定查询条件用于指示在所述待定写入区域写入的所述配置规则文件中对应的本体信息,所述本体信息至少包括所述实体类别映射和所述关系映射,且所述多个待定查询条件至少包括待定查询属性条件和待定查询关系条件;
目标查询条件获得单元,用于依据所述多个待定查询条件各自指示的所述配置规则文件包含的本体信息,获得针对所述原知识图谱对应的目标查询条件;所述目标查询条件至少包括目标查询属性条件和目标查询关系条件,
图查询语句生成单元,用于利用获得的所述目标查询条件,生成针对所述原知识图谱的图查询语句。
在一些实施例中,若图查询模板中的多个待定查询条件还可以包括用于指示查询结果是否去重的待去重条件和/或待查询约束条件,上述目标查询条件获得单元可以包括:
属性关系条件获得单元,用于依据所述实体类别映射和所述关系映射,分别获得针对所述原知识图谱的目标查询属性条件和目标查询关系条件;其中,所述实体类别包含有至少一个属性;以及,
去重条件获得单元,用于依据所述配置规则文件中的查询结果去重字段,获得针对所述原知识图谱的目标去重条件;和/或
查询约束条件获得单元,用于依据所述实体类别映射以及所述关系映射,获得针对所述原知识图谱的目标查询约束条件;所述目标查询约束条件能够表征属性维度、实体类别维度以及关系维度的约束。
可选的,上述查询约束条件获得单元可以包括:
第一获得单元,用于依据所述实体类别映射,获得第一约束条件和第二约束条件;
其中,所述第一约束条件用于指示所查询不同类中的实体在所述原本体文件中的相应实体名称;所述第二约束条件用于指示所述目标本体文件中各类的属性来自所述原本体文件中具有该属性的第一类;
第二获得单元,用于依据所述关系映射中的类间关系,获得第三约束条件;所述第三约束条件用于指示查询具有所述类间关系的实体对;
目标查询约束条件构成单元,用于由所述第一约束条件、所述第二约束条件和所述第三约束条件,构成针对所述原知识图谱的目标查询约束条件。
在又一些实施例中,上述图查询语句包含实体查询语句和关系查询语句,基于此,上述目标知识数据获得模块63可以包括:
实体查询结果得到单元,用于执行所述实体查询语句,得到实体查询结果;
目标实体信息获得单元,用于依据所述实体查询结果,获得所述目标本体文件下的目标实体信息;
关系查询结果得到单元,用于执行所述关系查询语句,得到关系查询结果;
目标关系信息获得单元,用于依据所述关系查询结果和所述目标实体信息,获得所述目标本体文件下的目标关系信息。
可选的,上述目标知识数据获得模块63还可以包括:
实体关键数据获得单元,用于依据所述实体查询结果,获得待生成的目标知识图谱与所述原知识图谱之间的实体关键数据;所述实体关键数据包括所述目标知识图谱与所述原知识图谱之间的实体映射;
数据缓存单元,用于缓存所述实体关键数据和所述目标实体信息;
基于此,上述目标关系信息获得单元可以包括:
数据调取单元,用于调取所述实体关键数据和所述目标实体信息;
目标关系信息生成单元,用于依据所述关系查询结果、所述目标实体信息及所述实体关键数据,生成所述目标本体文件下的目标关系信息。
可选的,上述目标关系信息获得单元还可以包括:
第一关系信息得到单元,用于在关系查询结果表征原知识图谱中存在所述符合所述目标查询约束条件的实体对的情况下,依据缓存的所述实体关键数据中相应的所述实体映射,得到该实体对之间的第一关系信息;
实体映射处理单元,用于在关系查询结果表征所述目标本体文件中第二关系依赖所述原知识图谱中的实体类别的情况下,将所依赖的实体类别中的实体映射至被依赖的相应所述第二关系;
第二关系信息获得单元,用于利用所述目标查询约束条件,获得映射处理后的实体对之间的第二关系信息;
目标关系信息构成单元,用于由得到的所述第一关系信息和所述第二关系信息,构成所述目标本体文本下的目标关系信息。
在又一些实施例中,上述图查询语句生成模块62可以包括:
本体标识信息获取单元,用于获取所述原本体文件和/或所述目标文本文件中的本体标识信息;
图查询语句生成单元,用于按照图查询模板,依据所述实体类别映射、所述关系映射以及所述本体标识信息,生成针对所述原知识图谱的图查询语句;
和/或,所述配置规则文件的生成方法包括:
配置规则文件生成单元,响应任一领域的原本体文件的结构更新请求,依据所述原本体文件以及更新后的目标本体文件,生成配置规则文件;
配置规则文件发送单元,用于将所述配置规则文件发送至服务器或指定终端设备。
需要说明的是,关于上述各装置实施例中的各种模块、单元等,均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块,以实现相应的功能,关于各程序模块及其组合所实现的功能,以及达到的技术效果,可以参照上述方法实施例相应部分的描述,本实施例不再赘述。
本申请还提供了一种计算机可读存储介质,其上可以存储计算机程序,该计算机程序可以被处理器调用并加载,以实现上述实施例描述的知识图谱更新方法的各个步骤,实现过程可以参照上文方法实施例相应部分的描述,本实施例不做赘述。
最后,需要说明的是,关于上述各实施例中,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
本申请涉及到的术语诸如“第一”、“第二”等仅用于描述目的,用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。且不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
另外,本说明书中各个实施例采用递进或并列的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备、介质而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种知识图谱更新方法,包括:
获取任一领域的原知识图谱、目标本体文件以及配置规则文件;其中,所述配置规则文件至少包含所述原知识图谱的原本体文件与所述目标本体文件之间的实体类别映射和关系映射;
按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句;
执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息;
依据所述目标实体信息和所述目标关系信息,生成所述领域的目标知识图谱。
2.根据权利要求1所述的方法,所述按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句,包括:
调取图查询模板;其中,所述图查询模板依据图查询语言配置,且包含有多个待定查询条件的待写入区域;所述待定查询条件用于指示在所述待定写入区域写入的所述配置规则文件中对应的本体信息,所述本体信息至少包括所述实体类别映射和所述关系映射,且所述多个待定查询条件至少包括待定查询属性条件和待定查询关系条件;
依据所述多个待定查询条件各自指示的所述配置规则文件包含的本体信息,获得针对所述原知识图谱对应的目标查询条件;所述目标查询条件至少包括目标查询属性条件和目标查询关系条件,
利用获得的所述目标查询条件,生成针对所述原知识图谱的图查询语句。
3.根据权利要求2所述的方法,若所述多个待定查询条件还包括用于指示查询结果是否去重的待去重条件和/或待查询约束条件,所述依据所述多个待定查询条件各自指示的所述配置规则文件包含的本体信息,获得针对所述原知识图谱对应的目标查询条件,包括:
依据所述实体类别映射和所述关系映射,分别获得针对所述原知识图谱的目标查询属性条件和目标查询关系条件;其中,所述实体类别包含有至少一个属性;以及,
依据所述配置规则文件中的查询结果去重字段,获得针对所述原知识图谱的目标去重条件;和/或
依据所述实体类别映射以及所述关系映射,获得针对所述原知识图谱的目标查询约束条件;所述目标查询约束条件能够表征属性维度、实体类别维度以及关系维度的约束。
4.根据权利要求3所述的方法,所述依据所述实体类别映射以及所述关系映射,获得针对所述原知识图谱的目标查询约束条件,包括:
依据所述实体类别映射,获得第一约束条件和第二约束条件;其中,所述第一约束条件用于指示所查询不同类中的实体在所述原本体文件中的相应实体名称;所述第二约束条件用于指示所述目标本体文件中各类的属性来自所述原本体文件中具有该属性的第一类;
依据所述关系映射中的类间关系,获得第三约束条件;所述第三约束条件用于指示查询具有所述类间关系的实体对;
由所述第一约束条件、所述第二约束条件和所述第三约束条件,构成针对所述原知识图谱的目标查询约束条件。
5.根据权利要求3或4所述的方法,所述图查询语句包含实体查询语句和关系查询语句;所述执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息,包括:
执行所述实体查询语句,得到实体查询结果;
依据所述实体查询结果,获得所述目标本体文件下的目标实体信息;
执行所述关系查询语句,得到关系查询结果;
依据所述关系查询结果和所述目标实体信息,获得所述目标本体文件下的目标关系信息。
6.根据权利要求5所述的方法,在所述依据所述实体查询结果,获得所述目标本体文件下的目标实体信息过程中,还包括:
依据所述实体查询结果,获得待生成的目标知识图谱与所述原知识图谱之间的实体关键数据;所述实体关键数据包括所述目标知识图谱与所述原知识图谱之间的实体映射;
缓存所述实体关键数据和所述目标实体信息;
所述依据所述关系查询结果和所述目标实体信息,获得所述目标本体文件下的目标关系信息,包括:
调取所述实体关键数据和所述目标实体信息;
依据所述关系查询结果、所述目标实体信息及所述实体关键数据,生成所述目标本体文件下的目标关系信息。
7.根据权利要求6所述的方法,所述依据所述关系查询结果和所述目标实体信息,获得所述目标本体文本下的目标关系信息,还包括:
若所述关系查询结果表征原知识图谱中存在所述符合所述目标查询约束条件的实体对,依据缓存的所述实体关键数据中相应的所述实体映射,得到该实体对之间的第一关系信息;
若所述关系查询结果表征所述目标本体文件中第二关系依赖所述原知识图谱中的实体类别,将所依赖的实体类别中的实体映射至被依赖的相应所述第二关系;
利用所述目标查询约束条件,获得映射处理后的实体对之间的第二关系信息;
由得到的所述第一关系信息和所述第二关系信息,构成所述目标本体文本下的目标关系信息。
8.根据权利要求1-4任一项所述的方法,所述按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句,包括:
获取所述原本体文件和/或所述目标文本文件中的本体标识信息;
按照图查询模板,依据所述实体类别映射、所述关系映射以及所述本体标识信息,生成针对所述原知识图谱的图查询语句;
和/或,所述配置规则文件的生成方法包括:
响应任一领域的原本体文件的结构更新请求,依据所述原本体文件以及更新后的目标本体文件,生成配置规则文件;
将所述配置规则文件发送至服务器或指定终端设备。
9.一种知识图谱更新装置,包括:
数据获取模块,用于获取任一领域的原知识图谱、目标本体文件以及配置规则文件;其中,所述配置规则文件至少包含所述原知识图谱的原本体文件与所述目标本体文件之间的实体类别映射和关系映射;
图查询语句生成模块,用于按照图查询模板,至少依据所述配置规则文件,生成针对所述原知识图谱的图查询语句;
目标知识数据获得模块,用于执行所述图查询语句,依据所得到的图查询结果,获得所述目标本体文件下的目标实体信息和目标关系信息;
目标知识图谱生成模块,用于依据所述目标实体信息和所述目标关系信息,生成所述领域的目标知识图谱。
10.一种计算机设备,包括:
通信接口;
存储器,用于存储实现如权利要求1-8任一项所述的知识图谱更新方法的程序;
处理器,用于加载执行所述存储器存储的所述程序,实现如权利要求1-8任一项所述的知识图谱更新方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111655790.3A CN114328965A (zh) | 2021-12-30 | 2021-12-30 | 知识图谱更新方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111655790.3A CN114328965A (zh) | 2021-12-30 | 2021-12-30 | 知识图谱更新方法、装置及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114328965A true CN114328965A (zh) | 2022-04-12 |
Family
ID=81019016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111655790.3A Pending CN114328965A (zh) | 2021-12-30 | 2021-12-30 | 知识图谱更新方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114328965A (zh) |
-
2021
- 2021-12-30 CN CN202111655790.3A patent/CN114328965A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10963800B2 (en) | Service layer augmentation of response to semantically-informed query of arbitrary external data sources | |
US9607060B2 (en) | Automatic generation of an extract, transform, load (ETL) job | |
Kolovos et al. | A research roadmap towards achieving scalability in model driven engineering | |
US9542469B2 (en) | Data warehouse data model adapters | |
US20130166563A1 (en) | Integration of Text Analysis and Search Functionality | |
CN107315764B (zh) | 一种非关系型数据库关联数据的更新方法及系统 | |
CN108540351B (zh) | 分布式大数据服务的自动化测试方法 | |
Gui et al. | IFC-based partial data model retrieval for distributed collaborative design | |
US20200012643A1 (en) | Method for managing and executing decoders and transformations using linked data and a service layer | |
Tauscher et al. | A modular graph transformation rule set for IFC‐to‐CityGML conversion | |
CN114238085A (zh) | 接口测试方法、装置、计算机设备、存储介质 | |
US11106526B1 (en) | Architecture-based root cause analysis | |
CN115329011A (zh) | 数据模型的构建方法、数据查询的方法、装置及存储介质 | |
CN114997111B (zh) | 业务处理方法、装置、计算机设备和存储介质 | |
US11977473B2 (en) | Providing a pseudo language for manipulating complex variables of an orchestration flow | |
Sangupamba et al. | Business intelligence and big data in the cloud: opportunities for design-science researchers | |
CN115794858A (zh) | 查询语句处理方法、装置、设备及存储介质 | |
US20220405065A1 (en) | Model Document Creation in Source Code Development Environments using Semantic-aware Detectable Action Impacts | |
CN114328965A (zh) | 知识图谱更新方法、装置及计算机设备 | |
Yohannis et al. | Towards efficient loading of change-based models | |
CN113360496A (zh) | 一种构建元数据标签库的方法及装置 | |
Varadharajulu et al. | Spatial data supply chains | |
Criado et al. | Enabling the reuse of stored model transformations through annotations | |
CN114996319B (zh) | 基于规则引擎的数据处理方法、装置、设备及存储介质 | |
CN116755684B (zh) | OAS Schema的生成方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |