CN113239063B - 一种图数据库更新方法及装置 - Google Patents

一种图数据库更新方法及装置 Download PDF

Info

Publication number
CN113239063B
CN113239063B CN202110699546.0A CN202110699546A CN113239063B CN 113239063 B CN113239063 B CN 113239063B CN 202110699546 A CN202110699546 A CN 202110699546A CN 113239063 B CN113239063 B CN 113239063B
Authority
CN
China
Prior art keywords
data
new
original
graph
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110699546.0A
Other languages
English (en)
Other versions
CN113239063A (zh
Inventor
王得贤
李长亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Digital Entertainment Co Ltd
Original Assignee
Beijing Kingsoft Digital Entertainment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Digital Entertainment Co Ltd filed Critical Beijing Kingsoft Digital Entertainment Co Ltd
Priority to CN202110699546.0A priority Critical patent/CN113239063B/zh
Publication of CN113239063A publication Critical patent/CN113239063A/zh
Application granted granted Critical
Publication of CN113239063B publication Critical patent/CN113239063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种图数据库更新方法及装置,其中所述图数据库更新方法包括:响应于用户的图数据库更新请求,构建新图数据库对应的新本体结构;将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;依据所述新数据导入规则对原图数据库进行修改获得临时图数据库,并基于所述新数据导入规则获取待导入图数据;将所述待导入图数据导入所述临时图数据库中获得新图数据库。本申请的图数据库更新方法,基于用户的需求对图数据库的本体结构进行修改,根据修改完成的本体结构获取导入图数据库的数据,避免对未变化数据的重复更新,提高了更新效率。

Description

一种图数据库更新方法及装置
技术领域
本申请涉及计算机技术领域,特别涉及一种图数据库更新方法及装置、计算设备和计算机可读存储介质。
背景技术
在用户使用知识图谱的过程中,可能会产生在现有知识图谱中新增或者删除某种类型的节点或边的需求。为了满足用户需求,需要更新图数据库从而得到符合用户需求的新的知识图谱。现有技术中更新图数据库方法,通常是根据用户请求创建新的本体结构,再根据新的本体结构将所需的所有数据从结构化数据库中重新导入图数据库中得到新图数据库。这种更新方式需要导入大量的数据,更新效率不高。
发明内容
有鉴于此,本申请实施例提供了一种图数据库更新方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本申请实施例的第一方面,提供了一种图数据库更新方法,包括:
接收知识图谱更新请求,构建新本体结构;
将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;
复制原图数据库获得临时图数据库,依据所述新数据导入规则对所述临时图数据库进行修改,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原知识图谱对应;
将所述待导入图数据导入所述临时图数据库中获得新图数据库。
根据本申请实施例的第二方面,提供了一种图数据库更新装置,包括:
构建模块,被配置为响应于用户的知识图谱更新请求,构建新知识图谱对应的新本体结构;
构建模块,被配置为接收知识图谱更新请求,构建新本体结构;
对比模块,被配置为将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;
获取模块,被配置为复制原图数据库获得临时图数据库,依据所述新数据导入规则对所述临时图数据库进行修改,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原知识图谱对应;
导入模块,被配置为将所述待导入图数据导入所述临时图数据库中获得新图数据库。
根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述图数据库更新方法的步骤。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述图数据库更新方法的步骤。
根据本申请实施例的第五方面,提供了一种芯片,其存储有计算机指令,该指令被芯片执行时实现所述图数据库更新方法的步骤。
本申请实施例中,通过接收知识图谱更新请求,构建新本体结构;将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;复制原图数据库获得临时图数据库,依据所述新数据导入规则对所述临时图数据库进行修改,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原知识图谱对应;将所述待导入图数据导入所述临时图数据库中获得新图数据库。本申请的图数据库更新方法,基于图数据库的本体结构对图数据库更新,仅更新图数据库中用户需要更新的图数据,避免在更新时需要将所有数据重新导入图数据库中完成图数据库的更新,提高了图数据库的更新效率。
附图说明
图1a是本申请实施例提供的图数据库结构示意图;
图1b是本申请实施例提供的图数据库更新的数据流向图;
图2是本申请实施例提供的计算设备的结构框图;
图3是本申请实施例提供的图数据库更新方法的流程图;
图4是本申请实施例提供的应用于知识图谱的图数据库更新方法的流程图;
图5是本申请实施例提供的本体结构示意图;
图6是本申请实施例提供的以节点张三为例的原知识图谱示意图;
图7是本申请实施例提供的原本体结构示意图;
图8是本申请实施例提供的新本体结构示意图;
图9是本申请实施例提供的图数据库的本体结构与结构化数据的映射方法以及本体结构约束信息示意图;
图10是本申请实施例提供的临时图数据库示意图;
图11是本申请实施例提供的以张三为例的新图数据库示意图;
图12是本申请实施例提供的装置的结构示意图;
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“响应于确定”或“在......情况下”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
本体结构(Schema):用于定义图数据库中所包含的元素的类型、属性以及元素的约束信息,所述元素包括节点和边,记为Schema。
知识图谱(Knowledge Graph):是一种基于图的数据结构,由节点(point)和边(Edge)组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”,知识图谱本质上是语义网络。实体指的可以是现实世界中的事物,比如姓名、地名、公司、电话、动物学名等;关系则用来表达不同实体之间的某种联系。
图数据库(Graph Database):图数据库是一种非关系型数据库,应用图形理论存储实体以及实体之间的关系信息,例如图数据库Neo4j、OrientDB、titan等。图数据库是知识图谱数据的重要载体。
数据导入规则:用于确定图数据库的本体结构中的节点(或者边)对应的数据在结构化数据库中的存储位置,以及所述节点(或者边)对应的数据与结构化数据库的数据之间的映射方法。
如图1a本申请实施例提供的图数据库结构示意图所示,一个图数据库中可存储有多个知识图谱的图谱数据,一个知识图谱对应有一个本体结构,每个本体结构存在与其对应的数据导入规则。例如,在用户新增对知识图谱1的更新需求后,首先要在图数据库中确定知识图谱1的图谱数据,再基于用户新增的对知识图谱1的需求对知识图谱1的图谱数据进行更新,从而完成对图数据库的更新。
下面结合图1b本申请实施例提供的数据流向的系统示意图,对本申请更新图数据库方法的构思进行简述。
图数据库104中存储有构建知识图谱所需的节点数据和关系数据,即构建知识图谱所需的图谱数据,以及新本体结构106、原本体结构108。结构化数据库114中存储有结构化数据,所述结构化数据为可以用二维表结构来实现表达的数据。用户在使用知识图谱的过程中可能会存在增加或删除知识图谱中节点或边的需求。系统根据用户的需求生成用户请求102,用户请求102携带有待更新的原知识图谱的标识以及对原知识图谱对应的图谱数据进行更新的图谱数据操作信息。图数据库104响应于用户请求102,构建对应用户请求102的新本体结构106,该新本体结构106中定义了新知识图谱中元素的类型、属性以及约束信息,所述元素包括节点和边。将新本体结构106与原本体结构108进行对比,获取区别的节点和/或关系数据并记录到区别日志110中。
每个知识图谱对应一个本体结构,每个本体结构存在与其对应的数据导入规则。数据导入规则用于确定本体结构中定义的节点或者边在结构化数据库中的存储位置,以及将从结构化数据映射为待导入图数据的映射方法,该结构化数据从结构化数据库中获取。根据区别日志110对与原知识图谱对应的原数据导入规则进行修改得到新数据导入规则112。对图数据库104进行复制得到临时图数据库。根据新数据导入规则112,修改临时图数据库,并根据新数据导入规则112在结构化数据库114中查询并获取与新本体结构定义的节点或边的类型、属性对应的差量结构化数据116。根据新数据导入规则112中定义的映射方法将从结构化数据库获取到的差量结构化数据116映射为待导入图数据120。将待导入图数据120导入原知识图谱对应的图数据库104的临时图数据库中,得到符合用户请求的新图数据库。
在本申请中,提供了一种图数据库更新方法及装置、计算设备和计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图2示出了根据本申请一实施例的计算设备200的结构框图。该计算设备200的部件包括但不限于存储器210和处理器220。处理器220与存储器210通过总线230相连接,数据库250用于保存数据。
计算设备200还包括接入设备240,接入设备240使得计算设备200能够经由一个或多个网络260通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,计算设备200的上述部件以及图2中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图2所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备200可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备200还可以是移动式或静止式的服务器。
其中,处理器120可以执行图3所示图数据库更新方法中的步骤。图3示出了根据本申请一实施例的图数据库更新方法的流程图,包括步骤302至步骤308。
步骤302:接收知识图谱更新请求,构建新本体结构。
在本具体实施例中,响应于来自用户的知识图谱更新请求,构建新本体结构,其中新本体结构与拟建立的新知识图谱所对应。具体地,在知识图谱的使用过程中,用户随时有新的需求产生,此时,为了用户可以更方便的使用知识图谱就需要对知识图谱进行更新,尤其是本体结构也需要随之变化。用于构建知识图谱的数据存储于图数据库中,故对知识图谱更新即对知识图谱对应的图谱数据进行更新。新知识图谱即符合用户新增需求的知识图谱。在构建新知识图谱的过程中,首先要根据实际需求构建新本体结构。每个本体结构都规定了知识图谱的图谱数据的数据类型以及数据的约束信息,本体结构中的具体内容包括但不限于:定义的节点、关系类型(根据定义的类型获取结构化数据)以及节点、关系的约束信息(根据约束信息检查数据)。新本体结构是根据用户对知识图谱的新增需求构建,用户有改变现有知识图谱的请求即可发出请求。新本体结构即与新知识图谱对应的本体结构。
在实际应用中,根据更新请求构建新本体结构的步骤可以是,在接收到知识图谱更新请求的情况下:
S3021、提取所述知识图谱更新请求中包含的知识图谱标识和图谱数据操作信息;
S3022、根据所述知识图谱标识确定所述原图数据库中与原知识图谱对应的图谱数据,以及根据所述图谱数据操作信息构建所述新知识图谱对应的新本体结构。
具体的,所述用户的知识图谱更新请求中包含原知识图谱标识以及图谱数据操作信息。知识图谱标识用于标识不同的知识图谱,获取更新请求中的知识图谱标识可以确定本次准备对图数据库中的哪个知识图谱进行更新,即确定了本次拟更新的知识图谱具体是哪一个。获取所述更新请求中的图谱数据操作信息,解析该操作信息,根据操作信息中携带的节点信息以及关系信息构建新本体结构。
在本申请一具体实施方式中,用户原需求为在知识图谱中展示节点A1、A2,原有本体结构中包括节点A1、A2。用户新增需求为增加节点A3,根据用户新增需求构建的新本体结构中包括节点A1、节点A2和节点A3,以及节点A3与节点A1的边,即新本体结构与原本体结构的区别是新本体结构中增加了节点A3以及节点A3与节点A1的边。
在构建本体结构过程中,自动检查本体结构的合理性包括:
获取预设合理性规则;
根据所述预设合理性规则对所述新本体结构进行遍历,筛选出不符合所述预设合理性规则的内容;
对不符合预设合理性规则的内容进行报错。
具体的,合理性规则可以是已定义的节点名称、属性名称等等。
在本申请一具体实施方式中,以本体结构中定义了节点Per、节点Loc以及节点Per与节点Loc间的关系Born为例,预设合理性规则为“节点Per、节点Loc以及关系Born”,根据关系Born查找本体结构中定义的节点Per和节点Loc,具体为将已定义与关系Born连接的节点Per和节点Loc与本体结构中定义的节点进行对比,此时的Per、Loc的名称被定义为Person和Location,即Person和Location不符合预设合理性规则,则系统对Person和Location的未定义问题进行报错。
步骤304:将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则。
其中,所述原本体结构为与原知识图谱对应的本体结构,原本体结构与原数据导入规则对应。原知识图谱即根据用户请求确定的待更新的知识图谱。本体结构中包括定义的节点类型和/或关系类型以及对应的约束信息以及为每个节点类型或关系类型设置的唯一标识。将新本体结构与原本体结构进行对比,即对比新本体结构中与原本体结构中的唯一标识;在原本体结构中缺少与新本体结构中对应的唯一标识时,即新本体结构中相较于原本体结构进行了新增操作;在新本体结构中缺少与原本体结构对应的唯一标识时,即新本体结构中相较于原本体结构进行了删除操作;在新本体结构中存在与原本体结构区别的唯一标识时,即新本体结构中相较于原本体结构进行了修改操作。记录对比产生的区别事件,获得区别日志。
在实际应用中,获取区别日志的步骤可以是S3041-S3042:
S3041、将所述新本体结构中定义的元素与所述原本体结构中定义的元素进行对比,确定待修改元素;
S3042、根据所述待修改元素生成区别日志。
具体的,将所述新本体结构中定义的元素与所述原本体结构中定义的元素进行对比,确定待修改元素;记录所述待修改元素,生成区别日志。元素包括节点和边以及约束信息,所述待修改元素即本体结构中定义的部分节点、关系以及节点或关系的约束规则,将新本体结构与原本体结构中定义的节点、关系进行对比,可以确定存在区别的节点、关系。记录所述存在区别的节点、关系,生成区别日志存储于原知识图谱对应的原图数据库中。
在本申请一具体实施方式中,假设原本体结构中包含节点A1、节点A2以及节点A1、A2之间的关系B1,根据用户需求构建的新本体结构中包含节点A1、节点A2、节点A3、节点A1、A2之间的关系B1以及A2与A3之间的关系B2。将新本体结构与原本体结构进行对比,记录新本体结构增加节点A3以及关系B2的指令,得到增加操作信息并保存至图数据库的区别日志。
获得区别日志后,根据区别日志对原数据导入规则进行修改得到新数据导入规则。
根据区别日志修改原数据导入规则的步骤可以是:读取所述区别日志中的所述待修改元素,并基于所述待修改元素对所述原数据导入规则进行修改,获得新数据导入规则。
具体的,数据导入规则中包括知识图谱的图谱数据的数据源以及映射方法,所述数据源为数据源的名称或标识,例如,数据H的数据源为结构化数据库N,或数据H的数据源为结构化数据库N中的数据表A的标识“A”。解析所述区别日志,获得所述待修改元素。区别日志中包含新增、删除或修改节点或关系的操作信息以及数据源信息,其中,操作信息包含待修改的元素以及对所述元素的操作内容,例如,删除节点A、增加关系B等等;数据源信息为待修改元素的数据源信息,例如,待修改节点A的数据源名称为G,即节点A的数据可从数据库G中获取。根据区别日志可以确定原数据导入规则中的待修改元素,以及待修改元素对应的数据导入规则。对比区别日志与原数据导入规则中记录的待修改元素的数据源以及映射方法,修改原数据导入规则中与区别日志存在不同的数据源以及映射方法,得到新数据导入规则。在一具体实施方式中,根据区别日志确定待修改的元素为节点“身高”、节点“行业”和关系“就读”。根据区别日志确定的待修改元素,修改原数据导入规则中节点“身高”、节点“行业”和关系“就读”的数据导入规则,得到新数据导入规则。
通过对原数据导入规则进行修改,得到新数据导入规则的技术手段,避免了在更新图数据库时需将所有数据重新导入至图数据库中,提高了更新效率。
步骤306:复制原图数据库获得临时图数据库,依据所述新数据导入规则对所述临时图数据库进行修改,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原知识图谱对应。
新数据导入规则中包含知识图谱的图谱数据的数据源以及映射方法。对原图数据库进行复制得到临时图数据库,后续删除、修改临时图数据库中的数据或向临时图数据库中添加数据,实现图数据库的更新。
根据新数据导入规则修改临时图数据库中的数据源以及映射方法,使新图数据库中可以包含符合用户需求的图数据。具体方法是对临时图数据库的原数据导入规则进行了修改,使临时图数据库符合新本体结构中定义的节点、关系以及约束信息,例如删除临时图数据库中节点E的数据等,但临时图数据库中不包含新本体结构中新增节点类型或关系类型对应的具体数据。根据新数据导入规则中的映射方法获取符合临时图数据库中定义的节点或关系类型的待导入图数据。
根据新数据导入规则修改临时图数据库并获取待导入图数据的步骤为:
S3061,依据所述新数据导入规则中定义的新数据源以及新映射方法,修改临时图数据库中定义的原数据源以及原映射方法;
S3062,依据所述新数据源确定待导入数据源,并根据所述待导入数据源加载待导入数据;
S3063,基于所述新映射方法将所述待导入数据映射为待导入图数据。
具体的,新数据导入规则中包含新数据源以及新映射方法,原知识图谱对应的数据导入规则中定义了原数据源以及原映射方法。将新数据源与原数据源进行对比,用新数据源替换原知识图谱中与新数据源存在区别的原数据源;将新映射方法与原映射方法进行对比,用新映射方法替换原知识图谱中与新映射方法存在区别的原映射方法,从而实现对临时图数据库的修改。根据新数据源确定导入临时图数据库中数据的数据源即待导入数据源,从所述待导入数据源中加载待导入数据,并根据新映射方法将待导入数据映射为待导入图数据。
例如,在一具体实施方式中,在原本体结构中存在节点A1和节点A2,根据用户新增需求新增了节点A3,创建新本体结构时,新本体结构中包含A1、A2与A3三个节点。原本体结构与新本体结构进行对比,产生的区别日志记录了在知识图谱中新增A3相关数据的修改指令。根据区别日志修改了从源数据库中获取A1及A2的相关数据信息的原数据导入规则,生成了从源数据库中获取A1、A2与A3的相关数据信息的新数据导入规则。根据区别日志、新本体结构以及新数据导入规则,对临时图数据库中的原本体结构进行修改,即临时图数据库中包含定义的节点A1、A2和A3,接下来获取向临时图数据库中添加的节点A3的具体数据。根据新数据导入规则中的数据源确定A3的数据源,从数据源中获取差量数据即A3的具体数据,根据映射方法将差量数据映射为待导入图数据。
在实际应用中,对临时图数据库进行的修改包括:根据所述新数据源和所述新映射方法对所述临时图数据库中的待修改元素对应的所述原数据源以及所述原映射方法进行修改。
将新数据导入规则定义的数据源和映射方法与原知识图谱中定义的数据源和映射方法进行对比从而确定待修改节点或关系。对待修改节点或关系对应的数据源或映射方法进行修改,得到修改完成临时图数据库。
在本申请一具体实施例中,所述根据所述新数据源和所述新映射方法对所述原知识图谱中的待修改元素对应的所述原数据源以及所述原映射方法进行修改,包括S30611、S30612:
S30611、在所述待修改元素中包含第一元素的情况下,在所述原知识图谱中确定所述第一元素对应的第二元素;
S30612、根据所述新数据源和所述新映射方法对所述第一元素和所述第二元素分别对应的原数据源以及原映射方法进行修改。
具体的,在第一元素为节点时,第二元素为关系;在第一元素为关系时,第二元素为节点。在根据新数据导入规则修改原图数据库中对应节点或关系的同时,需要对节点或关系相关的节点或关系进行修改。例如,确定待修改元素为某一节点时,需要确定与节点对应的关系并分别对关系和节点的数据导入规则进行修改;确定待修改元素为某一关系时,需要确定与关系对应的节点并分别对节点和关系的数据导入规则进行修改,得到修改完成的临时图数据库。
例如,原图数据库中包含定义的节点A、B以及A、B间的关系E,根据新数据导入规则增加节点C的同时,需要同时增加C与节点A或节点B之间的关系,从而完成节点与关系的连接,即增加C的同时增加A与C的关系F。
对原图数据库进行复制得到临时图数据库,并对临时图数据库进行修改得到符合新图数据库框架的临时图数据库,并根据数据导入规则获取待导入图数据,提高了更新图数据库的效率以及更新数据的准确率。
步骤308:将所述待导入图数据导入所述临时图数据库中获得新图数据库。
新图数据库可以是将待导入图数据导入至临时图数据库中得到图数据库。
具体的,根据用户需求创建的新本体结构与原本体结构对比产生的区别日志,根据区别日志修改原数据导入规则获得与新本体结构对应的新数据导入规则。在区别日志、新本体结构以及新数据导入规则的限制下,对临时图数据库中原知识图谱对应的原本体结构进行修改,根据临时图数据库中的数据导入规则获取待导入数据并导入至临时图数据库中,得到新图数据库。
在一具体实施方式中,将待导入图数据导入临时图数据库的导入方式为:根据区别日志、新本体结构及新数据导入规则获取到待导入图数据,待导入图数据的标识为第一节点和第二节点;第一个节点属性为中国,第二个节点属性为北京,两个节点的节点标识及节点属性构成了图谱导入数据对应节点的节点数据;北京与中国之间的关系为北京是中国的首都,所以两节点之间对应的关系为首都;获得上述由北京、中国两个节点数据以及节点间的关系首都生成的待导入图数据,将待导入图数据导入至临时图数据库中,完成图数据库的更新,获得新图数据库。
在实际应用中,将所述待导入图数据导入所述临时图数据库中获得新图数据库之前,还包括:
检查所述待导入图数据是否符合所述新本体结构中定义的约束信息;
若是,则执行将待导入图数据导入所述临时图数据库中获得新图数据库的操作;
若否,则对所述待导入图数据中不符合所述约束信息的图数据进行报错。
具体的,检查待导入图数据中节点或关系的类型是否与新本体结构中定义的节点和关系一致;检查待导入图数据中的节点数据或关系数据是否符合新本体结构中定义的约束信息,例如,节点数据是否为字符串类型,即节点约束信息为“字符串类型”。
本申请提供的图数据库更新方法,通过对比新本体结构与原本体结构得到本体结构中区别定义的节点或关系,再基于新数据导入规则修改对原图数据库进行复制得到的临时图数据库,并向临时图数据库中导入区别定义的节点的节点数据或关系的关系数据即可实现图数据库的更新,避免将所有数据重新导入的大规模导入数据的更新方式,提高了更新效率。
图4示出了本申请一实施例的图数据库更新方法,该图数据库更新方法以对包含节点张三的知识图谱为例进行描述,包括步骤402至步骤408。
步骤402:响应于用户的知识图谱更新请求,构建新知识图谱对应的新本体结构,其中所述知识图谱更新请求中携带有待更新的原知识图谱的标识以及需要对原知识图谱进行的更新操作。
每个知识图谱都对应有一个本体结构,所述本体结构中包含根据需求定义的元素的类型、属性以及元素的约束信息,所述元素包括节点和边。本申请在原图数据库的基础上实现对用户新的需求的实现。
通过知识图谱更新请求中携带的待更新的原知识图谱的标识可以确定用户希望对哪个原知识图谱进行更新,通过知识图谱更新请求中携带的需要对原知识图谱进行的更新操作可以确定在原知识图谱的基础上用户希望进行怎样的更新操作。
原图数据库响应于用户的知识图谱更新请求,构建对应用户请求的新知识图谱的新本体结构并存储在图数据库中。如图5所示,图5是本申请实施例提供的本体结构示意图,本体结构中定义了节点类型、节点属性和约束信息以及关系类型、关系属性和约束信息。
下面以更新存有人物相关信息知识图谱的图数据库为例,对本申请更新图数据库的方法进行说明。
如图6所示,图6是本申请实施例提供的以节点张三为例的原知识图谱示意图,原知识图谱为根据原图数据库中存储的节点数据和关系数据生成的知识图谱。
用户原需求为在人物相关信息知识图谱中展示人物信息、职位信息以及人物与职位之间的在任职位信息。图7本申请实施例提供的原本体结构示意图,根据用户原需求构建的原本体结构如图7所示,701中为定义的节点类型“人物”、节点属性“名称”和“编号”,702中为定义的关系类型“在任职位”、关系属性“名称”、“任职开始时间”,703中为定义的节点类型“职位”、节点属性“名称”和“编号”。根据用户原需求构建的原本体结构存储于原图数据库中。
用户对于现有人物相关信息知识图谱中的需求为增加教育地点信息。
图数据库响应于用户增加教育地点信息的请求,构建新本体结构。如图8所示,图8为本申请实施例提供的新本体结构示意图,801为定义的节点类型“人物”、节点属性“名称、编号”;803为定义的节点类型“职位”、节点属性“名称、编号”;802为定义的“人物”与“职位”间的关系类型“在任职位”、关系属性“名称、任职开始时间”;805为定义的节点类型“地点”、节点属性“名称、编号”;804为定义的“地点”与“人物”的关系类型“教育”、关系属性“名称、起始时间、结束时间”。新本体结构与原本体结构的不同在于新本体结构中增加了804教育关系以及805地点节点。
将构建完成的新本体结构存储在图数据库中。
在本申请一具体实施方式中,创建新本体结构,还包括:根据预设的合理性判断规则,对所述的新本体结构进行合理性检查。其中,合理性判断规则可以是判断新本体结构中定义的节点以及节点间关系是否正确。不正确的情况为,例如:在本体结构中定义了节点“姓名”和节点“位置”以及节点“姓名”和节点“学校”之间的关系为“就读于”。在“就读于”作为关系连接节点时,要确定该关系连接的两个节点“姓名”和“学校”是否在本体结构中定义。由于本体结构中只定义了节点“姓名”和节点“位置”,没有定义节点“学校”,关系“就读于”无法正确的连接节点,则对不合理问题进行报错。
步骤404:将新本体结构与原本体结构进行对比,对比得到的区别的节点和/或关系记录到区别日志中,并依据所述区别日志,修改原数据导入规则获得新数据导入规则。
具体的,区别的节点和/或关系是将新本体结构中定义的元素类型及属性与原本体结构中定义的元素的类型及属性进行对比得到的。
数据导入规则可以是确定知识图谱的本体结构中定义的节点或者边对应的数据在结构化数据库中的存储位置,以及所述节点或者边对应的数据与结构化数据库的数据之间的映射方法。其中,所述存储位置可以是结构化数据库或结构化数据库中的数据表等。本申请一具体实施例中,数据导入规则确定了本体结构定义的节点类型“地点”在结构化数据库中的存储位置为“地点”数据表,从所述数据表中获取节点类型“地点”的数据并根据数据导入规则中的映射方法对结构化数据进行映射得到待导入图数据。
原数据导入规则可以是从结构化数据库中获取原图数据库中数据的规则。新数据导入规则可以还包括从结构化数据库中获取用户需求的节点或关系数据的规则。
沿用步骤402中更新存有人物相关信息知识图谱的图数据库的实施例。
从存有新本体结构的图数据库中获取原本体结构与新本体结构,将原本体结构与新本体结构进行对比得到区别的节点和/或关系并记录到图数据库的区别日志中。本实施例中区别的节点和关系包括:节点类型“职位”、节点属性“名称”和“编号”,关系类型“下设职位”、关系属性“名称”和“任职开始时间”。将区别的节点和/或关系记录到区别日志中,并根据区别日志更新原数据导入规则得到新数据导入规则。
原数据导入规则确定的结构化数据库中的结构化数据如表1、表2、表3所示:
原本体结构定义的人物类型及名称、编号属性对应结构化数据库中数据表名为人物的数据表,其中,所述人物的数据表如表1所示,节点属性名称、编号对应人物数据表中的属性字段名称、编号;
表1
名称 编号
张三 3
李四 6
王五 5
原本体结构定义的职位类型及名称、编号属性对应结构化数据库中数据表名为职位的数据表,其中,所述职位的数据表如表2所示,节点属性名称、编号对应职位数据表中的属性字段名称、编号;
表2
名称 编号
大学校长 2
教导主任 3
辅导员 6
原本体结构定义的在任职位类型关系及名称、任职开始时间属性对应结构化数据库中数据表名为在任职位的数据表,其中,所述在任职位的数据表如表3所示,节点属性名称、起始时间和结束时间对应在任职位数据表中的属性字段名称、任职开始时间;
表3
名称 任职开始时间
2010-05
2011-03
将原本体结构与新本体结构进行对比,得到区别的节点和关系。如图8本申请实施例提供的新本体结构示意图所示,804定义的关系类型“教育”以及关系属性“名称、起始时间、结束时间”和805定义的节点类型“地点”以及节点属性“名称、编号”为区别的节点和关系,将区别的节点“地点”数据和关系“教育”数据存入区别日志中。根据区别日志得到新数据导入规则。
新数据导入规则中包含区别的节点类型“地点”、节点属性“名称、编号”以及区别的关系类型“教育”、关系属性“名称、起始时间、结束时间”对应的数据在结构化数据中的存储位置以及所述区别的节点和/或关系对应的数据与结构化数据库的数据之间的映射方法。
步骤406:复制原图数据库获得临时图数据库,依据新数据导入规则对所述临时图数据库进行修改,并基于新数据导入规则从结构化数据库中获取待导入图数据。
实际应用中,对原图数据库进行复制得到临时图数据库,后续对临时图数据库进行修改。对临时图数据库的修改包括新增节点和/或边,或者删除节点和/或边。若修改为删除节点和/或边,则将待删除内容从临时图数据库中删除即可;若修改为新增节点和/或边,则需要在临时图数据库中为需要新增的节点和/或边开辟对应的存储空间,此时将已辟空间但未导入对应数据的图数据库记为临时图数据库。
本申请实施例中,首先可以根据新数据导入规则从结构化数据库中获取对应的结构化数据,然后对结构化数据进行映射得到待导入图数据。
其中,对结构化数据进行映射得到待导入图数据时,所遵循的映射方法为用户可选的将结构化数据映射为待导入图数据的方法。例如,结构化数据为2010-01表示2010年1月,映射方法为对日期的处理,通过映射方法将数据2010-01转化为2010-01-00,其中“00”表示具体时间未知;或者在某一实施例中,对结构化数据中的姓名,对应的图数据的映射方法可以是“加括号”,那么结构化数据中的姓名“张三”就映射为节点“(张三)”。
如图9所示,图9为本申请实施例提供的图数据库的本体结构与结构化数据的映射方法以及本体结构约束信息示意图。图9中,902为本实施例的本体结构,906为本实施例的结构化数据库,904为本实施例的数据导入规则。
本体结构902中的约束信息“非空”、“大于零”等为约束数据作为节点数据或关系数据的信息。例如,本申请一实施例中,节点类型“身份证号”的约束信息为“唯一”,基于约束信息获取节点数据,则存入图数据库中的“身份证号”不会存在相同的情况,即存入图数据中的身份证号都是唯一的。
数据导入规则904中属性名的“姓名”、“出生地”等对应本体结构定义的节点属性,目标列名的“姓名”、“出生地”等为本体结构902对应结构化数据库906中数据表的属性字段,例如,目标列名“工资”对应结构化数据的属性字段工资;目标列名“姓名”对应结构化数据的属性字段姓名。数据导入规则904中的“字符串,最大长度2”等映射方法,可将从结构化数据库906中获取的结构化数据映射为待导入图数据。
结构化数据库906中的表A、表B为两个不同的结构化数据表,数据导入规则904指明了从表A中获取属性字段为姓名、出生地、教育地点、年龄的结构化数据,从表B中获取属性字段为工资的结构化数据以及将结构化数据映射为待导入图数据的映射方法。
以获取本体结构中定义的“姓名”的待导入图数据为例,对图9进行说明。根据数据导入规则904确定从结构化数据库中表A的姓名列获取数据。由于姓名的约束信息为非空,则需要导入结构化数据“赵大大”、“钱二”和“李三”;根据映射方法“字符串,最大长度2”,需要将字符串长度为2的结构化数据“钱二”和“李三”映射为待导入图数据“钱二”和“李三”,由于约束信息为非空,则需要将“赵大大”这个字符串长度为3的数据映射为字符串长度为2的数据“赵大”或“大大”作为待导入图数据,从而满足本体结构902定义的约束信息。
沿用步骤204中更新存有人物相关信息知识图谱的图数据库的实施例。
基于新数据导入规则开辟包括节点类型为“地点”的节点数据的空间以及关系类型为“教育”的关系数据的空间。修改完成的临时图数据库如图10所示,图10是本申请实施例提供的临时图数据库示意图。临时图数据库中开辟了存储节点或关系数据的空间,但新数据导入规则确定的节点数据或关系数据还未导入临时图数据库中。
依据新数据导入规则确定从结构化数据库中表名为“地点”和表名为“教育”的数据表中获取数据。所述表名为“地点”的数据表如表4所示,其中,新本体结构中定义的节点属性名称、编号对应地点数据表中的属性字段名称、编号。
表4
所述表名为“教育”的数据表如表5所示,其中,新本体结构中定义的节点属性名称、起始时间、结束时间对应教育数据表中的属性字段名称、起始时间、结束时间。
表5
名称 起始时间 结束时间
全日制就读 2010-09 2014-09
全日制就读 2015-03 2016-05
非全日制就读 2010-09 2013-09
从结构化数据库中获取到确定的结构化数据后,再根据新数据导入规则中的映射方法,将所述从结构化数据库中获取的结构化数据映射为待导入图数据。
步骤408:将待导入图数据导入临时图数据库中获得新图数据库。
对原图数据库进行复制得到临时图数据库,根据用户需求对应修改临时图数据库得到新图数据库。
具体的,根据数据导入规则,从结构化数据库中获取节点类型对应的属性字段以及属性字段对应的属性值并根据映射规则进行映射,得到待导入节点数据;根据数据导入规则,从结构化数据库中获取关系类型对应的属性字段以及属性字段的属性值并根据映射规则进行映射,得到待导入关系数据,所述待导入关系数据与待导入节点数据构成待导入图数据。
获取包含待导入图数据的导入文件,将导入文件导入至临时图数据库获得新图数据库。
沿用上例,根据新数据导入规则确定结构化数据库中数据表的表名为地点的结构化数据表,以表中的属性字段和属性值作为节点数据。
获取结构化数据库中数据表的表名为教育的数据表,以表中的属性字段和属性值作为关系数据。
原图数据库中以包含人物节点数据、职位节点数据以及在任职位关系数据,故将地点节点数据和教育关系数据进行映射得到待导入图数据,将待导入图数据的导入文件导入临时图数据库中,得到新图数据库,如图11所示,图11为以张三为例的新图数据库示意图。
在本申请一具体实施例中,获取待导入图数据后,还包括对待导入图数据进行基于新本体结构的数据检查,关系映射,生成导入前数据。
基于本体结构的数据检查可以是判断待导入图数据是否与新本体结构中定义的节点以及节点间关系相对应。若不对应则进行报错,若对应则根据数据导入规则将待导入图数据导入临时图数据库中得到新图数据库。
本申请提供的图数据库更新方法,通过对比新本体结构与原本体结构得到本体结构中区别定义的节点或关系,再基于新数据导入规则修改对原图数据库进行复制得到的临时图数据库,并向临时图数据库中导入区别定义的节点的节点数据或关系的关系数据即可实现图数据库的更新,避免将所有数据重新导入的大规模导入数据的更新方式,提高了更新效率。
与上述方法实施例相对应,本申请还提供了图数据库更新装置实施例,图12示出了本申请一个实施例的图数据库更新装置的结构示意图。如图12所示,该装置包括:
构建模块1202,被配置为接收知识图谱更新请求,构建新本体结构;
对比模块1204,被配置为复制原图数据库获得临时图数据库,依据所述新数据导入规则对所述临时图数据库进行修改,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原知识图谱对应;
获取模块1206,被配置依据所述新数据导入规则对原图数据库进行修改获得临时图数据库,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原图数据库对应;
导入模块1208,被配置为将所述待导入图数据导入所述临时图数据库中获得新图数据库。
所述装置还包括,第一检查模块,被配置为:
获取预设合理性规则;
根据所述预设合理性规则对所述本体结构进行遍历,筛选出不符合所述预设合理性规则的内容;
对不符合预设合理性规则的内容进行报错。
所述构建模块1202,被进一步配置为:
提取所述知识图谱更新请求中包含的知识图谱标识和知识图谱操作信息;
根据所述知识图谱标识确定所述原图数据库中与原知识图谱对应的图谱数据,以及根据所述图谱数据操作信息构建所述新知识图谱对应的新本体结构。
所述对比模块1204,被进一步配置为:
将所述新本体结构中定义的元素与所述原本体结构中定义的元素进行对比,确定待修改元素;
根据所述待修改元素生成区别日志。
所述对比模块1204,被进一步配置为:
读取所述区别日志中的所述待修改元素,并基于所述待修改元素对所述原数据导入规则进行修改,获得新数据导入规则。
所述获取模块1206,被进一步配置为:
依据所述新数据导入规则中定义的新数据源以及新映射方法,修改临时图数据库中定义的原数据源以及原映射方法;
依据所述新数据源确定待导入数据源,并根据所述待导入数据源加载待导入数据;
基于所述新映射方法将所述待导入数据映射为待导入图数据。
所述获取模块1206,被进一步配置为:
根据所述新数据源和所述新映射方法对所述原图数据库中的待修改元素对应的所述原数据源以及所述原映射方法进行修改,获得临时图数据库。
所述获取模块1206,被进一步配置为:
在所述待修改元素中包含第一元素的情况下,在所述原知识图谱中确定所述第一元素对应的第二元素;
根据所述新数据源和所述新映射方法对所述第一元素和所述第二元素分别对应的原数据源以及原映射方法进行修改。
所述装置还包括第二检查模块,被配置为:
检查所述待导入图数据是否符合所述新本体结构中定义的约束信息;
若是,则执行将待导入图数据导入所述临时图数据库中获得新图数据库的操作;
若否,则对所述待导入图数据中不符合所述约束信息的图数据进行报错。
本申请提供的图数据库更新装置,包括构建模块,被配置为接收知识图谱更新请求,构建新本体结构;对比模块,被配置为将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;获取模块,被配置为复制原图数据库获得临时图数据库,依据所述新数据导入规则对所述临时图数据库进行修改,并基于所述新数据导入规则获取待导入图数据,其中,所述原本体结构与所述原知识图谱对应;导入模块,被配置为将所述待导入图数据导入所述临时图数据库中获得新图数据库。本申请的图数据库更新装置,基于用户的需求对图数据库的本体结构进行修改,根据修改完成的本体结构获取导入图数据库的数据,避免了将未变化的数据重新导入图数据库中,提高了更新效率。
上述为本实施例的一种图数据库更新装置的示意性方案。需要说明的是,该图数据库更新装置的技术方案与上述的图数据库更新方法的技术方案属于同一构思,图数据库更新装置的技术方案未详细描述的细节内容,均可以参见上述图数据库更新方法的技术方案的描述。
需要说明的是,装置权利要求中的各组成部分应当理解为实现该程序流程各步骤或该方法各步骤所必须建立的功能模块,各个功能模块并非实际的功能分割或者分离限定。由这样一组功能模块限定的装置权利要求应当理解为主要通过说明书记载的计算机程序实现该解决方案的功能模块构架,而不应当理解为主要通过硬件方式实现该解决方案的实体装置。
本申请一实施例中还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述的图数据库更新方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的图数据库更新方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述图数据库更新方法的技术方案的描述。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述图数据库更新方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的图数据库更新方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述图数据库更新方法的技术方案的描述。
本申请实施例公开了一种芯片,其存储有计算机指令,该指令被处理器执行时实现如前所述图数据库更新方法的步骤。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (12)

1.一种图数据库更新方法,其特征在于,包括:
接收知识图谱更新请求,构建新本体结构;
将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;
依据所述新数据导入规则中定义的新数据源以及新映射方法,修改临时图数据库中定义的原数据源以及原映射方法,并基于所述新数据导入规则获取待导入图数据,其中,所述临时图数据库通过复制原图数据库获得,所述原本体结构与原知识图谱对应;
将所述待导入图数据导入所述临时图数据库中获得新图数据库。
2.根据权利要求1所述的方法,其特征在于,所述将所述新本体结构与原本体结构进行对比获得区别日志之前,还包括:
获取预设合理性规则;
根据所述预设合理性规则对所述本体结构进行遍历,筛选出不符合所述预设合理性规则的内容;
对不符合预设合理性规则的内容进行报错。
3.根据权利要求1所述的方法,其特征在于,所述接收知识图谱更新请求,构建新本体结构,包括:
提取所述知识图谱更新请求中包含的知识图谱标识和图谱数据操作信息;
根据所述知识图谱标识确定原图数据库中与原知识图谱对应的图谱数据,以及根据所述图谱数据操作信息构建新知识图谱对应的新本体结构。
4.根据权利要求1所述的方法,其特征在于,所述将所述新本体结构与原本体结构进行对比获得区别日志,包括:
将所述新本体结构中定义的元素与所述原本体结构中定义的元素进行对比,确定待修改元素;
根据所述待修改元素生成区别日志。
5.根据权利要求1所述的方法,其特征在于,所述根据所述区别日志修改原数据导入规则获得新数据导入规则,包括:
读取所述区别日志中的待修改元素,并基于所述待修改元素对所述原数据导入规则进行修改,获得新数据导入规则。
6.根据权利要求1所述的方法,其特征在于,所述基于所述新数据导入规则获取待导入图数据,包括:
依据所述新数据源确定待导入数据源,并根据所述待导入数据源加载待导入数据;
基于所述新映射方法将所述待导入数据映射为待导入图数据。
7.根据权利要求1所述的方法,其特征在于,所述依据所述新数据导入规则中定义的新数据源以及新映射方法,修改临时图数据库中定义的原数据源以及原映射方法,包括:
根据所述新数据源和所述新映射方法对所述临时图数据库中的待修改元素对应的所述原数据源以及所述原映射方法进行修改。
8.根据权利要求7所述的方法,其特征在于,所述根据所述新数据源和所述新映射方法对所述临时图数据库中的待修改元素对应的所述原数据源以及所述原映射方法进行修改,包括:
在所述待修改元素中包含第一元素的情况下,在所述原知识图谱中确定所述第一元素对应的第二元素;
根据所述新数据源和所述新映射方法对所述第一元素和所述第二元素分别对应的原数据源以及原映射方法进行修改。
9.根据权利要求1所述的方法,其特征在于,所述将所述待导入图数据导入所述临时图数据库中获得新图数据库之前,还包括:
检查所述待导入图数据是否符合所述新本体结构中定义的约束信息;
若是,则执行将待导入图数据导入所述临时图数据库中获得新图数据库的操作;
若否,则对所述待导入图数据中不符合所述约束信息的图数据进行报错。
10.一种图数据库更新装置,其特征在于,包括:
构建模块,被配置为接收知识图谱更新请求,构建新本体结构;
对比模块,被配置为将所述新本体结构与原本体结构进行对比获得区别日志,并根据所述区别日志修改原数据导入规则获得新数据导入规则;
获取模块,被配置为依据所述新数据导入规则中定义的新数据源以及新映射方法,修改临时图数据库中定义的原数据源以及原映射方法,并基于所述新数据导入规则获取待导入图数据,其中,所述临时图数据库通过复制原图数据库获得,所述原本体结构与原知识图谱对应;
导入模块,被配置为将所述待导入图数据导入所述临时图数据库中获得新图数据库。
11.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-9任意一项所述方法的步骤。
12.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-9任意一项所述方法的步骤。
CN202110699546.0A 2021-06-23 2021-06-23 一种图数据库更新方法及装置 Active CN113239063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110699546.0A CN113239063B (zh) 2021-06-23 2021-06-23 一种图数据库更新方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110699546.0A CN113239063B (zh) 2021-06-23 2021-06-23 一种图数据库更新方法及装置

Publications (2)

Publication Number Publication Date
CN113239063A CN113239063A (zh) 2021-08-10
CN113239063B true CN113239063B (zh) 2024-03-29

Family

ID=77140564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110699546.0A Active CN113239063B (zh) 2021-06-23 2021-06-23 一种图数据库更新方法及装置

Country Status (1)

Country Link
CN (1) CN113239063B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115329151B (zh) * 2022-10-17 2023-03-14 北方健康医疗大数据科技有限公司 图数据库的优化方法、装置、电子设备及存储介质
CN116028651B (zh) * 2023-03-28 2023-06-09 南京万得资讯科技有限公司 一种支持本体和数据增量更新的知识图谱构建系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7571156B1 (en) * 2003-03-28 2009-08-04 Netlogic Microsystems, Inc. Network device, storage medium and methods for incrementally updating a forwarding database
AU2013200110A1 (en) * 2012-01-10 2013-07-25 Paul A. Gilham A web server, client computing device and computer readable storage medium for facilitating e-commerce social group discounting
CN108090165A (zh) * 2017-12-13 2018-05-29 美林数据技术股份有限公司 一种基于嵌入式图数据库的图谱变化差异的获取方法
CN111930958A (zh) * 2020-07-13 2020-11-13 车智互联(北京)科技有限公司 一种图数据库构建方法、计算设备及可读存储介质
CN111949831A (zh) * 2020-08-10 2020-11-17 中国工商银行股份有限公司 一种图形数据库建立方法和装置、可读存储介质
CN112860953A (zh) * 2021-01-27 2021-05-28 国家计算机网络与信息安全管理中心 图数据库的数据导入方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9244914B2 (en) * 2012-09-28 2016-01-26 Apple Inc. Schema versioning for cloud hosted databases
EP2973044A2 (en) * 2013-03-15 2016-01-20 James Webber Graph database devices and methods for partitioning graphs
US11086935B2 (en) * 2018-05-07 2021-08-10 Apple Inc. Smart updates from historical database changes
US11593353B2 (en) * 2019-04-03 2023-02-28 Unitedhealth Group Incorporated Managing data objects for graph-based data structures
US11442920B2 (en) * 2019-06-28 2022-09-13 Paypal, Inc. Graph database system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7571156B1 (en) * 2003-03-28 2009-08-04 Netlogic Microsystems, Inc. Network device, storage medium and methods for incrementally updating a forwarding database
AU2013200110A1 (en) * 2012-01-10 2013-07-25 Paul A. Gilham A web server, client computing device and computer readable storage medium for facilitating e-commerce social group discounting
CN108090165A (zh) * 2017-12-13 2018-05-29 美林数据技术股份有限公司 一种基于嵌入式图数据库的图谱变化差异的获取方法
CN111930958A (zh) * 2020-07-13 2020-11-13 车智互联(北京)科技有限公司 一种图数据库构建方法、计算设备及可读存储介质
CN111949831A (zh) * 2020-08-10 2020-11-17 中国工商银行股份有限公司 一种图形数据库建立方法和装置、可读存储介质
CN112860953A (zh) * 2021-01-27 2021-05-28 国家计算机网络与信息安全管理中心 图数据库的数据导入方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于增量日志的数据组合视图定位更新方法;张元鸣;李梦妮;黄浪游;陆佳炜;肖刚;;计算机科学;第47卷(第06期);全文 *
异构环境下数据库增量同步更新机制;王玉标等;《计算机工程与设计》;第32卷(第3期);全文 *

Also Published As

Publication number Publication date
CN113239063A (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN110609902B (zh) 一种基于融合知识图谱的文本处理方法及装置
CN107633060B (zh) 一种信息处理方法及电子设备
US11151179B2 (en) Method, apparatus and electronic device for determining knowledge sample data set
CN113239063B (zh) 一种图数据库更新方法及装置
CN110119473A (zh) 一种目标文件知识图谱的构建方法及装置
CN110990390B (zh) 数据协同处理方法、装置、计算机设备和存储介质
WO2020010834A1 (zh) 一种faq问答库泛化方法、装置及设备
CN110633577A (zh) 文本脱敏方法以及装置
US20130097134A1 (en) System and method for subject identification from free format data sources
US20120158807A1 (en) Matching data based on numeric difference
CN109408821A (zh) 一种语料生成方法、装置、计算设备及存储介质
CN110851609A (zh) 表示学习方法及装置
CN114207604A (zh) 使用针对性问题回答来提取科学测量背景的系统和方法
CN115510249A (zh) 一种知识图谱的构建方法及装置、电子设备、存储介质
CN115374105A (zh) 数据处理方法以及装置
CN111309930B (zh) 一种基于表示学习的医学知识图谱实体对齐方法
CN111625858B (zh) 一种垂直领域下的智能化多模态数据脱敏方法和装置
CN114647719A (zh) 一种基于知识图谱的问答方法及装置
CN109144999B (zh) 一种数据定位方法、装置及存储介质、程序产品
CN116484220A (zh) 语义表征模型的训练方法、装置、存储介质及计算机设备
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
CN113326276A (zh) 一种图数据库更新方法及装置
CN115617945A (zh) 跨模态数据检索模型的建立方法以及跨模态数据检索方法
CN113537263A (zh) 二分类模型的训练方法及装置、实体链接方法及装置
CN113297165A (zh) 数据处理方法、装置及数据库操作系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant