CN116303516A - 一种更新知识图谱的方法、装置及相关设备 - Google Patents

一种更新知识图谱的方法、装置及相关设备 Download PDF

Info

Publication number
CN116303516A
CN116303516A CN202310433514.5A CN202310433514A CN116303516A CN 116303516 A CN116303516 A CN 116303516A CN 202310433514 A CN202310433514 A CN 202310433514A CN 116303516 A CN116303516 A CN 116303516A
Authority
CN
China
Prior art keywords
source data
graph
initial
data
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310433514.5A
Other languages
English (en)
Inventor
吴正良
陈辉华
苑博文
王艺洁
刘殿兴
岳丰
方兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Citic Securities Co ltd
Original Assignee
Citic Securities Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Citic Securities Co ltd filed Critical Citic Securities Co ltd
Priority to CN202310433514.5A priority Critical patent/CN116303516A/zh
Publication of CN116303516A publication Critical patent/CN116303516A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种更新知识图谱的方法,包括:获取更新记录数据,该更新记录数据用于记录用户在更新界面上针对初始知识图谱所执行的更新操作,该更新操作包括更新初始知识图谱中的节点和/或更新初始知识图谱中的边;根据更新记录数据以及用于构建初始知识图谱的初始源数据,生成目标源数据,并将该目标源数据加载至图数据库中,以便基于图数据库生成目标知识图谱。如此,用户可以直接在更新界面上对初始知识图谱中的节点和/边进行更新,无需修改用于构建知识图谱的底层数据,这不仅可以有效降低用户更新知识图谱的难度,而且,也能够有效提高更新知识图谱的效率。此外,本申请还提供了相应的更新知识图谱的装置及相关设备。

Description

一种更新知识图谱的方法、装置及相关设备
技术领域
本申请涉及数据处理技术领域,尤其涉及一种更新知识图谱的方法、装置及相关设备。
背景技术
知识图谱(knowledge graph),是一种结构化的语义知识库,能够用于以符号形式描述现实世界中的实体以及实体之间的相互关系,在数据搜索、信息挖掘、信息可视化等领域存在广泛应用。比如,基于企业、产品以及员工等信息所构建出的知识图谱,能够用于查询或者挖掘不同企业之间的关联关系(如控股关系、供应商关系等)、企业与产品之间的关联关系(如经营关系、发行关系等)、产品与产品之间的关联关系(如上下游关系等)、企业与员工之间的关联关系(如股权关系、任职关系等)、员工与员工之间的关联关系(如上下级关系、合作关系等)。
实际应用场景中,通常需要频繁对已构建的知识图谱进行更新,以适应数据信息的迭代变化。目前,知识图谱通常是只读的,因此,用户需要对用于构建知识图谱的底层数据进行修改,并基于修改后的底层数据构建出新的知识图谱,才能实现更新知识图谱。但是,这种更新知识图谱的方式,要求用户逐个修改底层数据,不仅更新效率较低,而且数据修改容易出错。
发明内容
本申请提供了一种更新知识图谱的方法,以提高更新知识图谱的效率以及友好性、降低用户更新知识图谱的难度。此外,本申请还提供了对应的更新知识图谱的装置、计算设备、计算机可读存储介质以及计算机程序产品。
第一方面,本申请提供一种更新知识图谱的方法,所述方法包括:
获取更新记录数据,所述更新记录数据用于记录用户在更新界面上针对初始知识图谱执行的更新操作,所述更新操作包括更新所述初始知识图谱中的节点、和/或更新所述初始知识图谱中的边;
根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,所述初始知识图谱基于所述初始源数据完成构建;
将所述目标源数据加载至图数据库;
基于所述图数据库,生成目标知识图谱。
在一种可能的实施方式中,所述将所述目标源数据加载至图数据库,包括
获取图谱表以及关系表,所述图谱表用于记录所述初始知识图谱中的节点与边,所述关系表用于记录所述目标源数据,所述目标源数据存储于关系型数据库;
获取用户在配置界面上针对所述图谱表以及所述关系表的配置操作;
根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系;
基于所述图谱表与所述关系表之间的映射,将所述目标源数据加载至所述图数据库。
在一种可能的实施方式中,所述根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系,包括:
根据所述配置操作,确定所述图谱表与所述关系表之间的关联主键;
利用所述关联主键,建立所述图谱表与所述关系表之间的映射关系。
在一种可能的实施方式中,所述更新操作包括删除操作、新增操作以及修改操作,所述根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,包括:
基于所述删除操作,从所述初始源数据中剔除被删除的节点以及边分别对应的属性数据,得到第一源数据;
从所述第一源数据中过滤得到第二源数据,所述第二源数据为所述初始知识图谱中未被更新的节点以及边分别对应的属性数据;
将所述新增操作所指示的新增的节点以及边分别对应的属性数据,确定为第三源数据;
基于所述修改操作以及所述初始源数据,确定第四源数据,所述第四源数据包括被修改的节点以及边分别对应的属性数据;
汇总所述第二源数据、第三源数据、第四源数据,得到所述目标源数据。
在一种可能的实施方式中,所述根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,包括:
获取变动源数据,所述变动源数据为相对于所述初始源数据存在变化的数据;
利用所述变动源数据对所述初始源数据中部分数据进行替换,得到替换后的初始源数据;
根据所述更新记录数据、所述替换后的初始源数据,生成所述目标源数据。
在一种可能的实施方式中,所述更新记录数据记录于日志,所述日志用于在满足预设条件下,将所述目标知识图谱回退至所述初始知识图谱。
在一种可能的实施方式中,所述方法还包括:
呈现所述目标知识图谱。
第二方面,本申请实施例还提供了一种更新知识图谱的装置,所述装置包括:
获取模块,用于获取更新记录数据,所述更新记录数据用于记录用户在更新界面上针对初始知识图谱执行的更新操作,所述更新操作包括更新所述初始知识图谱中的节点、和/或更新所述初始知识图谱中的边;
源数据生成模块,用于根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,所述初始知识图谱基于所述初始源数据完成构建;
加载模块,用于将所述目标源数据加载至图数据库;
知识图谱生成模块,用于基于所述图数据库,生成目标知识图谱。
在一种可能的实施方式中,所述加载模块,用于:
获取图谱表以及关系表,所述图谱表用于记录所述初始知识图谱中的节点与边,所述关系表用于记录所述目标源数据,所述目标源数据存储于关系型数据库;
获取用户在配置界面上针对所述图谱表以及所述关系表的配置操作;
根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系;
基于所述图谱表与所述关系表之间的映射,将所述目标源数据加载至所述图数据库。
在一种可能的实施方式中,所述加载模块,具体用于:
根据所述配置操作,确定所述图谱表与所述关系表之间的关联主键;
利用所述关联主键,建立所述图谱表与所述关系表之间的映射关系。
在一种可能的实施方式中,所述更新操作包括删除操作、新增操作以及修改操作,所述源数据生成模块,用于:
基于所述删除操作,从所述初始源数据中剔除被删除的节点以及边分别对应的属性数据,得到第一源数据;
从所述第一源数据中过滤得到第二源数据,所述第二源数据为所述初始知识图谱中未被更新的节点以及边分别对应的属性数据;
将所述新增操作所指示的新增的节点以及边分别对应的属性数据,确定为第三源数据;
基于所述修改操作以及所述初始源数据,确定第四源数据,所述第四源数据包括被修改的节点以及边分别对应的属性数据;
汇总所述第二源数据、第三源数据、第四源数据,得到所述目标源数据。
在一种可能的实施方式中,所述源数据生成模块,用于:
获取变动源数据,所述变动源数据为相对于所述初始源数据存在变化的数据;
利用所述变动源数据对所述初始源数据中部分数据进行替换,得到替换后的初始源数据;
根据所述更新记录数据、所述替换后的初始源数据,生成所述目标源数据。
在一种可能的实施方式中,所述更新记录数据记录于日志,所述日志用于在满足预设条件下,将所述目标知识图谱回退至所述初始知识图谱。
在一种可能的实施方式中,所述装置还包括:
呈现模块,用于呈现所述目标知识图谱。
第三方面,本申请提供一种计算设备,所述计算设备包括处理器、存储器。所述处理器用于执行存储器中存储的指令,以使得计算设备执行如第一方面或第一方面的任一种实现方式中的更新知识图谱的方法。需要说明的是,该存储器可以集成于处理器中,也可以是独立于处理器之外。计算设备还可以包括总线。其中,处理器通过总线连接存储器。其中,存储器可以包括可读存储器以及随机存取存储器。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算设备上运行时,使得计算设备执行上述第一方面或第一方面的任一种实现方式所述更新知识图谱的方法的操作步骤。
第五方面,本申请提供了一种包含指令的计算机程序产品,当其在计算设备上运行时,使得计算设备执行上述第一方面或第一方面的任一种实现方式所述更新知识图谱的方法的操作步骤。
本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请提供的一示例性数据处理系统10的结构示意图;
图2为本申请提供的一种更新知识图谱的方法的流程示意图;
图3为本申请提供的一示例性知识图谱的结构示意图;
图4为本申请提供的覆盖知识图谱的更新场景的示意图;
图5为本申请提供的一种更新知识图谱的装置的结构示意图;
图6为本申请提供的一种计算设备的硬件结构示意图。
具体实施方式
目前,在更新知识图谱的过程中,用户(如技术人员、运维人员等)通常需要根据更新需求,对用于构建知识图谱的底层数据进行逐个修改,以便基于修改后的底层数据所构建出的知识图谱满足该更新需求。但是,当底层数据的数据量较大时,用户所需修改的底层数据的数据量较多,如删除知识图谱中的一个节点时,用户需要逐个删除以该节点作为端点的所有边,从而导致更新知识图谱的效率较低;并且,单个节点对应的底层数据修改,往往会对其它节点的底层数据产生影响,因此,用户修改大量的底层数据难免会发生修改错误,如用户难免会遗漏对部分底层数据做出修改,从而导致更新后的知识图谱存在错误,增加知识图谱的运维难度。
基于此,本申请实施例提供了一种更新知识图谱的方法,以提高更新知识图谱的效率以及友好性、降低用户更新知识图谱的难度。具体实现时,在对初始知识图谱进行更新的过程中,先获取更新记录数据,该更新记录数据用于记录用户在更新界面上针对初始知识图谱所执行的更新操作,该更新操作包括更新初始知识图谱中的节点和/或更新初始知识图谱中的边;然后,根据获取的更新记录数据以及用于构建初始知识图谱的初始源数据,生成目标源数据,并将该目标源数据加载至图数据库中,以便基于图数据库生成目标知识图谱,该目标知识图谱也即为对初始知识图谱进行更新后所生成的新的知识图谱,以此实现知识图谱的更新。
如此,用户可以直接在更新界面上对初始知识图谱中的节点和/边进行更新,即可实现对初始知识图谱的更新,无需修改用于构建知识图谱的底层数据(如初始源数据等),这不仅可以有效降低用户更新知识图谱的难度,而且,通过根据更新操作自动化生成用于构建新的知识图谱的目标源数据,相对于用户手动逐个修改底层数据的方式而言,能够有效提高更新知识图谱的效率,也能尽可能避免认为操作而容易发生的更新错误、降低运维知识图谱的难度。
作为一种实现示例,本申请实施例可以应用于如图1所示的数据处理系统10。如图1所示,数据处理系统10包括客户端101、更新装置200。
其中,客户端101可以是更新装置200对外提供的网络浏览器,或者,客户端101可以是运行在用户侧设备上的应用。
更新装置200中可以配置有一个或者多个存储区域,每个存储区域可以用于构建一个数据库。示例性地,图1中以更新装置200包括存储区域1、存储区域2以及存储区域3为例进行说明。其中,存储区域1,用于存储日志,如存储用于记录用户102针对初始知识图谱所执行的更新操作的日志。存储区域2,用于存储构建初始知识图谱所采用的初始源数据、以及构建目标知识图谱(也即更新后的初始知识图谱)所采用的目标源数据。存储区域3,用于以图数据库的格式存储目标源数据。
在图1所示的数据处理系统10中,更新装置200可以通过客户端101向用户102呈现更新界面,该更新界面上包括初始知识图谱,以便用户102在该客户端101上对初始知识图谱中的节点或者边,执行相应的更新操作。客户端101生成操作日志,该操作日志中包括用于记录用户102所执行的更新操作的更新记录数据,并将该操作日志提供给更新装置200。更新装置200利用存储区域1存储该操作日志,并根据更新记录数据以及存储区域2中存储的初始源数据,生成目标源数据,并将该目标源数据加载至基于存储区域3构成的图数据库中,从而更新装置200基于该图数据库中的目标源数据生成目标知识图谱,以此实现对初始知识图谱完成更新。进一步地,更新装置200还可以通过客户端101将更新所得到的目标知识图谱呈现给用户102。客户端101还可以与更新装置200中的图数据库存在连接,从而客户端101可以对图数据库中的数据进行访问。
值得注意的是,图1所示的数据处理系统10仅作为一种实现示例,并不用于限定方案实施所适用的各种数据处理系统。比如,在其他可能的数据处理系统中,还可以包括其它客户端或者存储服务器等,该其它客户端或者存储服务器用于向更新装置200提供变动源数据,该变动源数据为相对于初始源数据存在变化的数据,如变动源数据可以是初始知识图谱中的某个节点的属性值发生变化后的值等。或者,当数据处理系统10应用于知识图谱平台时,该数据处理系统10,还可以集成有更多的装置或者设备等,以丰富数据处理系统10的功能或者算力。
为便于理解,下面结合附图,对本申请提供的更新知识图谱的方法的实施例进行描述。
参见图2,图2为本申请实施例提供的一种更新知识图谱的方法的流程示意图,该方法可以应用于图1数据处理系统10,或者可以应用于其它可适用的数据处理系统。为便于说明,本实施例中以应用于图1所示的数据处理系统10为例进行示例性说明。
其中,图2所示的更新知识图谱的方法可以由图1中的更新装置200执行,该方法具体可以包括:
S201:更新装置200获取更新记录数据,该更新记录数据用于记录用户102在更新界面上针对初始知识图谱执行的更新操作,该更新操作包括更新初始知识图谱中的节点的操作和/或更新初始知识图谱中的边的操作。
本实施例中,更新装置200可以通过客户端101向用户102呈现初始知识图谱,该初始知识图谱预先基于多个数据完成构建(为便于描述,以下将该多个数据称之为初始源数据)。示例性地,客户端101所呈现的初始知识图谱可以是如图3所示的知识图谱,包括多个节点,并且不同节点之间通过边连接。其中,初始知识图谱中的节点用于指代实际应用场景中的一个实体,如图3中较大的节点可以指代一个公司,与该节点连接的其它较小的节点可以用于指代属于该公司的一位工作人员。初始知识图谱中的边,用于指示两个节点所指代的实体之间的关系,如企业节点与员工节点之间的股权关系、任职关系等。
实际应用场景中,用户102可能需要对初始知识图谱进行相应的修改,如在该初始知识图谱中新增、删除节点/边等。本实施例中,为降低用户更新初始知识图谱的难度、提高更新效率,更新装置200可以支持用户102直接在更新界面上对初始知识图谱进行相应的修改。
具体地,用户102可以在更新界面上对已有的节点/边进行删除。比如,用户102可以指定删除初始知识图谱中的一个或者多个节点,并且,对于以被删除的节点作为端点的边默认一并删除。又比如,用户102可以指定删除知识图谱中的一条或者多条边等。
或者,用户102可以在更新界面上为初始知识图谱新增节点/边。比如,用户102可以创建新的节点,并进一步创建该节点与其它已有节点之间的边。又比如,用户102可以将初始知识图谱中两个未存在连接的两个节点创建一条边等。
或者,用户102可以在更新界面上对初始知识图谱中的节点/边所具有的属性进行修改,包括修改该节点/边的已有属性的值、为该节点/边新增属性、删除该节点/边已有的属性中的一种或者多种。
然后,客户端101可以根据用户102执行的针对节点或者边的更新操作,生成包括更新操作的操作日志,并将该操作日志发送给更新装置200。其中,该操作日志中的更新操作可以对应于一条或者多条记录,每条记录可以用于指示用户102针对一个节点或者一条边的更新内容,包括被更新的节点/边的标识、该节点/边的属性数据、操作类型等信息,操作类型的具体可以是修改、删除、新增等类型。实际应用时,该操作日志还可以记录其他信息,如记录修改日期、用户102的身份信息等。示例性地,所生成的操作日志的格式,例如可以是json格式,也可以是其它任意格式,对此并不进行限定。
相应地,更新装置200可以对接收到操作日志进行解析,并从中提取出更新记录数据。值得注意的是,由于用户102可能在不同时段,对同一节点或者同一边的属性信息进行多次修改,从而操作日志中的更新操作可能包含针对同一节点或者同一边的多条记录,此时,更新装置200在提取更新记录数据的过程中,针对同一节点或者同一边的多条记录,仅保留针对该节点或者边的属性的最新修改记录,如针对节点或者边的A属性以及B属性,可以按照修改日期保留距离当前时刻最近的用于修改A属性的一条记录以及用于修改B属性的一条记录等。比如,更新装置200可以创建汇总表,例如可以创建以“_summary”结尾的汇总表,该汇总表用于对操作日志中的多条记录进行汇总,并保留同一节点以及同一条边的各个属性的最新更新记录(在已创建汇总表的情况下,将操作日志中的多条记录添加至该汇总表即可)。
进一步地,更新装置200还可以对提取出的更新记录数据进行结构化存储,以方便后续的数据读取。如可以将该更新记录数据以日志形式存储于存储区域1所形成的关系型数据库中。其中,关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,并且,一系列的行和列可以被称为表(table),该一张或者多张表可以构成数据库。
在关系型数据库中,每个节点对应的更新记录数据(该节点的属性数据)可以保存为关系型数据库中的一张表,如以“_v”结尾的表,例如公司节点对应的更新记录数据可以保存为“company_v”的表。并且,每个边对应的更新记录数据(该边的属性数据)可以保存为该关系型数据库中的一张表,如以“_e”结尾的表,例如企业之间的控股关系保存为“com_com_controller_e”的表。其中,每次完成对于知识图谱的更新后,更新装置200可以删除以“_v”结尾的表以及以“_e”结尾的表。
本实施例中,是在用户102存在针对初始知识图谱的更新操作的条件下,介绍更新装置200执行更新知识图谱的具体实现过程,实际应用时,更新装置200可以先判断初始知识图谱当前是否存在节点或者边被修改,若不存在,则可以不用执行更新知识图谱的过程;若存在,则可以触发执行步骤S201及后续步骤,实现对初始知识图谱的更新。更新装置200可以判断是否存在以“_v”结尾的表和以“_e”结尾的表,如果存在,说明当前存在节点/边被修改,如果不存在,说明不存在节点/边被修改。
S202:更新装置200根据更新记录数据、初始知识图谱的初始源数据,生成目标源数据,其中,初始知识图谱基于该初始源数据完成构建。
本实施例中,初始源数据,可以是通过对多源、异构的数据进行清洗后所生成的源数据,也可以是来自于同一源端或者采用统一结构的源数据。
通常情况下,用户102对初始知识图谱的更新,主要是涉及对初始知识图谱中的部分节点以及部分边的更新。因此,更新装置200可以通过结合更新记录数据以及原先生成初始知识图谱所采用的初始源数据,生成新的源数据,以便后续利用该新的源数据(也即目标源数据)生成新的知识图谱。其中,初始源数据,可以存储于更新装置200基于存储区域2所构建的关系型数据库中。
在一种可能的实施方式中,由于实际应用场景中,在用户未参与更新的情况下,初始知识图谱中的部分节点或者边的属性也可能会发生变化。举例来说,假设初始知识图谱中的其中一个节点指代A公司,则基于业务变化,A公司可能会发生注销、或者A公司与其它公司之间的控股关系可能发生变化,此时,通过对初始源数据中关于A公司的属性进行更新(可以是直接A公司及其属性、或者可以是修改A公司的已有属性),以实现对初始源数据进行更新。然后,更新装置200结合该更新记录数据以及更新后的初始源数据,生成新的目标源数据。如此,能够及时有效的发现数据变化,避免出现脏数据,从而可以避免最终生成的新的知识图谱中发生数据不精准的问题,如多了A公司对应的节点,或者A公司对应的节点与其它节点之间的关系存在错误等。
具体实现时,更新装置200获取变动源数据,该变动源数据为相对于初始源数据存在变化的数据。然后,更新装置200可以利用该变动源数据对初始源数据中的部分数据进行替换,得到替换后的初始源数据(也即更新后的初始源数据)。最后,更新装置200根据该更新记录数据、替换后的初始源数据,生成目标源数据。
其中,更新装置200可以通过数据比对的方式,确定变动源数据。比如,更新装置200可以接收其它客户端或者外接的设备发送的源数据,该源数据例如可以仅涉及初始知识图谱中的部分节点以及部分边,如外接的设备可以定期将负责维护的多个实体的源数据发送给更新装置200等(源数据在每个周期内可能会发生变化,也可能未发生变化),从而更新装置200可以比对接收到的源数据与相应部分的初始源数据是否一致,并且,当存在不一致的数据时,更新装置200将该部分的初始源数据更新为接收到的源数据。或者,在其它实现方式中,更新装置200也可以接收其它客户端或者外接的设备发送的变动源数据等,比如,当存在源数据发生变更,其它客户端或者外接的设备可以直接将变动后的源数据发送给更新装置200等。
示例性地,更新装置200在生成目标源数据的过程中,可以根据不同类型的操作,确定不同部分的目标源数据。为便于理解,下面以更新记录数据所记录的更新操作同时包括删除、新增、修改的操作为例,介绍生成目标源数据的具体实现过程。
针对删除操作,更新装置200可以从替换后的初始源数据(或者未替换的初始源数据)中剔除被删除的节点、被删除的边分别对应的属性数据,得到第一源数据。其中,更新装置200可以将操作类型为“删除”的节点和边,依次确定为被删除的节点和被删除的边。此时,第一源数据所对应的节点以及边中,可能包含未被删除但是发生属性信息修改的节点或者边。因此,更新装置200可以从第一源数据中过滤得到第二源数据,该第二源数据为初始知识图谱中未被更新的节点以及边分别对应的属性数据。例如,更新装置200可以根据更新记录数据中所指示的被修改的节点以及边,对第一源数据进行过滤,得到第二源数据。
针对新增操作,更新装置200可以将该新增操作所指示的新增的节点以及边分别对应的属性数据,确定为第三源数据。
针对修改操作,更新装置200可以基于该修改操作以及初始源数据确定第四源数据,该第四源数据包括被修改的节点以及边分别对应的属性数据。
实际应用时,由于数据在数据库中是以表的形式进行保存,因此,更新装置200可以通过连接(join)删除操作/修改操作所对应的表,与记录初始源数据的表的方式,生成第二源数据、第四源数据,该连接可以包括内连接(inner join)、右连接(right join)等方式,在此不做限定。
最后,更新装置200可以通过汇总上述第二源数据、第三源数据以及第四源数据,生成得到目标源数据。
可以理解,当更新操作包括删除、新增、修改中的部分类型的操作时,更新装置200可以通过汇总上述相应的第二源数据、第三源数据以及第四源数据中的部分源数据生成目标源数据,本实施例对此不再进行赘述。
S203:更新装置200将目标源数据加载至图数据库。
其中,图数据库(graph database),是一种非关系型数据库,主要应用图形理论存储实体之间的关系信息,其以节点(Node)和边(Edge)的方式存储数据,并且,节点和边拥有其私有属性。
实际应用时,由于图数据库中的字段描述与关系型数据库中的字段描述容易存在不一致。比如,在图数据库中,公司节点对应的表的命名为“graph_company”,该公司节点的属性字段有“name”、“open_date”,而在关系型数据库中,该公司节点对应的表的命名为“all_company”,该公司节点对应的表所包括的属性字段的命名为“company_name”、“date”。如此,更新装置200如果直接通过字段描述匹配的方式,将关系型数据库中的目标源数据加载至图数据库,则可能会导致更新装置200难以识别描述同一对象的数据,从而影响知识图谱的构建。
因此,在一种可能的实施方式中,更新装置200可以获取图谱表以及关系表。其中,图谱表用于记录初始知识图谱中的节点与边,如图谱表可以包括实体表以及边表,其中,实体表包括的实体可以用于指示初始知识图谱中的节点,边表包括的边可以用于指示初始知识图谱中的边,也即不同实体之间的关系。关系表用于记录关系型数据库中存储的目标源数据。然后,更新装置200获取用户102在配置界面上针对该图谱表以及该关系表的配置操作,从而根据该配置操作,建立图谱表与关系表之间的映射关系。这样,更新装置200基于图谱表与关系表之间的映射,识别不同数据库对于同一对象的描述,并以此将目标源数据加载至图数据库,从而可以实现自动化识别不同数据库中描述的同一对象(包括同一实体或者同一条边)。
其中,用户102在配置界面上对图谱表以及关系表进行配置时,具体可以是为图谱表以及关系表配置关联主键。这样,更新装置200根据用户102执行的配置操作,确定图谱表与关系表之间的关联主键,并利用该关联主键,建立图谱表与关系表之间的映射关系,以此实现建立图谱表与系表之间的映射关系。
示例性地,关联主键,可以包括表级别的主键以及字段级别的主键,如此,更新装置200可以基于该表级别的主键,构建图谱表与关系表在表级别的映射关系,该映射关系例如可以包括节点/关系类型、图谱表名、图谱主键、对应的关系表名、对应的关系表主键。进一步地,该表级别的映射关系还可以包括图谱标签(可以用于描述节点/关系的属性)、描述(可以用于描述表的作用)、对应关系表库(可以用于描述数据库的名称),或者可以包括其它信息。并且,更新装置200可以基于该字段级别的主键,构建图谱表与关系表在字段级别的映射关系,该映射关系例如可以包括关系表库、关系表名称、关系表字段、字段顺序、字段类别、图谱标签、图属性中的一种或者多种,其中,字段类别包含主键、时间两种类别;或者,该字段级别的映射关系可以包括其它信息。
或者,建立图谱表与关系表之间的映射关系所需的关联主键,也可以是预先由技术人员静态配置于更新装置200中。这样,更新装置200可以基于固定配置的关联主键,建立图谱表与关系表之间的映射关系。
又或者,更新装置200可以基于预设的关联算法,将图谱表中的主键与关系表中的主键建立映射,以此实现建立图谱表与关系表之间的映射关系。进一步地,当存在部分关系表中的主键与图谱表中的主键存在较大差异时,更新装置200还可以将未成功建立映射关系的图谱表以及关系表呈现给用户102,以便根据用户102的操作建立映射关系;并且,更新装置200还可以将已建立的映射关系也呈现给用户102,以便由用户102对该映射关系进行人工核验和调整。
需要说明的是,更新装置200获取图谱表与关系表之间的映射关系的步骤不局限于将目标源数据加载至图数据库的过程中。比如,用户102可以在更新界面上更新初始知识图谱中的节点或边的过程中,可以在客户端101单独呈现的配置界面上配置图谱表与关系表之间的映射关系,从而更新装置200可以在生成目标源数据之前,构建得到图谱表与关系表之间的映射关系。
由于在图数据库中可能存储有用于构建初始知识图谱的数据,因此,更新装置200在向图数据库中加载目标源数据之前,可以先清空图数据库中的数据,然后再将该目标源数据加载至图数据库中,以此可以减少图数据库对于存储资源的占用,降低存储要求。
S204:更新装置200基于该图数据库,生成目标知识图谱。
可以理解,由于图数据库中定义了节点、边、节点的属性、以及边的属性,因此,基于该图数据库中记录的节点和边,能够生成新的知识图谱,即上述目标知识图谱,也即经过用户102更新后的初始知识图谱。
如此,在实现对于知识图谱的定制化的条件下,对于用户102而言,用户102可以直接在更新界面上对初始知识图谱中的节点和/边进行更新,其余过程由更新装置200根据更新内容自动实现对初始知识图谱的更新,无需用户102修改用于构建知识图谱的底层数据,这不仅可以有效降低用户102更新知识图谱的难度,而且,通过根据更新操作自动化生成用于构建新的知识图谱的目标源数据,相对于用户102手动逐个修改底层数据的方式而言,能够有效提高更新知识图谱的效率,也能尽可能避免认为操作而容易发生的更新错误。
并且,上述更新知识图谱的过程,可以覆盖大量的更新场景。以知识图谱包括节点a、节点b以及节点c这三个节点为例,并且这三个节点依次连接,如图4所示。则针对节点a,当节点a未变化时,节点a对应的边可能存在3种场景,分别为:节点a的边无变化、节点a新增边、节点a删除边;类似地,当节点a被修改时,该节点a对应的边仍然存在上述3种场景;另外,还存在一种删除节点a的更新场景。即,涉及节点a以及节点a的边,即存在7种(即3+3+1)更新场景。类似地,节点b也存在7种更新场景;节点c,作为末端节点,仅存在节点c无变化、节点c被修改以及节点c被删除三种更新场景。如此,仅仅针对3个节点,即可存在147种(即7*7*3)更新场景。当知识图谱中包括更多数量的节点时,上述更新知识图谱的方式,可以覆盖更多数量的更新场景。
进一步地,本实施例中,还可以进一步包括如下步骤:
S205:更新装置200将目标知识图谱发送给客户端101,以便客户端101将该目标知识图谱呈现给用户102。
如此,用户102可以在客户端101上查看更新后的知识图谱,并可以基于更新的知识图谱判断是否满足当前的业务需求,以便在不满足业务需求的情况下,继续参照上述过程对该知识图谱进行更新,直至最终更新得到的知识图谱符合用户102的预期。
或者,更新装置200可以按照上述过程,周期性的执行一次更新知识图谱的过程。具体地,对于用户102在T日针对知识图谱做出的更新操作,更新装置200可以无需即刻执行更新知识图谱的过程,而是可以先利用操作日志对该用户102的更新操作进行记录,并存储该操作日志。然后,更新装置200可以在第T+1日(也即用户102做出更新操作的第二天),根据存储的操作日志中所记录的更新操作,执行更新初始知识图谱的过程。如此,通过延迟响应知识图谱的更新,可以避免知识图谱被频繁更新。比如,假设用户102在第T日的n个不同时间段内(n为大于1的正整数),分别执行了更新知识图谱的操作,并且,还存在其它m个用户,也分别执行了针对知识图谱的更新操作,这些更新操作均记录于操作日志中。这样,更新装置200可以在第T+1日,根据操作日志记录的多个更新操作,通过日志汇总等方式,统一执行针对知识图谱的更新,无需在第T日频繁修改知识图谱,从而可以有效减少知识图谱的修改次数,减少资源消耗。并且,在第T日,用户102与其它用户能够始终基于同一知识图谱进行数据检索等服务,以此可以避免短时间内(即第T日)出现数据不一致的问题。
在进一步可能的实施方式中,当需要对知识图谱的版本进行回退时,比如,用户102针对初始知识图谱中的节点或边的更新存在错误等,更新装置200还可以根据操作日志中记录的更新记录数据,将目标知识图谱回退至初始知识图谱,以此可以提高更新知识图谱的容错性。
此外,本申请实施例还提供了一种更新知识图谱的装置。参阅图5,图5示出了本申请实施例中一种更新知识图谱的装置的结构示意图,图5所示的更新知识图谱的装置500,例如可以是上述图2所示的更新装置200。如图5所示,更新知识图谱的装置500包括:
获取模块501,用于获取更新记录数据,所述更新记录数据用于记录用户在更新界面上针对初始知识图谱执行的更新操作,所述更新操作包括更新所述初始知识图谱中的节点、和/或更新所述初始知识图谱中的边;
源数据生成模块502,用于根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,所述初始知识图谱基于所述初始源数据完成构建;
加载模块503,用于将所述目标源数据加载至图数据库;
知识图谱生成模块504,用于基于所述图数据库,生成目标知识图谱。
在一种可能的实施方式中,所述加载模块503,用于:
获取图谱表以及关系表,所述图谱表用于记录所述初始知识图谱中的节点与边,所述关系表用于记录所述目标源数据,所述目标源数据存储于关系型数据库;
获取用户在配置界面上针对所述图谱表以及所述关系表的配置操作;
根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系;
基于所述图谱表与所述关系表之间的映射,将所述目标源数据加载至所述图数据库。
在一种可能的实施方式中,所述加载模块503,具体用于:
根据所述配置操作,确定所述图谱表与所述关系表之间的关联主键;
利用所述关联主键,建立所述图谱表与所述关系表之间的映射关系。
在一种可能的实施方式中,所述更新操作包括删除操作、新增操作以及修改操作,所述源数据生成模块502,用于:
基于所述删除操作,从所述初始源数据中剔除被删除的节点以及边分别对应的属性数据,得到第一源数据;
从所述第一源数据中过滤得到第二源数据,所述第二源数据为所述初始知识图谱中未被更新的节点以及边分别对应的属性数据;
将所述新增操作所指示的新增的节点以及边分别对应的属性数据,确定为第三源数据;
基于所述修改操作以及所述初始源数据,确定第四源数据,所述第四源数据包括被修改的节点以及边分别对应的属性数据;
汇总所述第二源数据、第三源数据、第四源数据,得到所述目标源数据。
在一种可能的实施方式中,所述源数据生成模块502,用于:
获取变动源数据,所述变动源数据为相对于所述初始源数据存在变化的数据;
利用所述变动源数据对所述初始源数据中部分数据进行替换,得到替换后的初始源数据;
根据所述更新记录数据、所述替换后的初始源数据,生成所述目标源数据。
在一种可能的实施方式中,所述更新记录数据记录于日志,所述日志用于在满足预设条件下,将所述目标知识图谱回退至所述初始知识图谱。
在一种可能的实施方式中,所述装置500还包括:
呈现模块505,用于呈现所述目标知识图谱。
需要说明的是,上述装置各模块、单元之间的信息交互、执行过程等内容,由于与本申请实施例中方法实施例基于同一构思,其带来的技术效果与本申请实施例中方法实施例相同,具体内容可参见本申请实施例前述所示的方法实施例中的叙述,此处不再赘述。
此外,本申请实施例还提供了一种计算设备。参阅图6,图6示出了本申请实施例中一种计算设备的硬件结构示意图,该计算设备600可以包括处理器601以及存储器602。
其中,所述存储器602,用于存储计算机程序;
所述处理器601,用于根据所述计算机程序执行如下步骤:
获取更新记录数据,所述更新记录数据用于记录用户在更新界面上针对初始知识图谱执行的更新操作,所述更新操作包括更新所述初始知识图谱中的节点、和/或更新所述初始知识图谱中的边;
根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,所述初始知识图谱基于所述初始源数据完成构建;
将所述目标源数据加载至图数据库;
基于所述图数据库,生成目标知识图谱。
其中,处理器601可以是CPU,该处理器601还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立器件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。
存储器602例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory, RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM, DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
在一种可能的实施方式中,所述处理器601,具体用于根据所述计算机程序执行如下步骤:
获取图谱表以及关系表,所述图谱表用于记录所述初始知识图谱中的节点与边,所述关系表用于记录所述目标源数据,所述目标源数据存储于关系型数据库;
获取用户在配置界面上针对所述图谱表以及所述关系表的配置操作;
根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系;
基于所述图谱表与所述关系表之间的映射,将所述目标源数据加载至所述图数据库。
在一种可能的实施方式中,所述处理器601,具体用于根据所述计算机程序执行如下步骤:
根据所述配置操作,确定所述图谱表与所述关系表之间的关联主键;
利用所述关联主键,建立所述图谱表与所述关系表之间的映射关系。
在一种可能的实施方式中,所述更新操作包括删除操作、新增操作以及修改操作,所述处理器601,具体用于根据所述计算机程序执行如下步骤:
基于所述删除操作,从所述初始源数据中剔除被删除的节点以及边分别对应的属性数据,得到第一源数据;
从所述第一源数据中过滤得到第二源数据,所述第二源数据为所述初始知识图谱中未被更新的节点以及边分别对应的属性数据;
将所述新增操作所指示的新增的节点以及边分别对应的属性数据,确定为第三源数据;
基于所述修改操作以及所述初始源数据,确定第四源数据,所述第四源数据包括被修改的节点以及边分别对应的属性数据;
汇总所述第二源数据、第三源数据、第四源数据,得到所述目标源数据。
在一种可能的实施方式中,所述处理器601,具体用于根据所述计算机程序执行如下步骤:
获取变动源数据,所述变动源数据为相对于所述初始源数据存在变化的数据;
利用所述变动源数据对所述初始源数据中部分数据进行替换,得到替换后的初始源数据;
根据所述更新记录数据、所述替换后的初始源数据,生成所述目标源数据。
在一种可能的实施方式中,所述更新记录数据记录于日志,所述日志用于在满足预设条件下,将所述目标知识图谱回退至所述初始知识图谱。
在一种可能的实施方式中,所述处理器601,还用于根据所述计算机程序执行如下步骤:
呈现所述目标知识图谱。
另外,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方法实施例中所述的更新知识图谱的方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,ROM)/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目标。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请示例性的实施方式,并非用于限定本申请的保护范围。

Claims (10)

1.一种更新知识图谱的方法,其特征在于,所述方法包括:
获取更新记录数据,所述更新记录数据用于记录用户在更新界面上针对初始知识图谱执行的更新操作,所述更新操作包括更新所述初始知识图谱中的节点、和/或更新所述初始知识图谱中的边;
根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,所述初始知识图谱基于所述初始源数据完成构建;
将所述目标源数据加载至图数据库;
基于所述图数据库,生成目标知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标源数据加载至图数据库,包括:
获取图谱表以及关系表,所述图谱表用于记录所述初始知识图谱中的节点与边,所述关系表用于记录所述目标源数据,所述目标源数据存储于关系型数据库;
获取用户在配置界面上针对所述图谱表以及所述关系表的配置操作;
根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系;
基于所述图谱表与所述关系表之间的映射,将所述目标源数据加载至所述图数据库。
3.根据权利要求2所述的方法,其特征在于,所述根据所述配置操作,建立所述图谱表与所述关系表之间的映射关系,包括:
根据所述配置操作,确定所述图谱表与所述关系表之间的关联主键;
利用所述关联主键,建立所述图谱表与所述关系表之间的映射关系。
4.根据权利要求1所述的方法,其特征在于,所述更新操作包括删除操作、新增操作以及修改操作,所述根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,包括:
基于所述删除操作,从所述初始源数据中剔除被删除的节点以及边分别对应的属性数据,得到第一源数据;
从所述第一源数据中过滤得到第二源数据,所述第二源数据为所述初始知识图谱中未被更新的节点以及边分别对应的属性数据;
将所述新增操作所指示的新增的节点以及边分别对应的属性数据,确定为第三源数据;
基于所述修改操作以及所述初始源数据,确定第四源数据,所述第四源数据包括被修改的节点以及边分别对应的属性数据;
汇总所述第二源数据、第三源数据、第四源数据,得到所述目标源数据。
5.根据权利要求1所述的方法,其特征在于,所述根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,包括:
获取变动源数据,所述变动源数据为相对于所述初始源数据存在变化的数据;
利用所述变动源数据对所述初始源数据中部分数据进行替换,得到替换后的初始源数据;
根据所述更新记录数据、所述替换后的初始源数据,生成所述目标源数据。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述更新记录数据记录于日志,所述日志用于在满足预设条件下,将所述目标知识图谱回退至所述初始知识图谱。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
呈现所述目标知识图谱。
8.一种更新知识图谱的装置,其特征在于,所述装置包括:
获取模块,用于获取更新记录数据,所述更新记录数据用于记录用户在更新界面上针对初始知识图谱执行的更新操作,所述更新操作包括更新所述初始知识图谱中的节点、和/或更新所述初始知识图谱中的边;
源数据生成模块,用于根据所述更新记录数据、所述初始知识图谱的初始源数据,生成目标源数据,所述初始知识图谱基于所述初始源数据完成构建;
加载模块,用于将所述目标源数据加载至图数据库;
知识图谱生成模块,用于基于所述图数据库,生成目标知识图谱。
9.一种计算设备,其特征在于,包括处理器、存储器;
所述处理器用于执行所述存储器中存储的指令,以使所述计算设备执行如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,包括指令,当其在计算设备上运行时,使得所述计算设备执行如权利要求1至7中任一项所述方法的步骤。
CN202310433514.5A 2023-04-21 2023-04-21 一种更新知识图谱的方法、装置及相关设备 Pending CN116303516A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310433514.5A CN116303516A (zh) 2023-04-21 2023-04-21 一种更新知识图谱的方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310433514.5A CN116303516A (zh) 2023-04-21 2023-04-21 一种更新知识图谱的方法、装置及相关设备

Publications (1)

Publication Number Publication Date
CN116303516A true CN116303516A (zh) 2023-06-23

Family

ID=86803309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310433514.5A Pending CN116303516A (zh) 2023-04-21 2023-04-21 一种更新知识图谱的方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN116303516A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407407A (zh) * 2023-12-15 2024-01-16 中信证券股份有限公司 多异构数据源数据集更新方法、装置、设备和计算机介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284394A (zh) * 2018-09-12 2019-01-29 青岛大学 一种从多源数据集成视角构建企业知识图谱的方法
CN111339316A (zh) * 2020-02-27 2020-06-26 河海大学 一种知识图谱可视化编辑与持久化实现方法及系统架构
CN111427901A (zh) * 2020-03-23 2020-07-17 浪潮通用软件有限公司 交互式知识图谱数据编辑方法、计算机设备和存储介质
CN113111135A (zh) * 2021-04-22 2021-07-13 北京金山数字娱乐科技有限公司 一种知识图谱构建方法及装置
CN113157947A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 知识图谱的构建方法、工具、装置和服务器
CN113707339A (zh) * 2021-08-02 2021-11-26 西安交通大学 一种多源异质数据库间概念对齐与内容互译方法及系统
CN114417018A (zh) * 2022-03-28 2022-04-29 金现代信息产业股份有限公司 一种知识图谱的全流程可视化配置系统及方法
CN114564595A (zh) * 2022-03-02 2022-05-31 联想(北京)有限公司 知识图谱更新方法、装置及电子设备
CN115858810A (zh) * 2022-12-05 2023-03-28 中国联合网络通信集团有限公司 自动构建知识图谱的方法、系统、计算机设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284394A (zh) * 2018-09-12 2019-01-29 青岛大学 一种从多源数据集成视角构建企业知识图谱的方法
CN111339316A (zh) * 2020-02-27 2020-06-26 河海大学 一种知识图谱可视化编辑与持久化实现方法及系统架构
CN111427901A (zh) * 2020-03-23 2020-07-17 浪潮通用软件有限公司 交互式知识图谱数据编辑方法、计算机设备和存储介质
CN113111135A (zh) * 2021-04-22 2021-07-13 北京金山数字娱乐科技有限公司 一种知识图谱构建方法及装置
CN113157947A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 知识图谱的构建方法、工具、装置和服务器
CN113707339A (zh) * 2021-08-02 2021-11-26 西安交通大学 一种多源异质数据库间概念对齐与内容互译方法及系统
CN114564595A (zh) * 2022-03-02 2022-05-31 联想(北京)有限公司 知识图谱更新方法、装置及电子设备
CN114417018A (zh) * 2022-03-28 2022-04-29 金现代信息产业股份有限公司 一种知识图谱的全流程可视化配置系统及方法
CN115858810A (zh) * 2022-12-05 2023-03-28 中国联合网络通信集团有限公司 自动构建知识图谱的方法、系统、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407407A (zh) * 2023-12-15 2024-01-16 中信证券股份有限公司 多异构数据源数据集更新方法、装置、设备和计算机介质
CN117407407B (zh) * 2023-12-15 2024-04-12 中信证券股份有限公司 多异构数据源数据集更新方法、装置、设备和计算机介质

Similar Documents

Publication Publication Date Title
US10108914B2 (en) Method and system for morphing object types in enterprise content management systems
US8015151B2 (en) Method and system for managing and modifying time dependent data structures
US20210173696A1 (en) Design-time information based on run-time artifacts in a distributed computing cluster
CN106033436B (zh) 一种数据库的合并方法
US10963800B2 (en) Service layer augmentation of response to semantically-informed query of arbitrary external data sources
US8700560B2 (en) Populating a multi-relational enterprise social network with disparate source data
US10394805B2 (en) Database management for mobile devices
US10855673B2 (en) Automated production of certification controls by translating framework controls
US8677376B2 (en) Expressing equivalency relationships with identity graphs across multiple environments to create change list to be traversed to conform the environments
US11675769B2 (en) On-demand, dynamic and optimized indexing in natural language processing
CN107944036B (zh) 一种图谱变化差异的获取方法
US9652740B2 (en) Fan identity data integration and unification
CN116303516A (zh) 一种更新知识图谱的方法、装置及相关设备
CN114329096A (zh) 一种原生图数据库处理方法及系统
CN115329011A (zh) 数据模型的构建方法、数据查询的方法、装置及存储介质
US9411555B2 (en) Systems and methods for creating context sensitive graph topologies based on multidimensional context information
US11016830B2 (en) Entity-based service operation for object-based persistence
Kobayashi et al. Decoupling identity resolution from the maintenance of identity information
JP2023546818A (ja) データベースシステムのトランザクション処理方法、装置、電子機器、及びコンピュータプログラム
CN115203260A (zh) 一种异常数据确定方法、装置、电子设备及存储介质
KR101573663B1 (ko) 데이터 통합 방법 및 시스템
CN111930718B (zh) 配置管理数据库的节点调整方法及装置
CN115168487A (zh) 基于kettle的数据同步方法、组件、设备及介质
CN114328965A (zh) 知识图谱更新方法、装置及计算机设备
AU2012264599B2 (en) Method and system for dynamic profile structure handling and management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20230623