CN111782820B - 知识图谱创建方法及装置、可读存储介质及电子设备 - Google Patents

知识图谱创建方法及装置、可读存储介质及电子设备 Download PDF

Info

Publication number
CN111782820B
CN111782820B CN202010620166.9A CN202010620166A CN111782820B CN 111782820 B CN111782820 B CN 111782820B CN 202010620166 A CN202010620166 A CN 202010620166A CN 111782820 B CN111782820 B CN 111782820B
Authority
CN
China
Prior art keywords
vertex
target
data
graph
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010620166.9A
Other languages
English (en)
Other versions
CN111782820A (zh
Inventor
李小庆
郭朋富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Holding Co Ltd
Original Assignee
Jingdong Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Holding Co Ltd filed Critical Jingdong Technology Holding Co Ltd
Priority to CN202010620166.9A priority Critical patent/CN111782820B/zh
Publication of CN111782820A publication Critical patent/CN111782820A/zh
Application granted granted Critical
Publication of CN111782820B publication Critical patent/CN111782820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及计算机技术领域,提供了一种知识图谱创建方法及装置、计算机可读存储介质和电子设备。其中,上述方法包括:获取知识图谱查询请求中的目标顶点标识,并根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,所述关联数据为与目标顶点相关联的顶点和/或边的数据;以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱。本方案基于目标顶点标识,可以根据用户需求创建以目标顶点为中心的知识图谱,提高知识图谱的创建效率。

Description

知识图谱创建方法及装置、可读存储介质及电子设备
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种知识图谱创建方法、知识图谱创建装置、计算机可读存储介质及电子设备。
背景技术
知识图谱技术为人类提供了一种更好的组织、管理和理解互联网海量信息的能力,而知识图谱的创建,可以挖掘数据更深层次的价值,以帮助人类更好的利用互联网信息去创造更多的社会价值。
以知识图谱中的产业链图谱为例,通过创建某个行业的产业链图谱,可以把该行业的产品、企业、交易等数据综合起来,能够让企业从宏观局面上探索更前瞻的数据信息,以明确自己的企业策略、企业定位、发展战略,有利于企业甚至是整个行业的长远发展。
现有的产业链图谱创建技术中,大多都是利用关系数据库进行模型搭建,然后根据搭建的模型生成用户需要的产业链图谱。
然而,关系数据库存储的非结构化数据比较复杂,其读取性能较差,且关系数据库的模型一旦建立,可扩展性较差,当数据发生变化时,往往需要重新进行建模,进而会耗费较大的人力成本。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种知识图谱创建方法及装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服现有的知识图谱创建方法扩展性差的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供了一种知识图谱创建方法,包括:
获取知识图谱查询请求中的目标顶点标识,并根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱。
在本公开的一种示例性实施例中,基于前述方案,所述在数据库中查询所述目标顶点标识的关联数据,包括:
在图数据库中查询所述目标顶点标识的第一关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述知识图谱查询请求包括产业链图谱查询请求;
所述在图数据库中查询所述目标顶点标识的第一关联数据,包括:
确定所述产业链图谱查询请求对应的目标产业链;
在所述图数据库中获取所述目标产业链的基础图谱数据;
在所述目标产业链的基础图谱数据中查询所述目标顶点标识的第一关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述在数据库中查询所述目标顶点标识的关联数据,还包括:
在关系数据库中查询所述目标顶点标识的第二关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述知识图谱查询请求包括产业链图谱查询请求;
所述在关系数据库中查询所述目标顶点标识的第二关联数据,包括:
确定所述产业链图谱查询请求对应的目标产业链;
在所述关系数据库中获取所述目标产业链的自定义图谱数据;
在所述目标产业链的自定义图谱数据中查询所述目标顶点标识的第二关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述方法还包括:
接收在任一产业链的知识图谱中的新增顶点请求;
根据所述新增顶点请求中的编辑信息,在所述任一产业链的知识图谱中添加新增顶点以及所述新增顶点与原有顶点的边,并生成所述新增顶点的自定义图谱数据;
将所述新增顶点的自定义图谱数据存储至所述关系数据库,以添加到所述任一产业链的自定义图谱数据中。
在本公开的一种示例性实施例中,基于前述方案,所述在数据库中查询所述目标顶点标识的关联数据,还包括:
合并所述第一关联数据和所述第二关联数据,以确定所述目标顶点标识的关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述合并所述第一关联数据和所述第二关联数据,包括:
对比所述第一关联数据和所述第二关联数据中各顶点的标识,保留所述第二关联数据中与所述第一关联数据的至少一个顶点具有相同标识的顶点及其对应的边的数据,以合并所述第一关联数据和所述第二关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述目标知识图谱为第一目标图谱;
在创建所述第一目标图谱之后,所述方法还包括:
接收图谱展开请求,所述图谱展开请求是用户在所述第一目标图谱中选择第二根节点而生成的请求;
创建以所述第二根节点为中心的第二目标图谱。
在本公开的一种示例性实施例中,基于前述方案,所述方法应用于服务端,所述服务端包括前端服务器和后端服务器;
其中,所述后端服务器用于获取产业链图谱查询请求中的目标顶点标识,根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,并将所述关联数据发送至所述前端服务器,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
所述前端服务器用于接收所述关联数据,并根据所述关联数据创建目标产业链的目标图谱。
在本公开的一种示例性实施例中,基于前述方案,所述以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱,包括:
将查询到的所述关联数据转换为顶点列表和/或边列表,所述顶点列表包括所述关联数据中每个顶点的标识,所述边列表包括所述关联数据中每个边的标识、入边顶点和出边顶点;
以所述目标顶点为第一根节点,根据所述顶点列表和/或边列表,创建以所述第一根节点为中心的目标知识图谱。
根据本公开的第二方面,提供了一种知识图谱创建装置,包括:
关联数据获取模块,被配置为获取知识图谱查询请求中的目标顶点标识,并根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
目标知识图谱创建模块,被配置为以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱。
根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的知识图谱方法。
根据本公开实施例的第四方面,提供了一种电子设备,包括:处理器;以及,存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的知识图谱创建方法。
由上述技术方案可知,本公开示例性实施例中的知识图谱创建方法、知识图谱创建装置,以及实现所述知识图谱创建方法的计算机可读存储介质及电子设备,至少具备以下优点和积极效果:
在本公开的一些实施例所提供的技术方案中,首先,基于获取的知识图谱查询请求中的目标顶点标识,可以在数据库中查询该目标顶点标识的关联数据,其中,该关联数据为与目标顶点相关联的顶点和/或边的数据;然后,以该目标顶点为第一根节点,根据查询到的关联数据,可以创建以第一根节点为中心的目标知识图谱。与现有的知识图谱创建方法相比,一方面,本公开根据获取的目标顶点标识,可以创建以目标顶点为中心的知识图谱,从而能够根据用户的需求创建知识图谱;另一方面,本公开可以根据目标顶点的标识,在数据库中查询创建知识图谱所需要的数据,可见,当数据发生变化时,只需要更新数据库中的数据,便可以根据目标顶点的标识,从更新后的数据库中获取到与目标顶点关联的数据,从而创建更新后的目标知识图谱,因此,其具有更好的可扩展性,进而能够节省知识图谱创建的人工成本。
本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开一示例性实施例中知识图谱的创建方法的流程示意图;
图2示示出本公开一示例性实施例中在图数据库中查询第一关联数据的方法的子流程示意图;
图3示出本公开一示例性实施例中在关系数据库中查询第二关联数据的方法的子流程示意图;
图4示出本公开一示例性实施例中生成新增顶点的自定义图谱数据的方法的子流程示意图;
图5示出本公开一示例性实施例中初始的自定义的产业链图谱;
图6示出本公开一示例性实施例中创建的自定义的0度产业链图谱;
图7示出本公开一示例性实施例中为新增顶点增加关联顶点时的图形用户界面;
图8示出本公开一示例性实施例中另一个为新增顶点增加关联顶点的时的图形用户界面;
图9示出本公开一示例性实施例中为新增顶点增加的关联顶点的列表的图形用户界面;
图10示出本公开一示例性实施例中创建的自定义的1度产业链图谱;
图11示出本公开一示例性实施例中以“光伏配件”为中心的自定义的1度产业链图谱;
图12中(a)部分和(b)部分分别示出本公开一示例性实施例中变更根节点的人机交互界面和根节点变更后的产业链图谱;
图13示出本公开一示例性实施例中知识图谱创建装置的结构示意图;
图14示出本公开示例性实施例中计算机可读存储介质的结构示意图;以及,
图15示出本公开示例性实施例中电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”、“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
相关技术中,使用关系数据库进行模型搭建,来创建知识图谱。然而,这种创建方式的可扩展性较差,当数据发生变化时,需要重新进行建模,进而会耗费较大的人力成本。
鉴于上述一个或多个问题,本公开的实施例中首先提供一种知识图谱创建方法。
图1示出本公开一示例性实施例中知识图谱创建方法的流程示意图。参考图1,该方法包括:
步骤S110,获取知识图谱查询请求中的目标顶点标识,并根据目标顶点标识在数据库中查询目标顶点标识的关联数据,其中,关联数据为与目标顶点相关联的顶点和/或边的数据;
步骤S120,以目标顶点为第一根节点,根据查询到的关联数据,创建以第一根节点为中心的目标知识图谱。
在图1所示实施例所提供的技术方案中,首先,基于获取的知识图谱查询请求中的目标顶点标识,可以在数据库中查询该目标顶点标识的关联数据,其中,该关联数据为与目标顶点相关联的顶点和/或边的数据;然后,以该目标顶点为第一根节点,根据查询到的关联数据,可以创建以第一根节点为中心的目标知识图谱。与现有的知识图谱创建方法相比,一方面,本公开根据获取的目标顶点标识,可以创建以目标顶点为中心的知识图谱,从而能够根据用户的需求创建知识图谱;另一方面,本公开可以根据目标顶点的标识,在数据库中查询创建目标知识图谱所需要的数据,可见,当数据发生变化时,只需要更新数据库中的数据,便可以根据目标顶点的标识,从更新后的数据库中获取到与目标顶点关联的数据,从而创建更新后的目标知识图谱,因此,其具有更好的可扩展性,进而能够节省知识图谱创建的人工成本。
以下对图1所示实施例中各个步骤的具体实施方式进行详细阐述:
在步骤S110中,获取知识图谱查询请求中的目标顶点标识,并根据目标顶点标识在数据库中查询目标顶点标识的关联数据,其中,关联数据为与目标顶点相关联的顶点和/或边的数据。
在示例性的实施方式中,目标顶点标识可以包括目标顶点的名称或者ID(Identity Document,身份标识)等等。目标顶点标识的关联数据可以存储在数据库中,其中,数据库可以包括图数据库和/或关系数据库。具体的,图数据库中可以存储和目标顶点标识关联的基础图谱数据,关系数据库可以存储和目标顶点标识关联的用户自定义图谱数据。
示例性的,在数据库中查询目标顶点标识的关联数据可以包括在图数据库中查询目标顶点标识的第一关联数据,还可以包括在关系数据库中查询目标顶点标识的第二关联数据。其中,第一关联数据可以是上述的基础图谱数据中的数据,第二关联数据可以是上述的用户自定义图谱数据中的数据。
在图数据库中查询目标顶点标识的第一关联数据和在关系数据库中查询目标顶点表示的第二关联数据之后,还可以合并上述的第一关联数据和第二关联数据,以确定目标顶点标识的关联数据。
具体的,合并第一关联数据和第二关联数据可以包括,对比第一关联数据和第二关联数据中各顶点的标识,保留第二关联数据中与第一关联数据的至少一个顶点具有相同标识的顶点及其对应的边的数据,以合并第一关联数据和第二关联数据。
举例而言,合并第一关联数据和第二关联数据的具体实施方式可以是,当第一关联数据和第二关联数据中的某个顶点具有相同的顶点标识时,用第二关联数据中的顶点及其对应的边的数据替换具有相同顶点标识的第一关联数据中的顶点及其对应边的数据,以确定目标顶点标识的关联数据。
由于第二关联数据是用户自定义数据中的数据,因此,本示例性实施例提供的技术方案可以实现用户自定义图谱的创建。
在示例性的实施方式中,步骤S110中的知识图谱查询请求可以包括产业链图谱查询请求。其中,产业链图谱查询请求的目标顶点标识对应的顶点可以是产业链中的产品、企业、材料等。当产业链图谱查询请求中的目标顶点标识对应的顶点为企业时,上述的合并第一关联数据和第二关联数据的具体实施方式还可以是,对比第一关联数据和第二关联数据中各顶点的标识,当第一关联数据和第二关联数据中的某个顶点具有相同的顶点标识时,根据企业类型确定保留第一关联数据中的顶点及其对应的边的数据或保留第二关联数据中的顶点及其对应的数据。
其中,当企业类型是上市公司时,由于图数据库中存储的目标顶点标识的第一关联数据更全面,因此,可以保留第一关联数据中的顶点及其对应的边的数据;当企业类型是非上市公司时,由于图数据库中存储的第二关联数据和关系数据库中存储的第一关联数据的信息差别不大,且关系数据库中存储的第二关联数据中具有更多的用户自定义的数据,因此,可以保留第二关联数据中的顶点及其对应的边的数据。这样,可以根据公司类型灵活的创建产业链图谱,在提升创建的产业链图谱的全面性的同时,满足用户创建自定义产业链图谱的需求。
需要说明的是,在进行上述的第一关联数据和第二关联数据的合并时,也可以直接将第一关联数据和第二关联数据进行聚合,即获取第一关联数据和第二关联数据的并集,以确定目标顶点标识的关联数据,而不必考虑是否保留第一关联数据或第二关联数据。本示例性实施方式对此不做特殊限定。
示例性的,当步骤S110中的知识图谱查询请求是上述的产业链图谱查询请求时,上述的在图数据库中查询目标顶点标识的第一关联数据的方法可以如图2所示。参考图2,该方法可以包括步骤S210-步骤S230。
在步骤S210中,确定产业链图谱查询请求对应的目标产业链。
其中,在确定产业链图谱请求对应的目标产业链之前,可以在图数据库中存储至少一个产业链的基础图谱数据,产业链的基础图谱数据可以包括创建产业链所需要的已知的或公认的顶点和/或边的数据。每个顶点具有对应的顶点标识。目标产业链可以是包括目标顶点标识的产业链。
示例性的,步骤S210的具体实施方式可以是,根据产业链图谱查询请求中的目标顶点标识确定目标产业链。其中,目标顶点标识可以是顶点的名称或者ID。
在确定产业链图谱查询请求对应的目标产业链之后,在步骤S220中,在图数据库中获取目标产业链的基础图谱数据。
在图数据库中获取目标产业链的基础图谱数据之前,可以在图数据库中存储目标产业链的基础图谱数据。其中,目标产业链的基础图谱数据可以包括创建目标产业链的图谱所需要的已知的或者公认的顶点和/边的数据。具体的,顶点的数据可以包括目标产业的各个环节(上中下游)的材料、产品、指标、企业等,边的数据可以包括目标产业的各个环节的产品、材料、指标、企业等之间的关系,其中,关系可以包括供应关系、包含关系、参股关系、客户关系、子公司等。
在图数据库中存储目标产业链的基础图谱数据之前,图数据库可以利用算法,将目标产业链中公司的年报等类型的文件报告进行解析,以形成目标产业链的基础图谱数据,然后,将解析出来的目标产业链的基础图谱数据进行存储。
示例性的,上述的步骤S220的具体实施方式可以是,根据预设的图数据库的数据格式获取目标产业链的基础图谱数据。其中,预设的图数据库的数据格式可以包括预设的顶点的格式和预设的边的格式,具体的,预设的顶点的格式可以如表1所示,预设的边的格式可以如表2所示。在表1和表2中,标签列分别可以代表对应的每个顶点和边所具有的预设的格式,即每个顶点、边都具有id、label、type、properties,其中,顶点的properties又包括domain、original_name、name、entity_id,边的properties又包括inV、outV、inVLabel、outVLabel,其分别代表的含义如表1、表2中的含义列所示。当然,预设的顶点的格式和预设的边的格式也可以包括其它的标签,本示例性实施方式对此不做特殊限定。
表1图数据库中预设的顶点的格式
表2图数据库中预设的边的格式
继续参考图2,在图数据库中获取目标产业链的基础图谱数据之后,在步骤S230中,在目标产业链的基础图谱数据中查询目标顶点标识的第一关联数据。
其中,目标顶点标识的第一关联数据可以包括图数据库中与目标顶点关联的顶点和/或边的数据。其中,与目标顶点关联的顶点的数据可以是和目标顶点对应的材料或产品或指标或公司等具有供应关系的顶点,而该供应关系则可以是和目标顶点关联的边的数据。
示例性的,在目标产业链的基础图谱数据中查询目标顶点标识的第一关联数据的具体实施方式可以是,根据上述的预设的图数据库的数据格式在目标产业链的基础图谱数据中查询目标顶点标识的第一关联数据。
通过上述的步骤S210-步骤230,可以在图数据库中存储并查询目标产业链的基础图谱数据,当遇到数据更新时,只需要维护图数据库中的基础图谱数据以生成更新后的知识图谱,不需要重新建模,从而可以解决关系数据库对复杂结构信息的扩展性问题,节省知识图谱创建的人工成本。与此同时,还可以将知识图谱技术和结构化数据进行结合,来呈现产业链信息。
进一步的,为了实现自定义图谱的创建,还可以在关系数据库中查询目标顶点标识的第二关联数据。当步骤S110中的知识图谱查询请求是产业链图谱查询请求时,在关系数据库中查询目标顶点标识的第二关联数据的方法可以如图3所示。参考图3,该方法可以包括步骤S310-步骤S330。
在步骤S310中,确定产业链图谱查询请求对应的目标产业链。
其中,在确定产业链图谱请求对应的目标产业链之前,可以在关系数据库中存储至少一个产业链的自定义图谱数据,产业链的自定义图谱数据可以包括预设的自定义图谱中的顶点和/或边的数据。每个顶点具有对应的顶点标识。目标产业链可以是包括目标顶点标识的产业链。
示例性的,步骤S310的具体实施方式可以是,根据产业链图谱查询请求中的目标顶点标识确定目标产业链。其中,目标顶点标识可以是目标顶点的名称或者ID。
确定产业链图谱查询请求对应的目标产业链之后,在步骤S320中,在关系数据库中获取目标产业链的自定义图谱数据。
其中,在关系数据库中获取目标产业链的自定义图谱数据之前,可以生成目标产业链的自定义图谱数据并将其存储至关系数据库。自定义图谱数据可以包括用户在初始的自定义的产业链图谱中根据自己的需求新增顶点和/或边之后而生成的数据。
具体的,在关系数据库中可以存储初始的自定义的产业链图谱数据,用户可以在初始自定义的产业链图谱数据中新增顶点和/或边,以生成自定义图谱数据。示例性的,生成自定义图谱数据的方法可以如图4所示。参考图4,该方法可以包括步骤S410-步骤S420。
在步骤S410中,接收在任一产业链的知识图谱中的新增顶点的请求。
在示例性的实施方式中,接收在任一产业链的知识图谱中的新增顶点的请求之前,可以获取上述的初始的自定义的产业链图谱。新增顶点的请求可以包括用户在该初始的自定义的产业链图谱中新增顶点而生成的请求。其中,初始的自定义的产业链图谱的数据可以包括初始的自定义的顶点和/或边的数据,具体的,初始的自定义的顶点数据可以包括从上述的图数据库的基础图谱数据中获取的该产业的各环节的基本产品、基本材料、基本指标、基本企业等,或者从上述的图数据库的基础图谱数据中获取的该产业的各环节的预设产品、预设材料、预设指标、预设企业等,初始的自定义的边的数据可以包括上述的初始的自定义的顶点数据之间的供应关系等。
例如,基础图谱数据中的顶点数据有100个,可以获取该产业链中必须存在的产品、材料、指标、企业等对应的作为基本产品、基本材料、基本指标、基本企业等,以作为初始的自定义的产业链图谱数据,也可以获取其中的20个顶点数据及其对应的边的数据作为初始的自定义的产业链图谱数据,并将其存储至关系数据库中。这样,可以利用关系数据库实现用户对初始的自定义的产业链图谱数据的修改,以创建用户自定义的产业链的知识图谱。
接收在任一产业链的知识图谱中的新增顶点的请求之后,在步骤S420中,根据所述新增顶点请求中的编辑信息,在任一产业链的知识图谱中添加新增顶点以及新增顶点与原有顶点的边,并生成新增顶点的自定义图谱数据。
在示例性的实施方式中,新增顶点请求中的编辑信息可以包括新增顶点的标识、与新增顶点连接的初始的自定义的产业链图谱中的原有顶点、及新增顶点与该原有顶点的边。其中,新增顶点与原有顶点的边可以包括边的入边顶点属性、出边顶点属性。新增顶点的标识可以是一个,也可以是多个。
以光伏产业链的图谱为例,初始的自定义的产业链图谱可以如图5所示,新增顶点请求中的编辑信息可以包括新增顶点的名称,如图6中的“我的顶点”,还可以包括与新增顶点连接的图5中的原有顶点“光伏配件”,以及“我的顶点”和“光伏配件”之间的边,如图6中的601所示。那么,添加了新增顶点之后的自定义图谱可以如图6所示。新增顶点的自定义图谱数据即为该自定义图谱对应的顶点以及边的数据,其可以看作是新增节点的0度图谱数据,可以将其存储至关系数据库中,以创建用户自定义的产业链的图谱,如图6所示。
示例性的,当新增顶点添加到初始的自定义的产业链图谱,并生成新增节点的自定义0度图谱数据之后,还可以接收对该新增节点增加关联顶点及其对应的边的请求,以生成新增顶点的1度自定义图谱数据。
具体的,可以获取用户在图形用户界面输入的增加的新增顶点的关联顶点的标识,根据模糊匹配的方法,在图数据库中查询图数据库中是否存在该关联顶点,并将查询结果返回给图形用户界面。
例如,在为上述的新增节点“我的顶点”增加关联顶点“单晶硅”时,由于图数据库中存在该关联顶点,返回的查询结果对应的图形用户界面可以如图7所示。在为上述的新增节点“我的顶点”增加关联顶点“变形金刚”时,由于图数据库中不存在该关联顶点,返回的查询结果对应的图形用户界面如图8所示。
在图7中,用户可以在图7所示的图形用户界面中选择至少一个返回结果,如图7中的控件“单晶硅棒、单晶硅、单晶硅生长炉、单晶硅硅片、单晶硅电池片、单晶硅片/多晶硅片、单晶硅太阳电池片”等等中的至少一个,选择完成之后,选择图7中的控件“确定”,以确定最终选择。以用户最终确定选择控件“单晶硅”为例,响应于用户对控件“单晶硅”的确定操作,可以将顶点“单晶硅”添加至“我的顶点”的已匹配列表中,如图9所示。
在图8中,由于顶点“变形金刚”不再图数据库中,所以返回‘“变形金刚”不在图数据库中确认添加?’的提示,同样的,响应于用户对控件“确定”的触发操作,可以将顶点“变形金刚”添加至“我的顶点”的已匹配列表中,如图9所示。
继续参考图9,分别将“单晶硅”和“变形金刚”添加至“我的顶点”的已匹配列表中之后,响应于对控件“保存”的触发操作,可以将为“我的顶点”增加顶点“单晶硅”和顶点“变形金刚”的数据存储至关系数据库。
将增加的自定义的关联顶点存储至关系数据库之后,当用户在上述的图6所示的自定义的0度产业链图谱中点击“我的顶点”时,可以创建以“我的顶点”为中心的自定义的1度产业链图谱,如图10所示。
其中,响应于对图10中的控件“包含”和控件“供应”的触发操作,可以在图10中的各边中显示对应的边的关系名称,例如,点击控件“包括”,可以显示属于包括关系的边的名称。
与此同时,用户在上述的图6所示的自定义的0度产业链图谱中点击“光伏配件”时,也可以创建“光伏配件”为中心的自定义的1度产业链图谱,如图11所示。在图11中创建的以“光伏配件”为中心的1度产业链图谱,除了和图5中的已有的顶点“光伏电站”和“光伏应用产品”之间的连接关系外,已经新增了其和用户自定义的顶点“我的顶点”及二者之间的连接关系。
需要说明的是,用户在确定给新增顶点增加关联顶点的同时,会确定新增顶点和为其增加的关联顶点之间的连接关系,即确定关联顶点对应的边的入边顶点属性或出边顶点属性,其也会保存在关系数据库中。
此外,还可以接收对任一产业链删除和/或重命名顶点的请求,以生成自定义图谱数据。具体的,用户可以在上述的自定义的产业链图谱中删除某个顶点和/或重命名某个顶点的名称,以生成满足自己需求的产业链图谱数据。其中,自定义的产业链图谱可以是初始的自定义的产业链图谱,也可以是对初始的自定义产业链图谱进行修改后得到的自定义产业链图谱。与此同时,当接收到删除某个顶点的请求时,该顶点对应的边也会自动的删除。
进一步的,还可以接收对任一产业链新增/删除边的请求,以生成用户自定义图谱数据。具体的,用户可以在上述的自定义的产业链图谱中新增/删除边,以生成满足自己需求的产业链图谱数据。其中,自定义的产业链图谱可以是初始的自定义的产业链图谱,也可以是对初始的自定义产业链图谱进行修改后得到的自定义产业链图谱。
通过上述的步骤S410-步骤S420,用户可以根据输入的目标顶点标识,例如顶点ID和/或顶点名称,创建自定义的目标产业链的图谱数据,并将其存储至关系数据库中,当接收到产业链图谱查询请求时,可以根据目标顶点标识从关系数据库中查询该目标产业链的自定义的图谱数据,为用户提供了一种便利的创建知识图谱的方法。
继续参考图3,从关系数据库中获取目标产业链的自定义的图谱数据之后,在步骤S330中,在目标产业链的自定义图谱数据中查询目标顶点标识的第二关联数据。
其中,第二关系数据可以包括上述的关系数据库中与目标顶点关联的顶点和/边的数据。
示例性的,步骤S330的具体实施方式可以是,根据上述的产业链图谱查询请求中的目标顶点标识,以预设的关系数据库的数据格式在自定义图谱数据中查询与目标顶点关联的顶点的数据及与该关联的顶点连接的边的数据。
其中,预设的关系数据库的数据格式可以包括预设的顶点的格式和预设的边的格式,具体的,预设的顶点的格式可以如表3所示,预设的边的格式可以如表4所示。
在表3和表4中,字段名称列分别可以代表对应的每个顶点和边所具有的预设的格式。字段类型列为字段名称对应的类型,例如bigint表示主键id的类型为整数类型,括号中的11表示id的最大位数为11位,varchar表示产业链编码chain_code的数据类型为可变字符串,括号中的100表示可变字符串的最大长度为100位;字段说明列为字段名称对应的含义,例如,id表示主键,vertex_code表示顶点ID。当然,关系数据库中预设的顶点的格式和预设的边的格式也可以包括其它的字段,本示例性实施方式对此不做特殊限定。
表3关系数据库中预设的顶点的格式
表4关系数据库中预设的边的格式
通过上述的步骤S310-步骤S320,可以在关系数据库中获取与目标顶点标识关联的用户自定义的图谱数据,以创建满足用户需求的自定义的产业链图谱。
进一步的,将在上述的图数据库中获取的目标顶点标识的第一关联数据和在上述的关系数据库中获取的目标顶点标识的第二关联数据进行合并,可以确定目标顶点的关联数据。其中,合并的具体实施方式已在前面进行说明,此处不再进行赘述。这样,可以在实现用户自定义图谱的同时,保证创建的自定义图谱的全面性和丰富性。
继续参考图1,在确定目标顶点的关联数据之后,在步骤S120中,以目标顶点为第一根节点,根据查询到的关联数据,创建以第一根节点为中心的目标知识图谱。
示例性的,步骤S120的具体实施方式可以是,首先,将上述的步骤S110中查询到的关联数据转换为顶点列表和/或边列表,其中,顶点列表包括关联数据中每个顶点的标识,边列表包括关联数据中每个边的标识、入边顶点和出边顶点,然后,以目标顶点为第一根节点,根据顶点列表和/或边列表,绘制以第一根节点为中心的第一目标图谱。
例如,以目标顶点标识为上述的自定义的“我的顶点”为例,创建的以“我的顶点”为中心的自定义的目标知识图谱可以如上述的图10所示。
创建以第一根节点为中心的第一目标图谱之后,还可以创建第二目标图谱。具体的,可以包括接收图谱展开请求,其中,图谱展开请求是用户在第一目标图谱中选择第二根节点而生成的请求,创建以第二根节点为中心的第二目标图谱。
举例而言,在上述的图10中,当用户点击变形金刚时,响应于对控件“设为根节点”的触发操作,如图12(a)所示,可以将变形金刚作为第二根节点,创建以单晶硅为中心的第二目标图谱,如图12(b)所示。在图12(b)中,顶点“变形金刚”是用户在为顶点“我的顶点”创建1度图谱时自定义的顶点,在用户没有为顶点“变形金刚”进一步创建自定义的1度图谱的情况下,顶点“变形金刚”的自定义1度图谱没有任何的连接关系,因此其对应的自定义1度图谱,只有一个单独的顶点“变形金刚”。
进一步的,本示例性实施例提供的创建知识图谱的方法可以可用于服务端,其中,服务端可以包括前端服务器和后端服务器。具体的,后端服务器可以用于获取上述的产业链图谱查询请中的目标顶点标识,根据目标顶点标识在数据库中查询目标顶点标识的关联数据,并将关联数据发送至前端服务器,具体的,关联数据包括上述的顶点列表和/或边列表。而前端服务器用于接收该关联数据,并根据该关联数据创建产业链的目标图谱。
示例性的,上述的后端服务器可以包括代理服务模块、本地服务模块以及服务聚合模块。其中,代理服务模块用于接收和处理在上述的图数据库中进行第一关联数据查询的请求;本地服务模块用于接收和处理在上述的关系数据库中进行第二关联数据查询的请求,以及实现用户自定义图谱数据的请求;服务聚合模块用于解析代理服务返回的第一关联数据和本地服务返回的第二关联数据,并将二者进行合并。
其中,解析代理服务返回的第一关联数据可以包括解析顶点的属性和解析边的属性,具体的,解析的顶点的属性可以包括顶点编号、归属域、名称、类型,解析的边的属性可以包括关系编号/关系名/域/类型/出边顶点编号/出边顶点类型/入边顶点编号/入边顶点类型。解析本地服务返回的第一关联数据也可以包括解析顶点的属性和解析边的属性,具体的,解析的顶点的属性可以包括顶点编号/归属域/名称/类型/自定义类型,解析的边的属性可以包括关系编号/关系名/域/边类型/出边顶点编号/出边顶点类型/入边顶点编号/入边顶点类型/自定义类型等。
第一关联数据和第二关联数据分别解析完成之后,还可以按照各自预设的规则,剔除不必要的信息,其中,预设的规则可以是需要保留的顶点类型和/或边类型等。将解析并剔除不必要信息后的第一关联数据转换成第一顶点列表和/或第一边列表,将解析并剔除不必要信息后的第二关联数据转换成第二顶点列表和/或第二边列表,合并第一顶点列表和第二顶点列表以及和/或合并第一边列表和第二边列表,以确定目标顶点列表和/或目标边列表,并将目标顶点列表和/或目标边列表发送给前端服务器。
前端服务器在接收到目标顶点列表和/或边列表之后,根据目标顶点列表和/或边列表中的数据绘制目标知识图谱,并将绘制的目标知识图谱提供给客户端进行展示。
接下来,以目标顶点标识为“单晶硅”为例,更加直观的说明上述的代理服务模块、本地服务模块、服务聚合模块的业务流程。
示例性的,响应于用户在图形用户界面输入“单晶硅”的操作,代理服务模块接收“单晶硅”图谱查询请求,并判断该请求是否是合法请求,具体的,可以根据传递的参数数量是否和目标参数数量一致判断该请求是否合法,如果不一致,则代理服务模块拦截该异常信息并返回给图形用户界面错误提示,如果一致,则根据上述的表1和表2中的预设格式向图数据库发送查询请求。然后,代理服务模块获取在图数据库中的查询请求结果,并检验该结果是否有效,具体的,可以是当返回的值不为空时,则有效,进一步的,当查询结果有效时,代理服务模块将获取的查询请求结果发送给服务聚合模块。
响应于用户在图形用户界面输入“单晶硅”的操作,本地服务模块也同时接收“单晶硅”图谱查询请求,并判断该请求是否是合法请求,具体的,可以根据传递的参数数量是否和目标参数数量一致判断该请求是否合法,如果不一致,则本地服务模块拦截该异常信息并返回给图形用户界面错误提示,如果一致,则根据上述的表3和表4中的预设格式向关系数据库发送查询请求。然后,本地服务模块获取在关系数据库中的查询请求结果,并检验该结果是否有效,具体的,可以是当返回的值不为空时,则有效,进一步的,当查询结果有效时,本地服务模块将获取的查询请求结果发送给服务聚合模块。
服务聚合模块分别解析代理服务模块发送的数据和本地服务模块发送的数据,分别将解析后的数据转换成顶点列表和/或边列表,合并转换后的顶点列表和/或边列表,并将其发送给前端服务器,以使得前端服务器绘制目标知识图谱。
通过上述的步骤S110-步骤S120,本示例性实施例提供的知识图谱创建方法可以利用图数据库创建知识图谱,从而解决了单纯的利用关系数据库进行知识图谱创建时扩展性差的问题。
除此之外,本示例性实施方式提供的知识图谱创建方法,采用顶点标识匹配的方法,为用户提供了一种简单灵活的创建知识图谱的方法。用户只需要输入目标顶点标识,便可以在数据库中获取目标顶点标识的关联数据,从而根据关联数据创建目标知识图谱。在数据变更时,也只需要更新图数据库中的数据即可,然后根据目标顶点标识查询更新后的数据库中的数据,就可以创建数据更新后的知识图谱,不需要像关系数据库一样重新建模,因此,降低了知识图谱创建的人工成本,提高了知识图谱创建的效率。
与此同时,由于大多数的图数据库中的数据不支持用户进行自定义的修改,但为了实现用户自定义图谱的创建,本示例性实施方式提供的知识图谱创建方法可以利用关系数据库作为图数据库的入口,将用户自定义的数据存储在关系数据库中,当接收到图谱查询请求时,将关系数据库的数据和图数据库的数据进行合并展示,在保证知识图谱创建的全面性、提升知识图谱创建的扩展性的同时,实现创建用户自定义的知识图谱。
本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本发明示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
进一步的,图13示出本公开示例性实施例中知识图谱创建装置1300的结构示意图。参考图13所示,该知识图谱创建装置1300包括关联数据获取模块1310、目标知识图谱创建模块1320。其中:
上述关联数据获取模块1310,被配置为获取知识图谱查询请求中的目标顶点标识,并根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
上述目标知识图谱创建模块1320,被配置为以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱。
在本公开的一种示例性实施例中,基于前述实施例,上述的关联数据获取模块1310包括第一关联数据获取单元、第二关联数据获取单元、以及数据合并单元。其中:
上述的第一关联数据获取单元被配置为,在图数据库中查询上述目标顶点标识的第一关联数据;上述的第二关联数据获取单元被配置为,在关系数据库中查询在图数据库中查询上述目标顶点标识的第一关联数据;上述数据合并单元被配置为,合并上述的第一关联数据和第二关联数据,以确定目标标识的关联数据。
在本公开的一种示例性实施例中,基于前述实施例,上述的知识图谱查询请求包括产业链图谱查询请求,上述的第一关联数据获取单元还被具体配置为:
确定上述的产业链图谱查询请求对应的目标产业链;
在所述图数据库中获取上述的目标产业链的基础图谱数据;
在上述的目标产业链的基础图谱数据中查询上述的目标顶点标识的第一关联数据。
在本公开的一种示例性实施例中,基于前述实施例,上述的关联数据获取模块1310中的知识图谱查询请求包括产业链图谱查询请求,上述的第二关联数据获取单元还被具体配置为:
确定上述的产业链图谱查询请求对应的目标产业链;
在上述的关系数据库中获取上述的目标产业链的自定义图谱数据;
在上述的目标产业链的自定义图谱数据中查询上述的目标顶点标识的第二关联数据。
在本公开的一种示例性实施例中,基于前述实施例,上述的第二关联数据获取单元,还被具体配置为:
接收在任一产业链的知识图谱中的新增顶点请求;
根据上述的新增顶点请求中的编辑信息,在该任一产业链的知识图谱中添加新增顶点以及上述新增顶点与原有顶点的边,并生成上述的新增顶点的自定义图谱数据;
将上述的新增顶点的自定义图谱数据存储至上述的关系数据库,以添加到上述的任一产业链的自定义图谱数据中。
在本公开的一种示例性实施例中,基于前述实施例,上述的数据合并单元还被具体配置为:
对比上述的第一关联数据和第二关联数据中各顶点的标识,保留第二关联数据中与第一关联数据的至少一个顶点具有相同标识的顶点及其对应的边的数据,以合并上述的第一关联数据和所述第二关联数据。
在本公开的一种示例性实施例中,基于前述实施例,上述的目标知识图谱创建模块1320,还被具体配置为:
将上述的关联数据获取模块1310中查询到的关联数据转换为顶点列表和/或边列表,其中,顶点列表包括关联数据中每个顶点的标识,边列表包括关联数据中每个边的标识、入边顶点和出边顶点;
以目标顶点为第一根节点,根据顶点列表和/或边列表,创建以第一根节点为中心的目标知识图谱。
在本公开的一种示例性实施例中,上述的目标知识图谱创建模块1320中的目标知识图谱为第一目标图谱,基于前述实施例,上述的目标知识图谱创建模块1320,还被具体配置为:
接收图谱展开请求,其中,图谱展开请求是用户在上述的第一目标图谱中选择第二根节点而生成的请求;
创建以上述的第二根节点为中心的第二目标图谱。
在本公开的一种示例性实施例中,本公开提供的知识图谱查询装置可以部署在服务端,其中,服务端包括前端服务器和后端服务器器,基于前述实施例,上述的后端服务器用于执行上述的关联数据获取模块1310,并将获取的关联数据发送至前端服务器,上述的前端服务器用于接收后端服务器发送的关联数据,并执行上述的目标知识图谱创建模块1320。
上述的知识图谱创建装置中各单元的具体细节已经在对应的知识图谱创建方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图14所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品1400,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图15来描述根据本公开的这种实施方式的电子设备1500。图15显示的电子设备1500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图15所示,电子设备1500以通用计算设备的形式表现。电子设备1500的组件可以包括但不限于:上述至少一个处理单元1510、上述至少一个存储单元1520、连接不同系统组件(包括存储单元1520和处理单元1510)的总线1530以及显示单元1540。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1510执行,使得所述处理单元1510执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元1510可以执行如图1中所示的:步骤S110,获取知识图谱查询请求中的目标顶点标识,并根据目标顶点标识在数据库中查询目标顶点标识的关联数据;以及步骤S120,以目标顶点为第一根节点,根据查询到的关联数据,创建以第一根节点为中心的目标知识图谱。
又如,所述处理单元1510还可以执行如图2和/或图3和/或图4中所示的各个步骤。
存储单元1520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)15201和/或高速缓存存储单元15202,还可以进一步包括只读存储单元(ROM)15203。
存储单元1520还可以包括具有一组(至少一个)程序模块15205的程序/实用工具15204,这样的程序模块15205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1500也可以与一个或多个外部设备1600(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1500交互的设备通信,和/或与使得该电子设备1500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1550进行。并且,电子设备1500还可以通过网络适配器1560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1560通过总线1530与电子设备1500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (10)

1.一种知识图谱创建方法,其特征在于,包括:
获取知识图谱查询请求中的目标顶点标识,并根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱;
其中,所述数据库包括图数据库和关系数据库,所述在数据库中查询所述目标顶点标识的关联数据包括:在所述图数据库中查询所述目标顶点标识的第一关联数据,在所述关系数据库中查询所述目标顶点标识的第二关联数据;对比所述第一关联数据和所述第二关联数据中各顶点的标识,保留所述第二关联数据中与所述第一关联数据的至少一个顶点具有相同标识的顶点及其对应的边的数据,以合并所述第一关联数据和所述第二关联数据。
2.根据权利要求1所述的知识图谱创建方法,其特征在于,所述知识图谱查询请求包括产业链图谱查询请求;
所述在图数据库中查询所述目标顶点标识的第一关联数据,包括:
确定所述产业链图谱查询请求对应的目标产业链;
在所述图数据库中获取所述目标产业链的基础图谱数据;
在所述目标产业链的基础图谱数据中查询所述目标顶点标识的第一关联数据。
3.根据权利要求1所述的知识图谱创建方法,其特征在于,所述知识图谱查询请求包括产业链图谱查询请求;
所述在关系数据库中查询所述目标顶点标识的第二关联数据,包括:
确定所述产业链图谱查询请求对应的目标产业链;
在所述关系数据库中获取所述目标产业链的自定义图谱数据;
在所述目标产业链的自定义图谱数据中查询所述目标顶点标识的第二关联数据。
4.根据权利要求3所述的知识图谱创建方法,其特征在于,所述方法还包括:
接收在任一产业链的知识图谱中的新增顶点请求;
根据所述新增顶点请求中的编辑信息,在所述任一产业链的知识图谱中添加新增顶点以及所述新增顶点与原有顶点的边,并生成所述新增顶点的自定义图谱数据;
将所述新增顶点的自定义图谱数据存储至所述关系数据库,以添加到所述任一产业链的自定义图谱数据中。
5.根据权利要求1至4任一项所述的知识图谱创建方法,其特征在于,所述目标知识图谱为第一目标图谱;
在创建所述第一目标图谱之后,所述方法还包括:
接收图谱展开请求,所述图谱展开请求是用户在所述第一目标图谱中选择第二根节点而生成的请求;
创建以所述第二根节点为中心的第二目标图谱。
6.根据权利要求1至4任一项所述的知识图谱创建方法,其特征在于,所述方法应用于服务端,所述服务端包括前端服务器和后端服务器;
其中,所述后端服务器用于获取产业链图谱查询请求中的目标顶点标识,根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,并将所述关联数据发送至所述前端服务器,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
所述前端服务器用于接收所述关联数据,并根据所述关联数据创建目标产业链的目标图谱。
7.根据权利要求1至4任一项所述的知识图谱创建方法,其特征在于,所述以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱,包括:
将查询到的所述关联数据转换为顶点列表和/或边列表,所述顶点列表包括所述关联数据中每个顶点的标识,所述边列表包括所述关联数据中每个边的标识、入边顶点和出边顶点;
以所述目标顶点为第一根节点,根据所述顶点列表和/或边列表,创建以所述第一根节点为中心的目标知识图谱。
8.一种知识图谱创建装置,其特征在于,包括:
关联数据获取模块,被配置为获取知识图谱查询请求中的目标顶点标识,并根据所述目标顶点标识在数据库中查询所述目标顶点标识的关联数据,所述关联数据为与目标顶点相关联的顶点和/或边的数据;
目标知识图谱创建模块,被配置为以所述目标顶点为第一根节点,根据查询到的所述关联数据,创建以所述第一根节点为中心的目标知识图谱;
其中,所述数据库包括图数据库和关系数据库,所述在数据库中查询所述目标顶点标识的关联数据包括:在所述图数据库中查询所述目标顶点标识的第一关联数据,在所述关系数据库中查询所述目标顶点标识的第二关联数据;对比所述第一关联数据和所述第二关联数据中各顶点的标识,保留所述第二关联数据中与所述第一关联数据的至少一个顶点具有相同标识的顶点及其对应的边的数据,以合并所述第一关联数据和所述第二关联数据。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的知识图谱创建方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的知识图谱创建方法。
CN202010620166.9A 2020-06-30 2020-06-30 知识图谱创建方法及装置、可读存储介质及电子设备 Active CN111782820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010620166.9A CN111782820B (zh) 2020-06-30 2020-06-30 知识图谱创建方法及装置、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010620166.9A CN111782820B (zh) 2020-06-30 2020-06-30 知识图谱创建方法及装置、可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111782820A CN111782820A (zh) 2020-10-16
CN111782820B true CN111782820B (zh) 2024-05-17

Family

ID=72760063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010620166.9A Active CN111782820B (zh) 2020-06-30 2020-06-30 知识图谱创建方法及装置、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111782820B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220907B (zh) * 2021-06-10 2024-04-05 京东科技控股股份有限公司 业务知识图谱的构建方法及装置、介质、电子设备
CN113591088B (zh) * 2021-07-30 2023-08-29 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109213820A (zh) * 2018-08-30 2019-01-15 成都索贝数码科技股份有限公司 一种实现多种类型的数据库融合使用的方法
CN109271525A (zh) * 2018-08-08 2019-01-25 北京百度网讯科技有限公司 用于生成知识图谱的方法、装置、设备以及计算机可读存储介质
CN109299090A (zh) * 2018-09-03 2019-02-01 平安科技(深圳)有限公司 基金知识推理方法、系统、计算机设备和存储介质
CN109800335A (zh) * 2019-01-23 2019-05-24 平安科技(深圳)有限公司 企业图谱的生成方法、装置、计算机设备和存储介质
CN110489561A (zh) * 2019-07-12 2019-11-22 平安科技(深圳)有限公司 知识图谱构建方法、装置、计算机设备和存储介质
CN110750654A (zh) * 2019-10-28 2020-02-04 中国建设银行股份有限公司 知识图谱获取方法、装置、设备和介质
CN110909986A (zh) * 2019-11-04 2020-03-24 苏宁金融科技(南京)有限公司 基于知识图谱的疑似实际控制人的风险识别方法及系统
CN110929042A (zh) * 2019-11-26 2020-03-27 昆明能讯科技有限责任公司 一种基于电力企业的知识图谱构建和查询方法
CN110928984A (zh) * 2019-09-30 2020-03-27 珠海格力电器股份有限公司 一种知识图谱的构建方法、装置、终端及存储介质
CN111061750A (zh) * 2019-12-17 2020-04-24 Oppo广东移动通信有限公司 一种查询处理方法、装置及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017189026A1 (en) * 2016-04-25 2017-11-02 GraphSQL, Inc. System and method for querying a graph model
US11550455B2 (en) * 2016-06-07 2023-01-10 Palo Alto Research Center Incorporated Localized visual graph filters for complex graph queries

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271525A (zh) * 2018-08-08 2019-01-25 北京百度网讯科技有限公司 用于生成知识图谱的方法、装置、设备以及计算机可读存储介质
CN109213820A (zh) * 2018-08-30 2019-01-15 成都索贝数码科技股份有限公司 一种实现多种类型的数据库融合使用的方法
CN109299090A (zh) * 2018-09-03 2019-02-01 平安科技(深圳)有限公司 基金知识推理方法、系统、计算机设备和存储介质
CN109800335A (zh) * 2019-01-23 2019-05-24 平安科技(深圳)有限公司 企业图谱的生成方法、装置、计算机设备和存储介质
CN110489561A (zh) * 2019-07-12 2019-11-22 平安科技(深圳)有限公司 知识图谱构建方法、装置、计算机设备和存储介质
CN110928984A (zh) * 2019-09-30 2020-03-27 珠海格力电器股份有限公司 一种知识图谱的构建方法、装置、终端及存储介质
CN110750654A (zh) * 2019-10-28 2020-02-04 中国建设银行股份有限公司 知识图谱获取方法、装置、设备和介质
CN110909986A (zh) * 2019-11-04 2020-03-24 苏宁金融科技(南京)有限公司 基于知识图谱的疑似实际控制人的风险识别方法及系统
CN110929042A (zh) * 2019-11-26 2020-03-27 昆明能讯科技有限责任公司 一种基于电力企业的知识图谱构建和查询方法
CN111061750A (zh) * 2019-12-17 2020-04-24 Oppo广东移动通信有限公司 一种查询处理方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN111782820A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN111344693B (zh) 动态和分布式计算系统中的聚合
US9146955B2 (en) In-memory, columnar database multidimensional analytical view integration
US9098314B2 (en) Systems and methods for web based application modeling and generation
CN102426582B (zh) 数据操作管理装置和数据操作管理方法
CN109614402B (zh) 多维数据查询方法和装置
US8849854B2 (en) Method and system for providing detailed information in an interactive manner in a short message service (SMS) environment
US9110984B1 (en) Methods and systems for constructing a taxonomy based on hierarchical clustering
CN105988996B (zh) 一种索引文件生成方法及装置
US9201700B2 (en) Provisioning computer resources on a network
CN110472207A (zh) 表单生成方法和装置
CN110689268B (zh) 一种提取指标的方法和装置
CN106933837A (zh) 一种数据库表模型及创建方法
US8959475B2 (en) Generating a semantic graph that allows a user to intelligently and efficiently connect with people and assets involved in projects
CN111782820B (zh) 知识图谱创建方法及装置、可读存储介质及电子设备
JP2009530738A (ja) サービスシーケンス内の変換のための宣言
CN110674117A (zh) 数据建模方法、装置、计算机可读介质及电子设备
CN111382279A (zh) 审单方法和装置
CN109344374B (zh) 基于大数据的报表生成方法及装置、电子设备、存储介质
CN111813804A (zh) 一种数据查询方法、装置、电子设备及存储介质
CN113626223A (zh) 一种接口调用方法和装置
CN117454278A (zh) 一种标准企业数字化规则引擎的实现方法和系统
CN111666344A (zh) 异构数据同步方法及装置
CN110308907A (zh) 数据转换方法、装置、存储介质及电子设备
CN114064925A (zh) 知识图谱的构建方法、数据查询方法、装置、设备和介质
CN102999329A (zh) 基于可扩展标记语言映射配置的活动目录接口开发方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: Jingdong Digital Technology Holding Co.,Ltd.

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Digital Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant