CN111309868A - 一种知识图谱构建、检索方法及装置 - Google Patents

一种知识图谱构建、检索方法及装置 Download PDF

Info

Publication number
CN111309868A
CN111309868A CN202010104775.9A CN202010104775A CN111309868A CN 111309868 A CN111309868 A CN 111309868A CN 202010104775 A CN202010104775 A CN 202010104775A CN 111309868 A CN111309868 A CN 111309868A
Authority
CN
China
Prior art keywords
concept
knowledge graph
entities
data table
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010104775.9A
Other languages
English (en)
Other versions
CN111309868B (zh
Inventor
柴博
张强
宋博川
贾全烨
邵炜平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
Global Energy Interconnection Research Institute
Original Assignee
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
Global Energy Interconnection Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Zhejiang Electric Power Co Ltd, Global Energy Interconnection Research Institute filed Critical State Grid Corp of China SGCC
Priority to CN202010104775.9A priority Critical patent/CN111309868B/zh
Publication of CN111309868A publication Critical patent/CN111309868A/zh
Application granted granted Critical
Publication of CN111309868B publication Critical patent/CN111309868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种知识图谱构建、检索方法及装置,应用于电力终端设备的关系数据表,其中,知识图谱构建方法包括:获取至少一个电力终端设备的关系数据表;根据所述关系数据表构建知识图谱概念层及知识图谱实例层;将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。本发明通过将表格数据转换为概念层和实例层,能够更加清晰的体现关系数据之间的关系,提高用户需求理解和资源描述的准确度。

Description

一种知识图谱构建、检索方法及装置
技术领域
本发明涉及知识图谱技术领域,具体涉及一种知识图谱构建、检索方法及装置。
背景技术
随着信息技术的快速发展,我国的电力系统也进入高速发展阶段,泛在电力物联网是未来电力系统的骨干,是充分应用移动互联、人工智能等现代信息技术、先进通信技术,实现电力系统各个环节万物互联、人机交互、具有全面感知、信息高效处理、应用便捷灵活等特征的智慧服务系统。因此,发电、输电、配电、营销和完善等电力系统领域的利益相关者可以充分利用泛在电力互联网来拓展业务。然而,泛在电力互联网里具有大量且繁杂的数据信息,那么如何能够进行高效的数据查询、数据推理、数据共享等对于电力系统的未来发展至关重要。
电力终端设备是电力系统中必不可少的一部分,在泛在电力物联网中包含了大量数据信息,包括设备的厂商名称、设备的生产日期、设备使用的操作系统版本等,相关技术中描述这些数据的方式主要采用关系数据库和文本描述,数据之间的关系描述不清楚,使得技术人员在进行知识的表示、共享与重用、数据的检索以及概念匹配时操作繁琐,效率较低。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的知识的表示、共享与重用,数据的检索以及概念匹配时操作繁琐、效率低的缺陷,从而提供一种知识图谱构建、检索方法及装置。
根据第一方面,本发明实施例公开了一种知识图谱构建方法,应用于电力终端设备的关系数据表,包括如下步骤:获取至少一个电力终端设备的关系数据表;根据所述关系数据表构建知识图谱概念层及知识图谱实例层;将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。
结合第一方面,在第一方面第一实施方式中,根据所述关系数据表构建知识图谱概念层,包括:对所述关系数据表进行提取,得到多个概念实体;所述概念实体包括表名概念实体、列概念实体和属性概念实体;根据所述多个概念实体生成所述知识图谱概念层。
结合第一方面第一实施方式,在第一方面第二实施方式中,所述对所述关系数据表进行提取,得到多个概念实体,包括:将所述关系数据表的表名作为表名概念实体;对所述关系数据表中的每一列的属性名称进行提取,得到多个列概念实体;对所述关系数据表的每一列中多次出现的属性进行提取,得到多个属性概念实体。
结合第一方面第二实施方式,在第一方面第三实施方式中,根据所述多个概念实体生成知识图谱概念层,包括:根据不同的所述表名概念实体得到顶级概念实体;将不同的关系数据表中具有相同属性信息的列概念实体与所述顶级概念实体进行关联;将不同的关系数据表中属性信息不同的列概念实体与其对应的表名概念实体进行关联;将所述属性概念实体与其对应的列概念实体进行关联;根据关联后的表名概念实体、列概念实体、属性概念实体及顶级概念实体得到所述知识图谱概念层。
结合第一方面,在第一方面第四实施方式中,根据所述关系数据表构建知识图谱实例层,包括:将所述关系数据表实例化,得到多个对象实体;所述对象实体包括:行对象实体、属性对象实体;根据所述多个对象实例生成所述知识图谱实例层。
结合第一方面第四实施方式,在第一方面第五实施方式中,所述将所述关系数据表实例化,得到多个对象实例,包括:将所述关系数据表中除了第一行的每一行的信息作为一个行对象实体;对所述关系数据表中的属性值进行提取,得到多个属性对象实体。
结合第一方面第五实施方式,在第一方面第六实施方式中,根据所述多个对象实例进行生成所述知识图谱实例层,包括:将所述行对象实体与其对应的表名概念实体进行关联;将所述属性对象实体与所述属性概念实体进行关联;将所述行对象实体与其对应的属性对象实体进行关联;根据关联后的表名概念实体、行对象实体、属性对象实体得到所述知识图谱实例层。
根据第二方面,本发明实施例公开了一种检索方法,包括如下步骤:获取待检索信息;在根据第一方面或第一方面任一实施方式中任一项所述的知识图谱构建方法得到的知识图谱中,根据所述待检索信息检索得到相应的检索结果。
根据第三方面,本发明实施例公开了一种知识图谱构建装置,应用于电力终端设备的关系数据表,包括:获取模块,用于获取至少一个电力终端设备的关系数据表;构建模块,用于根据所述关系数据表构建知识图谱概念层及知识图谱实例层;组合模块,用于将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。
根据第四方面,本发明实施例公开了一种检索装置,包括:第二获取模块,用于获取待检索信息;检索模块,用于在根据第一方面或第一方面任一实施方式中任一项所述的知识图谱构建方法得到的知识图谱中,根据所述待检索信息检索得到相应的检索结果。
根据第五方面,本发明实施例还公开了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面或第一方面任一实施方式所述的知识图谱构建方法或如第二方面所述的检索方法。
根据第六方面,本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面或第一方面任一实施方式所述的知识图谱构建方法或如第二方面所述的检索方法。
本发明技术方案,具有如下优点:
1.本发明提供的知识图谱构建方法及装置,应用于电力终端设备的关系数据,通过获取至少一个电力终端设备的关系数据表,根据关系数据表构建知识图谱概念层及知识图谱实例层,将知识图谱概念层与知识图谱实例层进行组合形成知识图谱,将表格数据转换为概念层和实例层,能够更加清晰的体现关系数据之间的关系,提高用户需求理解和资源描述的准确度,并且知识图谱是允许跨越不同的应用及企业,可以实现知识的共享和重用。
2.本发明提供的检索方法及装置,通过获取待检索信息,在知识图谱中,根据待检索信息检索得到相应的检索结果,将需要将传统的检索机制由关键字匹配转变为概念和内容的匹配,提高了信息检索系统的检索效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中知识图谱构建方法的一个具体示例的流程图;
图2为本发明实施例2中检索方法的一个具体示例的流程图;
图3为本发明实施例3中知识图谱构建装置的一个具体示例的原理框图;
图4为本发明实施例4中检索装置的一个具体示例的原理框图;
图5为本发明实施例5中计算机设备的一个具体示例的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本实施例提供一种知识图谱构建方法,应用于电力终端设备的关系数据,如图1所示,包括如下步骤:
S11:获取至少一个电力终端设备的关系数据表。
示例性地,上述电力终端设备可以包括配电终端设备(DTU)、馈线终端设备(FTU)、负载终端设备(LCT)、计费控制单元设备(TCU)等的一种或多种,上述关系数据表可以从数据库中调取,关系数据表包括设备名称、电压等级、设备型号、出厂日期、使用的操作系统、操作系统版本号、固件主程序版本号、使用的规约及版本等。
S12:根据关系数据表构建知识图谱概念层及知识图谱实例层。
示例性地,知识图谱由实体和实体之间的关系构成,在本申请实施例中,实体包括概念实体和对象实体,其中,概念实体是指关系数据表中提取出来的各个概念,对象实体是指关系数据表中提取出来的各个数据或数据集,知识图谱的构建是从多个关系数据表中识别出所有可能的概念实体和对象实体,并构建概念实体和对象实体的关系,最终形成一个三元组集合的过程。具体地,通过分析电力终端设备的关系数据表,提取设备的相关概念,然后建立概念和概念之间的层次结构,形成知识图谱概念层;然后将关系数据表进行对象实例化,构建对象实体之间的二元关系,形成知识图谱实例层。
S13:将知识图谱概念层与知识图谱实例层进行组合形成知识图谱。
示例性地,知识图谱概念层与知识图谱实例层均为一个三元组集合,将生成的知识图谱概念层和知识图谱实例层进行合并,去除掉三元组集合中重复的三元组,最终得到的三元组集合就是电力终端设备关系数据表的知识图谱。
本发明提供的知识图谱构建方法,应用于电力终端设备的关系数据,通过获取至少一个电力终端设备的关系数据,根据关系数据构建知识图谱概念层,根据关系数据构建知识图谱实例层,能够更加清晰的体现关系数据之间的关系,能够提高用户需求理解和资源描述的准确度,并且知识图谱是允许跨越不同的应用及企业,可以实现知识的共享和重用。
作为本发明一个可选实施方式,根据关系数据表构建知识图谱概念层,包括:
本申请实施例以配电终端(DTU)的关系数据表和馈线终端(FTU)的关系数据表为例描述知识图谱的构建过程。在实际电力终端设备关系数据表的知识图谱构建时,可以有电力终端设备。具体地,下表1为配电终端设备(DTU)的关系数据表,表2为馈线终端设备(FTU)的关系数据表。
表1
Figure BDA0002388176170000081
表2
Figure BDA0002388176170000082
首先,对关系数据表进行提取,得到多个概念实体;概念实体包括表名概念实体、列概念实体和属性概念实体。如上表1和表2所示,表名概念实体可以为“DTU终端设备”和“FTU终端设备”;列概念实体可以为“使用的操作系统类”、“出厂日期类”等;属性概念实体可以为“Linux类”、“Windows类”等。
示例性地,通过分析电力终端设备的关系数据表,提取设备的相关概念,得到多个概念实体,包括表名概念实体、列概念实体和属性概念实体。
其次,根据多个概念实体生成知识图谱概念层。
示例性地,根据上述得到的多个概念实体,然建立概念和概念之间的层次结构,形成知识图谱概念层。
作为本发明一个可选实施方式,对关系数据表进行提取,得到多个概念实体,包括:
首先,将关系数据表的表名作为表名概念实体。
示例性地,在本申请实施例中,将表1的表名和表2的表名作为两个表名概念实体。具体为“DTU终端设备”和“FTU终端设备”。
其次,对关系数据表中的每一列的属性名称进行提取,得到多个列概念实体。
示例性地,属性名称是指关系数据表中第一行的各个名称,将表1和表2中的每一列对应的属性名称转换为一个概念实体,得到多个列概念实体,具体命名为“属性名称+类”,直至将所有关系数据表中的列概念实体全部提取完毕。例如,从DTU表的对应“使用的操作系统”这一列,可以提取出一个名称为“使用的操作系统类”的实体,从DTU表的对应“出厂日期”这一列,可以提取出一个名称为“出厂日期类”的实体,等等。
再次,对关系数据表的每一列中多次出现的属性进行提取,得到多个属性概念实体。
示例性地,针对每一个关系数据表中的每一个列,如果该列的属性值为固定的、频繁出现的一些特定值,那么也同时将这些特定属性值提取成概念实体,即为本申请的属性概念实体,具体命名为“属性值+类”。例如,DTU终端设备关系数据表中,“使用的操作系统”这个列的属性值频繁出现的值只有两个“Linux”和“Windows”,所以可以提取“Linux类”和“Windows类”两个属性概念实体。
作为本发明一个可选实施方式,根据多个概念实体生成知识图谱概念层,包括:
首先,根据不同的表名概念实体得到顶级概念实体。
示例性地,分析不同关系数据表的表名,构建顶级概念实体“终端设备”,其他电力终端设备都是“终端设备”的子类概念。其它电力终端设备实体和该“终端设备”实体之间存在子类关系。例如,“DTU终端设备”和“FTU终端设备”分别都是“终端设备”的子类。具体地,可构建如下相关三元组:(DTU终端设备,subClassOf,终端设备),(FTU终端设备,subClassOf,终端设备),其中,subClassOf表示子类。
其次,将不同的关系数据表中具有相同属性信息的列概念实体与顶级概念实体进行关联。
示例性地,分析不同关系数据表中具有相同的属性信息的列,将与这些相同属性信息列对应的提取出的列概念实体与顶层概念实体进行关联,关联关系使用这些属性的名称。DTU终端设备关系数据表和FTU终端设备关系数据表具有部分相同的属性如出厂日期,批次,设备名称,生产厂商等相关的列概念实体与顶级概念实体“终端设备”关联,构建三元组,具体地,(出厂日期,domain,终端设备),(出厂日期,range,出厂日期类),(批次,domain,终端设备),(批次,range,批次类),(设备名称,domain,终端设备),(设备名称,range,设备名称类),(生产厂商,domain,终端设备),(生产厂商,range,生产厂商类),等等,其中,domain表示属性类型,range表示属性的范围。
再次,将不同的关系数据表中属性信息不同的列概念实体与其对应的表名概念实体进行关联。
示例性地,对于不同的关系数据表,除去相同同属性信息以后,剩下的属于每个关系数据表特有的属性类实体,可以与该关系数据表名称对应的表名概念实体建立关联。关联关系使用这些属性的名称。例如“使用的操作系统”、“操作系统版本号”等属性信息属于“DTU终端设备”的固有属性,“固件主程序版本号”、“使用的规约及版本”属于“FTU终端设备”的固有属性。因此,建立关联方式如下三元组:(使用的操作系统,domain,DTU终端设备),(使用的操作系统,range,使用的操作系统类),(操作系统版本号,domain,DTU终端设备),(操作系统版本号,range,操作系统版本号类);(固件主程序版本号,domain,FTU终端设备),(固件主程序版本号,range,固件主程序版本号类),(使用的规约及版本,domain,FTU终端设备),(使用的规约及版本,range,使用的规约及版本类),等等。
然后,将属性概念实体与其对应的列概念实体进行关联。
示例性地,将关系数据表提取的每一列中具有特定属性值的属性概念实体同该列对应的列概念实体建立关联,关联关系属于子类关系。例如,可以构建三元组(Linux类,subClassOf,使用的操作系统类)和(Windows类,subClassOf,使用的操作系统类),等等。
最后,根据关联后的表名概念实体、列概念实体、属性概念实体及顶级概念实体得到知识图谱概念层。
示例性地,知识图谱概念层由各个关系数据表中提取的概念实体以及概念实体间的关系构成,将建立关联关系后的概念实体(即三元组集合)作为知识图谱概念层。
作为本发明一个可选实施方式,根据关系数据表构建知识图谱实例层,包括:
首先,将关系数据表实例化,得到多个对象实体;对象实体包括:行对象实体、属性对象实体。
示例性地,通过分析电力终端设备的关系数据表,提取设备的相关对象,得到多个对象实体,包括行对象实体、属性对象实体。
其次,根据多个对象实例生成知识图谱实例层。
示例性地,根据上述得到的多个对象实体,然建立各个对象实体之间的层次结构,形成知识图谱实例层。
作为本发明一个可选实施方式,将关系数据表实例化,得到多个对象实例,包括:
首先,将关系数据表中除了第一行的每一行的信息作为一个行对象实体。
示例性地,在关系数据表中,每一行称为一个记录。除了用于描述表结构的第一行外,以后的每一行记录都可以看成一个对象(也称为实例)。可以通过数据库查询操作可以获取关系数据表中的每一个记录,并根据记录顺序命名实例。命名规则为“小写表名+数字编号”。例如DTU终端设备表中,第一个记录(与“百汇1号柜”对应的那一行记录)对应的实例命名为“dtu1”,与“昌平1号柜”对应的对象实体名称是“dtu2”,与“百汇3号柜”对应的对象实体名称是“dtu3”,与“昌平2号柜”对应的对象实体名称是“dtu4”,……,以此类推顺序命名对象实体名称为“dtu1”、“dtu2”、…“dtuN”,等。
其次,对关系数据表中的属性值进行提取,得到多个属性对象实体。
示例性地,将每一个关系数据表中的所有的属性值都提取成实体,例如DTU终端设备表中,“百汇1号柜”、“AC220V”、“PDZ821”、…、“2012.06、“Linux”、“2.6.29.1”等等都是对象实体,在本申请实施例中称之为属性对象实体。
作为本发明一个可选实施方式,根据多个对象实例进行生成知识图谱实例层,包括:
首先,将行对象实体与其对应的表名概念实体进行关联。
示例性地,针对每一个关系数据表,建立表中行对象实体与其对应的表名概念实体之间的实例化关系,实例化关系采用type关系确定。例如,对于DTU终端设备关系数据表,它的实例“dtu1”、“dtu2”、…“dtuN”都需要和“DTU终端设备”实例建立实例化关系,因而构建三元组:(dtu1,type,DTU终端设备)、(dtu2,type,DTU终端设备),…,(dtuN,type,DTU终端设备),等等。
其次,将属性对象实体与属性概念实体进行关联。
示例性地,针对每一个关系数据表,建立表中属性对象实体与属性概念实体之间的实例化关系,实例化关系采用type关系确定。例如,对于DTU终端设备表,属性对象实体“Linux”与属性概念实体“Linux类”之间有实例化关系,属性对象实体“Windows”与属性概念实体“Windows类”之间有实例化关系,因而构建三元组:(Linux,type,Linux类)、(Windows,type,Windows类),等等。
再次,将行对象实体与其对应的属性对象实体进行关联。
示例性地,针对每个关系数据表,都要构建该表的对象实体之间的二元关系。具体分成两个子步骤:遍历该表中所有的属性列,遍历关系数据表的所有的对象实体,对于某给定对象实体,建立该对象实体与其对应的属性实体之间的二元关联关系,构建知识图谱三元组。例如,在DTU终端设备表中,其对象实体dtu1与其属性实体的二元关系可以通过其对应的属性名构建,比如dtu1可以通过属性名“设备名称”同属性实体“百汇1号柜”建立关联;因此可以构建与dtu1相关的实体之间二元关系的三元组如下:(dtu1,设备名称,百汇1号柜),(dtu1,电压等级,AC220V),(dtu1,设备型号,PDZ821),…,(dtu1,出厂日期,2012.06),(dtu1,使用的操作系统,Linux),(dtu1,操作系统版本号,2.6.29.1),……,直到对象实体的二元关系全部被构建。
最后,根据关联后的表名概念实体、行对象实体、属性对象实体得到知识图谱实例层。
示例性地,知识图谱实例层由各个关系数据表中提取的对象实体以及对象实体间的关系构成,将建立关联关系后的对象实体(即三元组集合)作为知识图谱实例层。
实施例2
本发明实施例提供一种检索方法,如图2所示,包括:
S21:获取待检索信息。
S22:在实施例1所述的知识图谱构建方法得到的知识图谱中,根据所述待检索信息检索得到相应的检索结果。
示例性地,在本发明实施例中,例如查询一个配电终端设备的电压等级,即可通过查询配电终端设备和电压等级进行查询,根据知识图谱三元组集合可以直接得到配电终端设备的电压等级为AC220V,如果使用传统的检索机制根据关键字配电终端设备和电压等级进行查询,得到的是关系数据库或文本描述的多个相关页面,然后操作人员需要点击不同的页面去查询配电终端设备的电压等级具体是什么,将需要将传统的检索机制由关键字匹配转变为概念和内容的匹配,提高了信息检索系统的检索效率。
实施例3
本发明实施例提供一种知识图谱构建装置,如图3所示,包括:
第一获取模块31,用于获取至少一个电力终端设备的关系数据表;具体实现方式见实施例1中步骤S11的相关描述,在此不再赘述。
构建模块32,用于根据关系数据表构建知识图谱概念层及知识图谱实例层。具体实现方式见实施例1中步骤S12的相关描述,在此不再赘述。
组合模块33,用于将知识图谱概念层与知识图谱实例层进行组合形成知识图谱。具体实现方式见实施例1中步骤S13的相关描述,在此不再赘述。
本发明提供的知识图谱构建装置,应用于电力终端设备的关系数据,通过获取至少一个电力终端设备的关系数据,根据关系数据构建知识图谱概念层,根据关系数据构建知识图谱实例层,能够更加清晰的体现关系数据之间的关系,能够提高用户需求理解和资源描述的准确度,并且知识图谱是允许跨越不同的应用及企业,可以实现知识的共享和重用。
作为本发明一个可选实施方式,构建模块32包括:
提取模块,用于对关系数据表进行提取,得到多个概念实体;概念实体包括表名概念实体、列概念实体和属性概念实体;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第一生成模块,用于根据多个概念实体生成知识图谱概念层。具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
作为本发明一个可选实施方式,提取模块包括:包括:
表名概念实体获得模块,用于将关系数据表的表名作为表名概念实体;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
列概念实体获得模块,用于对关系数据表中的每一列的属性名称进行提取,得到多个列概念实体;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
属性概念实体获得模块,用于对关系数据表的每一列中多次出现的属性进行提取,得到多个属性概念实体。具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
作为本发明一个可选实施方式,第一生成模块包括:
顶级概念实体获得模块,用于根据不同的表名概念实体得到顶级概念实体;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第一关联模块,用于将不同的关系数据表中具有相同属性信息的列概念实体与顶级概念实体进行关联;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第二关联模块,用于将不同的关系数据表中属性信息不同的列概念实体与其对应的表名概念实体进行关联;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第三关联模块,用于将属性概念实体与其对应的列概念实体进行关联;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
知识图谱概念层获得模块,用于根据关联后的表名概念实体、列概念实体、属性概念实体及顶级概念实体得到知识图谱概念层。具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
作为本发明一个可选实施方式,构建模块32还包括:
对象实体获得模块,用于将关系数据表实例化,得到多个对象实体;对象实体包括:行对象实体、属性对象实体;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第二生成模块,用于根据多个对象实例生成知识图谱实例层。具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
作为本发明一个可选实施方式,对象实体获得模块包括:
行对象实体获得模块,用于将关系数据表中除了第一行的每一行的信息作为一个行对象实体;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
属性对象实体获得模块,用于对关系数据表中的属性值进行提取,得到多个属性对象实体。具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
作为本发明一个可选实施方式,第二生成模块包括:包括:
第四关联模块,用于将行对象实体与其对应的表名概念实体进行关联;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第五关联模块,用于将属性对象实体与属性概念实体进行关联;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
第六关联模块,用于将行对象实体与其对应的属性对象实体进行关联;具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
知识图谱实例层获得模块,用于根据关联后的表名概念实体、行对象实体、属性对象实体得到知识图谱实例层。具体实现方式见实施例1中对应步骤的相关描述,在此不再赘述。
实施例4
本发明实施例还提供了一种检索装置,如图4所示,包括:
第二获取模块41,用于获取待检索信息。
检索模块42,用于在知识图谱构建方法得到的知识图谱中,根据所述待检索信息检索得到相应的检索结果。具体实现方式见实施例2中步骤S22的相关描述,在此不再赘述。
实施例5
本发明实施例还提供了一种计算机设备,如图5所示,该计算机设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的知识图谱构建方法对应的程序指令/模块(例如,图3所示的第一获取模块31、构建模块32和组合模块33或图4所示的第二获取模块41和检索模块42)。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的知识图谱构建方法或检索方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器52执行时,执行如图1所示实施例中的知识图谱构建方法或图2所示实施例中检索方法。
上述计算机设备具体细节可以对应参阅图1或图2所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
实施例6
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的知识图谱构建的方法或检索方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (12)

1.一种知识图谱构建方法,应用于电力终端设备的关系数据表,其特征在于,包括如下步骤:
获取至少一个电力终端设备的关系数据表;
根据所述关系数据表构建知识图谱概念层及知识图谱实例层;
将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。
2.根据权利要求1所述的方法,其特征在于,根据所述关系数据表构建知识图谱概念层,包括:
对所述关系数据表进行提取,得到多个概念实体;所述概念实体包括表名概念实体、列概念实体和属性概念实体;
根据所述多个概念实体生成所述知识图谱概念层。
3.根据权利要求2所述的方法,其特征在于,所述对所述关系数据表进行提取,得到多个概念实体,包括:
将所述关系数据表的表名作为表名概念实体;
对所述关系数据表中的每一列的属性名称进行提取,得到多个列概念实体;
对所述关系数据表的每一列中多次出现的属性进行提取,得到多个属性概念实体。
4.根据权利要求3所述的方法,其特征在于,根据所述多个概念实体生成知识图谱概念层,包括:
根据不同的所述表名概念实体得到顶级概念实体;
将不同的关系数据表中具有相同属性信息的列概念实体与所述顶级概念实体进行关联;
将不同的关系数据表中属性信息不同的列概念实体与其对应的表名概念实体进行关联;
将所述属性概念实体与其对应的列概念实体进行关联;
根据关联后的表名概念实体、列概念实体、属性概念实体及顶级概念实体得到所述知识图谱概念层。
5.根据权利要求1所述的方法,其特征在于,根据所述关系数据表构建知识图谱实例层,包括:
将所述关系数据表实例化,得到多个对象实体;所述对象实体包括:行对象实体、属性对象实体;
根据所述多个对象实例生成所述知识图谱实例层。
6.根据权利要求5所述的方法,其特征在于,所述将所述关系数据表实例化,得到多个对象实例,包括:
将所述关系数据表中除了第一行的每一行的信息作为一个行对象实体;
对所述关系数据表中的属性值进行提取,得到多个属性对象实体。
7.根据权利要求6所述的方法,其特征在于,根据所述多个对象实例进行生成所述知识图谱实例层,包括:
将所述行对象实体与其对应的表名概念实体进行关联;
将所述属性对象实体与所述属性概念实体进行关联;
将所述行对象实体与其对应的属性对象实体进行关联;
根据关联后的表名概念实体、行对象实体、属性对象实体得到所述知识图谱实例层。
8.一种检索方法,其特征在于,包括如下步骤:
获取待检索信息;
在根据权利要求1-7中任一项所述的知识图谱构建方法得到的知识图谱中,根据所述待检索信息检索得到相应的检索结果。
9.一种知识图谱构建装置,应用于电力终端设备的关系数据表,其特征在于,包括:
第一获取模块,用于获取至少一个电力终端设备的关系数据表;
构建模块,用于根据所述关系数据表构建知识图谱概念层及知识图谱实例层;
组合模块,用于将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。
10.一种检索装置,其特征在于,包括:
第二获取模块,用于获取待检索信息;
检索模块,用于在根据权利要求1-7中任一项所述的知识图谱构建方法得到的知识图谱中,根据所述待检索信息检索得到相应的检索结果。
11.一种计算机设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1至7任一所述的知识图谱构建方法或如权利要求8所述的检索方法。
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1至7任一所述的知识图谱构建方法或如权利要求8所述的检索方法。
CN202010104775.9A 2020-02-20 2020-02-20 一种知识图谱构建、检索方法及装置 Active CN111309868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010104775.9A CN111309868B (zh) 2020-02-20 2020-02-20 一种知识图谱构建、检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010104775.9A CN111309868B (zh) 2020-02-20 2020-02-20 一种知识图谱构建、检索方法及装置

Publications (2)

Publication Number Publication Date
CN111309868A true CN111309868A (zh) 2020-06-19
CN111309868B CN111309868B (zh) 2023-08-29

Family

ID=71159992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010104775.9A Active CN111309868B (zh) 2020-02-20 2020-02-20 一种知识图谱构建、检索方法及装置

Country Status (1)

Country Link
CN (1) CN111309868B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858957A (zh) * 2020-07-20 2020-10-30 上海汽车集团股份有限公司 一种知识图谱自动构建方法及系统
CN113094515A (zh) * 2021-04-13 2021-07-09 国网北京市电力公司 基于电力营销数据的知识图谱实体及链接提取方法
CN114780756A (zh) * 2022-06-07 2022-07-22 国网浙江省电力有限公司信息通信分公司 基于噪音检测和噪音感知的实体对齐方法及装置
CN115048533A (zh) * 2022-06-21 2022-09-13 四维创智(北京)科技发展有限公司 知识图谱构建的方法、装置、电子设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150019589A1 (en) * 2013-07-15 2015-01-15 Sinuhé Arroyo Template-driven structured query generation
CN107609052A (zh) * 2017-08-23 2018-01-19 中国科学院软件研究所 一种基于语义三角的领域知识图谱的生成方法及装置
CN108460136A (zh) * 2018-03-08 2018-08-28 国网福建省电力有限公司 电力运维信息知识图谱构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150019589A1 (en) * 2013-07-15 2015-01-15 Sinuhé Arroyo Template-driven structured query generation
CN107609052A (zh) * 2017-08-23 2018-01-19 中国科学院软件研究所 一种基于语义三角的领域知识图谱的生成方法及装置
CN108460136A (zh) * 2018-03-08 2018-08-28 国网福建省电力有限公司 电力运维信息知识图谱构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
凡天娣;景旭文;肖志建;李磊;徐建新;: "基于本体的船舶焊接工艺知识图谱构建" *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858957A (zh) * 2020-07-20 2020-10-30 上海汽车集团股份有限公司 一种知识图谱自动构建方法及系统
CN111858957B (zh) * 2020-07-20 2024-05-14 上海汽车集团股份有限公司 一种知识图谱自动构建方法及系统
CN113094515A (zh) * 2021-04-13 2021-07-09 国网北京市电力公司 基于电力营销数据的知识图谱实体及链接提取方法
CN114780756A (zh) * 2022-06-07 2022-07-22 国网浙江省电力有限公司信息通信分公司 基于噪音检测和噪音感知的实体对齐方法及装置
CN115048533A (zh) * 2022-06-21 2022-09-13 四维创智(北京)科技发展有限公司 知识图谱构建的方法、装置、电子设备及可读存储介质
CN115048533B (zh) * 2022-06-21 2023-06-27 四维创智(北京)科技发展有限公司 知识图谱构建的方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN111309868B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN111309868A (zh) 一种知识图谱构建、检索方法及装置
CN110362544B (zh) 日志处理系统、日志处理方法、终端及存储介质
US20120239606A1 (en) Business semantic network build
CN109284323B (zh) 检测数据的管理方法及装置
CN111400288A (zh) 数据质量检查方法及系统
CN110851511A (zh) 数据同步的方法及装置
CN112672370B (zh) 网元指标数据的自动检测方法及系统、设备和存储介质
CN112699278A (zh) 一种图数据库构建方法、装置、可读存储介质及电子设备
US20170032052A1 (en) Graph data processing system that supports automatic data model conversion from resource description framework to property graph
CN108763323B (zh) 基于资源集和大数据技术的气象格点文件应用方法
CN111858730A (zh) 一种图数据库的数据导入导出装置、方法、设备及介质
CN111221785A (zh) 一种多源异构数据的语义数据湖构建方法
CN112100402A (zh) 一种电网知识图谱构建方法及装置
CN116244387A (zh) 实体关系构建方法、装置、电子设备及存储介质
CN111310076B (zh) 地理位置查询方法、装置、介质及电子设备
CN109101595B (zh) 一种信息查询方法、装置、设备及计算机可读存储介质
CN116483707A (zh) 测试方法、装置、设备、存储介质及程序产品
CN111161818A (zh) 一种基于大数据技术的医疗数据交换共享系统及方法
CN113779068B (zh) 数据查询方法、装置、设备及存储介质
CN113741864B (zh) 基于自然语言处理的语义化服务接口自动设计方法与系统
CN115686497A (zh) 业务开发数据管理方法、开发引擎、电子设备和存储介质
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
CN110471708B (zh) 基于可重用组件的配置项获取的方法及装置
CN109828972B (zh) 一种基于有向图结构的数据集成方法
CN112286916A (zh) 一种数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant