CN113779271A - 一种基于循环神经网络的知识图谱构建方法及装置 - Google Patents

一种基于循环神经网络的知识图谱构建方法及装置 Download PDF

Info

Publication number
CN113779271A
CN113779271A CN202111070592.0A CN202111070592A CN113779271A CN 113779271 A CN113779271 A CN 113779271A CN 202111070592 A CN202111070592 A CN 202111070592A CN 113779271 A CN113779271 A CN 113779271A
Authority
CN
China
Prior art keywords
knowledge
data
module
neural network
recurrent neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111070592.0A
Other languages
English (en)
Inventor
李保平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huitong Guoxin Technology Co Ltd
Original Assignee
Guangzhou Huitong Guoxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huitong Guoxin Technology Co Ltd filed Critical Guangzhou Huitong Guoxin Technology Co Ltd
Priority to CN202111070592.0A priority Critical patent/CN113779271A/zh
Publication of CN113779271A publication Critical patent/CN113779271A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于循环神经网络的知识图谱构建方法及装置,涉及知识图谱领域,针对现有的部分知识图谱在构建时,无法搭配循环神经网络使用的问题,现提出如下方案,其包括S1、将初始数据从数据库中导出,并进行数据整理,同时对初始数据进行抽取,S2、将抽取出的数据进行初步整合,S3、将初步整合后的数据进行实体对齐,并将对齐后的知识进行表示,并与现有知识进行对比,S4、将对比后的知识进行处理,符合条件的知识直接输入知识图谱创建框架中,不符合条件的知识回到废弃知识库中,进行整合,并重复S3,依旧不符合条件的知识进行剔除。本发明结构新颖,且可以搭配循环网络的使用,增加了知识数据获取的范围。

Description

一种基于循环神经网络的知识图谱构建方法及装置
技术领域
本发明涉及知识图谱领域,尤其涉及一种基于循环神经网络的知识图谱构建方法及装置。
背景技术
知识图谱时一种将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,将各个学科的核心内容与框架展现出来的一种现代理论,在人们进行资料查询与检索时提供便利,使人们可以找出更加准确的信息,做出更全面的总结并提供更有深度相关的信息,知识图谱的发展已经步入正轨,但仍存在不足之处,现有的部分知识图谱在构建时,存在无法搭配循环神经网络使用,数据的获取存在局限性的问题,为解决这些问题,我们提出了一种基于循环神经网络的知识图谱构建方法及装置。
发明内容
本发明提出的一种基于循环神经网络的知识图谱构建方法及装置,解决了现有的部分知识图谱在构建时,无法搭配循环神经网络使用的问题。
为了实现上述目的,本发明采用了如下技术方案:
一种基于循环神经网络的知识图谱构建方法,包括以下步骤:
S1、将初始数据从数据库中导出,并进行数据整理,同时对初始数据进行抽取;
S2、将抽取出的数据进行初步整合;
S3、将初步整合后的数据进行实体对齐,并将对齐后的知识进行表示,并与现有知识进行对比;
S4、将对比后的知识进行处理,符合条件的知识直接输入知识图谱创建框架中,不符合条件的知识回到废弃知识库中,进行整合,并重复S3,依旧不符合条件的知识进行剔除;
S5、通过手动对知识进行修改或者添加;
S6、将现有知识进行输入,并进行整合,然后与循环神经网络进行对接,并通过循环神经网络进行检索,将检索整合后的知识输入知识图谱框架中;
S7、将知识图谱框架进行导出,然后创建出完整的知识图谱。
优选的,所述初始数据包括结构数据、半结构数据以及非结构数据。
优选的,所述步骤S1中抽取数据分为实体抽取、关系抽取和属性抽取,所述实体抽取、关系抽取和属性抽取分别采取不同的方法对知识进行抽取。
优选的,所述实体抽取通过深度学习的方法进行抽取,所述关系抽取通过远监督思想得到训练数据,并对数据进行标注,从而进行抽取,所述属性抽取,通过训练器进行标注抽取。
优选的,所述步骤S3中的实体对齐通过相似度计算模块对多个知识进行相似度计算,并将初始数据中的知识进行互补融合,形成全面、准确、完整的实体描述。
一种基于循环神经网络的知识图谱构建装置,包括以下:
初始数据库,用于储存原始的结构数据、半结构数据以及非结构数据,且所述初始数据库与数据处理模块相连接;
数据处理模块,用于将初始数据库中的数据进行整理与抽取,且所述数据处理模块与初始数据整合模块相连接;
初始数据整合模块,用于将抽取后的知识数据进行整合,且所述初始数据整合模块与相似度计算模块相连接;
相似度计算模块,用于将整合后的知识数据进行实体对齐,且所述相似度计算模块与知识融合模块相连接;
知识融合模块,用于实体对齐后的数据再一次融合,所述知识融合模块与知识对比模块相连接;
知识对比模块,用于将融合入后的知识数据与现有知识进行对比,剔除其余知识,所述知识对比模块与输出模块相连接;
输出模块,用于知识图谱框架搭建。
优选的,还包括:废弃数据库,用于接收知识对比模块剔除后的知识数据的收集;
数据库整合模块,用于剔除后的知识数据进行整合,且所述数据库整合模块与废弃数据库相连接,所述数据库整合模块将整合后的废弃知识数据重新传回相似度计算模块;
删除模块,用于剔除的知识数据删除,所述删除模块与废弃知识库相连接。
优选的,还包括:手动输入修改模块,用于手动输入或修改知识数据,并将输入的数据传输到相似度计算模块中,所述手动输入修改模块与循环神经网络连接;
循环神经网络,用于现有知识的检索和知识收集,所述循环神经网络与知识融合模块相连接。
优选的,所述数据处理模块包括深度学习训练模块、包装器以及RDF数据模块;
深度学习模块,用于非结构化数据的知识抽取;
包装器,用于半结构化数据的知识抽取;
RDF数据模块,用于结构化数据的知识抽取。
本发明的有益效果为:
通过将循环神经网络结合知识图谱的搭建,使知识图谱在搭建中的数据来源更加广泛,提升知识图谱包含的数据范围,同时通过搭建废弃知识库,将知识对比失败的知识数据进行重新整合匹配,大大增加了知识图谱的准确性,减少错误信息的出现。
综上所述,该装置不仅可以搭配循环网络的使用,增加了知识数据获取的范围,解决了现有的部分知识图谱在构建时,无法搭配循环神经网络使用的问题。
附图说明
图1为本发明所述的一种基于循环神经网络的知识图谱构建方法创建方法流程图。
图2为本发明所述的一种基于循环神经网络的知识图谱构建装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1
参照图1,一种基于循环神经网络的知识图谱构建方法,包括以下步骤:
S1、将初始数据从数据库中导出,并进行数据整理,同时对初始数据进行抽取。
S2、将抽取出的数据进行初步整合。
S3、将初步整合后的数据进行实体对齐,并将对齐后的知识进行表示,并与现有知识进行对比。
S4、将对比后的知识进行处理,符合条件的知识直接输入知识图谱创建框架中,不符合条件的知识回到废弃知识库中,进行整合,并重复S3,依旧不符合条件的知识进行剔除。
S5、通过手动对知识进行修改或者添加,并通过循环神经网络对现有知识进行检索,将检索整合后的知识输入知识图谱框架中。
S6、将现有知识进行输入,并进行整合,然后与循环神经网络进行对接。
S7、将知识图谱框架进行导出,然后创建出完整的知识图谱。
所述初始数据包括结构数据、半结构数据以及非结构数据。
所述步骤S1中抽取数据分为实体抽取、关系抽取和属性抽取,所述实体抽取、关系抽取和属性抽取分别采取不同的方法对知识进行抽取,抽取的数据分为结构化数据、半结构化数据以及非结构化数据。
所述实体抽取通过深度学习的方法进行抽取,所述关系抽取通过远监督思想得到训练数据,并对数据进行标注,从而进行抽取,所述属性抽取,通过训练器进行标注抽取。
所述步骤S3中的实体对齐通过相似度计算模块对多个知识进行相似度计算,并将初始数据中的知识进行互补融合,形成全面、准确、完整的实体描述。
实施例2
参照图2,一种基于循环神经网络的知识图谱构建装置,包括以下:
初始数据库,用于储存原始的结构数据、半结构数据以及非结构数据,且所述初始数据库与数据处理模块相连接;
数据处理模块,用于将初始数据库中的数据进行整理与抽取,且所述数据处理模块与初始数据整合模块相连接;
初始数据整合模块,用于将抽取后的知识数据进行整合,且所述初始数据整合模块与相似度计算模块相连接;
相似度计算模块,用于将整合后的知识数据进行实体对齐,且所述相似度计算模块与知识融合模块相连接;
知识融合模块,用于实体对齐后的数据再一次融合,所述知识融合模块与知识对比模块相连接;
知识对比模块,用于将融合入后的知识数据与现有知识进行对比,剔除其余知识,所述知识对比模块与输出模块相连接;
输出模块,用于知识图谱框架搭建。
一种基于循环神经网络的知识图谱构建装置,还包括:
废弃数据库,用于接收知识对比模块剔除后的知识数据的收集;
数据库整合模块,用于剔除后的知识数据进行整合,且所述数据库整合模块与废弃数据库相连接,所述数据库整合模块将整合后的废弃知识数据重新传回相似度计算模块。
删除模块,用于剔除的知识数据删除,所述删除模块与废弃知识库相连接。
一种基于循环神经网络的知识图谱构建装置,还包括:
手动输入修改模块,用于手动输入或修改知识数据,并将输入的数据传输到相似度计算模块中,所述手动输入修改模块与循环神经网络连接。
循环神经网络,用于现有知识的检索和知识收集,所述循环神经网络与知识融合模块相连接。
所述数据处理模块包括深度学习训练模块、包装器以及RDF数据模块;深度学习模块,用于非结构化数据的知识抽取;包装器,用于半结构化数据的知识抽取;RDF数据模块,用于结构化数据的知识抽取。
本发明在具体使用时,通过将原始的结构数据、半结构数据以及非结构数据从数据库中导出,并通过数据处理模块进行数据整理,并通过数据处理模块内部的深度学习训练模块、包装器以及RDF数据模块分别对非结构化数据、半结构化数据以及结构化数据进行知识抽取,知识整理抽取完毕后通过初始数据整合模块将抽取后的知识数据进行整合,整合完毕后,通过相似度计算模块将整合后的知识数据进行实体对齐,并将对齐后的知识进行表示,并与现有知识进行对比,将对比后的知识进行处理,符合条件的知识直接通过输出模块输入知识图谱创建框架中,不符合条件的知识回到废弃知识库中,通过数据库整合模块进行整合,并重新传回相似度计算模块,再次进行处理,依旧不符合条件的知识通过删除模块进行剔除,通过手动输入修改模块进行手动输入或修改知识数据,并将输入的数据传输到相似度计算模块中,然后通过循环神经网络将现有知识的检索和知识收集,并将检索的知识输入知识融合模块中进行融合,并通过知识对比模块进行对比,并与现有知识进行对比,将对比后的知识进行处理,符合条件的知识直接通过输出模块输入知识图谱创建框架中,不符合条件的知识回到废弃知识库中,通过数据库整合模块进行整合,并重新传回相似度计算模块,再次进行处理,依旧不符合条件的知识通过删除模块进行剔除即可。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于循环神经网络的知识图谱构建方法,其特征在于,包括以下步骤:
S1、将初始数据从数据库中导出,并进行数据整理,同时对初始数据进行抽取;
S2、将抽取出的数据进行初步整合;
S3、将初步整合后的数据进行实体对齐,并将对齐后的知识进行表示,并与现有知识进行对比;
S4、将对比后的知识进行处理,符合条件的知识直接输入知识图谱创建框架中,不符合条件的知识回到废弃知识库中,进行整合,并重复S3,依旧不符合条件的知识进行剔除;
S5、通过手动对知识进行修改或者添加;
S6、将现有知识进行输入,并进行整合,然后与循环神经网络进行对接,并通过循环神经网络进行检索,将检索整合后的知识输入知识图谱框架中;
S7、将知识图谱框架进行导出,然后创建出完整的知识图谱。
2.根据权利要求1所述的一种基于循环神经网络的知识图谱构建方法,其特征在于,所述初始数据包括结构数据、半结构数据以及非结构数据。
3.根据权利要求1所述的一种基于循环神经网络的知识图谱构建方法,其特征在于,所述步骤S1中抽取数据分为实体抽取、关系抽取和属性抽取,所述实体抽取、关系抽取和属性抽取分别采取不同的方法对知识进行抽取。
4.根据权利要求2所述的一种基于循环神经网络的知识图谱构建方法,其特征在于,所述实体抽取通过深度学习的方法进行抽取,所述关系抽取通过远监督思想得到训练数据,并对数据进行标注,从而进行抽取,所述属性抽取,通过训练器进行标注抽取。
5.根据权利要求1所述的一种基于循环神经网络的知识图谱构建方法,其特征在于,所述步骤S3中的实体对齐通过相似度计算模块对多个知识进行相似度计算,并将初始数据中的知识进行互补融合,形成全面、准确、完整的实体描述。
6.一种基于循环神经网络的知识图谱构建装置,其特征在于,应用于权利要求1-5任一项所述的基于循环神经网络的知识图谱构建方法,包括以下:
初始数据库,用于储存原始的结构数据、半结构数据以及非结构数据,且所述初始数据库与数据处理模块相连接;
数据处理模块,用于将初始数据库中的数据进行整理与抽取,且所述数据处理模块与初始数据整合模块相连接;
初始数据整合模块,用于将抽取后的知识数据进行整合,且所述初始数据整合模块与相似度计算模块相连接;
相似度计算模块,用于将整合后的知识数据进行实体对齐,且所述相似度计算模块与知识融合模块相连接;
知识融合模块,用于实体对齐后的数据再一次融合,所述知识融合模块与知识对比模块相连接;
知识对比模块,用于将融合入后的知识数据与现有知识进行对比,剔除其余知识,所述知识对比模块与输出模块相连接;
输出模块,用于知识图谱框架搭建。
7.根据权利要求6所述的一种基于循环神经网络的知识图谱构建装置,其特征在于,还包括:
废弃数据库,用于接收知识对比模块剔除后的知识数据的收集;
数据库整合模块,用于剔除后的知识数据进行整合,且所述数据库整合模块与废弃数据库相连接,所述数据库整合模块将整合后的废弃知识数据重新传回相似度计算模块;
删除模块,用于剔除的知识数据删除,所述删除模块与废弃知识库相连接。
8.根据权利要求6所述的一种基于循环神经网络的知识图谱构建装置,其特征在于,还包括:
手动输入修改模块,用于手动输入或修改知识数据,并将输入的数据传输到相似度计算模块中,所述手动输入修改模块与循环神经网络连接。
9.根据权利要求8所述的一种基于循环神经网络的知识图谱构建装置,其特征在于,所述循环神经网络,用于现有知识的检索和知识收集,所述循环神经网络与知识融合模块相连接。
10.根据权利要求6所述的一种基于循环神经网络的知识图谱构建装置,其特征在于,所述数据处理模块包括深度学习训练模块、包装器以及RDF数据模块;
所述深度学习模块,用于非结构化数据的知识抽取;
所述包装器,用于半结构化数据的知识抽取;
所述RDF数据模块,用于结构化数据的知识抽取。
CN202111070592.0A 2021-09-13 2021-09-13 一种基于循环神经网络的知识图谱构建方法及装置 Pending CN113779271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111070592.0A CN113779271A (zh) 2021-09-13 2021-09-13 一种基于循环神经网络的知识图谱构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111070592.0A CN113779271A (zh) 2021-09-13 2021-09-13 一种基于循环神经网络的知识图谱构建方法及装置

Publications (1)

Publication Number Publication Date
CN113779271A true CN113779271A (zh) 2021-12-10

Family

ID=78843355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111070592.0A Pending CN113779271A (zh) 2021-09-13 2021-09-13 一种基于循环神经网络的知识图谱构建方法及装置

Country Status (1)

Country Link
CN (1) CN113779271A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统
CN111897968A (zh) * 2020-07-20 2020-11-06 国网浙江省电力有限公司嘉兴供电公司 一种工业信息安全知识图谱构建方法和系统
EP3798922A1 (de) * 2019-08-02 2021-03-31 Robert Bosch GmbH Vorrichtung und verfahren zum maschinenlernen und ansteuern einer maschine
CN113190689A (zh) * 2021-05-25 2021-07-30 广东电网有限责任公司广州供电局 一种电力安全知识图谱的构建方法、装置、设备和介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统
EP3798922A1 (de) * 2019-08-02 2021-03-31 Robert Bosch GmbH Vorrichtung und verfahren zum maschinenlernen und ansteuern einer maschine
CN111897968A (zh) * 2020-07-20 2020-11-06 国网浙江省电力有限公司嘉兴供电公司 一种工业信息安全知识图谱构建方法和系统
CN113190689A (zh) * 2021-05-25 2021-07-30 广东电网有限责任公司广州供电局 一种电力安全知识图谱的构建方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN110597735B (zh) 一种面向开源软件缺陷特征深度学习的软件缺陷预测方法
CN111078889B (zh) 一种基于多种注意力和改进预训练的药物间关系抽取方法
CN109165284A (zh) 一种基于大数据的金融领域人机对话意图识别方法
CN110990590A (zh) 一种基于强化学习和迁移学习的动态金融知识图谱构建方法
CN107330125A (zh) 基于知识图谱技术的海量非结构化配网数据集成方法
CN107562918A (zh) 一种数学题知识点发现与批量标签获取方法
CN110188147B (zh) 基于知识图谱的文献实体关系发现方法及系统
CN111897914B (zh) 用于综合管廊领域的实体信息抽取及知识图谱构建方法
WO2021147786A1 (zh) 知识图谱的构建方法及装置、存储介质、电子设备
CN105631018A (zh) 基于主题模型的文章特征抽取方法
CN113094512B (zh) 一种工业生产制造中故障分析系统及方法
CN113157860B (zh) 一种基于小规模数据的电力设备检修知识图谱构建方法
CN108829696A (zh) 面向地铁设计规范中知识图谱节点自动构建方法
CN115905553A (zh) 面向施工图审查规范知识抽取与知识图谱构建方法及系统
CN112036179B (zh) 基于文本分类与语义框架的电力预案信息抽取方法
CN113392183A (zh) 一种儿童范畴图谱知识的表征与计算方法
CN113779271A (zh) 一种基于循环神经网络的知识图谱构建方法及装置
CN116611447A (zh) 一种基于深度学习方法的信息抽取和语义匹配系统及方法
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
CN114997154A (zh) 一种对话机器人语料自动构造方法及系统
CN113762589A (zh) 一种输变电工程变更预测系统及方法
Wu et al. Detection of Defects in Power Grid Inspection Images Based on Multi-scale Fusion
CN111814457A (zh) 一种电网工程合同文本生成方法
CN114510649B (zh) 基于去重样本的社交网络和lstm模型准确率计算方法
TWI840106B (zh) 語意分析系統及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211210