CN108073711A - 一种基于知识图谱的关系抽取方法和系统 - Google Patents

一种基于知识图谱的关系抽取方法和系统 Download PDF

Info

Publication number
CN108073711A
CN108073711A CN201711398108.0A CN201711398108A CN108073711A CN 108073711 A CN108073711 A CN 108073711A CN 201711398108 A CN201711398108 A CN 201711398108A CN 108073711 A CN108073711 A CN 108073711A
Authority
CN
China
Prior art keywords
entity
information
attribute
relation
entity pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711398108.0A
Other languages
English (en)
Other versions
CN108073711B (zh
Inventor
雷凯
沈颖
温德斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Shenzhen Graduate School
Original Assignee
Peking University Shenzhen Graduate School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Shenzhen Graduate School filed Critical Peking University Shenzhen Graduate School
Priority to CN201711398108.0A priority Critical patent/CN108073711B/zh
Publication of CN108073711A publication Critical patent/CN108073711A/zh
Application granted granted Critical
Publication of CN108073711B publication Critical patent/CN108073711B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于知识图谱的关系抽取方法和系统,其中方法包括:从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;根据所述最短路径集合提取实体对的路径结构信息;根据所述实体的描述属性提取实体对的属性文本信息;根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。在本申请的具体实施方式中,由于包括从知识图谱中提取实体的描述属性与连接实体对的路径,构建一个基于知识图谱路径结构信息与实体属性信息的关系抽取模型,通过提取知识图谱的路径信息与属性信息,从中挖掘其潜在语义信息,免去收集语料集与标注训练集,从而降低构建数据集的代价,提升关系抽取效率。

Description

一种基于知识图谱的关系抽取方法和系统
技术领域
本申请涉及数据挖掘技术领域,尤其涉及一种基于知识图谱的关系抽取方法和系统。
背景技术
随着认知神经、深度学习等领域的持续发展,人工智能逐渐涉足各个领域,致力于改善人们的生活,在图像识别、语音识别等领域已经超越了人类的水平。然而在自然语言处理领域,由于人类语言的复杂性以及事物的多样性,目前的技术尚不能达到完全理解语义的程度,因此需要一个语义联通的桥梁——知识图谱。知识图谱由知识以及知识之间的关系组成,其本质上来讲是一种语义网络,网络中的节点表示现实世界存在的实体(Entity),节点之间的边表示两个实体之间的关系。通过点与边的组合,将现实世界的知识抽象成可供机器处理应用的知识网络。目前知识图谱技术主要用于智能语义搜索、移动个人助理以及问答系统中。
许多研究机构与公司正在构建自己的知识图谱,如谷歌的Knowledge Graph,百度的知心等。目前已有许多开源的大型知识图谱项目,如freebase,YAGO,DBpedia等,但这些知识图谱还远未达到完备的阶段,而知识图谱的知识覆盖度直接决定了语义理解结果,并影响后续应用的效果。因此知识图谱补全是一个非常重要的问题,其关键是如何自动抽取信息得到候选知识单元,其中涉及的技术包括:实体抽取、关系抽取和属性抽取。其中关系抽取是提取实体对之间关联关系。目前主流的关系抽取方法是有监督的学习方法、半监督的学习方法和无监督的学习方法三种。与半监督的学习方法和无监督的学习方法相比,有监督的学习方法准确率与召回率更高,因此受到越来越多的关注。然而有监督的学习方法需要大量的人工标注训练语料,随着大数据时代的来临,实体对数量达到数十亿的量级,传统方法已无法满足需求。因此,在关系抽取问题中,如何降低构造数据集难度,提升模型训练效率成为了一个越来越重要的问题。
发明内容
本申请提供一种基于知识图谱的关系抽取方法和系统。
根据本申请的第一方面,本申请提供一种基于知识图谱的关系抽取方法,包括:
从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;
根据所述最短路径集合提取实体对的路径结构信息;
根据所述实体的描述属性提取实体对的属性文本信息;
根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。
上述方法,提取连接实体对的最短路径集合,具体包括:
将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。
上述方法,所述根据所述最短路径集合提取实体对的路径结构信息,具体包括:
利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。
上述方法,所述根据所述实体的描述属性提取实体对的属性文本信息,具体包括:
使用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。
上述方法,所述根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系,具体包括:
将所述实体对的路径结构信息和所述实体对的属性文本信息结合,构建表示实体对信息的第一向量;
通过一个全连接层,将所述表示实体对信息的第一向量转换成一个维度等于关系类别数量的第二向量,再通过一层softmax层将所述第二向量转换成条件概率分布;
根据所述概率分布,选取概率值最大的关系类别作为实体对之间的关系。
根据本申请的第二方面,本申请提供一种基于知识图谱的关系抽取系统,包括:
基本信息提取模块,用于从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;
路径结构信息提取模块,用于根据所述最短路径集合提取实体对的路径结构信息;
属性文本信息提取模块,用于根据所述实体的描述属性提取实体对的属性文本信息;
关系抽取模块,根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。
上述系统,所述基本信息提取模块,还用于将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。
上述系统,所述路径结构信息提取模块,还用于利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。
上述系统,所述属性文本信息提取模块,还用于使用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。
上述系统,所述关系抽取模块,还用于将所述实体对的路径结构信息和所述实体对的属性文本信息结合,构建表示实体对信息的第一向量;通过一个全连接层,将所述表示实体对信息的第一向量转换成一个维度等于关系类别数量的第二向量,再通过一层softmax层将所述第二向量转换成条件概率分布;根据所述概率分布,选取概率值最大的关系类别作为实体对之间的关系。
根据本申请的第三方面,本申请提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现上述方法。
由于采用了以上技术方案,使本申请具备的有益效果在于:
在本申请的具体实施方式中,由于包括从知识图谱中提取实体的描述属性与连接实体对的路径,构建一个基于知识图谱路径结构信息与实体属性信息的关系抽取模型,通过提取知识图谱的路径信息与属性信息,从中挖掘其潜在语义信息,免去收集语料集与标注训练集,从而降低构建数据集的代价,提升关系抽取效率。
附图说明
图1为本申请的方法在一种实施方式中的流程图;
图2为本申请的系统在一种实施方式中的功能模块示意图。
具体实施方式
下面通过具体实施方式结合附图对本申请作进一步详细说明。
实施例一:
如图1所示,本申请的基于知识图谱的关系抽取方法,其一种实施方式,包括以下步骤:
步骤102:从知识图谱中提取实体的描述属性与连接实体对的最短路径集合。
在一种实施方式中,提取连接实体对的最短路径集合,具体可以包括:
将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。
步骤1022:提取连接实体对的最短路径集合。将知识图谱视作有向图,针对当前实体对,利用双向广度优先搜索算法确认实体对之间的最短路径长度,随后利用深度优先搜索算法寻找一定数量的实体对的最短路径。
步骤1024:提取实体属性。知识图谱属性信息是为了弥补路径信息无法反映实体对之间语义关系的情况。由于现实世界知识结构复杂多样,同一类别下的实体或多或少存在属性缺失的问题,然而属性“描述”作为描述实体概况的短文本,其内容缺失的情况相较其他属性出现频率较低。因此,从已有知识图谱中分别提取实体对的“描述”属性,并将其拼接在一起,构成实体对的属性信息。
步骤104:根据最短路径集合提取实体对的路径结构信息。
在一种实施方式中,根据最短路径集合提取实体对的路径结构信息,具体可以包括:
利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。
步骤104基于步骤1022所得实体对最短路径集合,首先利用路径编码模型将路径转换成低维度路径向量表示,再将所有路径的向量表示融合,构建两个实体的路径信息,具体包括:
步骤1042:三元组向量化。通过步骤1022获取了连接实体对<source,target>的三元组路径{<s1,r1,t1>,<s2,r2,t2>,…,<sm,rm,tm>},其中<si,ri,ti>表示路径中第i组三元组,其中si表示头实体,ti表示尾实体,ri表示连接两个实体的关系。并且ti-1=si,i=2,3,…,m。s1=source,tm=target,m为连接实体对最短路径长度。
经过步骤102得到了一组路径,每个路径x都包含若干三元组,每个三元组(source,relation,target)都包含两个实体和一个关系。将实体和关系映射在同一个d维空间中。实体表示与关系表示用同一个嵌入矩阵V的列向量表示,V∈Rd×(e+r),其中e为实体的总数,r为关系的总数。将两个实体的向量表示与关系的实体表示拼接起来,构成一个三元组的表示t,t∈R3d。最终将三元组路径转换乘一组向量序列x={t1,t2,...,tm}。之后利用GRU模型学习三元组路径的向量表示。
步骤1044:路径编码模型。循环神经网络是一种特殊的神经网络模型,它能在时间序列上共享参数,从而将相连的输入关联起来,因此在RNN非常适用与NLP问题。但是随着输入序列长度增加,RNN会产生梯度消失或梯度爆炸的问题。为了解决这个问题,有许多RNN的变种模型被提出了,其中就包括GRU模型。GRU模型包括重置门r,更新门z和一个记忆单元s,其计算方式如下列公式所示:
z=σ(tiUz+si-1Wz+bz)
r=σ(tiUr+si-1Wr+br)
其中ti是输入向量,其代表三元组t的表示向量,h是输出向量,z是更新门,r是重置门,Uz,Ur,Uh,Wz,Wr,Wh∈R3d×3d是权重矩阵,bz,br,bh是偏移,σ是sigmoid函数,°是Hadamard积,是两个矩阵各个元素的乘积。
门将步骤1042得到的向量序列x={t1,t2,...,tm}作为GRU的输入,选取最后的输出向量hm作为最终当前三元组路径的编码编码表示p,p=hm
步骤1046:构建路径结构信息。经过之前的步骤,将从source实体为起点,target实体为终点的路径进行编码,构成一个路径矩阵S∈R3d×m,矩阵S由之前GRU生成的路径编码[p1,p2,p2,...,pm]构成。由于路径集合中包含大量无效路径,因此采用注意力模型为每条路径pi赋予不同的权重αi,从而计算路径矩阵S的向量表示pr:
M=tanh(WsS)
α=softmax(wTM)
pr=SαT
其中,M∈R3d×m为路径矩阵的映射矩阵,α∈Rm为注意力模型的权重,pr∈R3d为加入注意力模型后的路径表示,Ws∈R3d×3d,w∈R3d为映射参数。
如此,得到了代表实体对最短路径信息的向量pr。
步骤106:根据实体的描述属性提取实体对的属性文本信息。
在另一种实施方式中,步骤106具体可以包括以下步骤:
使用GRU(Gated Recurrent Unit,门控循环单元)模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。
对于步骤106,基于步骤102所得实体对“描述”属性,首先利用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性信息。步骤106具体包括:
步骤1062:构建实体属性的低维度向量表示。对实体的“描述”属性文本进行切分词等操作,将文本转换成词序列,再将每个词通过词嵌入的方式转化成低维度向量,并利用GRU模型对其进行编码,得到实体“描述”属性的向量表示pde,pde∈Rd,其中d为词向量维度。
步骤1064:构建实体对的“描述”属性向量。对于三元组<source,relation,target>,本发明认为source向量+relation向量=target向量。而通过S31步骤已经获得了source向量与target向量,因此根据上述公式,实体对的“描述”属性向量pd:
pd=pdtarget-pdsource
其中pdsource与pdtarget分别为source实体与target实体的“描述”属性向量。
通过上面的公式得到了实体对的“描述”属性信息,结合步骤104得到的实体对路径结构信息就可以提取实体对之间的关系。
步骤108:根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。
在一种实施方式中,步骤108具体可以包括以下步骤:
将实体对的路径结构信息和实体对的属性文本信息结合,构建表示实体对信息的第一向量;
通过一个全连接层,将表示实体对信息的第一向量转换成一个维度等于关系类别数量的第二向量,再通过一层softmax层将第二向量转换成条件概率分布;
根据概率分布,选取概率值最大的关系类别作为实体对之间的关系。
对于步骤108,利用知识图谱路径结构信息与实体属性信息进行关系抽取。将步骤104获得的实体对的路径结构信息pr与步骤106获得的实体对属性文本信息pd相结合,构建表示实体对信息的向量pk=[pr,pd],pk∈R4d
通过一个全连接层,将pk转换成一个维度等于关系类别数量r的向量v。最后再通过一层softmax层将上述向量v转换成条件概率分布y。
y=softmax(Wopk+bo)
其中,Wo∈Rr×4d为全连接层的映射矩阵,bo∈Rr为全连接层的偏移向量。
最后根据关系的概率分布,选取概率值最大的关系类别作为实体对的预测关系。
综上,本申请提供了一种基于知识图谱的关系抽取模型。首先,通过结合双向广度优先搜索算法与深度优先搜索算法构建连接两个实体对的最短路径集合,其次根据最短路径集合提取实体对的路径结构信息,并综合实体对的“描述”属性信息,抽取实体对之间的关系。该发明使用的数据完全来自知识图谱,不需要外源语料集,不需要人工标注数据集,因此极大降低构建数据集的代价,提升关系抽取效率,适合大规模快速进行关系抽取。同时,对其他领域的图谱增强工作具有一定的借鉴意义。
实施例二:
如图2所示,本申请的基于知识图谱的关系抽取系统,其一种实施方式,包括基本信息提取模块、路径结构信息提取模块、属性文本信息提取模块和关系抽取模块。基本信息提取模块,用于从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;路径结构信息提取模块,用于根据最短路径集合提取实体对的路径结构信息;属性文本信息提取模块,用于根据实体的描述属性提取实体对的属性文本信息;关系抽取模块,根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。
在一种实施方式中,基本信息提取模块还可以用于将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。
本申请的路径结构信息提取模块,还可以用于利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。
在一种实施方式中,属性文本信息提取模块,还可以用于使用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。
本申请的关系抽取模块,还可以用于将所述实体对的路径结构信息和所述实体对的属性文本信息结合,构建表示实体对信息的第一向量;通过一个全连接层,将所述表示实体对信息的第一向量转换成一个维度等于关系类别数量的第二向量,再通过一层softmax层将所述第二向量转换成条件概率分布;根据所述概率分布,选取概率值最大的关系类别作为实体对之间的关系。
实施例三:
本申请提供一种计算机可读存储介质,包括程序,该程序能够被处理器执行以实现实施例一中的方法。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分步骤可以通过程序来指令相关硬件完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。

Claims (11)

1.一种基于知识图谱的关系抽取方法,其特征在于,包括:
从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;
根据所述最短路径集合提取实体对的路径结构信息;
根据所述实体的描述属性提取实体对的属性文本信息;
根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。
2.如权利要求1所述的方法,其特征在于,提取连接实体对的最短路径集合,具体包括:
将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。
3.如权利要求2所述的方法,其特征在于,所述根据所述最短路径集合提取实体对的路径结构信息,具体包括:
利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述实体的描述属性提取实体对的属性文本信息,具体包括:
使用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。
5.如权利要求4所述的方法,其特征在于,所述根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系,具体包括:
将所述实体对的路径结构信息和所述实体对的属性文本信息结合,构建表示实体对信息的第一向量;
通过一个全连接层,将所述表示实体对信息的第一向量转换成一个维度等于关系类别数量的第二向量,再通过一层softmax层将所述第二向量转换成条件概率分布;
根据所述概率分布,选取概率值最大的关系类别作为实体对之间的关系。
6.一种基于知识图谱的关系抽取系统,其特征在于,包括:
基本信息提取模块,用于从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;
路径结构信息提取模块,用于根据所述最短路径集合提取实体对的路径结构信息;
属性文本信息提取模块,用于根据所述实体的描述属性提取实体对的属性文本信息;
关系抽取模块,根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。
7.如权利要求6所述的系统,其特征在于,所述基本信息提取模块,还用于将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。
8.如权利要求7所述的系统,其特征在于,所述路径结构信息提取模块,还用于利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。
9.如权利要求8所述的系统,其特征在于,所述属性文本信息提取模块,还用于使用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。
10.如权利要求9所述的系统,其特征在于,所述关系抽取模块,还用于将所述实体对的路径结构信息和所述实体对的属性文本信息结合,构建表示实体对信息的第一向量;通过一个全连接层,将所述表示实体对信息的第一向量转换成一个维度等于关系类别数量的第二向量,再通过一层softmax层将所述第二向量转换成条件概率分布;根据所述概率分布,选取概率值最大的关系类别作为实体对之间的关系。
11.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-5任意一项所述的方法。
CN201711398108.0A 2017-12-21 2017-12-21 一种基于知识图谱的关系抽取方法和系统 Active CN108073711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711398108.0A CN108073711B (zh) 2017-12-21 2017-12-21 一种基于知识图谱的关系抽取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711398108.0A CN108073711B (zh) 2017-12-21 2017-12-21 一种基于知识图谱的关系抽取方法和系统

Publications (2)

Publication Number Publication Date
CN108073711A true CN108073711A (zh) 2018-05-25
CN108073711B CN108073711B (zh) 2022-01-11

Family

ID=62155343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711398108.0A Active CN108073711B (zh) 2017-12-21 2017-12-21 一种基于知识图谱的关系抽取方法和系统

Country Status (1)

Country Link
CN (1) CN108073711B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846299A (zh) * 2018-06-09 2018-11-20 海南大学 基于数据图谱,信息图谱和知识图谱的信息安全保护方法
CN108959472A (zh) * 2018-06-20 2018-12-07 桂林电子科技大学 基于多步关系路径的知识图谱表示学习方法
CN108984745A (zh) * 2018-07-16 2018-12-11 福州大学 一种融合多知识图谱的神经网络文本分类方法
CN109241291A (zh) * 2018-07-18 2019-01-18 华南师范大学 基于深度强化学习的知识图谱最优路径查询系统及其方法
CN109271478A (zh) * 2018-09-17 2019-01-25 华中科技大学 一种基于bfs森林的社交网络中的知识图谱数据布局方法
CN109492111A (zh) * 2018-09-19 2019-03-19 平安科技(深圳)有限公司 最短路径查询方法、系统、计算机设备和存储介质
CN109582800A (zh) * 2018-11-13 2019-04-05 北京合享智慧科技有限公司 一种训练结构化模型、文本结构化的方法及相关装置
CN110825890A (zh) * 2020-01-13 2020-02-21 成都四方伟业软件股份有限公司 一种预训练模型知识图谱实体关系抽取方法及装置
CN111160841A (zh) * 2019-11-29 2020-05-15 广东轩辕网络科技股份有限公司 一种基于知识图谱的组织架构构建方法及装置
CN111177282A (zh) * 2019-12-30 2020-05-19 福州大学 一种融入注意力机制的预测方法
CN111401055A (zh) * 2020-04-07 2020-07-10 宁波深擎信息科技有限公司 从金融资讯提取脉络信息的方法和装置
CN111428009A (zh) * 2020-06-12 2020-07-17 太平金融科技服务(上海)有限公司 关系查询方法、装置、计算机设备和存储介质
CN111488741A (zh) * 2020-04-14 2020-08-04 税友软件集团股份有限公司 一种税收知识数据语义标注方法及相关装置
CN111597341A (zh) * 2020-05-22 2020-08-28 北京慧闻科技(集团)有限公司 一种文档级关系抽取方法、装置、设备及存储介质
CN111625659A (zh) * 2020-08-03 2020-09-04 腾讯科技(深圳)有限公司 知识图谱处理方法、装置、服务器及存储介质
CN111694967A (zh) * 2020-06-11 2020-09-22 腾讯科技(深圳)有限公司 属性抽取方法、装置、电子设备及介质
CN111813950A (zh) * 2020-05-20 2020-10-23 淮阴工学院 一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法
CN111814480A (zh) * 2020-07-21 2020-10-23 润联软件系统(深圳)有限公司 一种知识图谱补全方法、装置、计算机设备和存储介质
CN111949764A (zh) * 2020-08-18 2020-11-17 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN112035672A (zh) * 2020-07-23 2020-12-04 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN112069249A (zh) * 2020-10-14 2020-12-11 中国平安人寿保险股份有限公司 知识图谱关系挖掘方法、装置、计算机设备及存储介质
WO2021007159A1 (en) * 2019-07-05 2021-01-14 Google Llc Identifying entity attribute relations
US20210089580A1 (en) * 2019-09-24 2021-03-25 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for querying shortest path of graph, and storage medium
CN113222771A (zh) * 2020-07-10 2021-08-06 杭州海康威视数字技术股份有限公司 一种基于知识图谱确定目标群体的方法、装置及电子设备
CN113761212A (zh) * 2020-06-01 2021-12-07 中国石油化工股份有限公司 基于管道完整性的知识图谱构建方法及装置
CN113779260A (zh) * 2021-08-12 2021-12-10 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN117194459A (zh) * 2023-09-22 2023-12-08 天翼爱音乐文化科技有限公司 基于运维事件的运维知识库更新方法、系统、装置与介质
US11922121B2 (en) 2020-01-21 2024-03-05 Boe Technology Group Co., Ltd. Method and apparatus for information extraction, electronic device, and storage medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824115A (zh) * 2014-02-28 2014-05-28 中国科学院计算技术研究所 面向开放网络知识库的实体间关系推断方法及系统
CN106528863A (zh) * 2016-11-29 2017-03-22 中国国防科技信息中心 一种crf识别器的训练及技术及其属性名关系对抽取方法
CN106874378A (zh) * 2017-01-05 2017-06-20 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN106909622A (zh) * 2017-01-20 2017-06-30 中国科学院计算技术研究所 知识图谱向量表示方法、知识图谱关系推理方法及系统
CN106909882A (zh) * 2017-01-16 2017-06-30 广东工业大学 一种应用于保安机器人的人脸识别系统及方法
CN107180247A (zh) * 2017-05-19 2017-09-19 中国人民解放军国防科学技术大学 基于选择性注意力卷积神经网络的关系分类器及其方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824115A (zh) * 2014-02-28 2014-05-28 中国科学院计算技术研究所 面向开放网络知识库的实体间关系推断方法及系统
CN106528863A (zh) * 2016-11-29 2017-03-22 中国国防科技信息中心 一种crf识别器的训练及技术及其属性名关系对抽取方法
CN106874378A (zh) * 2017-01-05 2017-06-20 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN106909882A (zh) * 2017-01-16 2017-06-30 广东工业大学 一种应用于保安机器人的人脸识别系统及方法
CN106909622A (zh) * 2017-01-20 2017-06-30 中国科学院计算技术研究所 知识图谱向量表示方法、知识图谱关系推理方法及系统
CN107180247A (zh) * 2017-05-19 2017-09-19 中国人民解放军国防科学技术大学 基于选择性注意力卷积神经网络的关系分类器及其方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846299A (zh) * 2018-06-09 2018-11-20 海南大学 基于数据图谱,信息图谱和知识图谱的信息安全保护方法
CN108959472A (zh) * 2018-06-20 2018-12-07 桂林电子科技大学 基于多步关系路径的知识图谱表示学习方法
CN108959472B (zh) * 2018-06-20 2021-11-19 桂林电子科技大学 基于多步关系路径的知识图谱表示学习方法
CN108984745A (zh) * 2018-07-16 2018-12-11 福州大学 一种融合多知识图谱的神经网络文本分类方法
CN108984745B (zh) * 2018-07-16 2021-11-02 福州大学 一种融合多知识图谱的神经网络文本分类方法
CN109241291A (zh) * 2018-07-18 2019-01-18 华南师范大学 基于深度强化学习的知识图谱最优路径查询系统及其方法
CN109241291B (zh) * 2018-07-18 2022-02-15 华南师范大学 基于深度强化学习的知识图谱最优路径查询系统及其方法
CN109271478A (zh) * 2018-09-17 2019-01-25 华中科技大学 一种基于bfs森林的社交网络中的知识图谱数据布局方法
CN109271478B (zh) * 2018-09-17 2021-07-27 华中科技大学 一种基于bfs森林的社交网络中的知识图谱数据布局方法
CN109492111A (zh) * 2018-09-19 2019-03-19 平安科技(深圳)有限公司 最短路径查询方法、系统、计算机设备和存储介质
CN109582800A (zh) * 2018-11-13 2019-04-05 北京合享智慧科技有限公司 一种训练结构化模型、文本结构化的方法及相关装置
US11263400B2 (en) 2019-07-05 2022-03-01 Google Llc Identifying entity attribute relations
WO2021007159A1 (en) * 2019-07-05 2021-01-14 Google Llc Identifying entity attribute relations
US11657091B2 (en) * 2019-09-24 2023-05-23 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for querying shortest path of graph, and storage medium
US20210089580A1 (en) * 2019-09-24 2021-03-25 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for querying shortest path of graph, and storage medium
CN111160841A (zh) * 2019-11-29 2020-05-15 广东轩辕网络科技股份有限公司 一种基于知识图谱的组织架构构建方法及装置
CN111177282A (zh) * 2019-12-30 2020-05-19 福州大学 一种融入注意力机制的预测方法
CN110825890A (zh) * 2020-01-13 2020-02-21 成都四方伟业软件股份有限公司 一种预训练模型知识图谱实体关系抽取方法及装置
US11922121B2 (en) 2020-01-21 2024-03-05 Boe Technology Group Co., Ltd. Method and apparatus for information extraction, electronic device, and storage medium
CN111401055B (zh) * 2020-04-07 2023-04-18 宁波深擎信息科技有限公司 从金融资讯提取脉络信息的方法和装置
CN111401055A (zh) * 2020-04-07 2020-07-10 宁波深擎信息科技有限公司 从金融资讯提取脉络信息的方法和装置
CN111488741A (zh) * 2020-04-14 2020-08-04 税友软件集团股份有限公司 一种税收知识数据语义标注方法及相关装置
CN111813950B (zh) * 2020-05-20 2024-02-27 淮阴工学院 一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法
CN111813950A (zh) * 2020-05-20 2020-10-23 淮阴工学院 一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法
CN111597341B (zh) * 2020-05-22 2024-01-26 北京慧闻科技(集团)有限公司 一种文档级关系抽取方法、装置、设备及存储介质
CN111597341A (zh) * 2020-05-22 2020-08-28 北京慧闻科技(集团)有限公司 一种文档级关系抽取方法、装置、设备及存储介质
CN113761212A (zh) * 2020-06-01 2021-12-07 中国石油化工股份有限公司 基于管道完整性的知识图谱构建方法及装置
CN113761212B (zh) * 2020-06-01 2024-03-08 中国石油化工股份有限公司 基于管道完整性的知识图谱构建方法及装置
CN111694967B (zh) * 2020-06-11 2023-10-20 腾讯科技(深圳)有限公司 属性抽取方法、装置、电子设备及介质
CN111694967A (zh) * 2020-06-11 2020-09-22 腾讯科技(深圳)有限公司 属性抽取方法、装置、电子设备及介质
CN111428009A (zh) * 2020-06-12 2020-07-17 太平金融科技服务(上海)有限公司 关系查询方法、装置、计算机设备和存储介质
CN113222771B (zh) * 2020-07-10 2023-10-20 杭州海康威视数字技术股份有限公司 一种基于知识图谱确定目标群体的方法、装置及电子设备
CN113222771A (zh) * 2020-07-10 2021-08-06 杭州海康威视数字技术股份有限公司 一种基于知识图谱确定目标群体的方法、装置及电子设备
CN111814480A (zh) * 2020-07-21 2020-10-23 润联软件系统(深圳)有限公司 一种知识图谱补全方法、装置、计算机设备和存储介质
CN111814480B (zh) * 2020-07-21 2024-04-16 华润数字科技有限公司 一种知识图谱补全方法、装置、计算机设备和存储介质
CN112035672B (zh) * 2020-07-23 2023-05-09 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN112035672A (zh) * 2020-07-23 2020-12-04 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN111625659A (zh) * 2020-08-03 2020-09-04 腾讯科技(深圳)有限公司 知识图谱处理方法、装置、服务器及存储介质
CN111625659B (zh) * 2020-08-03 2020-11-13 腾讯科技(深圳)有限公司 知识图谱处理方法、装置、服务器及存储介质
CN111949764B (zh) * 2020-08-18 2021-06-29 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN111949764A (zh) * 2020-08-18 2020-11-17 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN112069249A (zh) * 2020-10-14 2020-12-11 中国平安人寿保险股份有限公司 知识图谱关系挖掘方法、装置、计算机设备及存储介质
CN113779260B (zh) * 2021-08-12 2023-07-18 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN113779260A (zh) * 2021-08-12 2021-12-10 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN117194459A (zh) * 2023-09-22 2023-12-08 天翼爱音乐文化科技有限公司 基于运维事件的运维知识库更新方法、系统、装置与介质
CN117194459B (zh) * 2023-09-22 2024-05-10 天翼爱音乐文化科技有限公司 基于运维事件的运维知识库更新方法、系统、装置与介质

Also Published As

Publication number Publication date
CN108073711B (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
CN108073711A (zh) 一种基于知识图谱的关系抽取方法和系统
CN108009285B (zh) 基于自然语言处理的林业生态环境人机交互方法
CN111651557B (zh) 一种自动化文本生成方法、装置及计算机可读存储介质
CN111859912B (zh) 基于pcnn模型的带有实体感知的远程监督关系抽取方法
CN110534087A (zh) 一种文本韵律层级结构预测方法、装置、设备及存储介质
WO2022057669A1 (zh) 基于结构化上下文信息的知识图谱预训练方法
CN108133038A (zh) 一种基于动态记忆网络的实体级别情感分类系统及方法
CN111753024B (zh) 一种面向公共安全领域的多源异构数据实体对齐方法
CN107180247A (zh) 基于选择性注意力卷积神经网络的关系分类器及其方法
CN106776540A (zh) 一种自由化文本生成方法
CN110197284A (zh) 一种虚假地址识别方法、装置及设备
CN112765370B (zh) 知识图谱的实体对齐方法、装置、计算机设备和存储介质
CN113268612B (zh) 基于均值融合的异构信息网知识图谱补全方法和装置
CN110765755A (zh) 一种基于双重选择门的语义相似度特征提取方法
CN107194422A (zh) 一种结合正反向实例的卷积神经网络关系分类方法
CN113780002A (zh) 基于图表示学习和深度强化学习的知识推理方法及装置
CN107679225A (zh) 一种基于关键词的回复生成方法
CN114820871A (zh) 字体生成方法、模型的训练方法、装置、设备和介质
CN108920446A (zh) 一种工程文本的处理方法
CN114841151B (zh) 基于分解-重组策略的医学文本实体关系联合抽取方法
CN114238524B (zh) 基于增强样本模型的卫星频轨数据信息抽取方法
CN114282001A (zh) 基于文本的任务处理方法、装置、计算机设备及存储介质
CN113568901B (zh) 一种数据处理方法、装置及存储介质
CN112598065B (zh) 一种基于记忆的门控卷积神经网络语义处理系统及方法
CN113486180A (zh) 一种基于关系层级交互的远程监督关系抽取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant