CN109902145B - 一种基于注意力机制的实体关系联合抽取方法和系统 - Google Patents

一种基于注意力机制的实体关系联合抽取方法和系统 Download PDF

Info

Publication number
CN109902145B
CN109902145B CN201910048837.6A CN201910048837A CN109902145B CN 109902145 B CN109902145 B CN 109902145B CN 201910048837 A CN201910048837 A CN 201910048837A CN 109902145 B CN109902145 B CN 109902145B
Authority
CN
China
Prior art keywords
word
entity
vector
label
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910048837.6A
Other languages
English (en)
Other versions
CN109902145A (zh
Inventor
虎嵩林
周艳
黄龙涛
韩冀中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201910048837.6A priority Critical patent/CN109902145B/zh
Publication of CN109902145A publication Critical patent/CN109902145A/zh
Application granted granted Critical
Publication of CN109902145B publication Critical patent/CN109902145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种基于注意力机制的实体关系联合抽取方法和系统。该方法的步骤包括:将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。该系统包括预处理模块、模型训练模块和结果处理模块。本发明通过更有效的利用句子中的关键信息,提升了关系实体联合抽取的性能,具有良好的实用性。

Description

一种基于注意力机制的实体关系联合抽取方法和系统
技术领域
本发明涉及深度学习与自然语言处理技术,具体涉及一种基于注意力机制的实体关系联合抽取方法和系统。
背景技术
近年来,互联网信息技术高速发展,新闻、社交等网站每天有海量的新数据产生出来。这些数据中包含着各种各样的内容,其中有很多十分有价值的信息,这些信息对人们的生活起着至关重要的作用。为了抽取并有效使用这些有价值的信息,提出了知识图谱的概念。在知识图谱中把海量数据中的人名、地名等专用名词表示为实体,并且将任意两个实体之间的联系表示为关系。这样海量的数据即被表示为实体和关系的三元组(实体1,关系,实体2)。虽然现有的知识图谱已经包含数亿计的数据,但是网络上的信息每天不断增加,知识图谱中的信息也需要随之进行完善。
为了自动化的对知识图谱进行完善,人们进行了多方面的技术研究,实体关系抽取技术就是其中一种。实体关系抽取主要任务是识别出文本中的实体并确定实体之间存在的语义关系。利用实体关系抽取可以把非结构化的文本转化为结构化的文本,帮助人们更快速便捷的找到所需信息。
目前,实体关系抽取根据抽取方式分为两种类型:流水线式和联合抽取方式。流水线式的实体关系抽取需要先进行实体识别任务,然后根据识别出来的实体,对任意两个实体之间的关系进行分类。这种方式可能没有考虑实体和关系之间的联系,并且实体识别结果的正确与否会直接影响到关系分类的结果。联合抽取方式可以充分利用实体和关系之间的联系,能够取得更好的抽取效果。近期提出的基于序列标注的方式进行实体关系联合抽取可以更好的利用实体和关系的相互关联。虽然这类方法采用了神经网络进行标签序列的预测,但是并未对句子的词,对当前被预测词的重要程度进行区分,这样也就无法更好的利用有关联词的信息同时忽略无关词的信息。
发明内容
针对上述技术问题,本发明提出一种基于注意力机制的神经网络结构,来充分利用整个输入句子中的关键信息,提高实体关系抽取的性能。
为了解决上述技术问题,本发明的技术方案如下:
一种基于注意力机制的实体关系联合抽取方法,包括如下步骤:
将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;
将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;
将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。
进一步地,每个所述标签包含三类信息:词在实体中的位置,实体所在的三元组对应的关系类型,实体在三元组中的位置,即属于第一个还是第二个实体。
进一步地,所述词在实体中的位置按照BIES的模式进行表示;所述关系类型为预定义的关系类型中的一种;所述实体在三元组中的位置用1或者2来表示,其中1表示三元组中第一个实体,2表示三元组中第二个实体;用标签O表示词不属于任何三元组。
进一步地,通过爬取大量的非标注语料,训练得到具有语义信息的词向量表示,用于将输入所述基于注意力机制的神经网络模型的句子中的每个词映射成对应的词向量。
进一步地,所述基于注意力机制的神经网络模型的训练过程包括:
1)将输入句子中的每个词映射成对应的词向量;
2)在编码层,把句子中每个词对应的词向量作为输入,采用双向长短记忆神经网络Bi-LSTM学习句子中每个词的上下文信息;
3)在注意力层,利用注意力机制学习对每个词的标签起关键作用的词表示,并将其和编码层学习到的上下文信息表示进行合并,得到每个词对应的有效向量表示dt
4)在解码层,对于输入的第t个词,将有效向量表示dt作为输入,利用长短记忆网络的链式网络,计算每个标签的向量表示Tt;所述长短记忆网络把第t个词的标签的表示向量作为下一个词预测的输入之一,学习到序列标签之间的依赖关系;
5)根据得到的标签的向量表示进行计算,得到每个词的对应到各类标签的概率;
6)选取所有样本的最大似然函数作为模型的目标函数;
7)通过反向传播算法训练模型,更新模型中所有的参数,最终得到标签的预测模型。
一种基于注意力机制的实体关系联合抽取系统,其包括:
预处理模块,负责将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;
模型训练模块,负责将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;
结果处理模块,负责将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。
本发明的有益效果在于:针对基于标签的实体关系联合抽取中,不能合理利用输入句子中关键信息的问题,提出了利用注意力机制来更好的学习这些特征,具体为:对于利用循环神经网络学习到的上下文信息,采用基于标签的注意力机制计算关键信息的向量表示,同时模型可学习这些关键信息向量和词上下文向量的权重,进行自动融合。这样,本发明通过更有效的利用句子中的关键信息,提升了关系实体联合抽取的性能,具有良好的实用性。
附图说明
图1为本发明实施例提供的基于注意力机制的实体关系联合抽取方法流程图;
图2为本发明实施例的神经网络模型结构图;
图3为本实施注意力机制学习词的有效向量表示的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面通过具体实施案例并结合附图,对本发明做进一步详细说明。
图1为本实施例中基于注意力机制的实体关系联合抽取方法的流程图,如图所示,该方法主要包括三个阶段,分别是:数据预处理阶段,基于注意力机制网络模型训练阶段,对预测得到的标签序列进行匹配获取到关系实体三元组阶段。
(一)数据预处理阶段
步骤1根据标注语料中给出的三元组信息,转化为标签序列。每个标签包含三类信息:词在实体中的位置,实体所在的三元组对应的关系类型,实体在三元组中属于第一个还是第二个实体。词在实体中的位置按照”BIES”(Begin,Inside,End,Single)的模式进行表示。实体关系的类型即为预定义好的关系类型中的一种,实体在三元组中的位置用1或者2来表示,其中1表示三元组中第一个实体,2表示三元组中第二个实体。另外用标签O表示词不属于任何三元组。比如句子“北京是中国的首都。”,这个句子中存在实体关系三元组(北京,国家首都,中国),其对应的标注语料结果为”北(B-NA-1)京(E-NA-1)是(O)中(B-NA-2)国(E-NA-2)的(O)首(O)都(O)”,其中NA表示国家首都(national capital)的缩写。
步骤2,用无标注的语料,通过word2vec训练得到具有语义信息的词向量表示,提供给模型使用。
(二)模型训练阶段
结合图2,基于注意力机制的实体关系联合抽取模型包括以下具体步骤:
步骤1,利用通过word2vec训练得到的词向量表示,将输入句子中的每个词映射成对应的词向量,输入句子长度统一为max_len,对于长度小于max_len的句子用填充字符进行补充,大于max_len的句子则进行截断;
步骤2,在编码层,把句子中每个词对应的词向量作为输入,采用双向长短记忆神经网络(Bi-LSTM)学习输入句子中每个词的上下文信息,其中第j个词的上下文表示为hj
步骤3,在注意力层,利用注意力机制,学习对每个词的标签起关键作用的词表示,并把这类信息的表示和编码层学习到的上下文信息表示进行合并,得到对标签预测更有效的向量表示方式。结合图3所示,其具体过程描述如下:
步骤3-1,计算句子中的词和当前被预测词相关性的权重,计算公式为:
Figure BDA0001950081090000041
其中hj表示从编码层得到的第j个词的向量表示,Tt-1表示第t-1个词的标签的向量表示,n表示句子的长度;
步骤3-2,上式计算出来的αj,t代表句子中第j个词和被预测的第t个词的相关程度,把这些权重和这些词对应的向量表示相乘并进行加权,即可得到与预测标签相关的词的向量表示,简称“标签相关词表示”:
Figure BDA0001950081090000042
步骤3-3利用门控机制对上面获取到的词的上下文信息表示和标签相关词表示进行融合,首先计算这两类表示各自占有的权重,计算公式为:
Figure BDA0001950081090000043
其中σ表示逻辑函数,
Figure BDA0001950081090000044
表示权重矩阵。
然后,把上式计算出来的权重和这两类表示进行加权,得到包含词的上下文信息和关键词信息的表示向量:
dt=gthat+(1-gt)ht
这样通过上面3步,得到每个词对应有效向量表示dt
步骤4,在解码层,对于输入的第t个词,把上面步骤中得到的词的信息表示向量dt作为输入,利用长短记忆网络的链式网络,计算每个标签的向量表示Tt,这个网络把第t个词的标签的表示向量作为下一个词预测的输入之一,可以学习到序列标签之间的依赖关系。
步骤5,根据上面得到的被预测词对应标签的向量表示Tt进行计算,得到每个词的对应到各类标签的概率:
yt=WyTt+by
Figure BDA0001950081090000051
其中,yt为第t个词对应到各类标签的向量表示,Wy为为权重矩阵,by为偏移向量,
Figure BDA0001950081090000052
为第t个词对应到第i类标签的概率分布,
Figure BDA0001950081090000053
为第t个词对应的第i类标签的向量表示,
Figure BDA0001950081090000054
为第t个词对应的第k类标签的向量表示,Nt表示标签的种类数目。
步骤6,对所有训练样本,通过最大化样本的最大似然函数来训练模型,更新模型中的参数,训练的目标函数L定义如下:
Figure BDA0001950081090000055
Figure BDA0001950081090000056
其中I(O)是一个切换函数,用来区分关系类型标签和其他类型标签,α则是用来区分这两类标签在计算目标函数的时候的权重,|D|表示训练语料总的数目,Lm表示第m条语料句子的长度,
Figure BDA0001950081090000057
表示第m个句子中第t个词对应到真实标签的概率值,xm表示第m条训练语料,θ表示模型中的所有参数。
步骤7,通过反向传播算法训练模型,更新模型中所有的参数,并最终得到标签的预测模型。
(三)结果处理阶段
步骤1,把需要进行关系实体抽取的句子,输入到上面得到的标签预测模型中,预测出每个词对应的标签;
步骤2,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组,图2中所示实例如果作为测试数据输入到模型中,模型给出预测标签后,抽取出句中的实体关系三元组为(北京,国家首都,中国),这样就完成了标签到三元组的转化,实现了实体关系联合抽取。
由上述方案可以看出,本方案针对实体关系联合抽取模型中,对整个句子中关键信息利用不足的问题,引入注意力机制进行信息融合和改进,可以提高模型预测的性能,具有良好的实用性。
本发明另一实施例提供一种基于注意力机制的实体关系联合抽取系统,其包括:
预处理模块,负责将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;
模型训练模块,负责将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;
结果处理模块,负责将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。
本发明中,编码层和解码层的Bi-LSTM网络可以替换为其他的循环网络结构,如RNN,GRU等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明构思的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明保护范围内。

Claims (9)

1.一种基于注意力机制的实体关系联合抽取方法,其特征在于,包括以下步骤:
将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;
将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;
将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组;
所述基于注意力机制的神经网络模型的训练过程包括:
1)将输入句子中的每个词映射成对应的词向量;
2)在编码层,把句子中每个词对应的词向量作为输入,采用双向长短记忆神经网络Bi-LSTM学习句子中每个词的上下文信息;
3)在注意力层,利用注意力机制学习对每个词的标签起关键作用的词表示,并将其和编码层学习到的上下文信息表示进行合并,得到每个词对应的有效向量表示dt
4)在解码层,对于输入的第t个词,将有效向量表示dt作为输入,利用长短记忆网络的链式网络,计算每个标签的向量表示Tt;所述长短记忆网络把第t个词的标签的表示向量作为下一个词预测的输入之一,学习到序列标签之间的依赖关系;
5)根据得到的标签的向量表示进行计算,得到每个词的对应到各类标签的概率;
6)选取所有样本的最大似然函数作为模型的目标函数;
7)通过反向传播算法训练模型,更新模型中所有的参数,最终得到标签的预测模型。
2.根据权利要求1所述的方法,其特征在于,每个所述标签包含三类信息:词在实体中的位置,实体所在的三元组对应的关系类型,实体在三元组中的位置,即属于第一个还是第二个实体。
3.根据权利要求2所述的方法,其特征在于,所述词在实体中的位置按照BIES的模式进行表示;所述关系类型为预定义的关系类型中的一种;所述实体在三元组中的位置用1或者2来表示,其中1表示三元组中第一个实体,2表示三元组中第二个实体;用标签O表示词不属于任何三元组。
4.根据权利要求1所述的方法,其特征在于,通过爬取大量的非标注语料,训练得到具有语义信息的词向量表示,用于将输入所述基于注意力机制的神经网络模型的句子中的每个词映射成对应的词向量。
5.根据权利要求1所述的方法,其特征在于,步骤3)包括:
3-1)计算句子中的词和当前被预测词相关性的权重,计算公式为:
Figure FDA0002887555050000021
其中hj表示从编码层得到的第j个词的向量表示,hk表示从编码层得到的第k个词的向量表示,Tt-1表示第t-1个词的标签的向量表示,n表示句子的长度;αj,t代表句子中第j个词和被预测的第t个词的相关程度;
3-2)将αj,t和词对应的向量表示相乘并进行加权,得到标签相关词表示:
Figure FDA0002887555050000022
3-3)利用门控机制把词的上下文信息表示和标签相关词表示进行融合,得到每个词对应的有效向量表示dt
6.根据权利要求5所述的方法,其特征在于,步骤3-3包括:
3-3-1)计算上下文信息表示和标签相关词表示各自占有的权重,计算公式为:
Figure FDA0002887555050000023
其中σ表示逻辑函数,
Figure FDA0002887555050000024
表示权重矩阵,其中ht表示从编码层得到的第t个词的向量表示;
3-3-2)把计算出来的权重和这两类表示进行加权,得到包含词的上下文信息和关键词信息的表示向量,即每个词对应的有效向量表示:dt=gthat+(1-gt)ht
7.根据权利要求1所述的方法,其特征在于,步骤5)所述每个词的对应到各类标签的概率为:
yt=WyTt+by
Figure FDA0002887555050000025
其中,yt为第t个词对应到各类标签的向量表示,Wy为为权重矩阵,Tt表示第t个词的标签的向量表示,by为偏移向量,
Figure FDA0002887555050000026
为第t个词对应到第i类标签的概率分布,
Figure FDA0002887555050000027
为第t个词对应的第i类标签的向量表示,
Figure FDA0002887555050000028
为第t个词对应的第k类标签的向量表示,Nt表示标签的种类数目。
8.根据权利要求1所述的方法,其特征在于,步骤6)对模型进行训练的目标函数L定义如下:
Figure FDA0002887555050000031
Figure FDA0002887555050000032
其中,I(O)是一个切换函数,用来区分关系类型标签和其他类型标签,α则是用来区分这两类标签在计算目标函数的时候的权重,D表示训练语料总的数目,Lm表示第m条语料句子的长度,
Figure FDA0002887555050000033
表示第m个句子中第t个词对应到真实标签的概率值,xm表示第m条训练语料,θ表示模型中的所有参数。
9.一种采用权利要求1~8中任一权利要求所述方法的基于注意力机制的实体关系联合抽取系统,其特征在于,包括:
预处理模块,负责将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;
模型训练模块,负责将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;
结果处理模块,负责将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。
CN201910048837.6A 2019-01-18 2019-01-18 一种基于注意力机制的实体关系联合抽取方法和系统 Active CN109902145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910048837.6A CN109902145B (zh) 2019-01-18 2019-01-18 一种基于注意力机制的实体关系联合抽取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910048837.6A CN109902145B (zh) 2019-01-18 2019-01-18 一种基于注意力机制的实体关系联合抽取方法和系统

Publications (2)

Publication Number Publication Date
CN109902145A CN109902145A (zh) 2019-06-18
CN109902145B true CN109902145B (zh) 2021-04-20

Family

ID=66943818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910048837.6A Active CN109902145B (zh) 2019-01-18 2019-01-18 一种基于注意力机制的实体关系联合抽取方法和系统

Country Status (1)

Country Link
CN (1) CN109902145B (zh)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222349B (zh) * 2019-06-13 2020-05-19 成都信息工程大学 一种深度动态上下文词语表示的方法及计算机
CN110275928B (zh) * 2019-06-24 2022-11-22 复旦大学 迭代式实体关系抽取方法
CN110597948A (zh) * 2019-07-11 2019-12-20 东华大学 一种基于深度学习的实体关系抽取方法
CN110413999B (zh) * 2019-07-17 2020-10-16 新华三大数据技术有限公司 实体关系抽取方法、模型训练方法及相关装置
CN110442693B (zh) * 2019-07-27 2022-02-22 中国科学院自动化研究所 基于人工智能的回复消息生成方法、装置、服务器及介质
CN110390109B (zh) * 2019-07-29 2023-06-30 创新先进技术有限公司 分析多条群聊消息间关联关系的方法和装置
CN110502749B (zh) * 2019-08-02 2023-10-03 中国电子科技集团公司第二十八研究所 一种基于双层注意力机制与双向gru的文本关系抽取方法
CN110472642B (zh) * 2019-08-19 2022-02-01 齐鲁工业大学 基于多级注意力的细粒度图像描述方法及系统
CN110705299B (zh) * 2019-09-26 2022-10-25 北京明略软件系统有限公司 实体和关系的联合抽取方法、模型、电子设备及存储介质
CN110795569B (zh) * 2019-10-08 2021-06-15 北京百度网讯科技有限公司 知识图谱的向量表示生成方法、装置及设备
CN110807069B (zh) * 2019-10-23 2022-06-07 华侨大学 一种基于强化学习算法的实体关系联合抽取模型构建方法
CN110807070A (zh) * 2019-10-25 2020-02-18 普强信息技术(北京)有限公司 一种基于神经网络的路况信息提取方法
CN111008276B (zh) * 2019-10-29 2023-04-18 云知声智能科技股份有限公司 一种完整实体关系抽取方法及装置
CN111079431A (zh) * 2019-10-31 2020-04-28 北京航天云路有限公司 一种基于迁移学习的实体关系联合抽取方法
CN110889276B (zh) * 2019-11-07 2023-04-25 广东工业大学 复数融合特征提取指针式抽取三元组信息的方法、系统及计算机介质
CN111090724B (zh) * 2019-11-21 2023-05-12 新华智云科技有限公司 一种基于深度学习的可评判文本内容与实体相关性的实体抽取方法
CN111008279B (zh) * 2019-11-27 2023-11-14 云知声智能科技股份有限公司 一种实体关系抽取方法及装置
CN111046670B (zh) * 2019-12-09 2023-04-18 大连理工大学 基于毒品案件法律文书的实体及关系联合抽取方法
CN111026869B (zh) * 2019-12-10 2020-08-18 山东大学 一种利用基于多层注意力的序列生成网络进行多罪名预测的方法
CN111125364B (zh) * 2019-12-24 2023-04-25 华南理工大学 一种基于ernie的远程监督关系抽取的降噪方法
CN111160035B (zh) * 2019-12-31 2023-06-20 北京明朝万达科技股份有限公司 文本语料的处理方法和装置
CN111143691B (zh) * 2019-12-31 2023-04-18 四川长虹电器股份有限公司 一种联合信息抽取方法及装置
CN111581326B (zh) * 2020-03-30 2022-05-31 中国科学院信息工程研究所 一种基于异构外部知识源图结构抽取答案信息的方法
CN111539211A (zh) * 2020-04-17 2020-08-14 中移(杭州)信息技术有限公司 实体及语义关系识别方法、装置、电子设备及存储介质
CN111597804B (zh) * 2020-05-15 2023-03-10 腾讯科技(深圳)有限公司 一种实体识别模型训练的方法以及相关装置
CN111476023B (zh) * 2020-05-22 2023-09-01 北京明朝万达科技股份有限公司 识别实体关系的方法及装置
CN111666427B (zh) * 2020-06-12 2023-05-12 长沙理工大学 一种实体关系联合抽取方法、装置、设备及介质
CN111767409B (zh) * 2020-06-14 2022-08-30 南开大学 一种基于多头自注意力机制的实体关系抽取方法
CN111967258B (zh) * 2020-07-13 2023-07-21 中国科学院计算技术研究所 一种构建共指消解模型的方法、共指消解的方法和介质
CN112069818A (zh) * 2020-08-06 2020-12-11 北京捷通华声科技股份有限公司 三元组预测模型生成方法、关系三元组提取方法和装置
CN111967242B (zh) * 2020-08-17 2024-05-03 支付宝(杭州)信息技术有限公司 一种文本信息的抽取方法、装置及设备
CN112214966A (zh) * 2020-09-04 2021-01-12 拓尔思信息技术股份有限公司 基于深度神经网络的实体及关系联合抽取方法
CN112100384B (zh) * 2020-11-10 2021-02-02 北京智慧星光信息技术有限公司 一种数据观点抽取方法、装置、设备及存储介质
CN112800756B (zh) * 2020-11-25 2022-05-10 重庆邮电大学 一种基于prado的实体识别方法
CN114625871B (zh) * 2020-12-14 2023-06-23 四川大学 一种基于注意力位置联合编码的三元组分类方法
CN113051891B (zh) * 2021-01-13 2022-11-18 东南大学 一种面向机场应急预案文本的实体与关系联合抽取方法
CN112818683A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于触发词规则和Attention-BiLSTM的中文人物关系提取方法
CN113158671B (zh) * 2021-03-25 2023-08-11 胡明昊 一种结合命名实体识别的开放域信息抽取方法
CN113076421B (zh) * 2021-04-02 2023-03-28 西安交通大学 一种社交噪音文本实体关系抽取优化方法及系统
CN113011191B (zh) * 2021-04-28 2024-04-16 广东工业大学 一种知识联合抽取模型训练方法
CN113342929A (zh) * 2021-05-07 2021-09-03 上海大学 一种面向材料领域的材料-组分-工艺-性能关系四元组抽取方法
CN113221571B (zh) * 2021-05-31 2022-07-01 重庆交通大学 基于实体相关注意力机制的实体关系联合抽取方法
CN113377908B (zh) * 2021-06-08 2022-06-28 四川大学 基于可学习多单词对打分器的方面级情感三元组抽取方法
CN113326698B (zh) * 2021-06-18 2023-05-09 深圳前海微众银行股份有限公司 检测实体关系的方法、模型训练方法及电子设备
CN113221539B (zh) * 2021-07-08 2021-09-24 华东交通大学 一种集成句法信息的嵌套命名实体识别方法与系统
CN113779260B (zh) * 2021-08-12 2023-07-18 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN113806514B (zh) * 2021-09-18 2024-03-01 上海交通大学 基于Transformer模型的实体关系抽取方法和系统
CN114004230B (zh) * 2021-09-23 2022-07-05 杭萧钢构股份有限公司 一种生产钢结构的工控调度方法和系统
CN113901151B (zh) * 2021-09-30 2023-07-04 北京有竹居网络技术有限公司 用于关系抽取的方法、装置、设备和介质
CN114218963A (zh) * 2022-02-22 2022-03-22 子长科技(北京)有限公司 文本信息处理方法、装置、电子设备及介质
CN114757179A (zh) * 2022-04-13 2022-07-15 成都信息工程大学 一种实体关系联合抽取方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304911A (zh) * 2018-01-09 2018-07-20 中国科学院自动化研究所 基于记忆神经网络的知识抽取方法以及系统和设备
CN108733792A (zh) * 2018-05-14 2018-11-02 北京大学深圳研究生院 一种实体关系抽取方法
CN108763353A (zh) * 2018-05-14 2018-11-06 中山大学 基于规则和远程监督的百度百科关系三元组抽取方法
CN108897857A (zh) * 2018-06-28 2018-11-27 东华大学 面向领域的中文文本主题句生成方法
CN109165385A (zh) * 2018-08-29 2019-01-08 中国人民解放军国防科技大学 一种基于实体关系联合抽取模型的多三元组抽取方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706113B2 (en) * 2017-01-06 2020-07-07 Microsoft Technology Licensing, Llc Domain review system for identifying entity relationships and corresponding insights

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304911A (zh) * 2018-01-09 2018-07-20 中国科学院自动化研究所 基于记忆神经网络的知识抽取方法以及系统和设备
CN108733792A (zh) * 2018-05-14 2018-11-02 北京大学深圳研究生院 一种实体关系抽取方法
CN108763353A (zh) * 2018-05-14 2018-11-06 中山大学 基于规则和远程监督的百度百科关系三元组抽取方法
CN108897857A (zh) * 2018-06-28 2018-11-27 东华大学 面向领域的中文文本主题句生成方法
CN109165385A (zh) * 2018-08-29 2019-01-08 中国人民解放军国防科技大学 一种基于实体关系联合抽取模型的多三元组抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于高层语义注意力机制的中文实体关系抽取;武文雅 等;《广西师范大学学报(自然科学版)》;20190110;第37卷(第1期);第32-41页 *

Also Published As

Publication number Publication date
CN109902145A (zh) 2019-06-18

Similar Documents

Publication Publication Date Title
CN109902145B (zh) 一种基于注意力机制的实体关系联合抽取方法和系统
Yang et al. Transfer learning for sequence tagging with hierarchical recurrent networks
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN109657239B (zh) 基于注意力机制和语言模型学习的中文命名实体识别方法
CN110222188B (zh) 一种多任务学习的公司公告处理方法及服务端
CN111738003B (zh) 命名实体识别模型训练方法、命名实体识别方法和介质
CN110609897A (zh) 一种融合全局和局部特征的多类别中文文本分类方法
CN111046179B (zh) 一种面向特定领域开放网络问句的文本分类方法
CN109800437A (zh) 一种基于特征融合的命名实体识别方法
CN111985239A (zh) 实体识别方法、装置、电子设备及存储介质
CN109960728A (zh) 一种开放域会议信息命名实体识别方法及系统
CN113591483A (zh) 一种基于序列标注的文档级事件论元抽取方法
CN113626589B (zh) 一种基于混合注意力机制的多标签文本分类方法
CN111967267B (zh) 一种基于XLNet的新闻文本地域提取的方法及系统
CN113705218A (zh) 基于字符嵌入的事件元素网格化抽取方法、存储介质及电子装置
CN114912423A (zh) 一种基于迁移学习的方面级别情感分析方法及装置
CN111368542A (zh) 一种基于递归神经网络的文本语言关联抽取方法和系统
CN114676255A (zh) 文本处理方法、装置、设备、存储介质及计算机程序产品
CN112101029B (zh) 一种基于bert模型的高校导师推荐管理方法
CN113515632A (zh) 基于图路径知识萃取的文本分类方法
CN110569355B (zh) 一种基于词块的观点目标抽取和目标情感分类联合方法及系统
Song et al. A method for identifying local drug names in xinjiang based on BERT-BiLSTM-CRF
CN110196995B (zh) 一种基于带偏置随机游走的复杂网络特征提取方法
CN111145914A (zh) 一种确定肺癌临床病种库文本实体的方法及装置
Lei et al. An input information enhanced model for relation extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant