CN112989833A - 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 - Google Patents
一种基于多层lstm的远程监督实体关系联合抽取方法和系统 Download PDFInfo
- Publication number
- CN112989833A CN112989833A CN202110406629.6A CN202110406629A CN112989833A CN 112989833 A CN112989833 A CN 112989833A CN 202110406629 A CN202110406629 A CN 202110406629A CN 112989833 A CN112989833 A CN 112989833A
- Authority
- CN
- China
- Prior art keywords
- entity
- lstm
- extraction
- layer
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 136
- 238000012549 training Methods 0.000 claims description 17
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 230000009849 deactivation Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 7
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 7
- 238000010276 construction Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于多层LSTM的远程监督实体关系联合抽取方法和系统,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
Description
技术领域
本发明涉及实体关系抽取技术领域,尤其涉及一种基于多层LSTM的远程监督实体关系联合抽取方法和系统。
背景技术
实体和关系的联合抽取是构建知识图的主要任务,是一项具有挑战性的工作,这项任务通过给出非结构化文本的句子来识别两个实体的三元组及其相关关系。识别三元组具有很大的挑战性,一是数据集的构建,对于专业领域的数据集需要花费很大的人力物力才能制作成功,二是给定一个句子,句子中可能出现三种类型的三元组,第一种是正常情况,在这种情况下,两个实体之间只有一个关系,并且实体不重叠,第二种类型是EPO(EntityPairOverlay),类似的实体对具有邻居和包含两种类型的关系,第三种类型是SEO(SingleEntityOverlay),该组共享一个重叠实体。现有的技术采用新的标记方法来重新标记实体和关系,虽然能够提高识别三元组的效果,但仍需大量的人力,另一种是通过联合模型的语法信息来提取三元组,对复杂关系类型的处理影响不大,但依赖关系是不完全的,提取效果不理想。
发明内容
本发明提供了一种基于多层LSTM的远程监督实体关系联合抽取方法和系统,用于解决现有的实体关系抽取效果不理想的技术问题。
有鉴于此,本发明第一方面提供了一种基于多层LSTM的远程监督实体关系联合抽取方法,包括:
以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
可选地,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
可选地,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
可选地,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
可选地,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
本发明第二方面提供了一种基于多层LSTM的远程监督实体关系联合抽取系统,包括:
数据集模块,用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
抽取模型模块,用于构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
训练模块,用于使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
可选地,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
可选地,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
可选地,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
可选地,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明中提供了一种基于多层LSTM的远程监督实体关系联合抽取方法,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例中提供的一种基于多层LSTM的远程监督实体关系联合抽取方法的流程示意图;
图2为本发明实施例中的远程监督数据集构建流程图;
图3为本发明实施例中的实体关系联合抽取模型结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1至图3,本发明提供了一种基于多层LSTM的远程监督实体关系联合抽取方法的实施例,包括:
步骤101、以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集。
本发明实施例中,首先构建数据集,使用百科三元组作为外部知识库,海洋经济产业文本数据的新闻文本作为外部文档库,构建流程如图2所示。对于百科三元组先构造出实体关系词典,对于海洋经济产业文本数据的新闻文本先获取句子集合,对句子进行去除指定的无用符号,如@#¥&*等,去除英文,去除表情符号,繁体和简体的转换和分词等步骤的预处理。然后在句子集合上查找到实体并与知识库构建的实体关系字典进行匹配,再进行句子和实体对的筛选,再对用的句子添加关系标签,得到数据集,最后再将数据集的格式进行json等对应需求文件格式转换,按照3:1的比例划分为训练集和测试集。
步骤102、构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块。
使用预先训练的glove840b向量来初始化单词得到300维嵌入,并随机初始化50维的嵌入字符。将字符LSTM、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别设置为100、400、250和256。对于关系提取模块,头的数量与关系类型的数量相同,每个头的大小设置为24。学习率、学习衰减和批次大小分别设置为0.001、0.95和64,为避免过度拟合,可以将随机失活率设置为0.3。
步骤103、使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
给出一个句子s={w1,w2,...,wn},wi表示第i个词,n是句子长度,形式上,每个令牌的初始嵌入是通过连接字符嵌入和词嵌入来计算的,其中dc和dw分别是词嵌入和字符嵌入的维度。字符嵌入采用Bi-LSTM算法。最后得到350维的嵌入向量。
编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。在双向on-LSTM层后采用全连接层来获得输入表示序列U={u1,u2,...,un}。使用CRF方法,CRF是一种判别概率模型,适用于序列分析。给定输入序列U={u1,u2,...,un},CRF预测输出序列的概率,通过对上层的训练,将上层的输出向量作为CRF层的输入进行句子级标注。随后,采用转移得分矩阵V∈Rk×k来学习相邻标签之间的依赖关系。此外,还使用状态得分矩阵v∈Rn ×k对标记和标签之间的映射进行建模,得到:
ν=UWν+bv
其中i为词在句子中的位置,yi为当前词的标签,yi-1为前一个词的标签,是输入句子的长度,U={u1,u2,...,un}。矩阵和bv∈Rn×k为模型参数,其中du为输入隐含表示的维数,将得到的分数进行归一化统一,将结果转换为概率值,以概率最大的输出序列作为最终的标注序列。
最后,标签序列的概率可以计算为:
其中,YX为所有可能的标签序列。
为了获得每个词的语义上下文特征,使用Bi-LSTM对输入进行编码,在双向ON-LSTM层输出的O={o1,o2,...,on}上采用全连接层来获得输入表示序列a={a1,a2,...,an}。再加上实体识别部分的实体标签,即一个向量为1×6的标签向量。a向量和标签向量两个拼接向量输入至双向LSTM中,LSTM基于先前隐藏向量ht-1、细胞状态ct-1和当前输入嵌入向量at来计算当前隐藏向量ht。Bi-LSTM的公式定义为:
ot=softmax(Woat+Uoht-1+bo)
Wo,Uo和bo为对应公式的各个权重,t-1为上一时刻,Bi-LSTM的输出为O={o1,o2,...,on}。
在Bi-LSTM网络的末尾连接注意力机制部分,注意力机制部分的输入隐藏表示序列为H={h1,h2,...,hn},该部分输入由a+O所得。
学习权重为:
A=HWa+ba
由于需要学习每个关系空间的特征语义信息是不同的,因此针对不同的关系类型需要单独的计算单词节点的依赖信息。将句子的特征表示投影到不同关系类型的特征子空间,如下所示:
然后,可以构造每种关系下的依赖关系自适应邻接矩阵Gm∈Rn×n,特定关系下的邻接矩阵构造方式为:
其中,σ为softmax函数。
最终得到每种预定义的关系的矩阵,通过最大化似然函数计算每种关系的概率:
r为对应某种关系,p(r/X)为对应某种关系的概率,xi为第i个词。
本发明实施例中提供了一种基于多层LSTM的远程监督实体关系联合抽取方法,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
本发明中提供了一种基于多层LSTM的远程监督实体关系联合抽取系统的实施例,包括:
数据集模块,用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
抽取模型模块,用于构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
训练模块,用于使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
本发明实施例中提供了一种基于多层LSTM的远程监督实体关系联合抽取系统,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,包括:
以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
2.根据权利要求1所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
3.根据权利要求1所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
4.根据权利要求1所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
5.根据权利要求4所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
6.一种基于多层LSTM的远程监督实体关系联合抽取方法系统,其特征在于,包括:
数据集模块,用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
抽取模型模块,用于构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
训练模块,用于使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
7.根据权利要求6所述的基于多层LSTM的远程监督实体关系联合抽取系统,其特征在于,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
8.根据权利要求6所述的基于多层LSTM的远程监督实体关系联合抽取系统,其特征在于,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
9.根据权利要求6所述的基于多层LSTM的远程监督实体关系联合抽取系统,其特征在于,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
10.根据权利要求9所述的基于多层LSTM的远程监督实体关系联合抽取方法系统,其特征在于,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406629.6A CN112989833A (zh) | 2021-04-15 | 2021-04-15 | 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406629.6A CN112989833A (zh) | 2021-04-15 | 2021-04-15 | 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112989833A true CN112989833A (zh) | 2021-06-18 |
Family
ID=76340653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110406629.6A Pending CN112989833A (zh) | 2021-04-15 | 2021-04-15 | 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112989833A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408289A (zh) * | 2021-06-29 | 2021-09-17 | 广东工业大学 | 一种多特征融合的供应链管理实体知识抽取的方法及系统 |
CN113553440A (zh) * | 2021-06-25 | 2021-10-26 | 武汉理工大学 | 一种基于层次推理的医学实体关系抽取方法 |
CN113779260A (zh) * | 2021-08-12 | 2021-12-10 | 华东师范大学 | 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165385A (zh) * | 2018-08-29 | 2019-01-08 | 中国人民解放军国防科技大学 | 一种基于实体关系联合抽取模型的多三元组抽取方法 |
US20200065374A1 (en) * | 2018-08-23 | 2020-02-27 | Shenzhen Keya Medical Technology Corporation | Method and system for joint named entity recognition and relation extraction using convolutional neural network |
CN110941716A (zh) * | 2019-11-05 | 2020-03-31 | 北京航空航天大学 | 一种基于深度学习的信息安全知识图谱的自动构建方法 |
CN111914558A (zh) * | 2020-07-31 | 2020-11-10 | 湖北工业大学 | 基于句袋注意力远程监督的课程知识关系抽取方法及系统 |
-
2021
- 2021-04-15 CN CN202110406629.6A patent/CN112989833A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200065374A1 (en) * | 2018-08-23 | 2020-02-27 | Shenzhen Keya Medical Technology Corporation | Method and system for joint named entity recognition and relation extraction using convolutional neural network |
CN109165385A (zh) * | 2018-08-29 | 2019-01-08 | 中国人民解放军国防科技大学 | 一种基于实体关系联合抽取模型的多三元组抽取方法 |
CN110941716A (zh) * | 2019-11-05 | 2020-03-31 | 北京航空航天大学 | 一种基于深度学习的信息安全知识图谱的自动构建方法 |
CN111914558A (zh) * | 2020-07-31 | 2020-11-10 | 湖北工业大学 | 基于句袋注意力远程监督的课程知识关系抽取方法及系统 |
Non-Patent Citations (1)
Title |
---|
王丽客等: "基于远程监督的藏文实体关系抽取", 中文信息学报, vol. 34, no. 03, pages 73 - 78 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553440A (zh) * | 2021-06-25 | 2021-10-26 | 武汉理工大学 | 一种基于层次推理的医学实体关系抽取方法 |
CN113553440B (zh) * | 2021-06-25 | 2022-08-16 | 武汉理工大学 | 一种基于层次推理的医学实体关系抽取方法 |
CN113408289A (zh) * | 2021-06-29 | 2021-09-17 | 广东工业大学 | 一种多特征融合的供应链管理实体知识抽取的方法及系统 |
CN113408289B (zh) * | 2021-06-29 | 2024-04-16 | 广东工业大学 | 一种多特征融合的供应链管理实体知识抽取的方法及系统 |
CN113779260A (zh) * | 2021-08-12 | 2021-12-10 | 华东师范大学 | 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110442707B (zh) | 一种基于seq2seq的多标签文本分类方法 | |
CN109697232B (zh) | 一种基于深度学习的中文文本情感分析方法 | |
WO2023024412A1 (zh) | 基于深度学习模型的视觉问答方法及装置、介质、设备 | |
CN109299273B (zh) | 基于改进seq2seq模型的多源多标签文本分类方法及其系统 | |
CN107145483B (zh) | 一种基于嵌入式表示的自适应中文分词方法 | |
CN107729309B (zh) | 一种基于深度学习的中文语义分析的方法及装置 | |
CN113128229B (zh) | 一种中文实体关系联合抽取方法 | |
CN111985239B (zh) | 实体识别方法、装置、电子设备及存储介质 | |
US20240177047A1 (en) | Knowledge grap pre-training method based on structural context infor | |
CN112989833A (zh) | 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 | |
CN111046668A (zh) | 多模态文物数据的命名实体识别方法与装置 | |
CN111709242B (zh) | 一种基于命名实体识别的中文标点符号添加方法 | |
CN111274804A (zh) | 基于命名实体识别的案件信息提取方法 | |
CN110472062B (zh) | 识别命名实体的方法及装置 | |
KR102139272B1 (ko) | 생의학적 개체명 인식 시스템 | |
CN113051922A (zh) | 一种基于深度学习的三元组抽取方法及系统 | |
CN113158676A (zh) | 专业实体与关系联合抽取方法、系统及电子设备 | |
CN114564563A (zh) | 一种基于关系分解的端到端实体关系联合抽取方法及系统 | |
CN114841151A (zh) | 基于分解-重组策略的医学文本实体关系联合抽取方法 | |
CN114925205A (zh) | 基于对比学习的gcn-gru文本分类方法 | |
CN115017890A (zh) | 基于字音字形相似的文本纠错方法和装置 | |
CN114743029A (zh) | 一种图像文本匹配的方法 | |
CN113051904B (zh) | 一种面向小规模知识图谱的链接预测方法 | |
CN115422362B (zh) | 一种基于人工智能的文本匹配方法 | |
CN116304064A (zh) | 一种基于抽取式的文本分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |