CN112989833A - 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 - Google Patents

一种基于多层lstm的远程监督实体关系联合抽取方法和系统 Download PDF

Info

Publication number
CN112989833A
CN112989833A CN202110406629.6A CN202110406629A CN112989833A CN 112989833 A CN112989833 A CN 112989833A CN 202110406629 A CN202110406629 A CN 202110406629A CN 112989833 A CN112989833 A CN 112989833A
Authority
CN
China
Prior art keywords
entity
lstm
extraction
layer
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110406629.6A
Other languages
English (en)
Inventor
程良伦
马建文
张伟文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202110406629.6A priority Critical patent/CN112989833A/zh
Publication of CN112989833A publication Critical patent/CN112989833A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于多层LSTM的远程监督实体关系联合抽取方法和系统,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。

Description

一种基于多层LSTM的远程监督实体关系联合抽取方法和系统
技术领域
本发明涉及实体关系抽取技术领域,尤其涉及一种基于多层LSTM的远程监督实体关系联合抽取方法和系统。
背景技术
实体和关系的联合抽取是构建知识图的主要任务,是一项具有挑战性的工作,这项任务通过给出非结构化文本的句子来识别两个实体的三元组及其相关关系。识别三元组具有很大的挑战性,一是数据集的构建,对于专业领域的数据集需要花费很大的人力物力才能制作成功,二是给定一个句子,句子中可能出现三种类型的三元组,第一种是正常情况,在这种情况下,两个实体之间只有一个关系,并且实体不重叠,第二种类型是EPO(EntityPairOverlay),类似的实体对具有邻居和包含两种类型的关系,第三种类型是SEO(SingleEntityOverlay),该组共享一个重叠实体。现有的技术采用新的标记方法来重新标记实体和关系,虽然能够提高识别三元组的效果,但仍需大量的人力,另一种是通过联合模型的语法信息来提取三元组,对复杂关系类型的处理影响不大,但依赖关系是不完全的,提取效果不理想。
发明内容
本发明提供了一种基于多层LSTM的远程监督实体关系联合抽取方法和系统,用于解决现有的实体关系抽取效果不理想的技术问题。
有鉴于此,本发明第一方面提供了一种基于多层LSTM的远程监督实体关系联合抽取方法,包括:
以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
可选地,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
可选地,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
可选地,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
可选地,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
本发明第二方面提供了一种基于多层LSTM的远程监督实体关系联合抽取系统,包括:
数据集模块,用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
抽取模型模块,用于构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
训练模块,用于使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
可选地,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
可选地,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
可选地,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
可选地,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明中提供了一种基于多层LSTM的远程监督实体关系联合抽取方法,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例中提供的一种基于多层LSTM的远程监督实体关系联合抽取方法的流程示意图;
图2为本发明实施例中的远程监督数据集构建流程图;
图3为本发明实施例中的实体关系联合抽取模型结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1至图3,本发明提供了一种基于多层LSTM的远程监督实体关系联合抽取方法的实施例,包括:
步骤101、以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集。
本发明实施例中,首先构建数据集,使用百科三元组作为外部知识库,海洋经济产业文本数据的新闻文本作为外部文档库,构建流程如图2所示。对于百科三元组先构造出实体关系词典,对于海洋经济产业文本数据的新闻文本先获取句子集合,对句子进行去除指定的无用符号,如@#¥&*等,去除英文,去除表情符号,繁体和简体的转换和分词等步骤的预处理。然后在句子集合上查找到实体并与知识库构建的实体关系字典进行匹配,再进行句子和实体对的筛选,再对用的句子添加关系标签,得到数据集,最后再将数据集的格式进行json等对应需求文件格式转换,按照3:1的比例划分为训练集和测试集。
步骤102、构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块。
使用预先训练的glove840b向量来初始化单词得到300维嵌入,并随机初始化50维的嵌入字符。将字符LSTM、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别设置为100、400、250和256。对于关系提取模块,头的数量与关系类型的数量相同,每个头的大小设置为24。学习率、学习衰减和批次大小分别设置为0.001、0.95和64,为避免过度拟合,可以将随机失活率设置为0.3。
步骤103、使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
给出一个句子s={w1,w2,...,wn},wi表示第i个词,n是句子长度,形式上,每个令牌的初始嵌入是通过连接字符嵌入
Figure BDA0003022539280000041
和词嵌入
Figure BDA0003022539280000042
来计算的,其中dc和dw分别是词嵌入和字符嵌入的维度。字符嵌入采用Bi-LSTM算法。最后得到350维的嵌入向量。
编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。在双向on-LSTM层后采用全连接层来获得输入表示序列U={u1,u2,...,un}。使用CRF方法,CRF是一种判别概率模型,适用于序列分析。给定输入序列U={u1,u2,...,un},CRF预测输出序列的概率,通过对上层的训练,将上层的输出向量作为CRF层的输入进行句子级标注。随后,采用转移得分矩阵V∈Rk×k来学习相邻标签之间的依赖关系。此外,还使用状态得分矩阵v∈Rn ×k对标记和标签之间的映射进行建模,得到:
Figure BDA0003022539280000051
ν=UWν+bv
其中i为词在句子中的位置,yi为当前词的标签,yi-1为前一个词的标签,是输入句子的长度,U={u1,u2,...,un}。矩阵
Figure BDA0003022539280000052
和bv∈Rn×k为模型参数,其中du为输入隐含表示的维数,将得到的分数进行归一化统一,将结果转换为概率值,以概率最大的输出序列作为最终的标注序列。
最后,标签序列的概率可以计算为:
Figure BDA0003022539280000053
其中,YX为所有可能的标签序列。
为了获得每个词的语义上下文特征,使用Bi-LSTM对输入进行编码,在双向ON-LSTM层输出的O={o1,o2,...,on}上采用全连接层来获得输入表示序列a={a1,a2,...,an}。再加上实体识别部分的实体标签,即一个向量为1×6的标签向量。a向量和标签向量两个拼接向量输入至双向LSTM中,LSTM基于先前隐藏向量ht-1、细胞状态ct-1和当前输入嵌入向量at来计算当前隐藏向量ht。Bi-LSTM的公式定义为:
Figure BDA0003022539280000054
Figure BDA0003022539280000055
Bi-LSTM网络由前向LSTM和后向LSTM组成,
Figure BDA0003022539280000056
分别用于区分隐藏状态:
Figure BDA0003022539280000057
ot=softmax(Woat+Uoht-1+bo)
Wo,Uo和bo为对应公式的各个权重,t-1为上一时刻,Bi-LSTM的输出为O={o1,o2,...,on}。
在Bi-LSTM网络的末尾连接注意力机制部分,注意力机制部分的输入隐藏表示序列为H={h1,h2,...,hn},该部分输入由a+O所得。
学习权重为:
A=HWa+ba
其中,
Figure BDA0003022539280000061
Figure BDA0003022539280000062
是模型需要学习的参数,du和da分别是句子特征H的隐藏状态维度和在A中的输入维度。
由于需要学习每个关系空间的特征语义信息是不同的,因此针对不同的关系类型需要单独的计算单词节点的依赖信息。将句子的特征表示投影到不同关系类型的特征子空间,如下所示:
Figure BDA0003022539280000063
Figure BDA0003022539280000064
其中,
Figure BDA0003022539280000065
Figure BDA0003022539280000066
表示第m个关系类别的查询向量和键值向量,
Figure BDA0003022539280000067
Figure BDA0003022539280000068
是模型的参数。dr为每种关系投影空间的维度,S为需要学习的参数矩阵。
然后,可以构造每种关系下的依赖关系自适应邻接矩阵Gm∈Rn×n,特定关系下的邻接矩阵构造方式为:
Figure BDA0003022539280000069
其中,σ为softmax函数。
最终得到每种预定义的关系的矩阵,通过最大化似然函数计算每种关系的概率:
Figure BDA00030225392800000610
r为对应某种关系,p(r/X)为对应某种关系的概率,xi为第i个词。
本发明实施例中提供了一种基于多层LSTM的远程监督实体关系联合抽取方法,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
本发明中提供了一种基于多层LSTM的远程监督实体关系联合抽取系统的实施例,包括:
数据集模块,用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
抽取模型模块,用于构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
训练模块,用于使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
本发明实施例中提供了一种基于多层LSTM的远程监督实体关系联合抽取系统,数据集采用百科三元组来远程监督制作数据集,实体关系联合抽取模型由实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块,使用远程监督数据集对实体关系联合抽取模型进行训练,使用训练好的实体关系联合抽取模型进行实体关系联合抽取,能够对实体关系进行有效识别,解决了现有的实体关系抽取效果不理想的技术问题。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,包括:
以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
2.根据权利要求1所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
3.根据权利要求1所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
4.根据权利要求1所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
5.根据权利要求4所述的基于多层LSTM的远程监督实体关系联合抽取方法,其特征在于,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
6.一种基于多层LSTM的远程监督实体关系联合抽取方法系统,其特征在于,包括:
数据集模块,用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库,构建远程监督数据集,其中,远程监督数据集包括三元组格式的训练集和测试集;
抽取模型模块,用于构建实体关系联合抽取模型,对实体关系联合抽取模型的参数进行初始化,其中,实体关系联合抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块;
训练模块,用于使用远程监督数据集对实体关系联合抽取模型进行训练,并使用训练好的实体关系联合抽取模型进行实体关系联合抽取。
7.根据权利要求6所述的基于多层LSTM的远程监督实体关系联合抽取系统,其特征在于,实体关系联合抽取模型的初始化参数配置为:
字符LSTM层、编码层、实体提取模块和关系提取模块的隐藏状态的大小分别为100、400、250和256;
关系提取模块的头的数量与关系类型的数量相同,每个头的大小设置为24;
学习率、学习率衰减和批次大小分别设置为0.001、0.95和64;
随机失活率设置为0.3。
8.根据权利要求6所述的基于多层LSTM的远程监督实体关系联合抽取系统,其特征在于,编码层使用Bi-on-LSTM提取句子的全局特征,得到词与词之间的依存关系。
9.根据权利要求6所述的基于多层LSTM的远程监督实体关系联合抽取系统,其特征在于,实体提取模块在双向on-LSTM层后采用全连接层来获得输入表示序列,使用CRF预测输出序列的概率。
10.根据权利要求9所述的基于多层LSTM的远程监督实体关系联合抽取方法系统,其特征在于,关系提取模块采用Bi-LSTM网络和注意力机制来获得实体对应关系的概率。
CN202110406629.6A 2021-04-15 2021-04-15 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 Pending CN112989833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110406629.6A CN112989833A (zh) 2021-04-15 2021-04-15 一种基于多层lstm的远程监督实体关系联合抽取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110406629.6A CN112989833A (zh) 2021-04-15 2021-04-15 一种基于多层lstm的远程监督实体关系联合抽取方法和系统

Publications (1)

Publication Number Publication Date
CN112989833A true CN112989833A (zh) 2021-06-18

Family

ID=76340653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110406629.6A Pending CN112989833A (zh) 2021-04-15 2021-04-15 一种基于多层lstm的远程监督实体关系联合抽取方法和系统

Country Status (1)

Country Link
CN (1) CN112989833A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408289A (zh) * 2021-06-29 2021-09-17 广东工业大学 一种多特征融合的供应链管理实体知识抽取的方法及系统
CN113553440A (zh) * 2021-06-25 2021-10-26 武汉理工大学 一种基于层次推理的医学实体关系抽取方法
CN113779260A (zh) * 2021-08-12 2021-12-10 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165385A (zh) * 2018-08-29 2019-01-08 中国人民解放军国防科技大学 一种基于实体关系联合抽取模型的多三元组抽取方法
US20200065374A1 (en) * 2018-08-23 2020-02-27 Shenzhen Keya Medical Technology Corporation Method and system for joint named entity recognition and relation extraction using convolutional neural network
CN110941716A (zh) * 2019-11-05 2020-03-31 北京航空航天大学 一种基于深度学习的信息安全知识图谱的自动构建方法
CN111914558A (zh) * 2020-07-31 2020-11-10 湖北工业大学 基于句袋注意力远程监督的课程知识关系抽取方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200065374A1 (en) * 2018-08-23 2020-02-27 Shenzhen Keya Medical Technology Corporation Method and system for joint named entity recognition and relation extraction using convolutional neural network
CN109165385A (zh) * 2018-08-29 2019-01-08 中国人民解放军国防科技大学 一种基于实体关系联合抽取模型的多三元组抽取方法
CN110941716A (zh) * 2019-11-05 2020-03-31 北京航空航天大学 一种基于深度学习的信息安全知识图谱的自动构建方法
CN111914558A (zh) * 2020-07-31 2020-11-10 湖北工业大学 基于句袋注意力远程监督的课程知识关系抽取方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王丽客等: "基于远程监督的藏文实体关系抽取", 中文信息学报, vol. 34, no. 03, pages 73 - 78 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113553440A (zh) * 2021-06-25 2021-10-26 武汉理工大学 一种基于层次推理的医学实体关系抽取方法
CN113553440B (zh) * 2021-06-25 2022-08-16 武汉理工大学 一种基于层次推理的医学实体关系抽取方法
CN113408289A (zh) * 2021-06-29 2021-09-17 广东工业大学 一种多特征融合的供应链管理实体知识抽取的方法及系统
CN113408289B (zh) * 2021-06-29 2024-04-16 广东工业大学 一种多特征融合的供应链管理实体知识抽取的方法及系统
CN113779260A (zh) * 2021-08-12 2021-12-10 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统

Similar Documents

Publication Publication Date Title
CN110442707B (zh) 一种基于seq2seq的多标签文本分类方法
CN109697232B (zh) 一种基于深度学习的中文文本情感分析方法
WO2023024412A1 (zh) 基于深度学习模型的视觉问答方法及装置、介质、设备
CN109299273B (zh) 基于改进seq2seq模型的多源多标签文本分类方法及其系统
CN107145483B (zh) 一种基于嵌入式表示的自适应中文分词方法
CN107729309B (zh) 一种基于深度学习的中文语义分析的方法及装置
CN113128229B (zh) 一种中文实体关系联合抽取方法
CN111985239B (zh) 实体识别方法、装置、电子设备及存储介质
US20240177047A1 (en) Knowledge grap pre-training method based on structural context infor
CN112989833A (zh) 一种基于多层lstm的远程监督实体关系联合抽取方法和系统
CN111046668A (zh) 多模态文物数据的命名实体识别方法与装置
CN111709242B (zh) 一种基于命名实体识别的中文标点符号添加方法
CN111274804A (zh) 基于命名实体识别的案件信息提取方法
CN110472062B (zh) 识别命名实体的方法及装置
KR102139272B1 (ko) 생의학적 개체명 인식 시스템
CN113051922A (zh) 一种基于深度学习的三元组抽取方法及系统
CN113158676A (zh) 专业实体与关系联合抽取方法、系统及电子设备
CN114564563A (zh) 一种基于关系分解的端到端实体关系联合抽取方法及系统
CN114841151A (zh) 基于分解-重组策略的医学文本实体关系联合抽取方法
CN114925205A (zh) 基于对比学习的gcn-gru文本分类方法
CN115017890A (zh) 基于字音字形相似的文本纠错方法和装置
CN114743029A (zh) 一种图像文本匹配的方法
CN113051904B (zh) 一种面向小规模知识图谱的链接预测方法
CN115422362B (zh) 一种基于人工智能的文本匹配方法
CN116304064A (zh) 一种基于抽取式的文本分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination