CN115080705B - 基于双模型增强的垂直领域关系抽取方法及系统 - Google Patents

基于双模型增强的垂直领域关系抽取方法及系统 Download PDF

Info

Publication number
CN115080705B
CN115080705B CN202210855091.1A CN202210855091A CN115080705B CN 115080705 B CN115080705 B CN 115080705B CN 202210855091 A CN202210855091 A CN 202210855091A CN 115080705 B CN115080705 B CN 115080705B
Authority
CN
China
Prior art keywords
entity
model
information
main
input sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210855091.1A
Other languages
English (en)
Other versions
CN115080705A (zh
Inventor
朱宁
许娟
杨雅婷
宋佳祥
白焜太
刘硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Health China Technologies Co Ltd
Original Assignee
Digital Health China Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Health China Technologies Co Ltd filed Critical Digital Health China Technologies Co Ltd
Priority to CN202210855091.1A priority Critical patent/CN115080705B/zh
Publication of CN115080705A publication Critical patent/CN115080705A/zh
Application granted granted Critical
Publication of CN115080705B publication Critical patent/CN115080705B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)
  • Stored Programmes (AREA)

Abstract

本发明涉及信息处理技术领域,且公开了基于双模型增强的垂直领域关系抽取方法及系统,本发明采用原始文本的实体信息配合设置双模型的方式,利用从垂直领域现有的知识图谱中的提取的属性信息文本进行关系抽取,最后结合双模型的关系抽取,能够在少量样本结合现有的知识图谱情况下,共同得出更准确的结果,节省大量的预训练计算资源。

Description

基于双模型增强的垂直领域关系抽取方法及系统
技术领域
本发明涉及信息处理技术领域,具体为基于双模型增强的垂直领域关系抽取方法及系统。
背景技术
关系抽取是从一段文本中抽取出(主体,关系,客体)这样的三元组。目前最主流的关系抽取模型是基于深度学习的监督学习模型,这类模型大多都是在大规模通用数据集上训练得到的(如Bert),在一些垂直领域,进行关系抽取时,采用通用数据训练的模型往往效果不佳,针对此问题,通常的方案是使用该垂直领域的数据来进行训练,得到引入该领域信息的预训练模型,问题是,预训练需要大量样本才能有好的效果,而现实基本属于低资源的情况。因此,现有采用单模型进行关系抽取在低资源的情况下往往效果不佳。
发明内容
本发明主要是提供基于双模型增强的垂直领域关系抽取方法及系统。
为了解决上述技术问题,本发明采用如下技术方案:
基于双模型增强的垂直领域关系抽取方法,包括:
采集原始文本,基于所述原始文本抽取实体信息;
基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列;
设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值;
基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
进一步,所述采集原始文本,基于所述原始文本抽取实体信息,包括:
采集原始文本,提取所述原始文本中的实体头、实体尾和实体跨度,并基于所述实体头、实体尾和实体跨度获取实体跨度信息;
基于所述实体跨度信息获取实体类型信息。
进一步,所述基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列,包括:
将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列;
基于实体头和实体尾在知识图谱中提取属性信息,并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。
进一步,所述设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值,包括:
设置主模型和辅模型;
将所述第一句子输入序列输入主模型获取主实体对向量;
将所述第二句子输入序列输入辅模型获取辅实体对向量;
基于所述主实体对向量和辅实体对向量加权并获取关系概率值。
进一步,所述基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果,包括:
基于主实体对向量预测主关系类型,基于辅实体对向量预测辅关系类型;
基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
基于双模型增强的垂直领域关系抽取系统,包括:
原始文本处理模块,用于采集原始文本,基于所述原始文本抽取实体信息;
句子输入序列获取模块,用于基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列;
关系概率值计算模块,用于设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值;
最终关系抽取模块,用于基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
进一步,所述原始文本处理模块,包括:
实体跨度信息获取子模块,用于采集原始文本,提取所述原始文本中的实体头、实体尾和实体跨度,并基于所述实体头、实体尾和实体跨度获取实体跨度信息;
实体类型信息获取子模块,用于基于所述实体跨度信息获取实体类型信息。
进一步,所述句子输入序列获取模块,包括:
第一序列获取子模块,用于将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列;
第二序列获取子模块,用于基于实体头和实体尾在知识图谱中提取属性信息,并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。
进一步,所述关系概率值计算模块,包括:
双模型设置子模块,用于设置主模型和辅模型;
主实体对向量获取子模块,用于将所述第一句子输入序列输入主模型获取主实体对向量;
辅实体对向量获取子模块,用于将所述第二句子输入序列输入辅模型获取辅实体对向量;
关系概率值计算子模块,用于基于所述主实体对向量和辅实体对向量加权并获取关系概率值。
进一步,所述最终关系抽取模块,包括:
关系类型预测子模块,用于基于主实体对向量预测主关系类型,基于辅实体对向量预测辅关系类型;
最终预测结果抽取子模块,用于基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
有益效果:本发明采用原始文本的实体信息配合设置双模型的方式,利用从垂直领域现有的知识图谱中的提取的属性信息文本进行关系抽取,最后结合双模型的关系抽取,能够在少量样本结合现有的知识图谱情况下,共同得出更准确的结果,节省大量的预训练计算资源。
附图说明
图1为本发明的基于双模型增强的垂直领域关系抽取方法流程图;
图2为本发明的基于双模型增强的垂直领域关系抽取系统框图。
具体实施方式
以下将结合实施例对本发明涉及的基于双模型增强的垂直领域关系抽取方法及系统技术方案进一步详细说明。
如图1所示,本发明的基于双模型增强的垂直领域关系抽取方法,包括:S1~S4;
S1、采集原始文本,基于所述原始文本抽取实体信息;
S2、基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列;
S3、设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值;
S4、基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
进一步,步骤S1中所述采集原始文本,基于所述原始文本抽取实体信息,包括:
S11、采集原始文本,提取所述原始文本中的实体头、实体尾和实体跨度,并基于所述实体头、实体尾和实体跨度获取实体跨度信息;
其中,将原始文本表示为X,实体跨度信息为:
Figure 804333DEST_PATH_IMAGE001
上式中,
Figure 49369DEST_PATH_IMAGE002
为实体跨度
Figure 360265DEST_PATH_IMAGE003
的实体头,
Figure 21054DEST_PATH_IMAGE004
为实体跨度
Figure 163322DEST_PATH_IMAGE005
的实体尾,
Figure 346304DEST_PATH_IMAGE006
为实体跨度
Figure 206812DEST_PATH_IMAGE003
的宽度特征。
S12、基于所述实体跨度信息获取实体类型信息。
其中,实体类型信息为:
Figure 232144DEST_PATH_IMAGE007
上式为使用ReLU函数激活的两层前馈神经网络进行实体类型信息
Figure 432181DEST_PATH_IMAGE009
的预测。
进一步,步骤S2中所述基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列,包括:
S21、将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列;
其中,将
Figure 691124DEST_PATH_IMAGE002
Figure 773350DEST_PATH_IMAGE004
和类型标识符
Figure 572678DEST_PATH_IMAGE010
嵌入原始文本中,得到第一句子输入序列:
Figure 627222DEST_PATH_IMAGE011
上式中,原始文本X由多个实体i、j等组成,S表示实体i起始,/S表示实体i结束,O表示实体j起始,/O表示实体j结束,
Figure 824110DEST_PATH_IMAGE013
为实体i的类型表示符,
Figure 596894DEST_PATH_IMAGE015
为实体j的类型表示符;
S22、基于实体头和实体尾在知识图谱中提取属性信息,并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。
其中,将
Figure 403176DEST_PATH_IMAGE016
Figure 577806DEST_PATH_IMAGE017
输入知识图谱中提取属性信息E,并将E作为类型标识符,进行拼接获取第二句子输入序列:
Figure 444131DEST_PATH_IMAGE018
上式中,原始文本X由多个实体i、j等组成,S表示实体i起始,/S表示实体i结束,O表示实体j起始,/O表示实体j结束,
Figure 704211DEST_PATH_IMAGE020
为实体i拼接的属性信息,
Figure 314183DEST_PATH_IMAGE022
为实体j拼接的属性信息。
进一步,步骤S3中所述设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值,包括:
S31、设置主模型和辅模型;
其中,主模型和辅模型均采用BERT模型。
S32、将所述第一句子输入序列输入主模型获取主实体对向量;
其中,将
Figure 343319DEST_PATH_IMAGE023
输入主模型,获取主实体对向量:
Figure 144660DEST_PATH_IMAGE024
S33、将所述第二句子输入序列输入辅模型获取辅实体对向量;
Figure 423194DEST_PATH_IMAGE025
S34、基于所述主实体对向量和辅实体对向量加权并获取关系概率值。
其中,关系概率值为:
p = σ(
Figure 571279DEST_PATH_IMAGE026
*
Figure 251659DEST_PATH_IMAGE027
+
Figure 725366DEST_PATH_IMAGE028
*
Figure 428880DEST_PATH_IMAGE029
+ b)
上式中,
Figure 882120DEST_PATH_IMAGE026
为主模型的权重矩阵,
Figure 682586DEST_PATH_IMAGE028
为辅模型的权重矩阵,b为偏置,σ为Sigmoid()函数用于将输出的值变成0-1之间的概率值p。
进一步,步骤S4中所述基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果,包括:
S41、基于主实体对向量预测主关系类型,基于辅实体对向量预测辅关系类型;
其中,主关系类型为:
Figure 327194DEST_PATH_IMAGE030
,辅关系类型:
Figure DEST_PATH_IMAGE031
S42、基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
其中,最终预测结果为:
Figure 314741DEST_PATH_IMAGE032
=p*
Figure DEST_PATH_IMAGE033
+(1-p)*
Figure 335787DEST_PATH_IMAGE034
如图2所示,本发明的基于双模型增强的垂直领域关系抽取系统,包括:
原始文本处理模块21,用于采集原始文本,基于所述原始文本抽取实体信息;
句子输入序列获取模块22,用于基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列;
关系概率值计算模块23,用于设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值;
最终关系抽取模块24,用于基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
进一步,所述原始文本处理模块21,包括:
实体跨度信息获取子模块211,用于采集原始文本,提取所述原始文本中的实体头、实体尾和实体跨度,并基于所述实体头、实体尾和实体跨度获取实体跨度信息;
实体类型信息获取子模块212,用于基于所述实体跨度信息获取实体类型信息。
进一步,所述句子输入序列获取模块22,包括:
第一序列获取子模块221,用于将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列;
第二序列获取子模块222,用于基于实体头和实体尾在知识图谱中提取属性信息,并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。
进一步,所述关系概率值计算模块23,包括:
双模型设置子模块231,用于设置主模型和辅模型;
主实体对向量获取子模块232,用于将所述第一句子输入序列输入主模型获取主实体对向量;
辅实体对向量获取子模块233,用于将所述第二句子输入序列输入辅模型获取辅实体对向量;
关系概率值计算子模块234,用于基于所述主实体对向量和辅实体对向量加权并获取关系概率值。
进一步,所述最终关系抽取模块24,包括:
关系类型预测子模块241,用于基于主实体对向量预测主关系类型,基于辅实体对向量预测辅关系类型;
最终预测结果抽取子模块242,用于基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.基于双模型增强的垂直领域关系抽取方法,其特征在于,包括:
采集原始文本,基于所述原始文本抽取实体信息;
基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列;
设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值;
基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果;
所述采集原始文本,基于所述原始文本抽取实体信息,包括:
采集原始文本,提取所述原始文本中的实体头、实体尾和实体跨度,并基于所述实体头、实体尾和实体跨度获取实体跨度信息;
基于所述实体跨度信息获取实体类型信息;
所述基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列,包括:
将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列;
基于实体头和实体尾在知识图谱中提取属性信息,并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。
2.根据权利要求1所述的方法,其特征在于,所述设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值,包括:
设置主模型和辅模型;
将所述第一句子输入序列输入主模型获取主实体对向量;
将所述第二句子输入序列输入辅模型获取辅实体对向量;
基于所述主实体对向量和辅实体对向量加权并获取关系概率值。
3.根据权利要求2所述的方法,其特征在于,所述基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果,包括:
基于主实体对向量预测主关系类型,基于辅实体对向量预测辅关系类型;
基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
4.基于双模型增强的垂直领域关系抽取系统,其特征在于,包括:
原始文本处理模块,用于采集原始文本,基于所述原始文本抽取实体信息;
句子输入序列获取模块,用于基于所述实体信息嵌入所述原始文本获取第一句子输入序列;基于所述实体信息在知识图谱中提取属性信息,并将所述实体信息与属性信息拼接获取第二句子输入序列;
关系概率值计算模块,用于设置主模型和辅模型,将所述第一句子输入序列输入主模型,将所述第二句子输入序列输入辅模型,基于主模型和辅模型的输出结果加权并获取关系概率值;
最终关系抽取模块,用于基于主模型的输出结果预测主关系类型,基于辅模型的输出结果预测辅关系类型,基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果;
所述原始文本处理模块,包括:
实体跨度信息获取子模块,用于采集原始文本,提取所述原始文本中的实体头、实体尾和实体跨度,并基于所述实体头、实体尾和实体跨度获取实体跨度信息;
实体类型信息获取子模块,用于基于所述实体跨度信息获取实体类型信息;
所述句子输入序列获取模块,包括:
第一序列获取子模块,用于将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列;
第二序列获取子模块,用于基于实体头和实体尾在知识图谱中提取属性信息,并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。
5.根据权利要求4所述的系统,其特征在于,所述关系概率值计算模块,包括:
双模型设置子模块,用于设置主模型和辅模型;
主实体对向量获取子模块,用于将所述第一句子输入序列输入主模型获取主实体对向量;
辅实体对向量获取子模块,用于将所述第二句子输入序列输入辅模型获取辅实体对向量;
关系概率值计算子模块,用于基于所述主实体对向量和辅实体对向量加权并获取关系概率值。
6.根据权利要求5所述的系统,其特征在于,所述最终关系抽取模块,包括:
关系类型预测子模块,用于基于主实体对向量预测主关系类型,基于辅实体对向量预测辅关系类型;
最终预测结果抽取子模块,用于基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。
CN202210855091.1A 2022-07-20 2022-07-20 基于双模型增强的垂直领域关系抽取方法及系统 Active CN115080705B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210855091.1A CN115080705B (zh) 2022-07-20 2022-07-20 基于双模型增强的垂直领域关系抽取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210855091.1A CN115080705B (zh) 2022-07-20 2022-07-20 基于双模型增强的垂直领域关系抽取方法及系统

Publications (2)

Publication Number Publication Date
CN115080705A CN115080705A (zh) 2022-09-20
CN115080705B true CN115080705B (zh) 2022-11-11

Family

ID=83260674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210855091.1A Active CN115080705B (zh) 2022-07-20 2022-07-20 基于双模型增强的垂直领域关系抽取方法及系统

Country Status (1)

Country Link
CN (1) CN115080705B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779260A (zh) * 2021-08-12 2021-12-10 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN113901825A (zh) * 2021-11-22 2022-01-07 东北大学 一种基于主动深度学习的实体关系联合抽取方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504490B2 (en) * 2010-04-09 2013-08-06 Microsoft Corporation Web-scale entity relationship extraction that extracts pattern(s) based on an extracted tuple
CN108733792B (zh) * 2018-05-14 2020-12-01 北京大学深圳研究生院 一种实体关系抽取方法
US11593560B2 (en) * 2020-10-21 2023-02-28 Beijing Wodong Tianjun Information Technology Co., Ltd. System and method for relation extraction with adaptive thresholding and localized context pooling
CN112527999B (zh) * 2020-12-22 2024-05-14 江苏省农业科学院 引入农业领域知识的抽取式智能问答方法及系统
CN113051929A (zh) * 2021-03-23 2021-06-29 电子科技大学 一种基于细粒度语义信息增强的实体关系抽取的方法
CN114510576A (zh) * 2021-12-21 2022-05-17 一拓通信集团股份有限公司 一种基于BERT和BiGRU融合注意力机制的实体关系抽取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779260A (zh) * 2021-08-12 2021-12-10 华东师范大学 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN113901825A (zh) * 2021-11-22 2022-01-07 东北大学 一种基于主动深度学习的实体关系联合抽取方法及系统

Also Published As

Publication number Publication date
CN115080705A (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN109934261B (zh) 一种知识驱动参数传播模型及其少样本学习方法
CN110765791A (zh) 机器翻译自动后编辑方法及装置
WO2022134793A1 (zh) 视频帧语义信息的提取方法、装置及计算机设备
CN109086265A (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN113743119B (zh) 中文命名实体识别模块、方法、装置及电子设备
CN113032601A (zh) 一种基于判别性提升的零样本草图检索方法
CN113239159A (zh) 基于关系推理网络的视频和文本的跨模态检索方法
CN113807214B (zh) 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN114048314A (zh) 一种自然语言隐写分析方法
Rama et al. LSTM autoencoders for dialect analysis
CN115080705B (zh) 基于双模型增强的垂直领域关系抽取方法及系统
CN117197568A (zh) 一种基于clip的零样本图像识别方法
CN115952360A (zh) 基于用户和物品共性建模的域自适应跨域推荐方法及系统
CN115934883A (zh) 一种基于语义增强的多特征融合的实体关系联合抽取方法
CN113159071B (zh) 一种跨模态图像-文本关联异常检测方法
CN115661539A (zh) 一种嵌入不确定性信息的少样本图像识别方法
CN111858999B (zh) 一种基于分段困难样本生成的检索方法及装置
CN110472243B (zh) 一种中文拼写检查方法
CN113139378B (zh) 一种基于视觉嵌入和条件归一化的图像描述方法
CN116629356B (zh) 基于编码器和高斯混合模型的少样本知识图谱补全方法
CN115587160B (zh) 一种基于自注意力机制的短语级文本图像生成方法及系统
CN116562275B (zh) 一种结合实体属性图的自动文本摘要方法
CN117251599B (zh) 一种视频语料智能测试优化方法、装置和存储介质
US20220366317A1 (en) Systems and methods for field extraction from unlabeled data
CN117235273A (zh) 一种基于跨模态监督的行业知识图谱实体对齐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant