CN112507137A - 开放环境下基于粒度感知的少样本关系抽取方法及应用 - Google Patents
开放环境下基于粒度感知的少样本关系抽取方法及应用 Download PDFInfo
- Publication number
- CN112507137A CN112507137A CN202011500258.XA CN202011500258A CN112507137A CN 112507137 A CN112507137 A CN 112507137A CN 202011500258 A CN202011500258 A CN 202011500258A CN 112507137 A CN112507137 A CN 112507137A
- Authority
- CN
- China
- Prior art keywords
- relation
- granularity
- relationship
- query
- predefined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008447 perception Effects 0.000 title claims abstract description 33
- 238000000605 extraction Methods 0.000 title claims abstract description 20
- 239000013598 vector Substances 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 11
- 238000001514 detection method Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 3
- 238000000691 measurement method Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 238000010276 construction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种开放环境下基于粒度感知的少样本关系抽取方法及应用,该方法包括:输入一个句子及存在于句子中的两个实体,输出该实体对在对应句子中所属的预定义关系或者判断出其不属于任何一个预定义关系;对每个单词采用预训练的词嵌入模型进行初始化,并采用卷积神经网络编码得到句子低维向量表示并映射到同一个高维向量空间中,以支持集的中心点作为每个关系类别的原型表示;通过衡量查询实例到各个关系原型之间距离来度量相似程度,得到查询实例的所属关系类别;对每个关系在空间中度量出其原型区域,判断查询实例是否属于预先定义的关系类别中。本发明适应开放动态环境场景,提高关系抽取的预测效果。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种开放环境下基于粒度感知的少样本关系抽取方法及应用。
背景技术
知识图谱以结构化的形式描述客观世界中概念、实体及其之间的关系,是一种对海量信息数据进行组织、管理和理解的方式,具有广泛的应用场景——语义搜索、智能问答、对话系统和推荐系统等。知识图谱以图的形式描述客观世界,由实体以及实体之间的关系所组成。因此,知识图谱的构建过程中需要从大量的文本数据中对实体以及实体与实体之间关系进行识别,即实体关系抽取。
然而,现有的关系抽取模型的性能均依赖于大量的高质量标注样本且标注成本较高。特别在知识图谱构建初期,获取大量的高质量模型训练样本是困难的。面对小样本训练数据的挑战,现有模型算法很容易出现过拟合问题,从而导致模型效果不理想。同时,在真实标注数据里,往往会出现很多的长尾关系(即存在某些实体类型和关系类型具有少量标注样本)。
同时,现有的关系抽取模型往往基于一个封闭世界的假设,即待预测查询实例的关系只能属于预定义关系集合中的其中一个种关系。然而,在开放动态的环境下,会存在新的关系暂时没有被发现或者没有被定义的场景。现存大部分的模型均忽略了新关系的出现,错误地将属于新关系的查询实例分类到预定义关系中。
发明内容
为了克服现有技术存在的缺陷与不足,本发明提供一种开放环境下基于粒度感知的少样本关系抽取方法,基于原型网络模型将实例表示映射到同一高维特征空间,考虑关系的粒度特征信息,提出了区域的原型网络模型,解决当前少样本关系学习模型中忽略关系粒度特征以及开放动态环境场景的问题,提高关系抽取的预测效果。
为了达到上述目的,本发明采用以下技术方案:
本发明提供一种开放环境下基于粒度感知的少样本关系抽取方法,包括下述步骤:
词编码:输入句子文本,将文本中的每一个单词映射为词嵌入向量;
句子编码:以句子为单位,将词嵌入向量输入到卷积神经网络中,构建多个卷积核提取出特征向量;
未知关系实例检测:以每个关系为单位,将支持样本的低维向量映射到特征空间中,并衡量出给定关系的区域范围;
若查询实例表示处于区域范围内,则属于给定的预定义关系,若不处于区域范围内,则不属于给定的预定义关系,从而判断出给定查询实例是否属于预定义的关系集合中;
关系粒度感知的区域原型网络:以每个关系为单位,利用句子编码得到支持样本的表示,并将每个关系表示成一个空间区域表示,捕捉每种关系的粒度特征,通过对比查询实例到各个关系的区域距离大小,检索出归属的预定义关系类别;
联合训练未知关系实例检测和关系粒度感知的区域原型网络后,输入预定义关系的支持集以及待预测的查询实例,进行词编码和句子编码,通过未知关系实例检测判断出该查询实例是否属于已预定义的关系集合,若查询实例被未知关系实例检测出不属于预定义关系时,其将输入到关系粒度感知的区域原型网络,进一步预测出所属的预定义关系。
作为优选的技术方案,所述将文本中的每一个单词映射为词嵌入向量,具体表示为:
作为优选的技术方案,所述构建多个卷积核提取出特征向量,所述特征向量包括单词之间的局部上下文信息,表示为:
x=fd(S)
其中,fφ(S)采用的是卷积神经网络和最大池化层;
对于给定的关系ri表示为其所属的ni个支持样本的中心点,表示为:
作为优选的技术方案,所述捕捉每种关系的粒度特征,粒度特征表示为:
向量的每个维度值表示为:
作为优选的技术方案,所述关系的分布宽度表示为:
αi=σ(sum{fi⊙wreject})
其中,η和θ是两个标量值,wreject表示权重向量;⊙表示为两个向量对应维度相乘运算,sum{.}表示向量内各个维度数值相加运算,σ(.)表示激活函数tanh,表示对于每个关系ri所属支持样本到其原型ci的最长距离,d(.,.)表示给定两个向量在高维特征空间中的欧式距离,max(.,.)表示获取数组内元素数值的最大值运算。
作为优选的技术方案,所述通过对比查询实例到各个关系的区域距离大小,检索出归属的预定义关系类别,具体步骤包括:
δi=σ(sum{fi⊙wgran})
将给定的查询实例编码后得到实例向量,属于关系ri的概率表示为:
其中,|R|表示的是预定义关系结合的关系数量,q表示实例向量。
作为优选的技术方案,所述联合训练的损失函数表示为:
Loss=λ1Lphrase1+λ2Lphrase2
其中,λ1和λ2分别代表的是未知关系实例检测和关系粒度感知的区域原型网络的损失函数权重。
本发明还提供一种开放环境下基于粒度感知的少样本关系抽取系统,包括:
词编码模块、句子编码模块、未知关系实例检测模块和关系粒度感知的区域原型网络模块;
所述词编码模块用于将输入句子文本中的每一个单词映射为词嵌入向量;
所述句子编码模块用于以句子为单位,将词嵌入向量输入到卷积神经网络中,构建多个卷积核提取出特征向量;
所述未知关系实例检测模块用于以每个关系为单位,将支持样本的低维向量映射到特征空间中,并衡量出给定关系的区域范围;
若查询实例表示处于区域范围内,则属于给定的预定义关系,若不处于区域范围内,则不属于给定的预定义关系,从而判断出给定查询实例是否属于预定义的关系集合中;
所述关系粒度感知的区域原型网络模块用于以每个关系为单位,利用句子编码得到支持样本的表示,并将每个关系表示成一个空间区域表示,捕捉每种关系的粒度特征,通过对比查询实例到各个关系的区域距离大小,检索出归属的预定义关系类别;
联合训练未知关系实例检测模块和关系粒度感知的区域原型网络模块,输入预定义关系的支持集以及待预测的查询实例,词编码模块和句子编码模块编码,通过未知关系实例检测模块判断出该查询实例是否属于已预定义的关系集合,若查询实例被未知关系实例检测模块出不属于预定义关系时,其将输入到关系粒度感知的区域原型网络模块,进一步预测出所属的预定义关系。
本发明还提供一种存储介质,存储有程序,所述程序被处理器执行时实现如上述开放环境下基于粒度感知的少样本关系抽取方法。
本发明还提供一种计算设备,包括处理器和用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现如上述开放环境下基于粒度感知的少样本关系抽取方法。
本发明与现有技术相比,具有如下优点和有益效果:
本发明利用少样本学习技术和基于原型网络模型,解决当前关系抽取模型依赖于大量标注样本,以及适应开放动态环境场景的关系抽取问题,提高关系抽取的预测效果。
附图说明
图1为本发明开放环境下基于粒度感知的少样本关系抽取方法流程示意图;
图2为本发明开放环境下基于粒度感知的少样本关系抽取系统结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示,本实施例提供一种开放环境下基于粒度感知的少样本关系抽取方法,具体步骤包括:
S1:词编码:输入句子文本,将文本中的每一个单词映射为词嵌入向量;
在本实施例中,文本中每一个单词映射得到的词嵌入向量表示为:
S={v1,v2,...,vL}
S2:句子编码:以句子为单位,将词嵌入向量输入到卷积神经网络中,构建多个卷积核提取出特征向量;
在本实施例中,卷积神经网络提取的特征向量包含了单词之间的局部上下文信息,因此,提取的特征向量表示为:
x=fφ(S)
其中,fφ(S)采用的是卷积神经网络和最大池化层,同时,对于给定的关系ri表示为其所属的ni个支持样本的中心点,其被表示为:
S3:未知关系实例检测:以每个关系为单位,将K个支持样本(K一般小于或者等于20)的低维向量映射到特征空间中,并衡量出给定关系的区域范围;若查询实例表示处于区域范围内,则属于给定的预定义关系,若不处于区域范围内,则不属于给定的预定义关系,从而判断出给定查询实例是否属于预定义的关系集合中;
在本实施例中,利用有限的支持样本以捕捉关系的粒度大小,从而度量出关系在特征空间中的范围区域,以应对动态开放的识别环境。
S4:以每个关系为单位,利用句子编码得到支持样本的表示,并以区域来表示关系的表示,并捕捉关系的粒度特征信息;即粗粒度关系被表示为更宽的区域;细粒度关系被表示为更窄的区域;最后通过对比查询实例到各个关系的区域距离大小,检索出最为可能的预定义关系类别;
在本实施例中,对于每个关系所拥有的有限支持标注样本,以捕捉每种关系的粗细粒度特征,其粒度特征表示为:
αi=σ(sum{fi⊙wreject})
其中,η和θ是两个可训练的标量值,通常会被初始化为1.0。同时,wreject表示的是为一个可学习的权重向量;⊙表示为两个向量对应维度相乘运算;sum{.}表示的是向量内各个维度数值相加运算;σ(.)表示的是tanh的激活函数。表示的是对于每个关系ri所属支持样本到其原型ci的最长距离。其公式表示为:
其中,d(.,.)表示的是给定两个向量在高维特征空间中的欧式距离。max(.,.)表示为获取数组内元素数值的最大值运算。
给定一个查询实例样本query,经过上述编码,可以得到对应的向量q。因此,给定一个查询实例q,其被判断数据关系ri的概率可表示如下:
δi=σ(sum{fi⊙wgran})
其中,d(.,.)表示的是给定两个向量之间的欧式距离。
给定查询实例query并输入到上述权利要求1,2的编码器,得到对应的实例向量表示q;因此给定实例q,属于关系ri的概率表示如下:
其中|R|表示的是预定义关系结合的关系数量。
S5:联合训练未知关系实例检测和关系粒度感知的区域原型网络后,输入预定义关系的支持集以及待预测的查询实例Query,进行词编码和句子编码后,通过未知关系实例检测后,可以判断出该查询实例Query是否属于已预定义的关系集合,若查询实例Query被未知关系实例检测检测出不属于预定义关系时,其将输入到关系粒度感知的区域原型网络,进一步预测出其属于最有可能的预定义关系。
在本实施例中,通过联合训练未知关系实例检测和关系粒度感知的区域原型网络,得到最佳的模型参数,联合训练的损失函数表示如下:
Loss=λ1Lphrase1+λ2Lphrase2
其中,λ1和λ2分别代表的是未知关系实例检测和关系粒度感知的区域原型网络的损失函数权重。
如图2所示,本实施例还提供一种开放环境下基于粒度感知的少样本关系抽取系统,包括:词编码模块、句子编码模块、未知关系实例检测模块和关系粒度感知的区域原型网络模块;
所述词编码模块用于将输入句子文本中的每一个单词映射为词嵌入向量;
所述句子编码模块用于以句子为单位,将词嵌入向量输入到卷积神经网络中,构建多个卷积核提取出特征向量;
所述未知关系实例检测模块用于以每个关系为单位,将支持样本的低维向量映射到特征空间中,并衡量出给定关系的区域范围;
若查询实例表示处于区域范围内,则属于给定的预定义关系,若不处于区域范围内,则不属于给定的预定义关系,从而判断出给定查询实例是否属于预定义的关系集合中;
所述关系粒度感知的区域原型网络模块用于以每个关系为单位,利用句子编码得到支持样本的表示,并将每个关系表示成一个空间区域表示,捕捉每种关系的粒度特征,通过对比查询实例到各个关系的区域距离大小,检索出归属的预定义关系类别;
联合训练未知关系实例检测模块和关系粒度感知的区域原型网络模块,输入预定义关系的支持集以及待预测的查询实例,词编码模块和句子编码模块编码,通过未知关系实例检测模块判断出该查询实例是否属于已预定义的关系集合,若查询实例被未知关系实例检测模块出不属于预定义关系时,其将输入到关系粒度感知的区域原型网络模块,进一步预测出所属的预定义关系。
本实施例提供一种存储介质,存储介质可以是ROM、RAM、磁盘、光盘等储存介质,该存储介质存储有一个或多个程序,所述程序被处理器执行时,实现上述开放环境下基于粒度感知的少样本关系抽取方法。
本实施例提供一种计算设备,所述的计算设备可以是台式电脑、笔记本电脑、智能手机、PDA手持终端、平板电脑或其他具有显示功能的终端设备,该计算设备包括该计算设备包括处理器和存储器,存储器存储有一个或多个程序,处理器执行存储器存储的程序时,实现上述开放环境下基于粒度感知的少样本关系抽取方法。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种开放环境下基于粒度感知的少样本关系抽取方法,其特征在于,包括下述步骤:
词编码:输入句子文本,将文本中的每一个单词映射为词嵌入向量;
句子编码:以句子为单位,将词嵌入向量输入到卷积神经网络中,构建多个卷积核提取出特征向量;
未知关系实例检测:以每个关系为单位,将支持样本的低维向量映射到特征空间中,并衡量出给定关系的区域范围;
若查询实例表示处于区域范围内,则属于给定的预定义关系,若不处于区域范围内,则不属于给定的预定义关系,从而判断出给定查询实例是否属于预定义的关系集合中;
关系粒度感知的区域原型网络:以每个关系为单位,利用句子编码得到支持样本的表示,并将每个关系表示成一个空间区域表示,捕捉每种关系的粒度特征,通过对比查询实例到各个关系的区域距离大小,检索出归属的预定义关系类别;
联合训练未知关系实例检测和关系粒度感知的区域原型网络后,输入预定义关系的支持集以及待预测的查询实例,进行词编码和句子编码,通过未知关系实例检测判断出该查询实例是否属于已预定义的关系集合,若查询实例被未知关系实例检测出不属于预定义关系时,其将输入到关系粒度感知的区域原型网络,进一步预测出所属的预定义关系。
7.根据权利要求1所述的开放环境下基于粒度感知的少样本关系抽取方法,其特征在于,所述联合训练的损失函数表示为:
Loss=λ1Lphrase1+λ2Lphrase2
其中,λ1和λ2分别代表的是未知关系实例检测和关系粒度感知的区域原型网络的损失函数权重。
8.一种开放环境下基于粒度感知的少样本关系抽取系统,其特征在于,包括:
词编码模块、句子编码模块、未知关系实例检测模块和关系粒度感知的区域原型网络模块;
所述词编码模块用于将输入句子文本中的每一个单词映射为词嵌入向量;
所述句子编码模块用于以句子为单位,将词嵌入向量输入到卷积神经网络中,构建多个卷积核提取出特征向量;
所述未知关系实例检测模块用于以每个关系为单位,将支持样本的低维向量映射到特征空间中,并衡量出给定关系的区域范围;
若查询实例表示处于区域范围内,则属于给定的预定义关系,若不处于区域范围内,则不属于给定的预定义关系,从而判断出给定查询实例是否属于预定义的关系集合中;
所述关系粒度感知的区域原型网络模块用于以每个关系为单位,利用句子编码得到支持样本的表示,并将每个关系表示成一个空间区域表示,捕捉每种关系的粒度特征,通过对比查询实例到各个关系的区域距离大小,检索出归属的预定义关系类别;
联合训练未知关系实例检测模块和关系粒度感知的区域原型网络模块,输入预定义关系的支持集以及待预测的查询实例,词编码模块和句子编码模块编码,通过未知关系实例检测模块判断出该查询实例是否属于已预定义的关系集合,若查询实例被未知关系实例检测模块出不属于预定义关系时,其将输入到关系粒度感知的区域原型网络模块,进一步预测出所属的预定义关系。
9.一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7任一项所述开放环境下基于粒度感知的少样本关系抽取方法。
10.一种计算设备,包括处理器和用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现如权利要求1-7任一项所述开放环境下基于粒度感知的少样本关系抽取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011500258.XA CN112507137B (zh) | 2020-12-17 | 2020-12-17 | 开放环境下基于粒度感知的少样本关系抽取方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011500258.XA CN112507137B (zh) | 2020-12-17 | 2020-12-17 | 开放环境下基于粒度感知的少样本关系抽取方法及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507137A true CN112507137A (zh) | 2021-03-16 |
CN112507137B CN112507137B (zh) | 2022-04-22 |
Family
ID=74922266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011500258.XA Active CN112507137B (zh) | 2020-12-17 | 2020-12-17 | 开放环境下基于粒度感知的少样本关系抽取方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507137B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547241A (zh) * | 2022-02-08 | 2022-05-27 | 南华大学 | 联合字符感知和句子感知的小样本实体识别方法与模型 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140163955A1 (en) * | 2012-12-10 | 2014-06-12 | General Electric Company | System and Method For Extracting Ontological Information From A Body Of Text |
CN108829722A (zh) * | 2018-05-08 | 2018-11-16 | 国家计算机网络与信息安全管理中心 | 一种远程监督的Dual-Attention关系分类方法及系统 |
US20190005012A1 (en) * | 2017-06-30 | 2019-01-03 | Accenture Global Solutions Limited | Document processing |
US20200134422A1 (en) * | 2018-10-29 | 2020-04-30 | International Business Machines Corporation | Relation extraction from text using machine learning |
-
2020
- 2020-12-17 CN CN202011500258.XA patent/CN112507137B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140163955A1 (en) * | 2012-12-10 | 2014-06-12 | General Electric Company | System and Method For Extracting Ontological Information From A Body Of Text |
US20190005012A1 (en) * | 2017-06-30 | 2019-01-03 | Accenture Global Solutions Limited | Document processing |
CN108829722A (zh) * | 2018-05-08 | 2018-11-16 | 国家计算机网络与信息安全管理中心 | 一种远程监督的Dual-Attention关系分类方法及系统 |
US20200134422A1 (en) * | 2018-10-29 | 2020-04-30 | International Business Machines Corporation | Relation extraction from text using machine learning |
Non-Patent Citations (1)
Title |
---|
李博等: "改进的卷积神经网络关系分类方法研究", 《计算机科学与探索》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547241A (zh) * | 2022-02-08 | 2022-05-27 | 南华大学 | 联合字符感知和句子感知的小样本实体识别方法与模型 |
CN114547241B (zh) * | 2022-02-08 | 2024-10-18 | 南华大学 | 一种联合字符感知和句子感知的小样本实体识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112507137B (zh) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108717408B (zh) | 一种敏感词实时监控方法、电子设备、存储介质及系统 | |
RU2678716C1 (ru) | Использование автоэнкодеров для обучения классификаторов текстов на естественном языке | |
CN112819023B (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN109471944B (zh) | 文本分类模型的训练方法、装置及可读存储介质 | |
CN113360701B (zh) | 一种基于知识蒸馏的素描图处理方法及其系统 | |
CN109784405B (zh) | 基于伪标签学习和语义一致性的跨模态检索方法及系统 | |
CN106845358B (zh) | 一种手写体字符图像特征识别的方法及系统 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
Li et al. | Fuzzy bag of words for social image description | |
CN112749737A (zh) | 图像分类方法及装置、电子设备、存储介质 | |
CN118094018B (zh) | 一种增强的图对比学习推荐系统方法、设备及存储介质 | |
CN115879508A (zh) | 一种数据处理方法及相关装置 | |
CN112507137B (zh) | 开放环境下基于粒度感知的少样本关系抽取方法及应用 | |
CN113535928A (zh) | 基于注意力机制下长短期记忆网络的服务发现方法及系统 | |
CN117391466A (zh) | 一种新型矛盾纠纷案件的预警方法和系统 | |
CN117009599A (zh) | 数据检索方法、装置、处理器及电子设备 | |
CN116467451A (zh) | 一种文本分类方法、装置、存储介质以及电子设备 | |
CN117216617A (zh) | 文本分类模型训练方法、装置、计算机设备和存储介质 | |
CN111091198A (zh) | 一种数据处理方法及装置 | |
Zhao et al. | Asymmetric deep hashing for person re-identifications | |
CN116089605A (zh) | 基于迁移学习和改进词袋模型的文本情感分析方法 | |
CN115272688A (zh) | 一种基于元特征的小样本学习图像分类方法 | |
CN110826726B (zh) | 目标处理方法、目标处理装置、目标处理设备及介质 | |
CN114692715A (zh) | 一种样本标注方法及装置 | |
Lulu et al. | TMNIO: Triplet merged network with involution operators for improved few‐shot image classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |