CN111985152A - 一种基于二分超球面原型网络的事件分类方法 - Google Patents
一种基于二分超球面原型网络的事件分类方法 Download PDFInfo
- Publication number
- CN111985152A CN111985152A CN202010738919.6A CN202010738919A CN111985152A CN 111985152 A CN111985152 A CN 111985152A CN 202010738919 A CN202010738919 A CN 202010738919A CN 111985152 A CN111985152 A CN 111985152A
- Authority
- CN
- China
- Prior art keywords
- representation
- prototype
- event
- hypersphere
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000001364 causal effect Effects 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 34
- 238000000605 extraction Methods 0.000 claims description 22
- 238000013507 mapping Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 238000012549 training Methods 0.000 description 7
- 208000027418 Wounds and injury Diseases 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 208000014674 injury Diseases 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于二分超球面原型网络的事件分类方法,包括:获取实例,利用实例表示模型编码得到实例表示;构建事件的原型表示;根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;根据总损失优化模型参数,得到参数确定的实例表示模型和优化后的原型表示;根据实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。通过事件之间的先验知识进行融合推理来事件分类,提升了事件分类的准确性。
Description
技术领域
本发明属于信息抽取及推理技术领域,具体涉及一种基于二分超球面原型网络的事件分类方法。
背景技术
传统的事件抽取模型总是基于监督学习的,因而需要充足的训练样本,但在真实世界中大量的标记样本往往是难以获取的。而且,事件抽取的效果随着样本数的减少而减弱。但是,目前的大部分模型都假设充足的训练样本是学习事件表示必不可少的条件,这使得事件抽取任务难以取得理想的效果。因此,让模型可以在低资源的情况下抽取事件就格外重要。传统的低资源事件抽取模型主要是基于监督学习,迁移学习/预训练,或者元学习,虽然它们也可以取得不错的效果,但都是数据驱动的模型,对数据的依赖太强,而且忽略了事件本身的隐含先验信息,比如,事件之间的因果关系。
从直觉上来看,建模事件之间的隐含关系有利于增强低资源事件抽取的效果,比如袭击事件包含461个实例,受伤事件包含53个实例,而袭击事件将会导致受伤事件,如果模型可以捕获这两类事件之间的因果关系,将知识从袭击因事件迁移到受伤果事件,那么将促进低资源事件的抽取效果,而且这种促进效果在事件实例极其小的时候表现尤为明显。
申请公布号为CN104598535A的专利申请公开了一种基于最大熵的事件抽取方法,申请公布号为CN106951530A的专利申请公开了一种事件类型抽取方法和装置。这两个技术方案的事情抽取方法对于低资源事件抽取效果均不好。
发明内容
本发明的目的是提供一种基于二分超球面原型网络的事件分类方法,特别适用于低资源事件的分类,通过事件之间的先验知识进行融合推理来事件分类,提升了事件分类的准确性。
为实现上述发明目的,本发明提供以下技术方案:
一种基于二分超球面原型网络的事件抽取方法,所述事件抽取方法包括以下步骤:
获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示,并通过超球面映射函数得到实例在超球面上的表示;
根据每个事件包含的所有实例的实例表示构建事件的原型表示;
根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;
根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和优化后的原型表示;
应用时,根据参数确定的实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。
与现有技术相比,本发明具有的有益效果至少包括:
上述事件分类方法是目前率先融合推理去解决事件抽取任务的方法,不同于以往的方法采用的模型多是数据驱动的,本发明中,采用将超球面一分为二的二分超球面原型网络,利用二分超球面原型网络进行融合推理,通过该二分超球面原型网络对事件对之间隐含的先验知识的建模,在优化过程中,可以将实例较多的事件类型的知识迁移到实例较少的事件类型上,可以降低模型对数据的依赖,在一定程度上缓解了低资源条件下事件分类效果不佳的问题,因而特别适合用于低资源场景的事件分类。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的基于二分超球面原型网络的事件分类方法的流程图;
图2是本发明实施例提供的二分超球面示意图;
图3是本发明实施例提供的事件分类方法中因果事件检测效果图;
图4(a)~图4(c)是本发明实施例提供的事件原型在普通原型网络PN、超球面原型网络HPN以及二分超球面原型网络Di-HPN下的可视化表示。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1是本发明实施例提供的基于二分超球面原型网络的事件分类方法的流程图,如图1所示,实施例提供的基于二分超球面原型网络的事件分类方法包括以下步骤:
S1,获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示。
事件提取领域,将每个句子作为一个实例,通过预训练的词向量和随机初始化的位置向量来编码实例。针对表示为X={xi,i∈[1,L]}的实例,xi表示实例中的第i个字段(每个字段可以理解为单个词),L为实例包含的最大字段数目,也就是每个实例包含的字段的总个数。
每个字段的嵌入表示x=[w,v],w表示预训练的词向量,v=[vb,ve,vl,]表示位置向量,dw维,vb,ve,vl分别表示字段到句首、句尾的距离和字段所属实例的字段长度,由3个dp维向量组成。
在获得每个字段的嵌入表示后,根据该嵌入表示可以获得整个实例的实例表示,具体地,将字段的嵌入表示的输入至实例表示模型中,经过编码得到实例表示,即xi表示第i个字段的嵌入表示。该实例表示模型作为整个算法中整体模型的一部分,在优化的过程中模型参数需要被优化。实例表示模型为CNN、RNN、BERT等一些文本编码模型。这些实例表示模型均能够获得比较准确编码得到实例表示。
S2,根据每个事件包含的所有实例的实例表示构建事件的原型表示。
不同于传统的原型网络只将极少量实例表示的均值作为原型表示,这里的超球面原型网络是将一个类别的所有实例表示的均值表示成原型,当然,兼顾模型的简洁性和有效性,这里设了一个最大实例数目的阈值σ,即一个原型最多由σ个实例的均值来表示。此外,不同于传统的原型网络中原型分布于平面,超球面原型网络中原型分布于超球面。因此,根据每个事件包含的所有实例的实例表示构建事件的原型表示为:
其中,pk表示第k类事件的原型表示,Fs(·)表示原型点分布到球面的函数,avg(·)表示平均函数,Xj表示第j个实例的实例表示,Jk为属于第k类事件的实例的总个数。
S3,根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失。
实施例中,训练的目标之一就是减少实例的超球面表示(也即是实际类别)和实例所属事件的原型表示之间的距离差异,利用超球面原型网络,有利于在构建原型的时候嵌入先验知识,这些事件之间隐含的关系是推理的基础,因此,根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失为:
其中,Lc表示分类损失,表示第j个实例的超球面表示与第k类事件的原型表示pk之间的夹角,Fs(·)表示原型点分布到球面的函数,Jk表示属于第k类事件的实例的总个数,|·|表示向量的模,‖·‖表示向量的二范数。
原型推理是基于原型对的隐含信息注入先验知识来进行的,比如事件之间的因果关系。如图2所示,本发明将超球面原型网络一分为二,分为源半球和目标半球,中间由介质层隔开,命名为二分超球面原型网络。给定一个事件因果对,因事件位于源半球,果事件位于目标半球,而且因果对事件到介质层的距离相等,即和分别表示分布在源半球和目标半球的第i层第j个原型,如果他们对应的事件类别刚好可以构成因果事件,则和到介质层的距离应该趋近于相等,即本发明中,将超球面一分为二建模的方式,可以在原型对之间进行推理,更利于推理出事件之间的因果关系。给定一对原型,它们之间构成因果对的可能性为:
其中,k和t表示事件的索引,pk表示第k类事件的原型表示,pt表示第t类事件的原型表示,D(·)表示原型表示到介质层距离的函数,λ是超参数,K表示总事件类型数,s(pk,pt)表示pk与pt形成因果对的可能性。
基于原型对的推理,可以实现原型对之间的知识迁移,这对于低资源场景来说,可以很大程度上减少模型对数据的依赖。根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失为:
其中,K表示总事件类型数。
这样,根据分类损失和推理损失构建得到总损失为:
L=αLc+(1-α)Lr
其中,L表示总损失,Lc表示分类损失,Lr表示推理损失,α为权重参数,取值为0~1。
S4,根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和优化后的原型表示。
实施例中,实例表示模型和二分超球面原型网络共同组成了本发明事件分类方法采用的模型,在获得总损失后可以根据总损失对实例表示模型参数和损失函数超参数进行优化。在优化的过程中,不仅实例表示模型参数和损失函数超参数得到优化,事件的原型表示也得到优化,优化结束后,优化后的事件的原型表示分布表示在二分超球面原型网络上,该优化后的原型表示作为评判新实例的事件类型的基础。
S5,应用时,根据参数确定的实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。
本发明中模型优化旨在使输出的类别编码(也即是超球面表示)和事件类原型之间的距离尽可能接近。对于新实例,应用S1中的方法先获得新实例包含字段的嵌入表示,也就是词向量和位置向量,然后根据该嵌入表示利用实例表示模型得到新实例的实例表示,接下来,计算实例表示与所有优化后的原型表示的相似度为:
最后,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。这样就实现了实例的事件分类。
上述事件分类方法是目前率先融合推理去解决事件抽取任务的方法,不同于以往的方法采用的模型多是数据驱动的,本发明中,采用将超球面一分为二的二分超球面原型网络,利用二分超球面原型网络进行融合推理,通过该二分超球面原型网络对事件对之间隐含的先验知识的建模,在优化过程中,可以将实例较多的事件类型的知识迁移到实例较少的事件类型上,可以降低模型对数据的依赖,在一定程度上缓解了低资源条件下事件分类效果不佳的问题,因而特别适合用于低资源场景的事件分类。
实验例
在训练过程中,使用SGD优化器进行优化,进行了30000次的训练迭代和2000次的测试迭代。词向量的维度设为50,单个位置向量的维度设为10,所以整个位置向量是30维。超参数σ设为500,λ设为1,α设为0.5。为了避免过拟合,设置了0.2的dropout比例。模型训练的学习率设为0.001。模型的性能用事件抽取的准确率、召回率和F1值来度量。
在因果事件抽取数据集上的事件抽取效果如下表所示:
模型 | 准确率 | 召回率 | F1值 |
DMCNN | 0.7033 | 0.7156 | 0.7156 |
JRNN | 0.7156 | 0.6831 | 0.7088 |
JMEE | 0.7491 | 0.7034 | 0.7418 |
Ours | 0.7889 | 0.7438 | 0.7732 |
Ours(+25%) | 0.7421 | 0.7132 | 0.7399 |
Ours(+50%) | 0.7605 | 0.7204 | 0.7539 |
Ours(+75%) | 0.7713 | 0.7378 | 0.7694 |
其中,DMCNN模型出自《Event Extraction via Dynamic Multi-PoolingConvolutional Neural Networks》,JRNN模型出自《Joint Event Extraction viaRecurrent Neural Networks》,JMEE模型出自《Jointly Multiple Events Extractionvia Attention-based Graph Information Aggregation》,Ours就是本发明提出二分超球面原型网络模型。
为了验证融合推理的二分超球面原型网络在低资源条件下的性能,分别在25%、50%、75%的数据上做测试,可以发现模型即使在低资源条件下也可以取得比传统模型更好的效果。
下面给出一些具体的实例,如图3所示。
图3中横轴表示的是因事件,纵轴是果事件,颜色越深表示构成因果事件对的可能性越高。可以发现,模型判断出的因果事件对基本还是符合实际情况的。比如,袭击作为因事件,比较可能的果事件是受伤,死亡和逮捕入狱;协商作为因事件,比较可能的果事件是合作;经济衰退作为果事件,比较可能的因事件是制裁和企业关闭。
此外,为论证融合推理的二分超球面原型网络解决因果事件抽取任务的优势,将二分超球面原型网络Di-HPN与传统的原型网络PN和超球面原型网络HPN做比较,可视化它们的原型结果,如图4(a)~图4(c)所示。可以发现,融合推理的二分超球面原型网络对因果事件的检测效果明显优于其他两个原型网络模型。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于二分超球面原型网络的事件分类方法,其特征在于,所述事件抽取方法包括以下步骤:
获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示,并通过超球面映射函数得到实例在超球面上的表示;
根据每个事件包含的所有实例的超球面表示构建事件的原型表示;
根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;
根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和优化后的原型表示;
应用时,根据参数确定的实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。
2.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,所述编码实例中字段的词向量和位置向量包括:
针对表示为X={xi,i∈[1,L]}的实例,xi表示实例中的第i个字段,L为实例包含的最大字段数目;
每个字段的嵌入表示x=[w,v],w表示预训练的词向量,v=[vb,ve,vl,]表示位置向量,vb,ve,vl分别表示字段到句首、句尾的距离和字段所属实例的字段长度。
3.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,所述实例表示模型为CNN、RNN、BERT模型。
7.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,根据分类损失和推理损失构建得到总损失为:
L=αLc+(1-α)Lr
其中,L表示总损失,Lc表示分类损失,Lr表示推理损失,α为权重参数,取值为0~1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010738919.6A CN111985152B (zh) | 2020-07-28 | 2020-07-28 | 一种基于二分超球面原型网络的事件分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010738919.6A CN111985152B (zh) | 2020-07-28 | 2020-07-28 | 一种基于二分超球面原型网络的事件分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985152A true CN111985152A (zh) | 2020-11-24 |
CN111985152B CN111985152B (zh) | 2022-09-13 |
Family
ID=73444636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010738919.6A Active CN111985152B (zh) | 2020-07-28 | 2020-07-28 | 一种基于二分超球面原型网络的事件分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985152B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553577A (zh) * | 2021-06-01 | 2021-10-26 | 中国人民解放军战略支援部队信息工程大学 | 基于超球面变分自动编码器的未知用户恶意行为检测方法及系统 |
CN113610151A (zh) * | 2021-08-05 | 2021-11-05 | 哈尔滨理工大学 | 一种基于原型网络的自编码器网络机制解决小样本图像分类的系统、方法、设备及存储介质 |
CN113987163A (zh) * | 2021-09-27 | 2022-01-28 | 浙江大学 | 一种基于本体指导的终身事件抽取方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598535A (zh) * | 2014-12-29 | 2015-05-06 | 中国科学院计算机网络信息中心 | 一种基于最大熵的事件抽取方法 |
CN106445990A (zh) * | 2016-06-25 | 2017-02-22 | 上海大学 | 事件本体构建方法 |
CN106951530A (zh) * | 2017-03-21 | 2017-07-14 | 苏州大学 | 一种事件类型抽取方法和装置 |
US20180103052A1 (en) * | 2016-10-11 | 2018-04-12 | Battelle Memorial Institute | System and methods for automated detection, reasoning and recommendations for resilient cyber systems |
US20180322416A1 (en) * | 2016-08-30 | 2018-11-08 | Soochow University | Feature extraction and classification method based on support vector data description and system thereof |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
-
2020
- 2020-07-28 CN CN202010738919.6A patent/CN111985152B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598535A (zh) * | 2014-12-29 | 2015-05-06 | 中国科学院计算机网络信息中心 | 一种基于最大熵的事件抽取方法 |
CN106445990A (zh) * | 2016-06-25 | 2017-02-22 | 上海大学 | 事件本体构建方法 |
US20180322416A1 (en) * | 2016-08-30 | 2018-11-08 | Soochow University | Feature extraction and classification method based on support vector data description and system thereof |
US20180103052A1 (en) * | 2016-10-11 | 2018-04-12 | Battelle Memorial Institute | System and methods for automated detection, reasoning and recommendations for resilient cyber systems |
CN106951530A (zh) * | 2017-03-21 | 2017-07-14 | 苏州大学 | 一种事件类型抽取方法和装置 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
Non-Patent Citations (7)
Title |
---|
NINGYU ZHANG,SHUMIN DENG,AND ETC,.: "Relation Adversarial Network for Low Resource Knowledge Graph Completion", 《HTTPS://ARXIV.ORG/PDF/1911.03091.PDF》 * |
PASCAL METTES,ELISE VAN DER POL,CEES G. M. SNOEK: "Hyperspherical Prototype Networks", 《33RD CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS (NEURIPS 2019)》 * |
SHUMIN DENG,NINGYU ZHANG,AND ETC,.: "Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection", 《HTTPS://ARXIV.ORG/PDF/1910.11621.PDF》 * |
SHUMIN DENG,NINGYU ZHANG,AND ETC,.: "When Low Resource NLP Meets Unsupervised Language Model:Meta-pretraining Then Meta-learning for Few-shot Text Classification", 《HTTPS://ARXIV.ORG/PDF/1908.08788.PDF》 * |
TONGZHOU WANG,PHILLIP ISOLA: "Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere", 《PROCEEDINGS OF THE 37 TH INTERNATIONAL CONFERENCE ON MACHINE》 * |
张宁豫,陈曦,陈矫彦,邓淑敏等: "基于位置的知识图谱链接预测", 《中文信息学报》 * |
陈华钧,耿玉霞,叶志权,邓淑敏: ""知识图谱+深度学习"赋能内容安全", 《信息安全研究》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553577A (zh) * | 2021-06-01 | 2021-10-26 | 中国人民解放军战略支援部队信息工程大学 | 基于超球面变分自动编码器的未知用户恶意行为检测方法及系统 |
CN113553577B (zh) * | 2021-06-01 | 2023-03-24 | 中国人民解放军战略支援部队信息工程大学 | 基于超球面变分自动编码器的未知用户恶意行为检测方法及系统 |
CN113610151A (zh) * | 2021-08-05 | 2021-11-05 | 哈尔滨理工大学 | 一种基于原型网络的自编码器网络机制解决小样本图像分类的系统、方法、设备及存储介质 |
CN113610151B (zh) * | 2021-08-05 | 2022-05-03 | 哈尔滨理工大学 | 基于原型网络和自编码器的小样本图像分类系统 |
CN113987163A (zh) * | 2021-09-27 | 2022-01-28 | 浙江大学 | 一种基于本体指导的终身事件抽取方法 |
CN113987163B (zh) * | 2021-09-27 | 2024-06-07 | 浙江大学 | 一种基于本体指导的终身事件抽取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111985152B (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023065545A1 (zh) | 风险预测方法、装置、设备及存储介质 | |
CN111985152B (zh) | 一种基于二分超球面原型网络的事件分类方法 | |
CN109389151B (zh) | 一种基于半监督嵌入表示模型的知识图谱处理方法和装置 | |
CN107220506A (zh) | 基于深度卷积神经网络的乳腺癌风险评估分析系统 | |
CN112417289B (zh) | 一种基于深度聚类的资讯信息智能推荐方法 | |
CN113190654B (zh) | 一种基于实体联合嵌入和概率模型的知识图谱补全方法 | |
CN111931505A (zh) | 一种基于子图嵌入的跨语言实体对齐方法 | |
CN112967088A (zh) | 基于知识蒸馏的营销活动预测模型结构和预测方法 | |
CN114358188A (zh) | 特征提取模型处理、样本检索方法、装置和计算机设备 | |
CN110111365B (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
CN112749274A (zh) | 基于注意力机制和干扰词删除的中文文本分类方法 | |
CN113554100B (zh) | 异构图注意力网络增强的Web服务分类方法 | |
Li et al. | A deep graph structured clustering network | |
Tang et al. | Re-thinking the relations in co-saliency detection | |
CN114332519A (zh) | 一种基于外部三元组和抽象关系的图像描述生成方法 | |
CN108470025A (zh) | 局部话题概率生成正则化自编码文本嵌入表示方法 | |
CN114036308A (zh) | 基于图注意力神经网络的知识图谱表示方法 | |
CN114942998B (zh) | 融合多源数据的知识图谱邻域结构稀疏的实体对齐方法 | |
CN103136540A (zh) | 一种基于隐结构推理的行为识别方法 | |
CN114036298B (zh) | 一种基于图卷积神经网络与词向量的节点分类方法 | |
CN114880538A (zh) | 基于自监督的属性图社团检测方法 | |
Ye et al. | TS2V: A transformer-based Siamese network for representation learning of univariate time-series data | |
CN113435190B (zh) | 一种融合多层次信息抽取和降噪的篇章关系抽取方法 | |
CN117011219A (zh) | 物品质量检测方法、装置、设备、存储介质和程序产品 | |
CN114882279A (zh) | 基于直推式半监督深度学习的多标签图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |