CN113468333A - 一种融合层次类别信息的事件检测方法与系统 - Google Patents

一种融合层次类别信息的事件检测方法与系统 Download PDF

Info

Publication number
CN113468333A
CN113468333A CN202111023710.2A CN202111023710A CN113468333A CN 113468333 A CN113468333 A CN 113468333A CN 202111023710 A CN202111023710 A CN 202111023710A CN 113468333 A CN113468333 A CN 113468333A
Authority
CN
China
Prior art keywords
vector representation
event
word
category
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111023710.2A
Other languages
English (en)
Other versions
CN113468333B (zh
Inventor
刘刚
万仲保
邬昌兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Jiaotong University
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN202111023710.2A priority Critical patent/CN113468333B/zh
Publication of CN113468333A publication Critical patent/CN113468333A/zh
Application granted granted Critical
Publication of CN113468333B publication Critical patent/CN113468333B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出一种融合层次类别信息的事件检测方法与系统,该方法包括:将句子中的每个词转换成词对应的语义向量表示,结合词对应的语义向量表示以计算得到词在上下文中的语义向量表示;根据事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;通过注意力机制确定词相关的事件类别信息的向量表示,将词相关的事件类别信息的向量表示与词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;以词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分,选择总得分最高的标记序列作为最终预测结果。在本发明中,充分利用了事件类别信息,可实现更为准确的事件检测效果。

Description

一种融合层次类别信息的事件检测方法与系统
技术领域
本发明涉及计算机信息处理技术领域,特别涉及一种融合层次类别信息的事件检测方法与系统。
背景技术
事件检测(Event detection)是文本信息抽取中的一项重要任务,其目的是找出文本中所包含的事件的触发词,同时判断事件的类别。例如,以句子“因为上网被骗了,他很难过”为输入,一个事件检测模型应该准确找出事件的触发词是“被骗”,并判断事件的类别为“网络诈骗”。事件检测是从非结构化的文本中抽取事件信息的第一步,也是众多自然语言处理应用的基础,因此受到学术界和产业界越来越多的关注,是当前的研究热点之一。事件检测通常被建模为序列标注问题,即给序列(句子)中的每个字或词指定一个标记。通过联合预测输入句子中每个词的标记(例如,常用的BIO标记模式),并连接相应的标记就可以得到该句子中包含事件的触发词及类别。
早期基于人工特征的事件检测方法通常包括两个步骤:首先,根据任务的特点人工定义大量的特征,包括词特征、句法特征以及实体特征等;然后,选用合适的机器学习算法用于预测,例如,最大熵模型、支持向量机和条件随机场等。这类方法的主要缺点是需要人工定义特征,而人工定义是一件费时费力的事件。此外,将大量人工特征表示为高维的离散向量(几万甚至几十万维)也容易导致过拟合问题。
近年来,随着深度学习的迅速发展,基于神经网络的方法已经成为主流的事件检测方法。这类方法通常设计端到端的网络模型用于事件检测,使用包含丰富语言特征的词向量(通常为低维的实数向量)作为输入,使用双向长短时记忆网络(BiLSTM)等自动提取特定于任务的特征。基于神经网络的方法不但避免了人工设计特征的繁重工作,而且性能优于基于人工特征的方法。现有基于神经网络的事件检测方法大致可以分为以下三大类:(1)采用不同结构的神经网络用于学习特征,例如,卷积神经网络、注意力机制和多头注意力机制等。(2)使用不同的学习算法优化事件检测模型,例如,对抗学习、知识蒸馏和预训练技术等。(3)引入外部资源增强事件检测模型,例如,事件论元相关信息、文档中更多的上下文信息、知识库中的信息和句法信息等。
然而,现有事件检测方法在学习特征的过程中,都忽略了事件类别信息的利用,包括事件类别的名称和事件类别之间的层次关系。本质上,现有方法把所有事件类别进行编号,而不考虑事件类别的名称,且只用于模型的分类层,这显然丢失了很多重要的信息。例如,模型在针对句子“因为上网被骗了,他很难过”进行事件检测时,考虑事件类别的名称有以下两个方面的作用:(1)句子中的词“被骗”和事件类别名称中的词“诈骗”在语义上很接近,这有助于模型准确识别出触发词“被骗”;(2)句子中的词“上网”和事件类别名称中的词“网络”在语义上很接近,这有助于模型准确识别出事件类别为“网络诈骗”。
基于此,有必要提出一种新型的事件检测方法,通过结合考虑事件类别信息,以提高事件检测方法的准确性。
发明内容
鉴于上述状况,有必要解决现有技术中,由于在进行事件检测时,没有将事件类别信息考虑进去,导致事件检测准确度不太理想的问题。
本发明实施例提供了一种融合层次类别信息的事件检测方法,其中,所述方法包括如下步骤:
步骤一:将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合所述词对应的语义向量表示以计算得到词在上下文中的语义向量表示;
步骤二:基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;
步骤三:通过注意力机制确定词相关的事件类别信息的向量表示,然后将所述词相关的事件类别信息的向量表示与所述词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;
步骤四:基于条件随机场层,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分,并选择总得分最高的标记序列作为最终的预测结果。
本发明提出的融合层次类别信息的事件检测方法,首先将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合词对应的语义向量表示以计算得到词在上下文中的语义向量表示;基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;通过注意力机制确定词相关的事件类别信息的向量表示,然后将词相关的事件类别信息的向量表示与词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;最后基于条件随机场层,以词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分,并选择总得分最高的标记序列作为最终的预测结果。本发明提出的融合层次类别信息的事件检测方法,充分利用了事件类别信息,可实现更为准确的事件检测效果。
所述融合层次类别信息的事件检测方法,其中,在所述步骤一中,词在上下文中的语义向量表示对应的符号表示为:
Figure 344296DEST_PATH_IMAGE001
其中,
Figure 792595DEST_PATH_IMAGE002
Figure 103490DEST_PATH_IMAGE003
均为长短时记忆网络,
Figure 29858DEST_PATH_IMAGE002
表示从左至右建模词的上文信息,
Figure 876853DEST_PATH_IMAGE003
表示从右至左建模词的下文信息,
Figure 964895DEST_PATH_IMAGE004
为融合了词的上文信息的语义向量表示,
Figure 763087DEST_PATH_IMAGE005
为融合了词的下文信息的语义向量表示,
Figure 493145DEST_PATH_IMAGE006
为词
Figure 693183DEST_PATH_IMAGE007
对应的语义向量表示,词
Figure 952126DEST_PATH_IMAGE007
在上下文中的语义向量表示为
Figure 237613DEST_PATH_IMAGE008
Figure 505784DEST_PATH_IMAGE009
表示向量拼接操作。
所述融合层次类别信息的事件检测方法,其中,在所述步骤二中,所述根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示的方法包括如下步骤:
基于事件类别之间的层次结构进行构建以得到事件类别结构图;
基于所述事件类别结构图构建得到图神经网络层,根据所述图神经网络层在所述事件类别结构图中的结点之间传递信息,以建模结点之间的语义关系,从而最终得到事件类别融合了层次信息的向量表示。
所述融合层次类别信息的事件检测方法,其中,所述事件类别结构图表示为
Figure 560327DEST_PATH_IMAGE010
Figure 757216DEST_PATH_IMAGE011
是一个带权有向图,
Figure 530000DEST_PATH_IMAGE012
表示事件类别结构图中所有结点的集合,每个结点对应一种事件类别,
Figure 336282DEST_PATH_IMAGE013
表示事件类别结构图中所有弧的集合;
在所述事件类别结构图中,结点
Figure 510911DEST_PATH_IMAGE014
Figure 111657DEST_PATH_IMAGE015
之间的弧
Figure 371737DEST_PATH_IMAGE016
定义如下:
Figure 981710DEST_PATH_IMAGE017
其中,1表示事件类别结构图中包含弧
Figure 745266DEST_PATH_IMAGE018
,0表示事件类别结构图中不包含弧
Figure 48072DEST_PATH_IMAGE018
,结点
Figure 19615DEST_PATH_IMAGE014
称为弧尾,结点
Figure 433279DEST_PATH_IMAGE015
称为弧头。
所述融合层次类别信息的事件检测方法,其中,在所述事件类别结构图中,弧
Figure 51342DEST_PATH_IMAGE018
上对应的权重
Figure 525048DEST_PATH_IMAGE019
定义如下:
Figure 494141DEST_PATH_IMAGE020
其中,
Figure 445917DEST_PATH_IMAGE021
表示在语料
Figure 184066DEST_PATH_IMAGE022
中结点
Figure 828674DEST_PATH_IMAGE023
对应类别的事件出现的次数,
Figure 285063DEST_PATH_IMAGE024
表示在语料
Figure 541994DEST_PATH_IMAGE022
中结点
Figure 869070DEST_PATH_IMAGE014
对应类别的事件出现的次数。
所述融合层次类别信息的事件检测方法,其中,所述事件类别融合了层次信息的向量表示对应的公式为:
Figure 684579DEST_PATH_IMAGE025
其中,
Figure 628265DEST_PATH_IMAGE026
为结点
Figure 187422DEST_PATH_IMAGE014
对应事件类别融合了层次信息的向量表示,
Figure 634584DEST_PATH_IMAGE027
为类别向量层输出的结点
Figure 355415DEST_PATH_IMAGE014
对应的事件类别的向量表示,
Figure 786397DEST_PATH_IMAGE028
为类别向量表示
Figure 185334DEST_PATH_IMAGE027
经过一个线性变换后得到的向量表示,
Figure 811487DEST_PATH_IMAGE029
为类别向量层输出的结点
Figure 231230DEST_PATH_IMAGE030
对应的事件类别的向量表示,
Figure 132190DEST_PATH_IMAGE031
为类别向量表示
Figure 553944DEST_PATH_IMAGE029
经过一个线性变换后得到的向量表示,
Figure 882157DEST_PATH_IMAGE032
为与弧尾结点
Figure 756572DEST_PATH_IMAGE014
有弧相连的弧头结点的下标的集合,
Figure 461223DEST_PATH_IMAGE033
为非线性函数,
Figure 3062DEST_PATH_IMAGE034
均为图神经网络层的参数。
所述融合层次类别信息的事件检测方法,其中,在所述步骤三中,通过注意力机制确定词
Figure 502177DEST_PATH_IMAGE035
相关的事件类别信息的向量表示
Figure 863888DEST_PATH_IMAGE036
对应的公式为:
Figure 608115DEST_PATH_IMAGE037
其中,
Figure 4462DEST_PATH_IMAGE036
是与词
Figure 408898DEST_PATH_IMAGE035
相关的事件类别的向量表示,
Figure 523485DEST_PATH_IMAGE038
是词
Figure 304359DEST_PATH_IMAGE035
在上下文中的语义向量表示,
Figure 820791DEST_PATH_IMAGE039
表示向量的转置,
Figure 661708DEST_PATH_IMAGE026
Figure 998011DEST_PATH_IMAGE040
分别为第
Figure 582577DEST_PATH_IMAGE041
个和第
Figure 454980DEST_PATH_IMAGE042
个事件类别融合了层次信息的向量表示,
Figure 466798DEST_PATH_IMAGE043
是句子中第
Figure 24818DEST_PATH_IMAGE044
个词与第
Figure 413074DEST_PATH_IMAGE041
个事件类别的相关性权重,
Figure 638519DEST_PATH_IMAGE045
为事件类别的数量;
Figure 821239DEST_PATH_IMAGE035
最终的语义向量表示
Figure 397714DEST_PATH_IMAGE046
对应的公式为:
Figure 58502DEST_PATH_IMAGE047
其中,
Figure 138454DEST_PATH_IMAGE009
表示向量拼接操作。
所述融合层次类别信息的事件检测方法,其中,在所述步骤四中,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分的步骤中,对应的公式为:
Figure 259119DEST_PATH_IMAGE048
其中,
Figure 791731DEST_PATH_IMAGE049
为计算得到的序列
Figure 521790DEST_PATH_IMAGE050
的总得分,
Figure 456248DEST_PATH_IMAGE051
是词
Figure 246349DEST_PATH_IMAGE052
预测为标记
Figure 266258DEST_PATH_IMAGE053
的得分,可由一个多层前馈神经网络计算得到,
Figure 534428DEST_PATH_IMAGE054
是预测标记
Figure 588972DEST_PATH_IMAGE055
Figure 284396DEST_PATH_IMAGE053
的转移得分,也是条件随机场层中需要学习的参数。
所述融合层次类别信息的事件检测方法,其中,在所述步骤四中,选择总得分最高的标记序列作为最终的预测结果,对应的公式表达为:
Figure 293065DEST_PATH_IMAGE056
其中,
Figure 364926DEST_PATH_IMAGE057
是对应于词
Figure 539556DEST_PATH_IMAGE035
的预测标记,CRF为条件随机场层。
本发明还提出一种融合层次类别信息的事件检测系统,其中,所述系统包括上下文信息编码模块、层次类别信息编码模块、信息融合模块和预测模块;
所述上下文信息编码模块用于:
将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合所述词对应的语义向量表示以计算得到词在上下文中的语义向量表示;
所述层次类别信息编码模块用于:
基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;
所述信息融合模块用于:
通过注意力机制确定词相关的事件类别信息的向量表示,然后将所述词相关的事件类别信息的向量表示与所述词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;
所述预测模块用于:
基于条件随机场层,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分,并选择总得分最高的标记序列作为最终的预测结果。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
附图说明
图1为本发明第一实施例提出的融合层次类别信息的事件检测方法的流程图;
图2为本发明第一实施例提出的融合层次类别信息的事件检测方法的原理图;
图3为本发明第一实施例提出的事件类别结构图;
图4为本发明第二实施例提出的融合层次类别信息的事件检测系统的结构图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
参照下面的描述和附图,将清楚本发明的实施例的这些和其他方面。在这些描述和附图中,具体公开了本发明的实施例中的一些特定实施方式,来表示实施本发明的实施例的原理的一些方式,但是应当理解,本发明的实施例的范围不受此限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
请参阅图1至图3,本发明第一实施例提出一种融合层次类别信息的事件检测方法,其中,所述方法包括如下步骤:
S101,将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合所述词对应的语义向量表示以计算得到词在上下文中的语义向量表示。
如图2所示,本步骤由上下文信息编码模块执行。其中,上下文信息编码模块包括词向量层和BiLSTM层。词向量层用于将句子中的每个词转换为对应的语义向量表示,BiLSTM层用于进一步学习词在上下文中的语义向量表示。
词向量层把句子中的每个词转换成对应的语义向量表示:
具体的,先基于现有词向量工具(Word2Vec或GloVe)在大规模无标注的文本上预训练好词向量矩阵
Figure 140301DEST_PATH_IMAGE058
Figure 400381DEST_PATH_IMAGE058
中的每一行对应词表中的一个词。给定含有
Figure 10354DEST_PATH_IMAGE059
个词的句子
Figure 39490DEST_PATH_IMAGE060
,从词向量矩阵
Figure 811137DEST_PATH_IMAGE058
中找到词
Figure 558513DEST_PATH_IMAGE035
对应的行向量,即为词
Figure 473642DEST_PATH_IMAGE035
的语义向量表示,记为
Figure 357284DEST_PATH_IMAGE061
。也就是说,词向量层把输入的句子
Figure 565412DEST_PATH_IMAGE062
转换成词向量序列
Figure 534505DEST_PATH_IMAGE063
BiLSTM层用于进一步学习词在上下文中的语义向量表示:
具体的,BiLSTM(双向长短时记忆网络)是一种常用于句子级上下文信息建模的神经网络,在众多自然语言处理任务上取得了较好的效果。如上所述,由于给定了句子
Figure 486280DEST_PATH_IMAGE062
对应的词向量序列
Figure 490008DEST_PATH_IMAGE063
,BiLSTM层按如下方式计算词在上下文中的语义向量表示:
Figure 603458DEST_PATH_IMAGE064
其中,
Figure 59847DEST_PATH_IMAGE002
Figure 815313DEST_PATH_IMAGE003
均为长短时记忆网络,
Figure 186732DEST_PATH_IMAGE002
表示从左至右建模词的上文信息,
Figure 2241DEST_PATH_IMAGE003
表示从右至左建模词的下文信息,
Figure 680347DEST_PATH_IMAGE004
为融合了词的上文信息的语义向量表示,
Figure 973925DEST_PATH_IMAGE005
为融合了词的下文信息的语义向量表示,
Figure 686666DEST_PATH_IMAGE006
为词
Figure 407497DEST_PATH_IMAGE007
对应的语义向量表示。
最后得到词
Figure 838479DEST_PATH_IMAGE007
在上下文中的语义向量表示为
Figure 935748DEST_PATH_IMAGE008
,其中,
Figure 502995DEST_PATH_IMAGE009
表示向量拼接操作。也就是说,BiLSTM层进一步把句子
Figure 161772DEST_PATH_IMAGE062
编码为含有上下文信息的词向量序列
Figure 814470DEST_PATH_IMAGE065
S102,基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示。
如图2所示,本步骤由层次类别信息编码模块执行。其中,层次类别信息编码模块包括类别向量层和图神经网络层。具体的,类别向量层用于将所有事件类别转换为相应的向量表示,图神经网络层(Graph Neural Network Layer)用于进一步学习事件类别融合层次信息的向量表示。
与词向量层类似,类别向量层将所有事件类别转换成相应的向量表示。由于事件类别的名称可以由一个词或多个词组成,例如,事件类别“诈骗”和“网络 诈骗”。在本发明中,直接基于预训练好的词对应的语义向量表示得到事件类别的向量表示。
具体地,对于仅含有一个词的事件类别,直接使用该词的向量表示作为该事件类别的向量表示;对于含有多个词的事件类别,平均这些词的向量表示作为该事件类别的向量表示。把所有事件类别的向量表示组成的向量序列记为
Figure 449851DEST_PATH_IMAGE066
,其中,
Figure 137184DEST_PATH_IMAGE067
为第
Figure 465397DEST_PATH_IMAGE068
个事件类别的向量表示,
Figure 339812DEST_PATH_IMAGE069
为事件类别的数量。
事件类别之间通常具有一定的层次结构,例如,事件类别“犯罪”中包括“诈骗”和“偷窃”等更具体的事件类别,而事件类别“诈骗”又可以进一步分为“电信 诈骗”和“网络诈骗”等。事件类别之间的层次结构可以认为是一种树结构,因此把事件类别“犯罪”称为事件类别“诈骗”和“偷窃”的父类别;反之,把事件类别“诈骗”和“偷窃”称之为事件类别“犯罪”的子类别。因此,本发明在类别向量层的基础上叠加一个图神经网络层,用于进一步学习事件类别融合层次信息的向量表示。
其中,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示的方法包括如下步骤:
S1021,基于事件类别之间的层次结构进行构建以得到事件类别结构图。
S1022,基于所述事件类别结构图构建得到图神经网络层,根据所述图神经网络层在所述事件类别结构图中的结点之间传递信息,以建模结点之间的语义关系,从而最终得到事件类别融合了层次信息的向量表示。
首先,所构建的事件类别结构图如图3所示。事件类别结构图表示为
Figure 44463DEST_PATH_IMAGE010
Figure 586303DEST_PATH_IMAGE011
是一个带权有向图,
Figure 819838DEST_PATH_IMAGE012
表示事件类别结构图中所有结点的集合,每个结点对应一种事件类别,
Figure 447129DEST_PATH_IMAGE013
表示事件类别结构图中所有弧的集合。
在事件类别结构图中,结点
Figure 925777DEST_PATH_IMAGE014
Figure 587702DEST_PATH_IMAGE015
之间的弧
Figure 257718DEST_PATH_IMAGE016
定义如下:
Figure 106725DEST_PATH_IMAGE070
其中,1表示事件类别结构图中包含弧
Figure 887599DEST_PATH_IMAGE018
,0表示事件类别结构图中不包含弧
Figure 404031DEST_PATH_IMAGE018
,结点
Figure 244949DEST_PATH_IMAGE014
称为弧尾,结点
Figure 581252DEST_PATH_IMAGE071
称为弧头。
如图3所示,事件类别“犯罪”是事件类别“诈骗”的父类别,因此在对应的结点之间存在两条边:一条由事件类别“犯罪”对应的结点指向事件类别“诈骗”对应的结点;另一条由事件类别“诈骗”对应的结点指向事件类别“犯罪”对应的结点。
给定标注语料
Figure 165817DEST_PATH_IMAGE022
,图3中弧
Figure 38220DEST_PATH_IMAGE018
上对应的权重
Figure 50039DEST_PATH_IMAGE019
定义如下:
Figure 608059DEST_PATH_IMAGE020
其中,
Figure 996315DEST_PATH_IMAGE021
表示在语料
Figure 221760DEST_PATH_IMAGE022
中结点
Figure 404480DEST_PATH_IMAGE071
对应类别的事件出现的次数,
Figure 715375DEST_PATH_IMAGE024
表示在语料
Figure 641743DEST_PATH_IMAGE022
中结点
Figure 721694DEST_PATH_IMAGE014
对应类别的事件出现的次数。因此,基于给定的语料
Figure 576780DEST_PATH_IMAGE022
,可统计出事件类别结构图中所有边的权重。在此需要补充说明的是,此处的语料由所有标注了的句子所构成。
如图3所示,由结点“犯罪”指向结点“诈骗”的弧的权重是0.6,可以理解为语料
Figure 374972DEST_PATH_IMAGE022
的所有“犯罪”事件中有60%的是“诈骗”事件;反之,由结点“诈骗”指向结点“犯罪”的弧的权重是1.0,可以理解为所有“诈骗”事件都是“犯罪”事件。
其次,基于事件类别结构图构建一个图神经网络层,通过在事件类别结构图的结点之间传递信息,可以有效地建模结点之间的语义关系,从而更好地学习结点的向量表示,也就是融合了层次信息的类别向量表示。
具体地,对事件类别结构图中的任一结点
Figure 839451DEST_PATH_IMAGE014
,按如下方式计算其对应的事件类别融合了层次信息的向量表示
Figure 39488DEST_PATH_IMAGE026
Figure 564011DEST_PATH_IMAGE025
其中,
Figure 583919DEST_PATH_IMAGE026
为结点
Figure 117669DEST_PATH_IMAGE072
对应事件类别融合了层次信息的向量表示,
Figure 172213DEST_PATH_IMAGE027
为类别向量层输出的结点
Figure 602057DEST_PATH_IMAGE072
对应的事件类别的向量表示,
Figure 876306DEST_PATH_IMAGE028
为类别向量表示
Figure 948167DEST_PATH_IMAGE067
经过一个线性变换后得到的向量表示,
Figure 857217DEST_PATH_IMAGE029
为类别向量层输出的结点
Figure 989121DEST_PATH_IMAGE030
对应的事件类别的向量表示,
Figure 718043DEST_PATH_IMAGE031
为类别向量表示
Figure 593595DEST_PATH_IMAGE029
经过一个线性变换后得到的向量表示,
Figure 622731DEST_PATH_IMAGE032
为与弧尾结点
Figure 659957DEST_PATH_IMAGE072
有弧相连的弧头结点的下标的集合,
Figure 141754DEST_PATH_IMAGE033
为非线性函数,
Figure 56882DEST_PATH_IMAGE034
均为图神经网络层的参数。
进一步的,图神经网络层对事件类别结构图中的每个结点进行上述运算,得到融合了层次信息的事件类别的向量表示,并记为
Figure 940525DEST_PATH_IMAGE073
S103,通过注意力机制确定词相关的事件类别信息的向量表示,然后将所述词相关的事件类别信息的向量表示与所述词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示。
如图2所示,本步骤由信息融合模块执行。信息融合模块首先使用注意力机制找出与句子中每个词相关的类别信息,然后与词在上下文中的语义向量表示进行拼接,将拼接后得到的向量表示作为词最终的语义向量表示。
注意力机制是一种常用的神经网络,能够自动发现与当前目标相关的信息,在自然语言处理中具有广泛的应用。具体地,对句子中的任一词
Figure 148652DEST_PATH_IMAGE007
,通过注意力机制确定的词
Figure 852166DEST_PATH_IMAGE007
相关的事件类别信息的向量表示
Figure 69521DEST_PATH_IMAGE036
对应的公式为:
Figure 807670DEST_PATH_IMAGE074
其中,
Figure 186698DEST_PATH_IMAGE036
是与词
Figure 643087DEST_PATH_IMAGE007
相关的事件类别的向量表示,
Figure 398554DEST_PATH_IMAGE038
是词
Figure 758253DEST_PATH_IMAGE007
在上下文中的语义向量表示,
Figure 573763DEST_PATH_IMAGE039
表示向量的转置,
Figure 517448DEST_PATH_IMAGE026
Figure 76605DEST_PATH_IMAGE040
分别为第
Figure 59518DEST_PATH_IMAGE068
个和第
Figure 45929DEST_PATH_IMAGE042
个事件类别融合了层次信息的向量表示,
Figure 211331DEST_PATH_IMAGE043
是句子中第
Figure 810065DEST_PATH_IMAGE044
个词与第
Figure 377312DEST_PATH_IMAGE068
个事件类别的相关性权重,
Figure 534624DEST_PATH_IMAGE045
为事件类别的数量。
进一步的,拼接词
Figure 187322DEST_PATH_IMAGE035
在上下文中的语义向量表示
Figure 88282DEST_PATH_IMAGE038
和与词
Figure 510036DEST_PATH_IMAGE035
相关的事件类别信息的向量表示
Figure 634987DEST_PATH_IMAGE075
,以得到词
Figure 509402DEST_PATH_IMAGE007
最终的语义向量表示
Figure 449939DEST_PATH_IMAGE046
,对应的公式为:
Figure 991779DEST_PATH_IMAGE047
其中,
Figure 962664DEST_PATH_IMAGE009
表示向量拼接操作。
经过信息融合模块层后,句子
Figure 589955DEST_PATH_IMAGE062
被编码为含有上下文信息和层次类别信息的词向量序列
Figure 832717DEST_PATH_IMAGE076
,用作预测模块的输入。
S104,基于条件随机场层,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列的总得分,并选择总得分最高的标记序列作为最终的预测结果。
如图2所示,本步骤由预测模块执行。预测模块使用一个CRF层(条件随机场层),针对句子中的每个词预测一个标记,也就是预测一个与句子长度相等的标记序列。CRF层常用于序列标注任务中,与基于分类层分别预测每个词的标记相比,其能够有效地建模标记之间约束关系,通常能取得更好的性能。
具体的,以词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分(以标记序列
Figure 291380DEST_PATH_IMAGE077
为例),对应的公式为:
Figure 539826DEST_PATH_IMAGE078
其中,
Figure 147089DEST_PATH_IMAGE049
为计算得到的序列
Figure 258789DEST_PATH_IMAGE050
的总得分,
Figure 369962DEST_PATH_IMAGE051
是词
Figure 210879DEST_PATH_IMAGE035
预测为标记
Figure 970019DEST_PATH_IMAGE053
的得分,可由一个多层前馈神经网络计算得到,
Figure 873691DEST_PATH_IMAGE079
是预测标记
Figure 575456DEST_PATH_IMAGE080
Figure 165704DEST_PATH_IMAGE053
的转移得分,也是条件随机场层(CRF)中需要学习的参数。
进一步的,选择总得分最高的标记序列作为最终的预测结果对应的公式表达为:
Figure 254883DEST_PATH_IMAGE081
其中,
Figure 911648DEST_PATH_IMAGE053
是对应于词
Figure 402672DEST_PATH_IMAGE035
的预测标记,
Figure 680332DEST_PATH_IMAGE082
为信息融合模块输出的含有上下文信息和层次类别信息的词向量序列。
本发明提出的融合层次类别信息的事件检测方法,首先将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合词对应的语义向量表示以计算得到词在上下文中的语义向量表示;基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;通过注意力机制确定词相关的事件类别信息的向量表示,然后将词相关的事件类别信息的向量表示与词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;最后基于条件随机场,以词最终的语义向量表示作为输入,计算每个句子的标记序列的总得分,并选择总得分最高的标记序列作为最终的预测结果。本发明提出的融合层次类别信息的事件检测方法,充分利用了事件类别信息,可实现更为准确的事件检测效果。
请参阅图4,本发明第二实施例还提出一种融合层次类别信息的事件检测系统,其中,所述系统包括上下文信息编码模块、层次类别信息编码模块、信息融合模块和预测模块;
所述上下文信息编码模块用于:
将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合所述词对应的语义向量表示以计算得到词在上下文中的语义向量表示;
所述层次类别信息编码模块用于:
基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;
所述信息融合模块用于:
通过注意力机制确定词相关的事件类别信息的向量表示,然后将所述词相关的事件类别信息的向量表示与所述词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;
所述预测模块用于:
基于条件随机场层,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列的总得分,并选择总得分最高的标记序列作为最终的预测结果。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种融合层次类别信息的事件检测方法,其特征在于,所述方法包括如下步骤:
步骤一:将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合所述词对应的语义向量表示以计算得到词在上下文中的语义向量表示;
步骤二:基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;
步骤三:通过注意力机制确定词相关的事件类别信息的向量表示,然后将所述词相关的事件类别信息的向量表示与所述词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;
步骤四:基于条件随机场层,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分,并选择总得分最高的标记序列作为最终的预测结果。
2.根据权利要求1所述的一种融合层次类别信息的事件检测方法,其特征在于,在所述步骤一中,词在上下文中的语义向量表示对应的符号表示为:
Figure 149943DEST_PATH_IMAGE001
其中,
Figure 965452DEST_PATH_IMAGE002
Figure 784503DEST_PATH_IMAGE003
均为长短时记忆网络,
Figure 281344DEST_PATH_IMAGE002
表示从左至右建模词的上文信息,
Figure 994085DEST_PATH_IMAGE003
表示从右至左建模词的下文信息,
Figure 855862DEST_PATH_IMAGE004
为融合了词的上文信息的语义向量表示,
Figure 286843DEST_PATH_IMAGE005
为融合了词的下文信息的语义向量表示,
Figure 758013DEST_PATH_IMAGE006
为词
Figure 590840DEST_PATH_IMAGE007
对应的语义向量表示,词
Figure 623518DEST_PATH_IMAGE007
在上下文中的语义向量表示为
Figure 541796DEST_PATH_IMAGE008
Figure 380439DEST_PATH_IMAGE009
表示向量拼接操作。
3.根据权利要求2所述的一种融合层次类别信息的事件检测方法,其特征在于,在所述步骤二中,所述根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示的方法包括如下步骤:
基于事件类别之间的层次结构进行构建以得到事件类别结构图;
基于所述事件类别结构图构建得到图神经网络层,根据所述图神经网络层在所述事件类别结构图中的结点之间传递信息,以建模结点之间的语义关系,从而最终得到事件类别融合了层次信息的向量表示。
4.根据权利要求3所述的一种融合层次类别信息的事件检测方法,其特征在于,所述事件类别结构图表示为
Figure 943138DEST_PATH_IMAGE010
Figure 536930DEST_PATH_IMAGE011
是一个带权有向图,
Figure 552291DEST_PATH_IMAGE012
表示事件类别结构图中所有结点的集合,每个结点对应一种事件类别,
Figure 256942DEST_PATH_IMAGE013
表示事件类别结构图中所有弧的集合;
在所述事件类别结构图中,结点
Figure 2044DEST_PATH_IMAGE014
Figure 710997DEST_PATH_IMAGE015
之间的弧
Figure 338288DEST_PATH_IMAGE016
定义如下:
Figure 456416DEST_PATH_IMAGE017
其中,1表示事件类别结构图中包含弧
Figure 118342DEST_PATH_IMAGE018
,0表示事件类别结构图中不包含弧
Figure 663724DEST_PATH_IMAGE018
,结点
Figure 981573DEST_PATH_IMAGE014
称为弧尾,结点
Figure 762447DEST_PATH_IMAGE015
称为弧头。
5.根据权利要求4所述的一种融合层次类别信息的事件检测方法,其特征在于,在所述事件类别结构图中,弧
Figure 154245DEST_PATH_IMAGE018
上对应的权重
Figure 260741DEST_PATH_IMAGE019
定义如下:
Figure 236525DEST_PATH_IMAGE020
其中,
Figure 821090DEST_PATH_IMAGE021
表示在语料
Figure 395291DEST_PATH_IMAGE022
中结点
Figure 282476DEST_PATH_IMAGE023
对应类别的事件出现的次数,
Figure 106075DEST_PATH_IMAGE024
表示在语料
Figure 635277DEST_PATH_IMAGE022
中结点
Figure 860722DEST_PATH_IMAGE025
对应类别的事件出现的次数。
6.根据权利要求5所述的一种融合层次类别信息的事件检测方法,其特征在于,所述事件类别融合了层次信息的向量表示对应的公式为:
Figure 918808DEST_PATH_IMAGE026
其中,
Figure 698545DEST_PATH_IMAGE027
为结点
Figure 624913DEST_PATH_IMAGE028
对应事件类别融合了层次信息的向量表示,
Figure 78765DEST_PATH_IMAGE029
为类别向量层输出的结点
Figure 697966DEST_PATH_IMAGE028
对应的事件类别的向量表示,
Figure 637103DEST_PATH_IMAGE030
为类别向量表示
Figure 101582DEST_PATH_IMAGE029
经过一个线性变换后得到的向量表示,
Figure 176985DEST_PATH_IMAGE031
为类别向量层输出的结点
Figure 170349DEST_PATH_IMAGE032
对应的事件类别的向量表示,
Figure 190258DEST_PATH_IMAGE033
为类别向量表示
Figure 599374DEST_PATH_IMAGE031
经过一个线性变换后得到的向量表示,
Figure 653917DEST_PATH_IMAGE034
为与弧尾结点
Figure 988821DEST_PATH_IMAGE028
有弧相连的弧头结点的下标的集合,
Figure 761605DEST_PATH_IMAGE035
为非线性函数,
Figure 36729DEST_PATH_IMAGE036
均为图神经网络层的参数。
7.根据权利要求3所述的一种融合层次类别信息的事件检测方法,其特征在于,在所述步骤三中,通过注意力机制确定词
Figure 821145DEST_PATH_IMAGE037
相关的事件类别信息的向量表示
Figure 953049DEST_PATH_IMAGE038
对应的公式为:
Figure 822916DEST_PATH_IMAGE039
其中,
Figure 964048DEST_PATH_IMAGE038
是与词
Figure 868550DEST_PATH_IMAGE007
相关的事件类别的向量表示,
Figure 109038DEST_PATH_IMAGE040
是词
Figure 856414DEST_PATH_IMAGE007
在上下文中的语义向量表示,
Figure 643980DEST_PATH_IMAGE041
表示向量的转置,
Figure 527622DEST_PATH_IMAGE042
Figure 876695DEST_PATH_IMAGE043
分别为第
Figure 845788DEST_PATH_IMAGE044
个和第
Figure 938509DEST_PATH_IMAGE045
个事件类别融合了层次信息的向量表示,
Figure 879920DEST_PATH_IMAGE046
是句子中第
Figure 524528DEST_PATH_IMAGE047
个词与第
Figure 856283DEST_PATH_IMAGE048
个事件类别的相关性权重,
Figure 877329DEST_PATH_IMAGE049
为事件类别的数量;
Figure 109465DEST_PATH_IMAGE050
最终的语义向量表示
Figure 924974DEST_PATH_IMAGE051
对应的公式为:
Figure 806342DEST_PATH_IMAGE052
其中,
Figure 240866DEST_PATH_IMAGE009
表示向量拼接操作。
8.根据权利要求7所述的一种融合层次类别信息的事件检测方法,其特征在于,在所述步骤四中,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分的步骤中,对应的公式为:
Figure 953607DEST_PATH_IMAGE053
其中,
Figure 80963DEST_PATH_IMAGE054
为计算得到的序列
Figure 511944DEST_PATH_IMAGE055
的总得分,
Figure 484580DEST_PATH_IMAGE056
是词
Figure 255089DEST_PATH_IMAGE057
预测为标记
Figure 412401DEST_PATH_IMAGE058
的得分,可由一个多层前馈神经网络计算得到,
Figure 439001DEST_PATH_IMAGE059
是预测标记
Figure 605540DEST_PATH_IMAGE060
Figure 168240DEST_PATH_IMAGE058
的转移得分,也是条件随机场层中需要学习的参数。
9.根据权利要求8所述的一种融合层次类别信息的事件检测方法,其特征在于,在所述步骤四中,选择总得分最高的标记序列作为最终的预测结果对应的公式表达为:
Figure 496453DEST_PATH_IMAGE061
其中,
Figure 839709DEST_PATH_IMAGE062
是对应于词
Figure 357409DEST_PATH_IMAGE037
的预测标记,CRF为条件随机场层。
10.一种融合层次类别信息的事件检测系统,其特征在于,所述系统包括上下文信息编码模块、层次类别信息编码模块、信息融合模块和预测模块;
所述上下文信息编码模块用于:
将输入的句子中的每个词转换成词对应的语义向量表示,基于双向长短时记忆网络并结合所述词对应的语义向量表示以计算得到词在上下文中的语义向量表示;
所述层次类别信息编码模块用于:
基于所述词对应的语义向量表示得到对应的事件类别的向量表示,根据所述事件类别的向量表示及事件类别的层次结构计算得到事件类别融合了层次信息的向量表示;
所述信息融合模块用于:
通过注意力机制确定词相关的事件类别信息的向量表示,然后将所述词相关的事件类别信息的向量表示与所述词在上下文中的语义向量表示进行拼接,以得到词最终的语义向量表示;
所述预测模块用于:
基于条件随机场层,以所述词最终的语义向量表示作为输入,计算句子的每个标记序列对应的总得分,并选择总得分最高的标记序列作为最终的预测结果。
CN202111023710.2A 2021-09-02 2021-09-02 一种融合层次类别信息的事件检测方法与系统 Active CN113468333B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111023710.2A CN113468333B (zh) 2021-09-02 2021-09-02 一种融合层次类别信息的事件检测方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111023710.2A CN113468333B (zh) 2021-09-02 2021-09-02 一种融合层次类别信息的事件检测方法与系统

Publications (2)

Publication Number Publication Date
CN113468333A true CN113468333A (zh) 2021-10-01
CN113468333B CN113468333B (zh) 2021-11-19

Family

ID=77867339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111023710.2A Active CN113468333B (zh) 2021-09-02 2021-09-02 一种融合层次类别信息的事件检测方法与系统

Country Status (1)

Country Link
CN (1) CN113468333B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114266258A (zh) * 2021-12-30 2022-04-01 北京百度网讯科技有限公司 一种语义关系提取方法、装置、电子设备及存储介质
CN114462418A (zh) * 2021-12-31 2022-05-10 粤港澳大湾区数字经济研究院(福田) 事件检测方法、系统、智能终端及计算机可读存储介质
CN115763167A (zh) * 2022-11-22 2023-03-07 黄华集团有限公司 固体柜断路器及其控制方法
CN116701576A (zh) * 2023-08-04 2023-09-05 华东交通大学 无触发词的事件检测方法和系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101174273A (zh) * 2007-12-04 2008-05-07 清华大学 基于元数据分析的新闻事件检测方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
US20190042881A1 (en) * 2017-12-07 2019-02-07 Intel Corporation Acoustic event detection based on modelling of sequence of event subparts
CN111859935A (zh) * 2020-07-03 2020-10-30 大连理工大学 基于文献的癌症相关生物医学事件数据库构建方法
CN112241457A (zh) * 2020-09-22 2021-01-19 同济大学 一种融合扩展特征的事理知识图谱事件检测方法
CN112446216A (zh) * 2021-02-01 2021-03-05 华东交通大学 一种融合中心词信息的嵌套命名实体识别方法与装置
CN113157859A (zh) * 2021-04-06 2021-07-23 北京理工大学 一种基于上位概念信息的事件检测方法
CN113221539A (zh) * 2021-07-08 2021-08-06 华东交通大学 一种集成句法信息的嵌套命名实体识别方法与系统
CN113239142A (zh) * 2021-04-26 2021-08-10 昆明理工大学 融合句法信息的无触发词事件检测方法
CN113282714A (zh) * 2021-06-29 2021-08-20 中国人民解放军国防科技大学 一种基于区分性词向量表示的事件检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101174273A (zh) * 2007-12-04 2008-05-07 清华大学 基于元数据分析的新闻事件检测方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
US20190042881A1 (en) * 2017-12-07 2019-02-07 Intel Corporation Acoustic event detection based on modelling of sequence of event subparts
CN111859935A (zh) * 2020-07-03 2020-10-30 大连理工大学 基于文献的癌症相关生物医学事件数据库构建方法
CN112241457A (zh) * 2020-09-22 2021-01-19 同济大学 一种融合扩展特征的事理知识图谱事件检测方法
CN112446216A (zh) * 2021-02-01 2021-03-05 华东交通大学 一种融合中心词信息的嵌套命名实体识别方法与装置
CN113157859A (zh) * 2021-04-06 2021-07-23 北京理工大学 一种基于上位概念信息的事件检测方法
CN113239142A (zh) * 2021-04-26 2021-08-10 昆明理工大学 融合句法信息的无触发词事件检测方法
CN113282714A (zh) * 2021-06-29 2021-08-20 中国人民解放军国防科技大学 一种基于区分性词向量表示的事件检测方法
CN113221539A (zh) * 2021-07-08 2021-08-06 华东交通大学 一种集成句法信息的嵌套命名实体识别方法与系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHEN ZUO ET AL.: ""Learning Contextual Dependence With Convolutional Hierarchical Recurrent Neural Networks"", 《EEE TRANSACTIONS ON IMAGE PROCESSING》 *
胡超文 等: ""基于深度学习的隐式篇章关系识别综述"", 《计算机科学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114266258A (zh) * 2021-12-30 2022-04-01 北京百度网讯科技有限公司 一种语义关系提取方法、装置、电子设备及存储介质
CN114462418A (zh) * 2021-12-31 2022-05-10 粤港澳大湾区数字经济研究院(福田) 事件检测方法、系统、智能终端及计算机可读存储介质
CN115763167A (zh) * 2022-11-22 2023-03-07 黄华集团有限公司 固体柜断路器及其控制方法
CN115763167B (zh) * 2022-11-22 2023-09-22 黄华集团有限公司 固体柜断路器及其控制方法
CN116701576A (zh) * 2023-08-04 2023-09-05 华东交通大学 无触发词的事件检测方法和系统
CN116701576B (zh) * 2023-08-04 2023-10-10 华东交通大学 无触发词的事件检测方法和系统

Also Published As

Publication number Publication date
CN113468333B (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN113468333B (zh) 一种融合层次类别信息的事件检测方法与系统
Zhou et al. Deep learning for aspect-level sentiment classification: survey, vision, and challenges
Suhaili et al. Service chatbots: A systematic review
CN110580292B (zh) 一种文本标签生成方法、装置和计算机可读存储介质
CN111708882B (zh) 基于Transformer的中文文本信息缺失的补全方法
CN112685539B (zh) 基于多任务融合的文本分类模型训练方法和装置
CN110704576A (zh) 一种基于文本的实体关系抽取方法及装置
CN113065358B (zh) 面向银行咨询服务基于多粒度对齐的文本对语义匹配方法
CN112380863A (zh) 一种基于多头自注意力机制的序列标注方法
CN112926324A (zh) 融合词典与对抗迁移的越南语事件实体识别方法
CN113255320A (zh) 基于句法树和图注意力机制的实体关系抽取方法及装置
CN114881014A (zh) 实体别名关系获取方法、训练方法、装置及存储介质
CN111538841B (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统
Pichl et al. Alquist 2.0: Alexa prize socialbot based on sub-dialogue models
Fischbach et al. Fine-grained causality extraction from natural language requirements using recursive neural tensor networks
CN111259147A (zh) 基于自适应注意力机制的句子级情感预测方法及系统
CN113010635B (zh) 一种文本纠错方法及装置
CN116861269A (zh) 工程领域的多源异构数据融合及分析方法
CN117149940A (zh) 事件论元抽取方法、装置
CN111723301B (zh) 基于层次化主题偏好语义矩阵的关注关系识别及标注方法
Jayawickrama et al. Seeking sinhala sentiment: Predicting facebook reactions of sinhala posts
Lanchantin et al. Transfer learning with motiftrans-formers for predicting protein-protein interactions between a novel virus and humans
Zhao et al. Learning discriminative neural sentiment units for semi-supervised target-level sentiment classification
CN110795134A (zh) 基于开源软件包依赖特征的标签推荐方法、模型及系统
Lee et al. Unsupervised sentence embedding using document structure-based context

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant