CN112765987A - 一种基于递归条件随机场解码器的事件识别方法及系统 - Google Patents

一种基于递归条件随机场解码器的事件识别方法及系统 Download PDF

Info

Publication number
CN112765987A
CN112765987A CN202110101327.8A CN202110101327A CN112765987A CN 112765987 A CN112765987 A CN 112765987A CN 202110101327 A CN202110101327 A CN 202110101327A CN 112765987 A CN112765987 A CN 112765987A
Authority
CN
China
Prior art keywords
event
argument
label
role
random field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110101327.8A
Other languages
English (en)
Inventor
姬东鸿
费豪
吴胜琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202110101327.8A priority Critical patent/CN112765987A/zh
Publication of CN112765987A publication Critical patent/CN112765987A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于递归条件随机场解码器的事件识别方法及系统,通过对未标注的语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架中,具有更高的识别准确率,无需复杂的规则以及强人工特征即可实现事件识别功能。

Description

一种基于递归条件随机场解码器的事件识别方法及系统
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于条件随机场模型的事 件识别方法及系统。
背景技术
事件是一种重要的知识,近年来,事件识别的研究在自然语言处理领域 受到了广泛关注。现有方法主要可以分为两类:基于规则的方法和机器学习 方法。基于规则的方法主要集中在一组提取规则的定义上,例如正则表达式 和匹配模式规则。但是,定义这些规则很费力且费时,并且需要很多领域知 识。任务的总体性能在很大程度上取决于已定义规则的质量。同时,与机器 学习方法相比,基于规则的方法具有较差的泛化能力。机器学习的方法识别 事件,就是借鉴文本分类的思想,将事件类别及事件元素的识别转化成为分 类问题,其核心在于分类器的构造和特征的选择。但事件分类与文本分类又 有所区别,主要表现在以下方面:分类的文本短,大部分都是一个完整的句 子;因为是事件表述语句,所以语句中包含的信息量大。Chieu等首次在事 件抽取中引入最大熵模型用于事件元素的识别,实现了对讲座通告和人事管 理事件的抽取。H.Llorens等通过CRF模型进行语义角色标注,并应用于 TimeML的事件抽取,提升了系统的性能。为了提高识别效果,有时将多种机器学习算法混合使用或将机器学习与模型匹配相结合。D.Ahn结合MegaM 和TiMBL两种机器学习方法分别实现了事件类别识别和事件元素识别两大任 务,在ACE语料的实验结果表明该方法优于采用单一算法。基于机器学习 的方法虽然不依赖于语料的内容与格式,但这类方法需要大量的手工设计特 征,尤其是句法特征的构造。现有技术中也有研究如何有效地将句子的依存 关系图映射到句法特征,然后使用这些句法特征进行事件识别,其工作表明语法功能对于该任务非常关键。但是,以前的工作通常通过基于依赖关系树 提取一组手工制作的特征对其进行建模,但是无法以全局方式自动捕获它。 现有的事件识别方法准确率较低,并且需要复杂的规则以及强人工特征才能 实现。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于 递归条件随机场解码器的事件识别方法及系统。
本发明解决上述技术问题的技术方案如下:一种基于递归条件随机场解 码器的事件识别方法,包括如下步骤:
步骤1:对文本实例X进行事件识别并生成标注,其中,标注包含:事 件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2
步骤2:对未标注的语料文本实例X进行句法依存分析,得到带有句法 依存树结构标注的语料文本实例Xs并保存;
步骤3:将带有句法依存树结构的所有所述语料文本实例Xs、事件触发 词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验 证集;
其中,所述训练集包括文本实例Xt、事件触发词和事件类型标准标注
Figure BDA0002915784920000021
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000022
所述验证集包括文本实例Xe、事 件触发词和事件类型标准标注
Figure BDA0002915784920000023
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000024
步骤4:基于所述训练集的文本实例Xt,利用递归神经网络学习高级表 示
Figure BDA0002915784920000025
并利用条件随机场解码器基于所述高级表示
Figure BDA0002915784920000026
进行预测,生成预测事 件触发词及事件类型Y′1 ,t
步骤5:基于所述训练集的文本实例Xt以及所述预测事件触发词及事件 类型Y′1 ’t,利用递归神经网络学习高级表示
Figure BDA0002915784920000031
并利用条件随机场解码器基 于所述高级表示
Figure BDA0002915784920000032
进行预测,生成预测事件论元及事件论元角色Y′2 ’t
步骤6:根据所述预测事件触发词及事件类型Y′1 ,t、预测事件论元及事 件论元角色Y′2 ’t、事件触发词和事件类型标准标注
Figure BDA0002915784920000033
和事件论元和事件论元 角色标准标注
Figure BDA0002915784920000034
构建交叉熵损失值,通过交叉熵损失值对递归神经网络和 条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
步骤7:利用训练后的模型Ω(W)对所述验证集中的文本实例Xe进行识 别,得到对应的预测事件触发词及事件类型Y′1 ’e以及预测的事件论元及事件 论元角色Y′2 ’e;并将二者分别与事件触发词和事件类型标准标注
Figure BDA0002915784920000035
和事件论 元和事件论元角色标准标注
Figure BDA0002915784920000036
一一对应比对,评估和分析模型的事件元素 识别的性能。
本发明的有益效果是:本发明的基于递归条件随机场解码器的事件识别 方法,通过对未标注的语料文本实例进行句法依存分析,然后划分为训练集 和验证集,再对所述训练集和验证集均进行高级表示学习和预测,并将构建 交叉熵损失值,以对递归神经网络和条件随机场解码器的整体参数W进行 学习,从而完成对整个模型的识别性能的评估,将递归神经网络和条件随机 场集成到统一的框架中,具有更高的识别准确率,无需复杂的规则以及强人 工特征即可实现事件识别功能。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步:所述步骤1中具体包括如下步骤:
将所述事件触发词和事件类型标注与预设事件触发词以及事件类型中 的元素进行比较,并根据所述事件触发词是否与预设事件触发词以及事件类 型中的元素匹配对所述事件触发词和事件类型标注标签,在所述事件触发词 和事件类型的标签名称中添加用于表示事件类型的后缀名;
将所述事件论元及事件论元角色与预设事件论元及事件论元角色中的 元素进行比较,并根据所述事件论元及事件论元角色是否与预设事件论元及 事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标签,在所 述事件论元及事件论元角色标注标签名称中添加用于表示事件类型的后缀 名。
上述进一步方案的有益效果是:通过对文本实例X进行事件识别并生成 标注,从而便于将所述事件触发词和事件类型进行区分开来。
进一步:所述步骤3中,将带有句法依存树结构的所有语料文本实例Xs、 事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2分别按 照预设比例随机划分出所述训练集与所述验证集。
上述进一步方案的有益效果是:通过将所述语料文本实例Xs、事件触 发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2分别按照预设 比例随机划分出所述训练集与所述验证集,可以方便后续对所述训练集与所 述验证均进行高级表示学习和预测,从而方便后续对训练后的模型进行评估 和分析。
进一步:所述步骤4中,所述利用递归神经网络学习高级表示
Figure BDA0002915784920000041
的具体 方法包括:
利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌入表示e(wi);
将所述递归神经网络中的每个节点分别与从其嵌入表示e(wi)映射的单 词wi相关联,并根据递归转换计算递归神经网络中的每个节点的隐藏输出, 即高级表示
Figure BDA0002915784920000042
计算公式为:
Figure BDA0002915784920000043
其中,
Figure BDA0002915784920000044
表示通用转换矩阵,
Figure BDA0002915784920000045
表示参数矩阵,e(wi) 为单词wi的嵌入表示,hi为节点i,b1为偏置参数。
上述进一步方案的有益效果是:通过将每个单词wi的嵌入表示e(wi)和递 归神经网络中的节点进行关联,从而可以准确计算出递归神经网络中的每个 节点的隐藏输出,以完成高级表示
Figure BDA0002915784920000051
的学习。
进一步:所述步骤4中,所述利用条件随机场解码器基于所述高级表示
Figure BDA0002915784920000052
进行预测,生成预测事件触发词及事件类型Y′1 ,t的具体实现为:
根据所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出 进行解码,得到预测事件触发词及事件类型Y′1 ,t的条件概率模型
Figure BDA0002915784920000053
其 计算公式为:
Figure BDA0002915784920000054
其中,yi和yi-1为条件随机场在i与i-1位置所预测的标签,
Figure BDA0002915784920000055
为 对应i位置的势函数,
Figure BDA0002915784920000056
为对应i位置的势函数;
Figure BDA0002915784920000057
其中,
Figure BDA0002915784920000058
和by′,y分别是标签对(′,y)的权重和偏置参数。
上述进一步方案的有益效果是:通过所述条件随机场解码器对递归神经 网络中的每个节点的隐藏输出进行解码,可以准确得到预测事件触发词及事 件类型Y′1 ’t的条件概率模型。
进一步:所述步骤5中,所述利用递归神经网络学习高级表示
Figure BDA0002915784920000059
的具体 方法包括:
利用条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌 入表示e(wi);同时所述预测事件触发词及事件类型Y′1 ,t通过采用查表的方式 获取对应的嵌入表示e(y1);
将递归神经网络中的每个节点分别与从其嵌入表示e(wi)映射的单词wi相关联,并根据递归转换计算递归神经网络中的每个节点的隐藏输出,即高 级表示
Figure BDA00029157849200000510
计算公式为:
Figure BDA00029157849200000511
其中,
Figure BDA0002915784920000061
表示通用转换矩阵,
Figure BDA0002915784920000062
表示参数矩阵,e(wi) 为单词wi的嵌入表示,hi为节点i,b2为偏置参数。
上述进一步方案的有益效果是:通过采用查表的方式可以准确获取每个 单词wi的嵌入表示e(wi),以及预测事件触发词及事件类型Y′1 ’t的嵌入表示 e(y1),从而可以将每个节点分别与从其嵌入表示e(wi)映射的单词wi准确关联, 这样根据地柜转换即可计算出每个节点的隐藏输出,从而完成高级表示
Figure BDA0002915784920000063
的 学习。
进一步:所述步骤5中,所述利用条件随机场解码器基于所述高级表示
Figure BDA0002915784920000064
进行预测,生成预测事件论元及事件论元角色Y′2 ’t的具体方法为:
根据条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行 解码,得到预测事件论元及事件论元角色Y′2 ’t的条件概率模型
Figure BDA0002915784920000065
其计 算方式为:
Figure BDA0002915784920000066
其中,yi和yi-1为条件随机场在i与i-1位置所预测的标签,
Figure BDA0002915784920000067
为对应i位置的势函数,
Figure BDA0002915784920000068
为对应i位置的势函数;
Figure BDA0002915784920000069
其中,
Figure BDA00029157849200000610
和by′,y分别是标签对(y′,y)的权重和偏置参数。
上述进一步方案的有益效果是:通过利用条件随机场解码器对递归神经 网络中的每个节点的隐藏输出进行解码,即可得到预测事件论元及事件论元 角色Y′2 ,t的条件概率模型
Figure BDA00029157849200000611
从而便于后续进行损失值构建以及整体模 型的识别性能评估和分析。
进一步:所述步骤6中,所述预测事件触发词及事件类型Y′1 ,t、预测事 件论元及事件论元角色Y′2 ,t、事件触发词和事件类型标准标注
Figure BDA00029157849200000612
和事件论元 和事件论元角色标准标注
Figure BDA00029157849200000613
构建最大条件似然估计的交叉熵损失值的具体 公式为:
Figure BDA0002915784920000071
其中,W为模型Ω(W)所有的参数总和。
上述进一步方案的有益效果是:通过上述公式可以准确计算出最大条件 似然估计的交叉熵损失值,这样通过交叉熵损失值对递归神经网络和条件随 机场解码器的整体参数W进行训练,以便后续根据训练后的模型Ω(W)对所 述验证集中的文本实例Xe进行识别。
进一步:所述步骤7中,所述将二者分别与事件触发词和事件类型标准 标注
Figure BDA0002915784920000072
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000073
一一对应比对,评估和分析 模型的事件元素识别的性能的计算过程为:
Figure BDA0002915784920000074
Figure BDA0002915784920000075
Figure BDA0002915784920000076
其中:
正确标准事件标注 错误标准事件标注
预测到事件标注 TP FP
未预测到事件标注 FN TN
每个事件标注包含事件元素事件触发词和事件类型标注,以及事件论元 和事件论元角色标注。
上述进一步方案的有益效果是:通过所述预测事件触发词及事件类型 Y′1 ,e以及预测的事件论元及事件论元角色Y′2 ,e分别与事件触发词和事件类型 标准标注
Figure BDA0002915784920000077
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000078
一一对应比对,判定是 否预测到事件元素,从而准确评估和分析模型的事件元素识别的性能。
本发明还提供了一种基于递归条件随机场解码器的事件识别系统,包括 标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模 块和识别评估模块;
所述标注模块,用于对文本实例X进行事件识别并生成标注,其中, 标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标 注Y2
所述句法分析模块,用于对未标注的语料文本实例X进行句法依存分 析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
所述划分模块,用于将带有句法依存树结构的所有所述语料文本实例 Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分 为训练集与验证集;
其中,所述训练集包括文本实例Xt、事件触发词和事件类型标准标注
Figure BDA0002915784920000081
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000082
所述验证集包括文本实例Xe、事 件触发词和事件类型标准标注
Figure BDA0002915784920000083
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000084
所述第一学习预测模块,用于基于所述训练集的文本实例Xt以及所述 预测事件触发词及事件类型Y′1 ,t,利用递归神经网络学习高级表示
Figure BDA0002915784920000085
并利 用条件随机场解码器基于所述高级表示
Figure BDA0002915784920000086
进行预测,生成预测事件论元及事 件论元角色Y′2 ,t
所述第二预测模块,用于根据所述预测事件触发词及事件类型Y′1 ,t、预 测事件论元及事件论元角色Y′2 ,t事件触发词和事件类型标准标注
Figure BDA0002915784920000087
和事件 论元和事件论元角色标准标注
Figure BDA0002915784920000088
构建损失值,通过交叉熵对递归神经网络 和条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
所述识别评估模块,用于利用训练后的模型Ω(W)对所述验证集中的文 本实例Xe进行识别,得到对应的预测事件触发词及事件类型Y′1 ,e以及预测的 事件论元及事件论元角色Y′2 ,e;并将二者分别与事件触发词和事件类型标准 标注
Figure BDA0002915784920000089
和事件论元和事件论元角色标准标注
Figure BDA00029157849200000810
一一对应比对,评估和分析 模型的事件元素识别的性能。
本发明的基于递归条件随机场解码器的事件识别系统,通过对未标注的 语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训 练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递 归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个 模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架 中,具有更高的识别准确率,无需复杂的规则以及强人工特征即可实现事件 识别功能。
附图说明
图1为本发明一实施例的基于递归条件随机场解码器的事件识别方法的 流程示意图;
图2为本发明一实施例的事件识别图例;
图3为本发明一实施例的事件触发词与事件类型的标注图例;
图4为本发明一实施例的事件论元与事件论元角色的标注图例;
图5为本发明一实施例的事件触发词与事件类型模型结构示意图;
图6为本发明一实施例的事件论元与事件论元角色模型结构示意图;
图7为本发明一实施例的基于递归条件随机场解码器的事件识别系统的 结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本 发明,并非用于限定本发明的范围。
如图1所示,一种基于递归条件随机场解码器的事件识别方法,包括如 下步骤:
步骤1:对文本实例X进行事件识别并生成标注,其中,标注包含:事 件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2
步骤2:对未标注的语料文本实例X进行句法依存分析,得到带有句法 依存树结构标注的语料文本实例Xs并保存;
步骤3:将带有句法依存树结构的所有所述语料文本实例Xs、事件触发 词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验 证集;
其中,所述训练集包括文本实例Xt、事件触发词和事件类型标准标注
Figure BDA0002915784920000101
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000102
所述验证集包括文本实例Xe、事 件触发词和事件类型标准标注
Figure BDA0002915784920000103
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000104
步骤4:基于所述训练集的文本实例Xt,利用递归神经网络学习高级表 示
Figure BDA0002915784920000105
并利用条件随机场解码器基于所述高级表示
Figure BDA0002915784920000106
进行预测,生成预测事 件触发词及事件类型Y′1 ,t
步骤5:基于所述训练集的文本实例Xt以及所述预测事件触发词及事件 类型Y′1 ,t,利用递归神经网络学习高级表示
Figure BDA0002915784920000107
并利用条件随机场解码器基 于所述高级表示
Figure BDA0002915784920000108
进行预测,生成预测事件论元及事件论元角色Y′2 ,t
步骤6:根据所述预测事件触发词及事件类型Y′1 ,t、预测事件论元及事 件论元角色Y′2 ,t、事件触发词和事件类型标准标注
Figure BDA0002915784920000109
和事件论元和事件论元 角色标准标注
Figure BDA00029157849200001010
构建交叉熵损失值,通过交叉熵对递归神经网络和条件随 机场解码器的整体参数W进行训练,得到训练后的模型Ω(W);
步骤7:利用训练后的模型Ω(W)对所述验证集中的文本实例Xe进行识 别,得到对应的预测事件触发词及事件类型Y′1 ’e以及预测的事件论元及事件 论元角色Y′2 ’e;并将二者分别与事件触发词和事件类型标准标注
Figure BDA00029157849200001011
和事件论 元和事件论元角色标准标注
Figure BDA00029157849200001012
一一对应比对,评估和分析模型的事件元素 识别的性能。
本发明的基于递归条件随机场解码器的事件识别方法,通过对未标注的 语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训 练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递 归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个 模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架 中,具有更高的识别准确率,结合事件识别中的事件触发词识别、事件类型 识别、事件论元识别和事件论元角色识别,可同时得到以上结果,无需复杂 的规则以及强人工特征即可实现事件识别功能。
事件识别的原始问题是:对于给定的文本实例X,把含有事件信息的非 结构化文本以结构化的形式呈现出来,直观上来看,可以把事件抽取的任务 理解成从文本中找到特定类别的事件,然后进行填表的过程,如图2所示。 因此,通常来说,事件识别的基本任务都可以用以下几个方面概括:事件触 发词检测Event(trigger)detection、事件触发词分类Event trigger typing、事件论元识别Event Argument Identification、事件论元角色识别Event Argument Role Identification。可以从两个角度直观上看待事 件识别问题,第一,事件触发词检测与事件触发词分类这个两个任务之间是 有一定关系的,即可以做联合抽取;第二,事件论元识别与事件论元角色之 间也是有一定关联的,每个事件论元都有与之对应的事件论元角色,因此考 虑将两个自任务相结合做联合抽取。
在本发明的一个或多个实施例中,所述步骤1中具体包括如下步骤:
步骤11:将所述事件触发词和事件类型标注与预设事件触发词以及事件 类型中的元素进行比较,并根据所述事件触发词是否与预设事件触发词以及 事件类型中的元素匹配对所述事件触发词和事件类型标注标签,在所述事件 触发词和事件类型的标签名称中添加用于表示事件类型的后缀名;
实际中,预设事件类型包括ACE2005定义的33种事件类型,另外增加 一种None类型,共34种事件类型。图3给出了事件触发词与事件类型的标 注结果,如果词不是事件触发词中的元素,则标记为O;如果词属于事件触 发词内并且是事件触发词的起始词,则标记为B;如果词位于事件触发词内 并且出现在触发词的起始词之后,则标记为I。在标签B,I添加后缀以表示 事件类型,例如B-marry,I-marry,表示该触发词的对用的事件类型为结婚。
步骤12:将所述事件论元及事件论元角色与预设事件论元及事件论元角 色中的元素进行比较,并根据所述事件论元及事件论元角色是否与预设事件 论元及事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标 签,在所述事件论元及事件论元角色标注标签名称中添加用于表示事件类型 的后缀名。
实际中,预设预设角色类型包括ACE2005定义的35种角色类型,增加 一种None类型,共36类论元角色,图4给出了事件论元与事件论元角色的 标注结果。如果不是预设预设角色类型中的元素,则标记为O;如果属于预 设预设角色类型内并且是事件论元的起始词,则标记为B;如果属于预设预 设角色类型内并且出现在事件论元的起始词之后,则标记为I。在标签B,I 添加后缀以表示事件类型,例如B-person、I-person,表示该论元的角色为结婚的人;B-date、I-date表示该论元的角色为结婚的时间。
通过对文本实例X进行事件识别并生成标注,从而便于将所述事件触发 词和事件类型进行区分开来。
在本发明的一个或多个实施例中,所述步骤3中,将带有句法依存树结 构的所有语料文本实例Xs、事件触发词和事件类型标注Y1以及事件论元和 事件论元角色标注Y2分别按照预设比例随机划分出所述训练集与所述验证 集。
通过将所述语料文本实例Xe、事件触发词和事件类型标注Y1以及事件 论元和事件论元角色标注Y2分别按照预设比例随机划分出所述训练集与所 述验证集,可以方便后续对所述训练集与所述验证均进行高级表示学习和预 测,从而方便后续对训练后的模型进行评估和分析。
本发明的实施例中,所述步骤2中,使用Berkeley工具对未标注的语 料文本实例X进行句法依存分析,以得到带有句法依存树结构标注的语料 文本实例Xs并保存。
本实施例中,所述所有语料文本实例Xs、事件触发词和事件类型标注 Y1以及事件论元和事件论元角色标注Y2分别按照9:1的比例划分为训练集 与验证集。
在本发明的一个或多个实施例中,所述步骤4中,所述利用递归神经网 络学习高级表示
Figure BDA0002915784920000131
的具体方法包括:
利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌入表示e(wi),将所述递归神经网络中的每个节点分别与从其嵌入表示 e(wi)映射的单词wi相关联,网络中的内部节点
Figure BDA00029157849200001310
代表每一步的递归计算转换 的隐藏输出,隐藏输出的初始值由对应的嵌入e(wi)通过通用变换矩阵
Figure BDA0002915784920000132
计算得到,根据递归转换计算递归神经网络中的每个节点的隐藏输 出,即高级表示
Figure BDA0002915784920000133
计算公式为:
Figure BDA0002915784920000134
其中,
Figure BDA0002915784920000135
表示通用转换矩阵,
Figure BDA0002915784920000136
表示参数矩阵,e(wi) 为单词wi的嵌入表示,hi为节点i,b1为偏置参数。
通过将每个单词wi的嵌入表示e(wi)和递归神经网络中的节点进行关联, 从而可以准确计算出递归神经网络中的每个节点的隐藏输出,以完成高级表 示
Figure BDA0002915784920000137
的学习,如图5所示,为本实施例利用递归神经网络学习高级表示
Figure BDA0002915784920000138
的 结果。
在本发明的一个或多个实施例中,所述步骤4中,所述利用条件随机场 解码器基于所述高级表示
Figure BDA0002915784920000139
进行预测,生成预测事件触发词及事件类型Y′1 ,t的具体实现为:
根据所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出 进行解码,得到预测事件触发词及事件类型Y′1 ,t的条件概率模型
Figure BDA0002915784920000141
其 计算公式为:
Figure BDA0002915784920000142
其中,yi和yi-1为条件随机场在i与i-1位置所预测的标签,
Figure BDA0002915784920000143
为 对应i位置的势函数,
Figure BDA0002915784920000144
为对应i位置的势函数;
Figure BDA0002915784920000145
其中,
Figure BDA0002915784920000146
和by′,y分别是标签对(y′,y)的权重和偏置参数。
通过所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出 进行解码,可以准确得到预测事件触发词及事件类型Y′1 ,t的条件概率模型, 如图6所示,为本实施例采用条件随机场模型解码每个节点的隐藏输出的结 果。
在本发明的一个或多个实施例中,所述步骤5中,所述利用递归神经网 络学习高级表示
Figure BDA0002915784920000147
的具体方法包括:
利用条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌 入表示e(wi);同时所述预测事件触发词及事件类型Y′1 ,t通过采用查表的方式 获取对应的嵌入表示e(y1);
将递归神经网络中的每个节点分别与从其嵌入表示e(wi)映射的单词wi相关联,并根据递归转换计算递归神经网络中的每个节点的隐藏输出,即高 级表示
Figure BDA0002915784920000148
计算公式为:
Figure BDA0002915784920000149
其中,
Figure BDA00029157849200001410
表示通用转换矩阵,
Figure BDA00029157849200001411
表示参数矩阵,e(wi) 为单词wi的嵌入表示,hi为节点i,b2为偏置参数。
通过采用查表的方式可以准确获取每个单词wi的嵌入表示e(wi),以及预 测事件触发词及事件类型T′1 ’t的嵌入表示e(y1),从而可以将每个节点分别与 从其嵌入表示e(wi)映射的单词wi准确关联,这样根据地柜转换即可计算出每 个节点的隐藏输出,从而完成高级表示
Figure BDA0002915784920000151
的学习,这里和步骤4中的方法类 似。
在本发明的一个或多个实施例中,所述步骤5中,所述利用条件随机场 解码器基于所述高级表示
Figure BDA0002915784920000152
进行预测,生成预测事件论元及事件论元角色 Y′2 ’t的具体方法为:
根据条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行 解码,得到预测事件论元及事件论元角色Y′2 ,t的条件概率模型
Figure BDA0002915784920000153
其计 算方式为:
Figure BDA0002915784920000154
其中,yi和yi-1为条件随机场在i与i-1位置所预测的标签,
Figure BDA0002915784920000155
为对应i位置的势函数,
Figure BDA0002915784920000156
为对应i位置的势函数;
Figure BDA0002915784920000157
其中,
Figure BDA0002915784920000158
和by′,y分别是标签对(y′,y)的权重和偏置参数。
通过利用条件随机场解码器对递归神经网络中的每个节点的隐藏输出 进行解码,即可得到预测事件论元及事件论元角色Y′2 ,t的条件概率模型
Figure BDA0002915784920000159
从而便于后续进行损失值构建以及整体模型的识别性能评估和分 析,这里和步骤4中的方法类似。
在本发明的一个或多个实施例中,所述步骤6中,所述预测事件触发词 及事件类型Y′1 ,t、预测事件论元及事件论元角色Y′2 ,t、事件触发词和事件类 型标准标注
Figure BDA00029157849200001510
和事件论元和事件论元角色标准标注
Figure BDA00029157849200001511
构建最大条件似然估 计的交叉熵损失值的具体公式为:
Figure BDA00029157849200001512
其中,W为模型Ω(W)所有的参数总和。
通过上述公式可以准确计算出最大条件似然估计的交叉熵损失值,这样 通过交叉熵损失值对递归神经网络和条件随机场解码器的整体参数W进行 训练,以便后续根据训练后的模型Ω(W)对所述验证集中的文本实例Xe进 行识别。
在本发明的一个或多个实施例中,所述步骤7中,所述将二者分别与事 件触发词和事件类型标准标注
Figure BDA0002915784920000161
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000162
一 一对应比对,评估和分析模型的事件元素识别的性能的计算过程为:
Figure BDA0002915784920000163
Figure BDA0002915784920000164
Figure BDA0002915784920000165
其中:
正确标准事件标注 错误标准事件标注
预测到事件标注 TP FP
未预测到事件标注 FN TN
每个事件标注包含事件触发词和事件类型标注,以及事件论元和事件论 元角色标注。这里,TP表示能预测到正确标准事件标注,FP表示能预测到 错误标准事件标注,FN表示未能预测到正确标准事件标注,TN表示未能预 测到错误标准事件标注。
通过所述预测事件触发词及事件类型Y′1 ,e以及预测的事件论元及事件论 元角色Y′2 ’e分别与事件触发词和事件类型标准标注
Figure BDA0002915784920000166
和事件论元和事件论 元角色标准标注
Figure BDA0002915784920000167
一一对应比对,判定是否预测到事件元素,从而准确评 估和分析模型的事件元素识别的性能。
事件识别研究的兴起是自然语言处理领域各项具体应用任务的需求。如 在信息检索领域,目前在信息检索领域,很多检索字段无法直接从问题中得 到,而是需要针对问题进行一定的解析识别。
例如,1)谁是《狂人日记》的作者?
要正确回答问题1),需要抽取的事件触发词为作者,对应的事件类型 为写作,《狂人日记》为对应事件的论元,论元角色为标题。最后得到的结 果为:
事件类型 写作
标题 《狂人日记》
作者
2)有关在中国台湾举办汉代文物大展的时间和地点。
要正确回答问题2)需要抽取的事件触发词为举办,对应的事件类型为 活动,中国台湾、汉代文物大展为对应事件的论元,中国台湾对应的论元角 色为地点,汉代文物大展对应的论元角色为标题,最后得到的结果为:
事件类型 活动
标题 汉代文物大展
地点 中国台湾
时间
我们可以根据事件识别的结果得到相应的检索字段,可提高检索的效 果。事件识别在自动文摘或自动问答领域也有重要应用。例如在多文档自动 文摘中,可利用事件识别得到文摘的关键信息;在自动问答中,可利用事件 识别结果提高机器对问题的理解能力,提高问题回答的相关性以及质量。
如图7所示,本发明还提供了一种基于递归条件随机场解码器的事件识 别系统,包括标注模块、句法分析模块、划分模块、第一学习预测模块、第 二学习预测模块和识别评估模块;
所述标注模块,用于对文本实例X进行事件识别并生成标注,其中, 标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标 注Y2
所述句法分析模块,用于对未标注的语料文本实例X进行句法依存分 析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
所述划分模块,用于将带有句法依存树结构的所有所述语料文本实例 Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分 为训练集与验证集;
其中,所述训练集包括文本实例Xt、事件触发词和事件类型标准标注
Figure BDA0002915784920000181
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000182
所述验证集包括文本实例Xe、事 件触发词和事件类型标准标注
Figure BDA0002915784920000183
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000184
所述第一学习预测模块,用于基于所述训练集的文本实例Xt以及所述 预测事件触发词及事件类型Y′1 ’t,利用递归神经网络学习高级表示
Figure BDA0002915784920000185
并利 用条件随机场解码器基于所述高级表示
Figure BDA0002915784920000186
进行预测,生成预测事件论元及事 件论元角色Y′2 ’t
所述第二预测模块,用于根据所述预测事件触发词及事件类型Y′1 ’t、预 测事件论元及事件论元角色Y′2 ’t事件触发词和事件类型标准标注
Figure BDA00029157849200001810
和事件 论元和事件论元角色标准标注
Figure BDA0002915784920000187
构建损失值,通过交叉熵对递归神经网络 和条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
所述识别评估模块,用于利用训练后的模型Ω(W)对所述验证集中的文 本实例Xe进行识别,得到对应的预测事件触发词及事件类型Y′1 ,e以及预测的 事件论元及事件论元角色Y′2 ’e;并将二者分别与事件触发词和事件类型标准 标注
Figure BDA0002915784920000188
和事件论元和事件论元角色标准标注
Figure BDA0002915784920000189
一一对应比对,评估和分析 模型的事件元素识别的性能。
本发明的基于递归条件随机场解码器的事件识别系统,通过对未标注的 语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训 练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递 归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个 模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架 中,具有更高的识别准确率,无需复杂的规则以及强人工特征即可实现事件 识别功能。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明 的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发 明的保护范围之内。

Claims (10)

1.一种基于递归条件随机场解码器的事件识别方法,其特征在于,包括如下步骤:
步骤1:对文本实例X进行事件识别并生成标注,其中,标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2
步骤2:对未标注的语料文本实例X进行句法依存分析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
步骤3:将带有句法依存树结构的所有所述语料文本实例Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验证集;
其中,所述训练集包括文本实例Xt、事件触发词和事件类型标准标注
Figure FDA0002915784910000011
和事件论元和事件论元角色标准标注
Figure FDA0002915784910000012
所述验证集包括文本实例Xe、事件触发词和事件类型标准标注
Figure FDA0002915784910000013
和事件论元和事件论元角色标准标注
Figure FDA0002915784910000014
步骤4:基于所述训练集的文本实例Xt,利用递归神经网络学习高级表示
Figure FDA0002915784910000015
并利用条件随机场解码器基于所述高级表示
Figure FDA0002915784910000016
进行预测,生成预测事件触发词及事件类型
Figure FDA0002915784910000017
步骤5:基于所述训练集的文本实例Xt以及所述预测事件触发词及事件类型
Figure FDA0002915784910000018
利用递归神经网络学习高级表示
Figure FDA0002915784910000019
并利用条件随机场解码器基于所述高级表示
Figure FDA00029157849100000110
进行预测,生成预测事件论元及事件论元角色
Figure FDA00029157849100000111
步骤6:根据所述预测事件触发词及事件类型
Figure FDA00029157849100000112
预测事件论元及事件论元角色
Figure FDA00029157849100000113
事件触发词和事件类型标准标注
Figure FDA00029157849100000114
和事件论元和事件论元角色标准标注
Figure FDA00029157849100000115
构建交叉熵损失值,通过交叉熵对递归神经网络和条件随机场解码器的整体参数W进行训练,得到训练后的模型Ω(W);
步骤7:利用训练后的模型Ω(W)对所述验证集中的文本实例Xe进行识别,得到对应的预测事件触发词及事件类型
Figure FDA0002915784910000021
以及预测的事件论元及事件论元角色
Figure FDA0002915784910000022
并将二者分别与事件触发词和事件类型标准标注
Figure FDA0002915784910000023
和事件论元和事件论元角色标准标注
Figure FDA0002915784910000024
一一对应比对,评估和分析模型的事件元素识别的性能。
2.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤1中具体包括如下步骤:
将所述事件触发词和事件类型标注与预设事件触发词以及事件类型中的元素进行比较,并根据所述事件触发词是否与预设事件触发词以及事件类型中的元素匹配对所述事件触发词和事件类型标注标签,在所述事件触发词和事件类型的标签名称中添加用于表示事件类型的后缀名;
将所述事件论元及事件论元角色与预设事件论元及事件论元角色中的元素进行比较,并根据所述事件论元及事件论元角色是否与预设事件论元及事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标签,在所述事件论元及事件论元角色标注标签名称中添加用于表示事件类型的后缀名。
3.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤3中,将带有句法依存树结构的所有语料文本实例Xs、事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2分别按照预设比例随机划分出所述训练集与所述验证集。
4.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤4中,所述利用递归神经网络学习高级表示
Figure FDA0002915784910000025
的具体方法包括:
利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌入表示e(wi);
将所述递归神经网络中的每个节点分别与从其嵌入表示e(wi)映射的单词wi相关联,并根据递归转换计算递归神经网络中的每个节点的隐藏输出,即高级表示
Figure FDA0002915784910000031
计算公式为:
Figure FDA0002915784910000032
其中,
Figure FDA0002915784910000033
表示通用转换矩阵,
Figure FDA0002915784910000034
表示参数矩阵,e(wi)为单词wi的嵌入表示,hi为节点i,b1为偏置参数。
5.根据权利要求4所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤4中,所述利用条件随机场解码器基于所述高级表示
Figure FDA0002915784910000035
进行预测,生成预测事件触发词及事件类型
Figure FDA0002915784910000036
的具体实现为:
根据所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码,得到预测事件触发词及事件类型
Figure FDA0002915784910000037
的条件概率模型
Figure FDA0002915784910000038
其计算公式为:
Figure FDA0002915784910000039
其中,yi和yi-1为条件随机场在i与i-1位置所预测的标签,
Figure FDA00029157849100000310
为对应i位置的势函数,
Figure FDA00029157849100000311
为对应i位置的势函数;
Figure FDA00029157849100000312
其中,
Figure FDA00029157849100000313
和by′,y分别是标签对(y′,y)的权重和偏置参数。
6.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤5中,所述利用递归神经网络学习高级表示
Figure FDA00029157849100000314
的具体方法包括:
利用条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌入表示e(wi);同时所述预测事件触发词及事件类型
Figure FDA00029157849100000315
通过采用查表的方式获取对应的嵌入表示e(y1)
将递归神经网络中的每个节点分别与从其嵌入表示e(wi)映射的单词wi相关联,并根据递归转换计算递归神经网络中的每个节点的隐藏输出,即高级表示
Figure FDA00029157849100000316
计算公式为:
Figure FDA0002915784910000041
其中,
Figure FDA0002915784910000042
表示通用转换矩阵,
Figure FDA0002915784910000043
表示参数矩阵,e(wi)为单词wi的嵌入表示,hi为节点i,b2为偏置参数。
7.根据权利要求3所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤5中,所述利用条件随机场解码器基于所述高级表示
Figure FDA0002915784910000044
进行预测,生成预测事件论元及事件论元角色
Figure FDA0002915784910000045
的具体方法为:
根据条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码,得到预测事件论元及事件论元角色
Figure FDA0002915784910000046
的条件概率模型
Figure FDA0002915784910000047
其计算方式为:
Figure FDA0002915784910000048
其中,yi和yi-1为条件随机场在i与i-1位置所预测的标签,
Figure FDA0002915784910000049
为对应i位置的势函数,
Figure FDA00029157849100000410
为对应i位置的势函数;
Figure FDA00029157849100000411
其中,
Figure FDA00029157849100000412
和by′,y分别是标签对(y′,y)的权重和偏置参数。
8.根据权利要求3所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤6中,所述预测事件触发词及事件类型
Figure FDA00029157849100000413
预测事件论元及事件论元角色
Figure FDA00029157849100000414
事件触发词和事件类型标准标注
Figure FDA00029157849100000415
和事件论元和事件论元角色标准标注
Figure FDA00029157849100000416
构建最大条件似然估计的交叉熵损失值的具体公式为:
Figure FDA00029157849100000417
其中,W为模型Ω(W)所有的参数总和。
9.根据权利要求3所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤7中,所述将二者分别与事件触发词和事件类型标准标注
Figure FDA00029157849100000418
和事件论元和事件论元角色标准标注
Figure FDA00029157849100000419
一一对应比对,评估和分析模型的事件元素识别的性能的计算过程为:
Figure FDA0002915784910000051
Figure FDA0002915784910000052
Figure FDA0002915784910000053
其中:
正确标准事件标注 错误标准事件标注 预测到事件标注 TP FP 未预测到事件标注 FN TN
每个事件标注包含事件触发词和事件类型标注,以及事件论元和事件论元角色标注。
10.一种基于递归条件随机场解码器的事件识别系统,其特征在于:包括标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模块和识别评估模块;
所述标注模块,用于对文本实例X进行事件识别并生成标注,其中,标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2
所述句法分析模块,用于对未标注的语料文本实例X进行句法依存分析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
所述划分模块,用于将带有句法依存树结构的所有所述语料文本实例Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验证集;
其中,所述训练集包括文本实例Xt、事件触发词和事件类型标准标注
Figure FDA0002915784910000054
和事件论元和事件论元角色标准标注
Figure FDA0002915784910000055
所述验证集包括文本实例Xe、事件触发词和事件类型标准标注
Figure FDA0002915784910000056
和事件论元和事件论元角色标准标注
Figure FDA0002915784910000057
所述第一学习预测模块,用于基于所述训练集的文本实例Xt以及所述预测事件触发词及事件类型
Figure FDA0002915784910000061
利用递归神经网络学习高级表示
Figure FDA0002915784910000062
并利用条件随机场解码器基于所述高级表示
Figure FDA0002915784910000063
进行预测,生成预测事件论元及事件论元角色
Figure FDA0002915784910000064
所述第二预测模块,用于根据所述预测事件触发词及事件类型
Figure FDA0002915784910000065
预测事件论元及事件论元角色
Figure FDA0002915784910000066
事件触发词和事件类型标准标注
Figure FDA0002915784910000067
和事件论元和事件论元角色标准标注
Figure FDA0002915784910000068
构建损失值,通过交叉熵对递归神经网络和条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
所述识别评估模块,用于利用训练后的模型Ω(W)对所述验证集中的文本实例Xe进行识别,得到对应的预测事件触发词及事件类型
Figure FDA0002915784910000069
以及预测的事件论元及事件论元角色
Figure FDA00029157849100000610
并将二者分别与事件触发词和事件类型标准标注
Figure FDA00029157849100000611
和事件论元和事件论元角色标准标注
Figure FDA00029157849100000612
一一对应比对,评估和分析模型的事件元素识别的性能。
CN202110101327.8A 2021-01-26 2021-01-26 一种基于递归条件随机场解码器的事件识别方法及系统 Pending CN112765987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110101327.8A CN112765987A (zh) 2021-01-26 2021-01-26 一种基于递归条件随机场解码器的事件识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110101327.8A CN112765987A (zh) 2021-01-26 2021-01-26 一种基于递归条件随机场解码器的事件识别方法及系统

Publications (1)

Publication Number Publication Date
CN112765987A true CN112765987A (zh) 2021-05-07

Family

ID=75707376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110101327.8A Pending CN112765987A (zh) 2021-01-26 2021-01-26 一种基于递归条件随机场解码器的事件识别方法及系统

Country Status (1)

Country Link
CN (1) CN112765987A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319735A1 (en) * 2007-06-22 2008-12-25 International Business Machines Corporation Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications
CN109558583A (zh) * 2017-09-27 2019-04-02 株式会社理光 一种自动生成文摘的方法、装置及设备
CN110134757A (zh) * 2019-04-19 2019-08-16 杭州电子科技大学 一种基于多头注意力机制的事件论元角色抽取方法
US20200184307A1 (en) * 2018-12-11 2020-06-11 Adobe Inc. Utilizing recurrent neural networks to recognize and extract open intent from text inputs
CN112163416A (zh) * 2020-10-09 2021-01-01 北京理工大学 一种融合句法和实体关系图卷积网络的事件联合抽取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319735A1 (en) * 2007-06-22 2008-12-25 International Business Machines Corporation Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications
CN109558583A (zh) * 2017-09-27 2019-04-02 株式会社理光 一种自动生成文摘的方法、装置及设备
US20200184307A1 (en) * 2018-12-11 2020-06-11 Adobe Inc. Utilizing recurrent neural networks to recognize and extract open intent from text inputs
CN110134757A (zh) * 2019-04-19 2019-08-16 杭州电子科技大学 一种基于多头注意力机制的事件论元角色抽取方法
CN112163416A (zh) * 2020-10-09 2021-01-01 北京理工大学 一种融合句法和实体关系图卷积网络的事件联合抽取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘新星;姬东鸿;任亚峰: "基于神经网络模型的产品属性情感分析", 计算机应用, no. 006 *
张迎;张宜飞;王中卿;王红玲;: "基于主次关系特征的自动文摘方法", 计算机科学, no. 1 *

Similar Documents

Publication Publication Date Title
CN109325228B (zh) 英文事件触发词抽取方法和系统
Demir et al. Improving named entity recognition for morphologically rich languages using word embeddings
CN111709241A (zh) 一种面向网络安全领域的命名实体识别方法
CN111506714A (zh) 基于知识图嵌入的问题回答
CN113191148B (zh) 一种基于半监督学习和聚类的轨道交通实体识别方法
CN113221567A (zh) 司法领域命名实体及关系联合抽取方法
CN117076653B (zh) 基于思维链及可视化提升上下文学习知识库问答方法
CN113705218B (zh) 基于字符嵌入的事件元素网格化抽取方法、存储介质及电子装置
CN113821605B (zh) 一种事件抽取方法
CN111651983B (zh) 一种基于自训练与噪声模型的因果事件抽取方法
CN113742733B (zh) 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置
CN110209816A (zh) 基于对抗模仿学习的事件识别及分类方法、系统、装置
CN113312914B (zh) 一种基于预训练模型的安全事件实体识别方法
CN116151256A (zh) 一种基于多任务和提示学习的小样本命名实体识别方法
CN113590810A (zh) 摘要生成模型训练方法、摘要生成方法、装置及电子设备
CN115718792A (zh) 一种基于自然语义处理和深度学习的敏感信息提取方法
CN111091002B (zh) 一种中文命名实体的识别方法
CN113947087B (zh) 一种基于标签的关系构建方法、装置、电子设备及存储介质
CN115292568B (zh) 一种基于联合模型的民生新闻事件抽取方法
CN115481635A (zh) 一种地址要素解析方法和系统
CN115935995A (zh) 面向知识图谱生成的非遗丝织领域实体关系抽取方法
CN113312918B (zh) 融合部首向量的分词和胶囊网络法律命名实体识别方法
CN111708870A (zh) 基于深度神经网络的问答方法、装置及存储介质
CN112765987A (zh) 一种基于递归条件随机场解码器的事件识别方法及系统
CN114648029A (zh) 一种基于BiLSTM-CRF模型的电力领域命名实体识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240621