CN112765987A - 一种基于递归条件随机场解码器的事件识别方法及系统 - Google Patents
一种基于递归条件随机场解码器的事件识别方法及系统 Download PDFInfo
- Publication number
- CN112765987A CN112765987A CN202110101327.8A CN202110101327A CN112765987A CN 112765987 A CN112765987 A CN 112765987A CN 202110101327 A CN202110101327 A CN 202110101327A CN 112765987 A CN112765987 A CN 112765987A
- Authority
- CN
- China
- Prior art keywords
- event
- argument
- label
- role
- random field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000012795 verification Methods 0.000 claims abstract description 32
- 230000006870 function Effects 0.000 claims abstract description 17
- 238000011156 evaluation Methods 0.000 claims abstract description 15
- 230000000306 recurrent effect Effects 0.000 claims description 57
- 238000002372 labelling Methods 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 239000004576 sand Substances 0.000 claims description 7
- 238000010200 validation analysis Methods 0.000 claims description 6
- 230000009286 beneficial effect Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 206010037742 Rabies Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种基于递归条件随机场解码器的事件识别方法及系统,通过对未标注的语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架中,具有更高的识别准确率,无需复杂的规则以及强人工特征即可实现事件识别功能。
Description
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于条件随机场模型的事 件识别方法及系统。
背景技术
事件是一种重要的知识,近年来,事件识别的研究在自然语言处理领域 受到了广泛关注。现有方法主要可以分为两类:基于规则的方法和机器学习 方法。基于规则的方法主要集中在一组提取规则的定义上,例如正则表达式 和匹配模式规则。但是,定义这些规则很费力且费时,并且需要很多领域知 识。任务的总体性能在很大程度上取决于已定义规则的质量。同时,与机器 学习方法相比,基于规则的方法具有较差的泛化能力。机器学习的方法识别 事件,就是借鉴文本分类的思想,将事件类别及事件元素的识别转化成为分 类问题,其核心在于分类器的构造和特征的选择。但事件分类与文本分类又 有所区别,主要表现在以下方面:分类的文本短,大部分都是一个完整的句 子;因为是事件表述语句,所以语句中包含的信息量大。Chieu等首次在事 件抽取中引入最大熵模型用于事件元素的识别,实现了对讲座通告和人事管 理事件的抽取。H.Llorens等通过CRF模型进行语义角色标注,并应用于 TimeML的事件抽取,提升了系统的性能。为了提高识别效果,有时将多种机器学习算法混合使用或将机器学习与模型匹配相结合。D.Ahn结合MegaM 和TiMBL两种机器学习方法分别实现了事件类别识别和事件元素识别两大任 务,在ACE语料的实验结果表明该方法优于采用单一算法。基于机器学习 的方法虽然不依赖于语料的内容与格式,但这类方法需要大量的手工设计特 征,尤其是句法特征的构造。现有技术中也有研究如何有效地将句子的依存 关系图映射到句法特征,然后使用这些句法特征进行事件识别,其工作表明语法功能对于该任务非常关键。但是,以前的工作通常通过基于依赖关系树 提取一组手工制作的特征对其进行建模,但是无法以全局方式自动捕获它。 现有的事件识别方法准确率较低,并且需要复杂的规则以及强人工特征才能 实现。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于 递归条件随机场解码器的事件识别方法及系统。
本发明解决上述技术问题的技术方案如下:一种基于递归条件随机场解 码器的事件识别方法,包括如下步骤:
步骤1:对文本实例X进行事件识别并生成标注,其中,标注包含:事 件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2;
步骤2:对未标注的语料文本实例X进行句法依存分析,得到带有句法 依存树结构标注的语料文本实例Xs并保存;
步骤3:将带有句法依存树结构的所有所述语料文本实例Xs、事件触发 词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验 证集;
步骤5:基于所述训练集的文本实例Xt以及所述预测事件触发词及事件 类型Y′1 ’t,利用递归神经网络学习高级表示并利用条件随机场解码器基 于所述高级表示进行预测,生成预测事件论元及事件论元角色Y′2 ’t;
步骤6:根据所述预测事件触发词及事件类型Y′1 ,t、预测事件论元及事 件论元角色Y′2 ’t、事件触发词和事件类型标准标注和事件论元和事件论元 角色标准标注构建交叉熵损失值,通过交叉熵损失值对递归神经网络和 条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
步骤7:利用训练后的模型Ω(W)对所述验证集中的文本实例Xe进行识 别,得到对应的预测事件触发词及事件类型Y′1 ’e以及预测的事件论元及事件 论元角色Y′2 ’e;并将二者分别与事件触发词和事件类型标准标注和事件论 元和事件论元角色标准标注一一对应比对,评估和分析模型的事件元素 识别的性能。
本发明的有益效果是:本发明的基于递归条件随机场解码器的事件识别 方法,通过对未标注的语料文本实例进行句法依存分析,然后划分为训练集 和验证集,再对所述训练集和验证集均进行高级表示学习和预测,并将构建 交叉熵损失值,以对递归神经网络和条件随机场解码器的整体参数W进行 学习,从而完成对整个模型的识别性能的评估,将递归神经网络和条件随机 场集成到统一的框架中,具有更高的识别准确率,无需复杂的规则以及强人 工特征即可实现事件识别功能。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步:所述步骤1中具体包括如下步骤:
将所述事件触发词和事件类型标注与预设事件触发词以及事件类型中 的元素进行比较,并根据所述事件触发词是否与预设事件触发词以及事件类 型中的元素匹配对所述事件触发词和事件类型标注标签,在所述事件触发词 和事件类型的标签名称中添加用于表示事件类型的后缀名;
将所述事件论元及事件论元角色与预设事件论元及事件论元角色中的 元素进行比较,并根据所述事件论元及事件论元角色是否与预设事件论元及 事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标签,在所 述事件论元及事件论元角色标注标签名称中添加用于表示事件类型的后缀 名。
上述进一步方案的有益效果是:通过对文本实例X进行事件识别并生成 标注,从而便于将所述事件触发词和事件类型进行区分开来。
进一步:所述步骤3中,将带有句法依存树结构的所有语料文本实例Xs、 事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2分别按 照预设比例随机划分出所述训练集与所述验证集。
上述进一步方案的有益效果是:通过将所述语料文本实例Xs、事件触 发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2分别按照预设 比例随机划分出所述训练集与所述验证集,可以方便后续对所述训练集与所 述验证均进行高级表示学习和预测,从而方便后续对训练后的模型进行评估 和分析。
利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌入表示e(wi);
上述进一步方案的有益效果是:通过所述条件随机场解码器对递归神经 网络中的每个节点的隐藏输出进行解码,可以准确得到预测事件触发词及事 件类型Y′1 ’t的条件概率模型。
利用条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌 入表示e(wi);同时所述预测事件触发词及事件类型Y′1 ,t通过采用查表的方式 获取对应的嵌入表示e(y1);
上述进一步方案的有益效果是:通过采用查表的方式可以准确获取每个 单词wi的嵌入表示e(wi),以及预测事件触发词及事件类型Y′1 ’t的嵌入表示 e(y1),从而可以将每个节点分别与从其嵌入表示e(wi)映射的单词wi准确关联, 这样根据地柜转换即可计算出每个节点的隐藏输出,从而完成高级表示的 学习。
上述进一步方案的有益效果是:通过利用条件随机场解码器对递归神经 网络中的每个节点的隐藏输出进行解码,即可得到预测事件论元及事件论元 角色Y′2 ,t的条件概率模型从而便于后续进行损失值构建以及整体模 型的识别性能评估和分析。
进一步:所述步骤6中,所述预测事件触发词及事件类型Y′1 ,t、预测事 件论元及事件论元角色Y′2 ,t、事件触发词和事件类型标准标注和事件论元 和事件论元角色标准标注构建最大条件似然估计的交叉熵损失值的具体 公式为:
其中,W为模型Ω(W)所有的参数总和。
上述进一步方案的有益效果是:通过上述公式可以准确计算出最大条件 似然估计的交叉熵损失值,这样通过交叉熵损失值对递归神经网络和条件随 机场解码器的整体参数W进行训练,以便后续根据训练后的模型Ω(W)对所 述验证集中的文本实例Xe进行识别。
其中:
正确标准事件标注 | 错误标准事件标注 | |
预测到事件标注 | TP | FP |
未预测到事件标注 | FN | TN |
每个事件标注包含事件元素事件触发词和事件类型标注,以及事件论元 和事件论元角色标注。
上述进一步方案的有益效果是:通过所述预测事件触发词及事件类型 Y′1 ,e以及预测的事件论元及事件论元角色Y′2 ,e分别与事件触发词和事件类型 标准标注和事件论元和事件论元角色标准标注一一对应比对,判定是 否预测到事件元素,从而准确评估和分析模型的事件元素识别的性能。
本发明还提供了一种基于递归条件随机场解码器的事件识别系统,包括 标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模 块和识别评估模块;
所述标注模块,用于对文本实例X进行事件识别并生成标注,其中, 标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标 注Y2;
所述句法分析模块,用于对未标注的语料文本实例X进行句法依存分 析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
所述划分模块,用于将带有句法依存树结构的所有所述语料文本实例 Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分 为训练集与验证集;
所述第一学习预测模块,用于基于所述训练集的文本实例Xt以及所述 预测事件触发词及事件类型Y′1 ,t,利用递归神经网络学习高级表示并利 用条件随机场解码器基于所述高级表示进行预测,生成预测事件论元及事 件论元角色Y′2 ,t;
所述第二预测模块,用于根据所述预测事件触发词及事件类型Y′1 ,t、预 测事件论元及事件论元角色Y′2 ,t事件触发词和事件类型标准标注和事件 论元和事件论元角色标准标注构建损失值,通过交叉熵对递归神经网络 和条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
所述识别评估模块,用于利用训练后的模型Ω(W)对所述验证集中的文 本实例Xe进行识别,得到对应的预测事件触发词及事件类型Y′1 ,e以及预测的 事件论元及事件论元角色Y′2 ,e;并将二者分别与事件触发词和事件类型标准 标注和事件论元和事件论元角色标准标注一一对应比对,评估和分析 模型的事件元素识别的性能。
本发明的基于递归条件随机场解码器的事件识别系统,通过对未标注的 语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训 练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递 归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个 模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架 中,具有更高的识别准确率,无需复杂的规则以及强人工特征即可实现事件 识别功能。
附图说明
图1为本发明一实施例的基于递归条件随机场解码器的事件识别方法的 流程示意图;
图2为本发明一实施例的事件识别图例;
图3为本发明一实施例的事件触发词与事件类型的标注图例;
图4为本发明一实施例的事件论元与事件论元角色的标注图例;
图5为本发明一实施例的事件触发词与事件类型模型结构示意图;
图6为本发明一实施例的事件论元与事件论元角色模型结构示意图;
图7为本发明一实施例的基于递归条件随机场解码器的事件识别系统的 结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本 发明,并非用于限定本发明的范围。
如图1所示,一种基于递归条件随机场解码器的事件识别方法,包括如 下步骤:
步骤1:对文本实例X进行事件识别并生成标注,其中,标注包含:事 件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2;
步骤2:对未标注的语料文本实例X进行句法依存分析,得到带有句法 依存树结构标注的语料文本实例Xs并保存;
步骤3:将带有句法依存树结构的所有所述语料文本实例Xs、事件触发 词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验 证集;
步骤5:基于所述训练集的文本实例Xt以及所述预测事件触发词及事件 类型Y′1 ,t,利用递归神经网络学习高级表示并利用条件随机场解码器基 于所述高级表示进行预测,生成预测事件论元及事件论元角色Y′2 ,t;
步骤6:根据所述预测事件触发词及事件类型Y′1 ,t、预测事件论元及事 件论元角色Y′2 ,t、事件触发词和事件类型标准标注和事件论元和事件论元 角色标准标注构建交叉熵损失值,通过交叉熵对递归神经网络和条件随 机场解码器的整体参数W进行训练,得到训练后的模型Ω(W);
步骤7:利用训练后的模型Ω(W)对所述验证集中的文本实例Xe进行识 别,得到对应的预测事件触发词及事件类型Y′1 ’e以及预测的事件论元及事件 论元角色Y′2 ’e;并将二者分别与事件触发词和事件类型标准标注和事件论 元和事件论元角色标准标注一一对应比对,评估和分析模型的事件元素 识别的性能。
本发明的基于递归条件随机场解码器的事件识别方法,通过对未标注的 语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训 练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递 归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个 模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架 中,具有更高的识别准确率,结合事件识别中的事件触发词识别、事件类型 识别、事件论元识别和事件论元角色识别,可同时得到以上结果,无需复杂 的规则以及强人工特征即可实现事件识别功能。
事件识别的原始问题是:对于给定的文本实例X,把含有事件信息的非 结构化文本以结构化的形式呈现出来,直观上来看,可以把事件抽取的任务 理解成从文本中找到特定类别的事件,然后进行填表的过程,如图2所示。 因此,通常来说,事件识别的基本任务都可以用以下几个方面概括:事件触 发词检测Event(trigger)detection、事件触发词分类Event trigger typing、事件论元识别Event Argument Identification、事件论元角色识别Event Argument Role Identification。可以从两个角度直观上看待事 件识别问题,第一,事件触发词检测与事件触发词分类这个两个任务之间是 有一定关系的,即可以做联合抽取;第二,事件论元识别与事件论元角色之 间也是有一定关联的,每个事件论元都有与之对应的事件论元角色,因此考 虑将两个自任务相结合做联合抽取。
在本发明的一个或多个实施例中,所述步骤1中具体包括如下步骤:
步骤11:将所述事件触发词和事件类型标注与预设事件触发词以及事件 类型中的元素进行比较,并根据所述事件触发词是否与预设事件触发词以及 事件类型中的元素匹配对所述事件触发词和事件类型标注标签,在所述事件 触发词和事件类型的标签名称中添加用于表示事件类型的后缀名;
实际中,预设事件类型包括ACE2005定义的33种事件类型,另外增加 一种None类型,共34种事件类型。图3给出了事件触发词与事件类型的标 注结果,如果词不是事件触发词中的元素,则标记为O;如果词属于事件触 发词内并且是事件触发词的起始词,则标记为B;如果词位于事件触发词内 并且出现在触发词的起始词之后,则标记为I。在标签B,I添加后缀以表示 事件类型,例如B-marry,I-marry,表示该触发词的对用的事件类型为结婚。
步骤12:将所述事件论元及事件论元角色与预设事件论元及事件论元角 色中的元素进行比较,并根据所述事件论元及事件论元角色是否与预设事件 论元及事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标 签,在所述事件论元及事件论元角色标注标签名称中添加用于表示事件类型 的后缀名。
实际中,预设预设角色类型包括ACE2005定义的35种角色类型,增加 一种None类型,共36类论元角色,图4给出了事件论元与事件论元角色的 标注结果。如果不是预设预设角色类型中的元素,则标记为O;如果属于预 设预设角色类型内并且是事件论元的起始词,则标记为B;如果属于预设预 设角色类型内并且出现在事件论元的起始词之后,则标记为I。在标签B,I 添加后缀以表示事件类型,例如B-person、I-person,表示该论元的角色为结婚的人;B-date、I-date表示该论元的角色为结婚的时间。
通过对文本实例X进行事件识别并生成标注,从而便于将所述事件触发 词和事件类型进行区分开来。
在本发明的一个或多个实施例中,所述步骤3中,将带有句法依存树结 构的所有语料文本实例Xs、事件触发词和事件类型标注Y1以及事件论元和 事件论元角色标注Y2分别按照预设比例随机划分出所述训练集与所述验证 集。
通过将所述语料文本实例Xe、事件触发词和事件类型标注Y1以及事件 论元和事件论元角色标注Y2分别按照预设比例随机划分出所述训练集与所 述验证集,可以方便后续对所述训练集与所述验证均进行高级表示学习和预 测,从而方便后续对训练后的模型进行评估和分析。
本发明的实施例中,所述步骤2中,使用Berkeley工具对未标注的语 料文本实例X进行句法依存分析,以得到带有句法依存树结构标注的语料 文本实例Xs并保存。
本实施例中,所述所有语料文本实例Xs、事件触发词和事件类型标注 Y1以及事件论元和事件论元角色标注Y2分别按照9:1的比例划分为训练集 与验证集。
利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌入表示e(wi),将所述递归神经网络中的每个节点分别与从其嵌入表示 e(wi)映射的单词wi相关联,网络中的内部节点代表每一步的递归计算转换 的隐藏输出,隐藏输出的初始值由对应的嵌入e(wi)通过通用变换矩阵 计算得到,根据递归转换计算递归神经网络中的每个节点的隐藏输 出,即高级表示计算公式为:
通过将每个单词wi的嵌入表示e(wi)和递归神经网络中的节点进行关联, 从而可以准确计算出递归神经网络中的每个节点的隐藏输出,以完成高级表 示的学习,如图5所示,为本实施例利用递归神经网络学习高级表示的 结果。
通过所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出 进行解码,可以准确得到预测事件触发词及事件类型Y′1 ,t的条件概率模型, 如图6所示,为本实施例采用条件随机场模型解码每个节点的隐藏输出的结 果。
利用条件随机场解码器的嵌入层采用查表的方式获取每个单词wi的嵌 入表示e(wi);同时所述预测事件触发词及事件类型Y′1 ,t通过采用查表的方式 获取对应的嵌入表示e(y1);
通过采用查表的方式可以准确获取每个单词wi的嵌入表示e(wi),以及预 测事件触发词及事件类型T′1 ’t的嵌入表示e(y1),从而可以将每个节点分别与 从其嵌入表示e(wi)映射的单词wi准确关联,这样根据地柜转换即可计算出每 个节点的隐藏输出,从而完成高级表示的学习,这里和步骤4中的方法类 似。
通过利用条件随机场解码器对递归神经网络中的每个节点的隐藏输出 进行解码,即可得到预测事件论元及事件论元角色Y′2 ,t的条件概率模型 从而便于后续进行损失值构建以及整体模型的识别性能评估和分 析,这里和步骤4中的方法类似。
在本发明的一个或多个实施例中,所述步骤6中,所述预测事件触发词 及事件类型Y′1 ,t、预测事件论元及事件论元角色Y′2 ,t、事件触发词和事件类 型标准标注和事件论元和事件论元角色标准标注构建最大条件似然估 计的交叉熵损失值的具体公式为:
其中,W为模型Ω(W)所有的参数总和。
通过上述公式可以准确计算出最大条件似然估计的交叉熵损失值,这样 通过交叉熵损失值对递归神经网络和条件随机场解码器的整体参数W进行 训练,以便后续根据训练后的模型Ω(W)对所述验证集中的文本实例Xe进 行识别。
其中:
正确标准事件标注 | 错误标准事件标注 | |
预测到事件标注 | TP | FP |
未预测到事件标注 | FN | TN |
每个事件标注包含事件触发词和事件类型标注,以及事件论元和事件论 元角色标注。这里,TP表示能预测到正确标准事件标注,FP表示能预测到 错误标准事件标注,FN表示未能预测到正确标准事件标注,TN表示未能预 测到错误标准事件标注。
通过所述预测事件触发词及事件类型Y′1 ,e以及预测的事件论元及事件论 元角色Y′2 ’e分别与事件触发词和事件类型标准标注和事件论元和事件论 元角色标准标注一一对应比对,判定是否预测到事件元素,从而准确评 估和分析模型的事件元素识别的性能。
事件识别研究的兴起是自然语言处理领域各项具体应用任务的需求。如 在信息检索领域,目前在信息检索领域,很多检索字段无法直接从问题中得 到,而是需要针对问题进行一定的解析识别。
例如,1)谁是《狂人日记》的作者?
要正确回答问题1),需要抽取的事件触发词为作者,对应的事件类型 为写作,《狂人日记》为对应事件的论元,论元角色为标题。最后得到的结 果为:
事件类型 | 写作 |
标题 | 《狂人日记》 |
作者 | ? |
2)有关在中国台湾举办汉代文物大展的时间和地点。
要正确回答问题2)需要抽取的事件触发词为举办,对应的事件类型为 活动,中国台湾、汉代文物大展为对应事件的论元,中国台湾对应的论元角 色为地点,汉代文物大展对应的论元角色为标题,最后得到的结果为:
事件类型 | 活动 |
标题 | 汉代文物大展 |
地点 | 中国台湾 |
时间 | ? |
我们可以根据事件识别的结果得到相应的检索字段,可提高检索的效 果。事件识别在自动文摘或自动问答领域也有重要应用。例如在多文档自动 文摘中,可利用事件识别得到文摘的关键信息;在自动问答中,可利用事件 识别结果提高机器对问题的理解能力,提高问题回答的相关性以及质量。
如图7所示,本发明还提供了一种基于递归条件随机场解码器的事件识 别系统,包括标注模块、句法分析模块、划分模块、第一学习预测模块、第 二学习预测模块和识别评估模块;
所述标注模块,用于对文本实例X进行事件识别并生成标注,其中, 标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标 注Y2;
所述句法分析模块,用于对未标注的语料文本实例X进行句法依存分 析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
所述划分模块,用于将带有句法依存树结构的所有所述语料文本实例 Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分 为训练集与验证集;
所述第一学习预测模块,用于基于所述训练集的文本实例Xt以及所述 预测事件触发词及事件类型Y′1 ’t,利用递归神经网络学习高级表示并利 用条件随机场解码器基于所述高级表示进行预测,生成预测事件论元及事 件论元角色Y′2 ’t;
所述第二预测模块,用于根据所述预测事件触发词及事件类型Y′1 ’t、预 测事件论元及事件论元角色Y′2 ’t事件触发词和事件类型标准标注和事件 论元和事件论元角色标准标注构建损失值,通过交叉熵对递归神经网络 和条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
所述识别评估模块,用于利用训练后的模型Ω(W)对所述验证集中的文 本实例Xe进行识别,得到对应的预测事件触发词及事件类型Y′1 ,e以及预测的 事件论元及事件论元角色Y′2 ’e;并将二者分别与事件触发词和事件类型标准 标注和事件论元和事件论元角色标准标注一一对应比对,评估和分析 模型的事件元素识别的性能。
本发明的基于递归条件随机场解码器的事件识别系统,通过对未标注的 语料文本实例进行句法依存分析,然后划分为训练集和验证集,再对所述训 练集和验证集均进行高级表示学习和预测,并将构建交叉熵损失值,以对递 归神经网络和条件随机场解码器的整体参数W进行学习,从而完成对整个 模型的识别性能的评估,将递归神经网络和条件随机场集成到统一的框架 中,具有更高的识别准确率,无需复杂的规则以及强人工特征即可实现事件 识别功能。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明 的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发 明的保护范围之内。
Claims (10)
1.一种基于递归条件随机场解码器的事件识别方法,其特征在于,包括如下步骤:
步骤1:对文本实例X进行事件识别并生成标注,其中,标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2;
步骤2:对未标注的语料文本实例X进行句法依存分析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
步骤3:将带有句法依存树结构的所有所述语料文本实例Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验证集;
步骤6:根据所述预测事件触发词及事件类型预测事件论元及事件论元角色事件触发词和事件类型标准标注和事件论元和事件论元角色标准标注构建交叉熵损失值,通过交叉熵对递归神经网络和条件随机场解码器的整体参数W进行训练,得到训练后的模型Ω(W);
2.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤1中具体包括如下步骤:
将所述事件触发词和事件类型标注与预设事件触发词以及事件类型中的元素进行比较,并根据所述事件触发词是否与预设事件触发词以及事件类型中的元素匹配对所述事件触发词和事件类型标注标签,在所述事件触发词和事件类型的标签名称中添加用于表示事件类型的后缀名;
将所述事件论元及事件论元角色与预设事件论元及事件论元角色中的元素进行比较,并根据所述事件论元及事件论元角色是否与预设事件论元及事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标签,在所述事件论元及事件论元角色标注标签名称中添加用于表示事件类型的后缀名。
3.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于,所述步骤3中,将带有句法依存树结构的所有语料文本实例Xs、事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2分别按照预设比例随机划分出所述训练集与所述验证集。
10.一种基于递归条件随机场解码器的事件识别系统,其特征在于:包括标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模块和识别评估模块;
所述标注模块,用于对文本实例X进行事件识别并生成标注,其中,标注包含:事件触发词和事件类型标注Y1以及事件论元和事件论元角色标注Y2;
所述句法分析模块,用于对未标注的语料文本实例X进行句法依存分析,得到带有句法依存树结构标注的语料文本实例Xs并保存;
所述划分模块,用于将带有句法依存树结构的所有所述语料文本实例Xs、事件触发词和事件类型标注Y1和事件论元和事件论元角色标注Y2划分为训练集与验证集;
所述第二预测模块,用于根据所述预测事件触发词及事件类型预测事件论元及事件论元角色事件触发词和事件类型标准标注和事件论元和事件论元角色标准标注构建损失值,通过交叉熵对递归神经网络和条件随机场解码器的整体参数W进行学习,得到训练后的模型Ω(W);
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110101327.8A CN112765987A (zh) | 2021-01-26 | 2021-01-26 | 一种基于递归条件随机场解码器的事件识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110101327.8A CN112765987A (zh) | 2021-01-26 | 2021-01-26 | 一种基于递归条件随机场解码器的事件识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112765987A true CN112765987A (zh) | 2021-05-07 |
Family
ID=75707376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110101327.8A Pending CN112765987A (zh) | 2021-01-26 | 2021-01-26 | 一种基于递归条件随机场解码器的事件识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112765987A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080319735A1 (en) * | 2007-06-22 | 2008-12-25 | International Business Machines Corporation | Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications |
CN109558583A (zh) * | 2017-09-27 | 2019-04-02 | 株式会社理光 | 一种自动生成文摘的方法、装置及设备 |
CN110134757A (zh) * | 2019-04-19 | 2019-08-16 | 杭州电子科技大学 | 一种基于多头注意力机制的事件论元角色抽取方法 |
US20200184307A1 (en) * | 2018-12-11 | 2020-06-11 | Adobe Inc. | Utilizing recurrent neural networks to recognize and extract open intent from text inputs |
CN112163416A (zh) * | 2020-10-09 | 2021-01-01 | 北京理工大学 | 一种融合句法和实体关系图卷积网络的事件联合抽取方法 |
-
2021
- 2021-01-26 CN CN202110101327.8A patent/CN112765987A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080319735A1 (en) * | 2007-06-22 | 2008-12-25 | International Business Machines Corporation | Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications |
CN109558583A (zh) * | 2017-09-27 | 2019-04-02 | 株式会社理光 | 一种自动生成文摘的方法、装置及设备 |
US20200184307A1 (en) * | 2018-12-11 | 2020-06-11 | Adobe Inc. | Utilizing recurrent neural networks to recognize and extract open intent from text inputs |
CN110134757A (zh) * | 2019-04-19 | 2019-08-16 | 杭州电子科技大学 | 一种基于多头注意力机制的事件论元角色抽取方法 |
CN112163416A (zh) * | 2020-10-09 | 2021-01-01 | 北京理工大学 | 一种融合句法和实体关系图卷积网络的事件联合抽取方法 |
Non-Patent Citations (2)
Title |
---|
刘新星;姬东鸿;任亚峰: "基于神经网络模型的产品属性情感分析", 计算机应用, no. 006 * |
张迎;张宜飞;王中卿;王红玲;: "基于主次关系特征的自动文摘方法", 计算机科学, no. 1 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325228B (zh) | 英文事件触发词抽取方法和系统 | |
Demir et al. | Improving named entity recognition for morphologically rich languages using word embeddings | |
CN111709241A (zh) | 一种面向网络安全领域的命名实体识别方法 | |
CN111506714A (zh) | 基于知识图嵌入的问题回答 | |
CN113191148B (zh) | 一种基于半监督学习和聚类的轨道交通实体识别方法 | |
CN113221567A (zh) | 司法领域命名实体及关系联合抽取方法 | |
CN117076653B (zh) | 基于思维链及可视化提升上下文学习知识库问答方法 | |
CN113705218B (zh) | 基于字符嵌入的事件元素网格化抽取方法、存储介质及电子装置 | |
CN113821605B (zh) | 一种事件抽取方法 | |
CN111651983B (zh) | 一种基于自训练与噪声模型的因果事件抽取方法 | |
CN113742733B (zh) | 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置 | |
CN110209816A (zh) | 基于对抗模仿学习的事件识别及分类方法、系统、装置 | |
CN113312914B (zh) | 一种基于预训练模型的安全事件实体识别方法 | |
CN116151256A (zh) | 一种基于多任务和提示学习的小样本命名实体识别方法 | |
CN113590810A (zh) | 摘要生成模型训练方法、摘要生成方法、装置及电子设备 | |
CN115718792A (zh) | 一种基于自然语义处理和深度学习的敏感信息提取方法 | |
CN111091002B (zh) | 一种中文命名实体的识别方法 | |
CN113947087B (zh) | 一种基于标签的关系构建方法、装置、电子设备及存储介质 | |
CN115292568B (zh) | 一种基于联合模型的民生新闻事件抽取方法 | |
CN115481635A (zh) | 一种地址要素解析方法和系统 | |
CN115935995A (zh) | 面向知识图谱生成的非遗丝织领域实体关系抽取方法 | |
CN113312918B (zh) | 融合部首向量的分词和胶囊网络法律命名实体识别方法 | |
CN111708870A (zh) | 基于深度神经网络的问答方法、装置及存储介质 | |
CN112765987A (zh) | 一种基于递归条件随机场解码器的事件识别方法及系统 | |
CN114648029A (zh) | 一种基于BiLSTM-CRF模型的电力领域命名实体识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240621 |