CN112765987A

CN112765987A - 一种基于递归条件随机场解码器的事件识别方法及系统

Info

Publication number: CN112765987A
Application number: CN202110101327.8A
Authority: CN
Inventors: 姬东鸿; 费豪; 吴胜琼
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-05-07

Abstract

本发明涉及一种基于递归条件随机场解码器的事件识别方法及系统，通过对未标注的语料文本实例进行句法依存分析，然后划分为训练集和验证集，再对所述训练集和验证集均进行高级表示学习和预测，并将构建交叉熵损失值，以对递归神经网络和条件随机场解码器的整体参数W进行学习，从而完成对整个模型的识别性能的评估，将递归神经网络和条件随机场集成到统一的框架中，具有更高的识别准确率，无需复杂的规则以及强人工特征即可实现事件识别功能。

Description

一种基于递归条件随机场解码器的事件识别方法及系统

技术领域

本发明涉及自然语言处理领域，尤其涉及一种基于条件随机场模型的事件识别方法及系统。

背景技术

事件是一种重要的知识，近年来，事件识别的研究在自然语言处理领域受到了广泛关注。现有方法主要可以分为两类：基于规则的方法和机器学习方法。基于规则的方法主要集中在一组提取规则的定义上，例如正则表达式和匹配模式规则。但是，定义这些规则很费力且费时，并且需要很多领域知识。任务的总体性能在很大程度上取决于已定义规则的质量。同时，与机器学习方法相比，基于规则的方法具有较差的泛化能力。机器学习的方法识别事件，就是借鉴文本分类的思想，将事件类别及事件元素的识别转化成为分类问题，其核心在于分类器的构造和特征的选择。但事件分类与文本分类又有所区别，主要表现在以下方面:分类的文本短，大部分都是一个完整的句子；因为是事件表述语句，所以语句中包含的信息量大。Chieu等首次在事件抽取中引入最大熵模型用于事件元素的识别，实现了对讲座通告和人事管理事件的抽取。H.Llorens等通过CRF模型进行语义角色标注，并应用于 TimeML的事件抽取，提升了系统的性能。为了提高识别效果，有时将多种机器学习算法混合使用或将机器学习与模型匹配相结合。D.Ahn结合MegaM 和TiMBL两种机器学习方法分别实现了事件类别识别和事件元素识别两大任务，在ACE语料的实验结果表明该方法优于采用单一算法。基于机器学习的方法虽然不依赖于语料的内容与格式，但这类方法需要大量的手工设计特征，尤其是句法特征的构造。现有技术中也有研究如何有效地将句子的依存关系图映射到句法特征，然后使用这些句法特征进行事件识别，其工作表明语法功能对于该任务非常关键。但是，以前的工作通常通过基于依赖关系树提取一组手工制作的特征对其进行建模，但是无法以全局方式自动捕获它。现有的事件识别方法准确率较低，并且需要复杂的规则以及强人工特征才能实现。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足，提供一种基于递归条件随机场解码器的事件识别方法及系统。

本发明解决上述技术问题的技术方案如下：一种基于递归条件随机场解码器的事件识别方法，包括如下步骤：

步骤1：对文本实例X进行事件识别并生成标注，其中，标注包含：事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂；

步骤2：对未标注的语料文本实例X进行句法依存分析，得到带有句法依存树结构标注的语料文本实例X^s并保存；

步骤3：将带有句法依存树结构的所有所述语料文本实例X^s、事件触发词和事件类型标注Y₁和事件论元和事件论元角色标注Y₂划分为训练集与验证集；

其中，所述训练集包括文本实例X^t、事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

所述验证集包括文本实例X^e、事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

步骤4：基于所述训练集的文本实例X^t，利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件触发词及事件类型Y′₁ ^，t；

步骤5：基于所述训练集的文本实例X^t以及所述预测事件触发词及事件类型Y′₁ ^’t，利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色Y′₂ ^’t；

步骤6：根据所述预测事件触发词及事件类型Y′₁ ^，t、预测事件论元及事件论元角色Y′₂ ^’t、事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

构建交叉熵损失值，通过交叉熵损失值对递归神经网络和条件随机场解码器的整体参数W进行学习，得到训练后的模型Ω(W)；

步骤7：利用训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别，得到对应的预测事件触发词及事件类型Y′₁ ^’e以及预测的事件论元及事件论元角色Y′₂ ^’e；并将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能。

本发明的有益效果是：本发明的基于递归条件随机场解码器的事件识别方法，通过对未标注的语料文本实例进行句法依存分析，然后划分为训练集和验证集，再对所述训练集和验证集均进行高级表示学习和预测，并将构建交叉熵损失值，以对递归神经网络和条件随机场解码器的整体参数W进行学习，从而完成对整个模型的识别性能的评估，将递归神经网络和条件随机场集成到统一的框架中，具有更高的识别准确率，无需复杂的规则以及强人工特征即可实现事件识别功能。

在上述技术方案的基础上，本发明还可以做如下改进：

进一步：所述步骤1中具体包括如下步骤：

将所述事件触发词和事件类型标注与预设事件触发词以及事件类型中的元素进行比较，并根据所述事件触发词是否与预设事件触发词以及事件类型中的元素匹配对所述事件触发词和事件类型标注标签，在所述事件触发词和事件类型的标签名称中添加用于表示事件类型的后缀名；

将所述事件论元及事件论元角色与预设事件论元及事件论元角色中的元素进行比较，并根据所述事件论元及事件论元角色是否与预设事件论元及事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标签，在所述事件论元及事件论元角色标注标签名称中添加用于表示事件类型的后缀名。

上述进一步方案的有益效果是：通过对文本实例X进行事件识别并生成标注，从而便于将所述事件触发词和事件类型进行区分开来。

进一步：所述步骤3中，将带有句法依存树结构的所有语料文本实例X^s、事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂分别按照预设比例随机划分出所述训练集与所述验证集。

上述进一步方案的有益效果是：通过将所述语料文本实例X^s、事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂分别按照预设比例随机划分出所述训练集与所述验证集，可以方便后续对所述训练集与所述验证均进行高级表示学习和预测，从而方便后续对训练后的模型进行评估和分析。

进一步：所述步骤4中，所述利用递归神经网络学习高级表示

的具体方法包括：

利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词w_i的嵌入表示e(w_i)；

将所述递归神经网络中的每个节点分别与从其嵌入表示e(w_i)映射的单词w_i相关联，并根据递归转换计算递归神经网络中的每个节点的隐藏输出，即高级表示

计算公式为：

其中，

表示通用转换矩阵，

表示参数矩阵，e(w_i) 为单词w_i的嵌入表示，h_i为节点i，b¹为偏置参数。

上述进一步方案的有益效果是：通过将每个单词w_i的嵌入表示e(w_i)和递归神经网络中的节点进行关联，从而可以准确计算出递归神经网络中的每个节点的隐藏输出，以完成高级表示

的学习。

进一步：所述步骤4中，所述利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件触发词及事件类型Y′₁ ^，t的具体实现为：

根据所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，得到预测事件触发词及事件类型Y′₁ ^，t的条件概率模型

其计算公式为：

其中，y_i和y_i-1为条件随机场在i与i-1位置所预测的标签，

为对应i位置的势函数，

为对应i位置的势函数；

其中，

和b_y′，y分别是标签对(′，y)的权重和偏置参数。

上述进一步方案的有益效果是：通过所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，可以准确得到预测事件触发词及事件类型Y′₁ ^’t的条件概率模型。

进一步：所述步骤5中，所述利用递归神经网络学习高级表示

的具体方法包括：

利用条件随机场解码器的嵌入层采用查表的方式获取每个单词w_i的嵌入表示e(w_i)；同时所述预测事件触发词及事件类型Y′₁ ^，t通过采用查表的方式获取对应的嵌入表示e(y₁)；

将递归神经网络中的每个节点分别与从其嵌入表示e(w_i)映射的单词w_i相关联，并根据递归转换计算递归神经网络中的每个节点的隐藏输出，即高级表示

计算公式为：

其中，

表示通用转换矩阵，

表示参数矩阵，e(w_i) 为单词w_i的嵌入表示，h_i为节点i，b²为偏置参数。

上述进一步方案的有益效果是：通过采用查表的方式可以准确获取每个单词w_i的嵌入表示e(w_i)，以及预测事件触发词及事件类型Y′₁ ^’t的嵌入表示 e(y₁)，从而可以将每个节点分别与从其嵌入表示e(w_i)映射的单词w_i准确关联，这样根据地柜转换即可计算出每个节点的隐藏输出，从而完成高级表示

的学习。

进一步：所述步骤5中，所述利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色Y′₂ ^’t的具体方法为：

根据条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，得到预测事件论元及事件论元角色Y′₂ ^’t的条件概率模型

其计算方式为：

其中，y_i和y_i-1为条件随机场在i与i-1位置所预测的标签，

为对应i位置的势函数，

为对应i位置的势函数；

其中，

和b_y′，y分别是标签对(y′，y)的权重和偏置参数。

上述进一步方案的有益效果是：通过利用条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，即可得到预测事件论元及事件论元角色Y′₂ ^，t的条件概率模型

从而便于后续进行损失值构建以及整体模型的识别性能评估和分析。

进一步：所述步骤6中，所述预测事件触发词及事件类型Y′₁ ^，t、预测事件论元及事件论元角色Y′₂ ^，t、事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

构建最大条件似然估计的交叉熵损失值的具体公式为：

其中，W为模型Ω(W)所有的参数总和。

上述进一步方案的有益效果是：通过上述公式可以准确计算出最大条件似然估计的交叉熵损失值，这样通过交叉熵损失值对递归神经网络和条件随机场解码器的整体参数W进行训练，以便后续根据训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别。

进一步：所述步骤7中，所述将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能的计算过程为：

其中：

	正确标准事件标注	错误标准事件标注
			预测到事件标注	TP	FP
未预测到事件标注	FN	TN

每个事件标注包含事件元素事件触发词和事件类型标注，以及事件论元和事件论元角色标注。

上述进一步方案的有益效果是：通过所述预测事件触发词及事件类型 Y′₁ ^，e以及预测的事件论元及事件论元角色Y′₂ ^，e分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，判定是否预测到事件元素，从而准确评估和分析模型的事件元素识别的性能。

本发明还提供了一种基于递归条件随机场解码器的事件识别系统，包括标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模块和识别评估模块；

所述标注模块，用于对文本实例X进行事件识别并生成标注，其中，标注包含：事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂；

所述句法分析模块，用于对未标注的语料文本实例X进行句法依存分析，得到带有句法依存树结构标注的语料文本实例X^s并保存；

所述划分模块，用于将带有句法依存树结构的所有所述语料文本实例 X^s、事件触发词和事件类型标注Y₁和事件论元和事件论元角色标注Y₂划分为训练集与验证集；

和事件论元和事件论元角色标准标注

和事件论元和事件论元角色标准标注

所述第一学习预测模块，用于基于所述训练集的文本实例X^t以及所述预测事件触发词及事件类型Y′₁ ^，t，利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色Y′₂ ^，t；

所述第二预测模块，用于根据所述预测事件触发词及事件类型Y′₁ ^，t、预测事件论元及事件论元角色Y′₂ ^，t事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

构建损失值，通过交叉熵对递归神经网络和条件随机场解码器的整体参数W进行学习，得到训练后的模型Ω(W)；

所述识别评估模块，用于利用训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别，得到对应的预测事件触发词及事件类型Y′₁ ^，e以及预测的事件论元及事件论元角色Y′₂ ^，e；并将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能。

本发明的基于递归条件随机场解码器的事件识别系统，通过对未标注的语料文本实例进行句法依存分析，然后划分为训练集和验证集，再对所述训练集和验证集均进行高级表示学习和预测，并将构建交叉熵损失值，以对递归神经网络和条件随机场解码器的整体参数W进行学习，从而完成对整个模型的识别性能的评估，将递归神经网络和条件随机场集成到统一的框架中，具有更高的识别准确率，无需复杂的规则以及强人工特征即可实现事件识别功能。

附图说明

图1为本发明一实施例的基于递归条件随机场解码器的事件识别方法的流程示意图；

图2为本发明一实施例的事件识别图例；

图3为本发明一实施例的事件触发词与事件类型的标注图例；

图4为本发明一实施例的事件论元与事件论元角色的标注图例；

图5为本发明一实施例的事件触发词与事件类型模型结构示意图；

图6为本发明一实施例的事件论元与事件论元角色模型结构示意图；

图7为本发明一实施例的基于递归条件随机场解码器的事件识别系统的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

如图1所示，一种基于递归条件随机场解码器的事件识别方法，包括如下步骤：

和事件论元和事件论元角色标准标注

和事件论元和事件论元角色标准标注

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件触发词及事件类型Y′₁ ^，t；

步骤5：基于所述训练集的文本实例X^t以及所述预测事件触发词及事件类型Y′₁ ^，t，利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色Y′₂ ^，t；

步骤6：根据所述预测事件触发词及事件类型Y′₁ ^，t、预测事件论元及事件论元角色Y′₂ ^，t、事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

构建交叉熵损失值，通过交叉熵对递归神经网络和条件随机场解码器的整体参数W进行训练，得到训练后的模型Ω(W)；

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能。

本发明的基于递归条件随机场解码器的事件识别方法，通过对未标注的语料文本实例进行句法依存分析，然后划分为训练集和验证集，再对所述训练集和验证集均进行高级表示学习和预测，并将构建交叉熵损失值，以对递归神经网络和条件随机场解码器的整体参数W进行学习，从而完成对整个模型的识别性能的评估，将递归神经网络和条件随机场集成到统一的框架中，具有更高的识别准确率，结合事件识别中的事件触发词识别、事件类型识别、事件论元识别和事件论元角色识别，可同时得到以上结果，无需复杂的规则以及强人工特征即可实现事件识别功能。

事件识别的原始问题是：对于给定的文本实例X,把含有事件信息的非结构化文本以结构化的形式呈现出来，直观上来看，可以把事件抽取的任务理解成从文本中找到特定类别的事件，然后进行填表的过程，如图2所示。因此，通常来说，事件识别的基本任务都可以用以下几个方面概括：事件触发词检测Event(trigger)detection、事件触发词分类Event trigger typing、事件论元识别Event Argument Identification、事件论元角色识别Event Argument Role Identification。可以从两个角度直观上看待事件识别问题，第一，事件触发词检测与事件触发词分类这个两个任务之间是有一定关系的，即可以做联合抽取；第二，事件论元识别与事件论元角色之间也是有一定关联的，每个事件论元都有与之对应的事件论元角色，因此考虑将两个自任务相结合做联合抽取。

在本发明的一个或多个实施例中，所述步骤1中具体包括如下步骤：

步骤11：将所述事件触发词和事件类型标注与预设事件触发词以及事件类型中的元素进行比较，并根据所述事件触发词是否与预设事件触发词以及事件类型中的元素匹配对所述事件触发词和事件类型标注标签，在所述事件触发词和事件类型的标签名称中添加用于表示事件类型的后缀名；

实际中，预设事件类型包括ACE2005定义的33种事件类型，另外增加一种None类型，共34种事件类型。图3给出了事件触发词与事件类型的标注结果，如果词不是事件触发词中的元素，则标记为O；如果词属于事件触发词内并且是事件触发词的起始词，则标记为B；如果词位于事件触发词内并且出现在触发词的起始词之后，则标记为I。在标签B,I添加后缀以表示事件类型，例如B-marry，I-marry，表示该触发词的对用的事件类型为结婚。

步骤12：将所述事件论元及事件论元角色与预设事件论元及事件论元角色中的元素进行比较，并根据所述事件论元及事件论元角色是否与预设事件论元及事件论元角色中的元素匹配对所述事件论元及事件论元角色标注标签，在所述事件论元及事件论元角色标注标签名称中添加用于表示事件类型的后缀名。

实际中，预设预设角色类型包括ACE2005定义的35种角色类型，增加一种None类型，共36类论元角色，图4给出了事件论元与事件论元角色的标注结果。如果不是预设预设角色类型中的元素，则标记为O；如果属于预设预设角色类型内并且是事件论元的起始词，则标记为B；如果属于预设预设角色类型内并且出现在事件论元的起始词之后，则标记为I。在标签B,I 添加后缀以表示事件类型，例如B-person、I-person，表示该论元的角色为结婚的人；B-date、I-date表示该论元的角色为结婚的时间。

通过对文本实例X进行事件识别并生成标注，从而便于将所述事件触发词和事件类型进行区分开来。

在本发明的一个或多个实施例中，所述步骤3中，将带有句法依存树结构的所有语料文本实例X^s、事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂分别按照预设比例随机划分出所述训练集与所述验证集。

通过将所述语料文本实例X^e、事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂分别按照预设比例随机划分出所述训练集与所述验证集，可以方便后续对所述训练集与所述验证均进行高级表示学习和预测，从而方便后续对训练后的模型进行评估和分析。

本发明的实施例中，所述步骤2中，使用Berkeley工具对未标注的语料文本实例X进行句法依存分析，以得到带有句法依存树结构标注的语料文本实例X^s并保存。

本实施例中，所述所有语料文本实例X^s、事件触发词和事件类型标注 Y₁以及事件论元和事件论元角色标注Y₂分别按照9:1的比例划分为训练集与验证集。

在本发明的一个或多个实施例中，所述步骤4中，所述利用递归神经网络学习高级表示

的具体方法包括：

利用所述条件随机场解码器的嵌入层采用查表的方式获取每个单词w_i的嵌入表示e(w_i)，将所述递归神经网络中的每个节点分别与从其嵌入表示 e(w_i)映射的单词w_i相关联，网络中的内部节点

代表每一步的递归计算转换的隐藏输出，隐藏输出的初始值由对应的嵌入e(w_i)通过通用变换矩阵

计算得到，根据递归转换计算递归神经网络中的每个节点的隐藏输出，即高级表示

计算公式为：

其中，

表示通用转换矩阵，

通过将每个单词w_i的嵌入表示e(w_i)和递归神经网络中的节点进行关联，从而可以准确计算出递归神经网络中的每个节点的隐藏输出，以完成高级表示

的学习，如图5所示，为本实施例利用递归神经网络学习高级表示

的结果。

在本发明的一个或多个实施例中，所述步骤4中，所述利用条件随机场解码器基于所述高级表示

其计算公式为：

其中，y_i和y_i-1为条件随机场在i与i-1位置所预测的标签，

为对应i位置的势函数，

为对应i位置的势函数；

其中，

和b_y′，y分别是标签对(y′，y)的权重和偏置参数。

通过所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，可以准确得到预测事件触发词及事件类型Y′₁ ^，t的条件概率模型，如图6所示，为本实施例采用条件随机场模型解码每个节点的隐藏输出的结果。

在本发明的一个或多个实施例中，所述步骤5中，所述利用递归神经网络学习高级表示

的具体方法包括：

计算公式为：

其中，

表示通用转换矩阵，

通过采用查表的方式可以准确获取每个单词w_i的嵌入表示e(w_i)，以及预测事件触发词及事件类型T′₁ ^’t的嵌入表示e(y₁)，从而可以将每个节点分别与从其嵌入表示e(w_i)映射的单词w_i准确关联，这样根据地柜转换即可计算出每个节点的隐藏输出，从而完成高级表示

的学习，这里和步骤4中的方法类似。

在本发明的一个或多个实施例中，所述步骤5中，所述利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色 Y′₂ ^’t的具体方法为：

根据条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，得到预测事件论元及事件论元角色Y′₂ ^，t的条件概率模型

其计算方式为：

其中，y_i和y_i-1为条件随机场在i与i-1位置所预测的标签，

为对应i位置的势函数，

为对应i位置的势函数；

其中，

和b_y′，y分别是标签对(y′，y)的权重和偏置参数。

通过利用条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，即可得到预测事件论元及事件论元角色Y′₂ ^，t的条件概率模型

从而便于后续进行损失值构建以及整体模型的识别性能评估和分析，这里和步骤4中的方法类似。

在本发明的一个或多个实施例中，所述步骤6中，所述预测事件触发词及事件类型Y′₁ ^，t、预测事件论元及事件论元角色Y′₂ ^，t、事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

构建最大条件似然估计的交叉熵损失值的具体公式为：

其中，W为模型Ω(W)所有的参数总和。

通过上述公式可以准确计算出最大条件似然估计的交叉熵损失值，这样通过交叉熵损失值对递归神经网络和条件随机场解码器的整体参数W进行训练，以便后续根据训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别。

在本发明的一个或多个实施例中，所述步骤7中，所述将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

其中：

每个事件标注包含事件触发词和事件类型标注，以及事件论元和事件论元角色标注。这里，TP表示能预测到正确标准事件标注，FP表示能预测到错误标准事件标注，FN表示未能预测到正确标准事件标注，TN表示未能预测到错误标准事件标注。

通过所述预测事件触发词及事件类型Y′₁ ^，e以及预测的事件论元及事件论元角色Y′₂ ^’e分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

事件识别研究的兴起是自然语言处理领域各项具体应用任务的需求。如在信息检索领域，目前在信息检索领域，很多检索字段无法直接从问题中得到，而是需要针对问题进行一定的解析识别。

例如，1)谁是《狂人日记》的作者？

要正确回答问题1)，需要抽取的事件触发词为作者，对应的事件类型为写作，《狂人日记》为对应事件的论元，论元角色为标题。最后得到的结果为：

事件类型	写作
		标题	《狂人日记》
作者	？

2)有关在中国台湾举办汉代文物大展的时间和地点。

要正确回答问题2)需要抽取的事件触发词为举办，对应的事件类型为活动，中国台湾、汉代文物大展为对应事件的论元，中国台湾对应的论元角色为地点，汉代文物大展对应的论元角色为标题，最后得到的结果为：

事件类型	活动
		标题	汉代文物大展
地点	中国台湾
		时间	？

我们可以根据事件识别的结果得到相应的检索字段，可提高检索的效果。事件识别在自动文摘或自动问答领域也有重要应用。例如在多文档自动文摘中，可利用事件识别得到文摘的关键信息；在自动问答中，可利用事件识别结果提高机器对问题的理解能力，提高问题回答的相关性以及质量。

如图7所示，本发明还提供了一种基于递归条件随机场解码器的事件识别系统，包括标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模块和识别评估模块；

和事件论元和事件论元角色标准标注

和事件论元和事件论元角色标准标注

所述第一学习预测模块，用于基于所述训练集的文本实例X^t以及所述预测事件触发词及事件类型Y′₁ ^’t，利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色Y′₂ ^’t；

所述第二预测模块，用于根据所述预测事件触发词及事件类型Y′₁ ^’t、预测事件论元及事件论元角色Y′₂ ^’t事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

所述识别评估模块，用于利用训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别，得到对应的预测事件触发词及事件类型Y′₁ ^，e以及预测的事件论元及事件论元角色Y′₂ ^’e；并将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于递归条件随机场解码器的事件识别方法,其特征在于，包括如下步骤：

和事件论元和事件论元角色标准标注

和事件论元和事件论元角色标准标注

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件触发词及事件类型

步骤5：基于所述训练集的文本实例X^t以及所述预测事件触发词及事件类型

利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色

步骤6：根据所述预测事件触发词及事件类型

预测事件论元及事件论元角色

事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

步骤7：利用训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别，得到对应的预测事件触发词及事件类型

以及预测的事件论元及事件论元角色

并将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能。

2.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤1中具体包括如下步骤：

3.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤3中，将带有句法依存树结构的所有语料文本实例X^s、事件触发词和事件类型标注Y₁以及事件论元和事件论元角色标注Y₂分别按照预设比例随机划分出所述训练集与所述验证集。

4.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤4中，所述利用递归神经网络学习高级表示

的具体方法包括：

计算公式为：

其中，

表示通用转换矩阵，

表示参数矩阵，e(w_i)为单词w_i的嵌入表示，h_i为节点i，b¹为偏置参数。

5.根据权利要求4所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤4中，所述利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件触发词及事件类型

的具体实现为：

根据所述条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，得到预测事件触发词及事件类型

的条件概率模型

其计算公式为：

其中，y_i和y_i-1为条件随机场在i与i-1位置所预测的标签，

为对应i位置的势函数，

为对应i位置的势函数；

其中，

和b_y′，y分别是标签对(y′，y)的权重和偏置参数。

6.根据权利要求1所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤5中，所述利用递归神经网络学习高级表示

的具体方法包括：

利用条件随机场解码器的嵌入层采用查表的方式获取每个单词w_i的嵌入表示e(w_i)；同时所述预测事件触发词及事件类型

通过采用查表的方式获取对应的嵌入表示e(y₁)

计算公式为：

其中，

表示通用转换矩阵，

表示参数矩阵，e(w_i)为单词w_i的嵌入表示，h_i为节点i，b²为偏置参数。

7.根据权利要求3所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤5中，所述利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色

的具体方法为：

根据条件随机场解码器对递归神经网络中的每个节点的隐藏输出进行解码，得到预测事件论元及事件论元角色

的条件概率模型

其计算方式为：

其中，y_i和y_i-1为条件随机场在i与i-1位置所预测的标签，

为对应i位置的势函数，

为对应i位置的势函数；

其中，

和b_y′，y分别是标签对(y′，y)的权重和偏置参数。

8.根据权利要求3所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤6中，所述预测事件触发词及事件类型

预测事件论元及事件论元角色

事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

构建最大条件似然估计的交叉熵损失值的具体公式为：

其中，W为模型Ω(W)所有的参数总和。

9.根据权利要求3所述的基于递归条件随机场解码器的事件识别方法,其特征在于，所述步骤7中，所述将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

其中：

正确标准事件标注错误标准事件标注预测到事件标注 TP FP 未预测到事件标注 FN TN

每个事件标注包含事件触发词和事件类型标注，以及事件论元和事件论元角色标注。

10.一种基于递归条件随机场解码器的事件识别系统，其特征在于：包括标注模块、句法分析模块、划分模块、第一学习预测模块、第二学习预测模块和识别评估模块；

所述划分模块，用于将带有句法依存树结构的所有所述语料文本实例X^s、事件触发词和事件类型标注Y₁和事件论元和事件论元角色标注Y₂划分为训练集与验证集；

和事件论元和事件论元角色标准标注

和事件论元和事件论元角色标准标注

所述第一学习预测模块，用于基于所述训练集的文本实例X^t以及所述预测事件触发词及事件类型

利用递归神经网络学习高级表示

并利用条件随机场解码器基于所述高级表示

进行预测，生成预测事件论元及事件论元角色

所述第二预测模块，用于根据所述预测事件触发词及事件类型

预测事件论元及事件论元角色

事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

所述识别评估模块，用于利用训练后的模型Ω(W)对所述验证集中的文本实例X^e进行识别，得到对应的预测事件触发词及事件类型

以及预测的事件论元及事件论元角色

并将二者分别与事件触发词和事件类型标准标注

和事件论元和事件论元角色标准标注

一一对应比对，评估和分析模型的事件元素识别的性能。