CN109739982A

CN109739982A - 事件检测方法

Info

Publication number: CN109739982A
Application number: CN201811563503.4A
Authority: CN
Inventors: 林鸿宇; 韩先培; 孙乐; 陆垚杰
Original assignee: Institute of Software of CAS
Current assignee: Institute of Software of CAS
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2019-05-10

Abstract

本发明提供一种事件检测方法。所述方法包括：使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。本发明通过动态缩放负例样本的训练权重，能够解决现有事件检测模型中的类别不平等问题，且不需要引入任何额外的模型参数。

Description

事件检测方法

技术领域

本发明涉及自然语言处理技术领域，尤其涉及一种事件检测方法。

背景技术

事件抽取是信息抽取中的一个关键任务，事件检测则是事件抽取中的一个关键步骤。事件检测的目标是从给定的文本中识别出特定事件类别的触发词。例如，给定句子“亨利受伤了”，一个事件检测系统应当能够识别出“受伤”是一个“伤害”类别事件的触发词。

现有的神经网络模型通常将事件检测转化为一个词级别的分类问题，例如，在句子中“亨利受伤了”中，一个事件检测系统通过将上述句子中的三个词分别分类为“空”，“伤害事件”以及“空”，从而完成事件检测任务。这类的模型对先验信息的依赖较小，并且已经在事件检测领域取得了较大的进展。

在实现本发明的过程中，发明人发现现有技术中至少存在如下技术问题：

现有的事件检测方法存在着显著的类别不平等问题，这种类别不平等主要体现在数据分布以及使用的评价指标上，具体来说，在数据分布上，被标记为“空”的样本数量显著性地多于被标记为特定类别事件样本的样本数量，在评价指标上，通常使用在事件类别上的F值作为评价标准，而这种评价标准中对于“空”类别上的正确预测结果常常被忽略。由此可见，由于上述的类别不平等问题的存在，使得现有的事件检测模型无法得到良好结果。

发明内容

本发明提供的事件检测方法，通过动态缩放负例样本的训练权重，能够解决现有事件检测模型中的类别不平等问题，且不需要引入任何额外的模型参数。

第一方面，本发明提供一种事件检测方法，包括：

使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；

计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。

可选地，所述使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用通过以下计算公式实现：

其中，和分别是所述F值评价指标对正例样本的边际效用和所述F值评价指标对负例样本的边际效用，分别用于表示正例样本和负例样本对所述F值评价指标的相对重要性，β是所述F值评价指标中用于平衡准确率与召回率的参数，P和N分别表示训练数据中的正例样本总数量和负例样本总数量，TP和TN分别表示正确预测的正例样本数量和正确预测的负例样本数量，PE表示一个正例样本类别与另一个正例样本类别之间的预测错误。

可选地，所述计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛包括：

将负例样本的相对重要性与正例样本的相对重要性的比值作为负例样本在模型训练中的权重ω_β(θ)，其中，所述负例样本在模型训练中的权重ω_β(θ)的计算公式如下：

其中，所述θ为模型参数；

计算基于权重缩放的交叉熵损失函数，使得模型参数θ朝着所述基于权重缩放的交叉熵损失函数的梯度方向前进，直至模型参数θ满足要求，其中，所述基于权重缩放的交叉熵损失函数的计算公式如下：

其中，L_AS(θ)为基于权重缩放的交叉熵损失函数，p(y_i|x_i；θ)表示样本x_i属于样本类别y_i的概率值。

可选地，所述F值评价指标对正例样本和负例样本的边际效用的近似计算公式如下：

其中，TP^B(θ)和TN^B(θ)分别是所述F值评价指标对正例样本的边际效用和所述F值评价指标对负例样本的边际效用。

可选地，所述负例样本在模型训练中的权重ω_β(θ)的近似计算公式如下：

其中，P^B和N^B分别表示正例样本总数量和负例样本总数量

本发明实施例提供的事件检测方法，所述方法包括：使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。与现有技术相比，本发明通过动态缩放负例样本的训练权重，能够解决现有事件检测模型中的类别不平等问题，且不需要引入任何额外的模型参数。

附图说明

图1为本发明一实施例事件检测方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种事件检测方法，如图1所示，所述方法包括：

S11、使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用。

S12、计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。

边际效用是一个经济学中的概念，代表的是每增加消费一单位的某种商品或者服务能够给总体效用带来的增加量。本发明借用这一概念，来计算模型每预测对一个正例类别样本以及负例类别样本给最终评价准则带来的提升。

具体地，所述使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用通过以下计算公式实现：

进一步地，所述计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛包括：

其中，所述θ为模型参数；

为了使得上述动态重要性缩放方法能适用于基于批处理的神经网络梯度优化算法，本发明使用如下的统计量来近似计算TP与TN，即所述F值评价指标对正例样本和负例样本的边际效用的近似计算公式如下：

然后使用如下方法来近似计算ω_β(θ)，即所述负例样本在模型训练中的权重ω_β(θ)的近似计算公式如下：

其中，P^B和N^B分别表示正例样本总数量和负例样本总数量。

例如，以输入文本为“小明受伤了”为例来阐述本发明的事件检测方法。

其中，训练语料包括：

正例1：“受伤”标记为“伤害”事件。

负例1：“小明”标记为“空”。

负例2：“了”标记为“空”。

具体的事件检测过程如下：

1)使用现有的神经网络事件检测模型，计算得到“小明”，“受伤”，“了”被分类为正例样本和负例样本的概率值。

2)基于上述概率值，使用基于边际效用理论的类别重要性计算机制，计算得到正例样本与负例样本的相对重要性。

3)基于上述正例样本与负例样本的相对重要性，使用用于神经网络批处理优化的动态重要性缩放方法更新神经网络事件检测模型的参数。

4)重复步骤1)至3)，直至神经网络事件检测模型收敛。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种事件检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用通过以下计算公式实现：

3.根据权利要求2所述的方法，其特征在于，所述计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛包括：

其中，所述θ为模型参数；

4.根据权利要求3所述的方法，其特征在于，所述F值评价指标对正例样本和负例样本的边际效用的近似计算公式如下：

5.根据权利要求4所述的方法，其特征在于，所述负例样本在模型训练中的权重ω_β(θ)的近似计算公式如下：

其中，P^B和N^B分别表示正例样本总数量和负例样本总数量。