CN109558591A

CN109558591A - 中文事件检测方法及装置

Info

Publication number: CN109558591A
Application number: CN201811438685.2A
Authority: CN
Inventors: 林鸿宇; 韩先培; 孙乐; 陆垚杰
Original assignee: Institute of Software of CAS
Current assignee: Institute of Software of CAS
Priority date: 2018-11-28
Filing date: 2018-11-28
Publication date: 2019-04-02

Abstract

本发明提供一种中文事件检测方法及装置。所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块，所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元。本发明能够直接在字符级别生成完整的触发词块以及对触发词块进行事件类别分类，从而避免事件触发词块与词的不匹配问题，得出更鲁棒的事件检测结果。

Description

中文事件检测方法及装置

技术领域

本发明涉及自然语言处理领域，尤其涉及一种中文事件检测方法及装置。

背景技术

事件抽取是信息抽取中的一个关键任务，事件检测则是事件抽取中的一个关键步骤。事件检测的目标是从给定的文本中识别出特定事件类别的触发词。例如，给定句子“亨利受伤了”，一个事件检测系统应当能够识别出“受伤”是一个“伤害”类别事件的触发词。

现有的神经网络模型通常将事件检测转化为一个词级别的分类问题，例如，在句子中“亨利受伤了”中，一个事件检测系统通过将上述句子中的三个词分别分类为“空”，“伤害事件”以及“空”，从而完成事件检测任务。这类的模型对先验信息的依赖较小，并且已经在事件检测领域取得了较大的进展。

在实现本发明的过程中，发明人发现现有技术中至少存在如下技术问题：

基于词级别分类的事件检测方法没有考虑到事件触发词块与词的不匹配问题。特别是在中文当中，许多事件触发词块并不是一个特定的词，具体地说，一个事件触发词块可能是一个词的一部分，还有可能同时跨越多个词，例如，给定句子“这家公司并购了多家公司”中的“并购”一词中的“并”和“购”属于两种特定类别的事件触发词块，即事件触发词块“并”和“购”是“并购”一词中的一部分；例如，给定句子“那个受伤的士兵不幸身亡了”中的多个词“受了伤”、“身亡”构成一个事件触发词块，即一个事件触发词块由多个词构成。显然，基于词级别分类的事件检测方法不可能检测到上述的事件触发词块，因此这类基于词级别分类的事件检测系统无法取得最优的结果。

发明内容

本发明提供的中文事件检测方法及装置，能够直接在字符级别生成完整的触发词块以及对触发词块进行事件类别分类，从而避免事件触发词块与词的不匹配问题，得出更鲁棒的事件检测结果。

第一方面，本发明提供一种中文事件检测方法，包括：

利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示，并按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示；

基于所述输入文本的混合特征表示，利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分，利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值，并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块；

基于所述输入文本的混合特征表示，利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分，利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值，并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别；

其中，所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。

第二方面，本发明提供一种中文事件检测装置，所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块，所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元；

所述字符级别特征表示生成单元，用于利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征抽取得到所述输入文本的字符级别特征表示；

所述词级别特征表示生成单元，用于利用卷积神经网络卷积层和动态多池化层对输入文本进行词级别特征抽取得到所述输入文本的词符级别特征表示；

所述特征混合单元，用于按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示；

所述触发词块生成模块，用于基于所述输入文本的混合特征表示，利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分，利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值，并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块；

所述事件类别分类模块，用于基于所述输入文本的混合特征表示，利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分，利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值，并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别；

本发明实施例提供的中文事件检测方法及装置，利用字符级别文本能够揭示触发词块内部的组合结构信息以及词级别文本能够提供精确的语义知识提出了字符的混合特征表示，并基于字符的混合特征表示在每个中文字符上直接识别整个触发词块以及事件类别识别，与现有技术相比，本发明能够避免事件触发词块与词的不匹配问题，从而能够显著提升中文事件检测结果的准确性。

附图说明

图1为本发明一实施例中文事件检测方法的流程图；

图2为字符级别特征表示与词级别特征表示混合示意图；

图3为上述实施例中触发词块检测结果的示意图；

图4为本发明一实施例中文事件检测装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种中文事件检测方法，如图1所示，所述方法包括：

S11、利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示，并按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示。

S12、基于所述输入文本的混合特征表示，利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分，利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值，并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块。

S13、基于所述输入文本的混合特征表示，利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分，利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值，并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别。

本发明实施例提供的中文事件检测方法，利用字符级别文本能够揭示触发词块内部的组合结构信息以及词级别文本能够提供精确的语义知识提出了字符的混合特征表示，并基于字符的混合特征表示在每个中文字符上直接识别整个触发词块以及事件类别识别，与现有技术相比，本发明能够避免事件触发词块与词的不匹配问题，从而能够显著提升中文事件检测结果的准确性。

具体地，利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示具体实现步骤如下：

1)利用卷积层捕捉输入文本的组合语义：r_ij＝tanh(w_i·x_j:j+h-1+b_i)

其中，x_j:j+h-1代表的是输入文本中从第j个字符(或者词)到第j+h-1个字符(或者词)的向量化表示，w_i和b_i是模型参数，tanh代表激活函数。

2)利用动态多池化层保留输入文本不同部分的重要信息：

其中，c表示当前待检测的字符(或者词)所处的位置。

3)将和拼接起来得到该当前字符(或者词)的字符级别特征表示f′_char(或者词级别特征表示f′_word)。

可选地，当所述预定的混合规则为连接混合规则时，所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括：

直接将所述输入文本的字符级别特征表示与词级别特征表示连接，以得到所述输入文本的混合特征表示。

如图2所示，利用连接混合规则得到的所述输入文本的混合特征表示为：f_C＝f′_char+f′_word。

可选地，当所述预定的混合规则为通用混合规则时，所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括：

基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。

如图2所示，利用连接混合规则得到的所述输入文本的混合特征表示为：f_G＝z_Gf′_char+(1-z_G)f′_word；

其中，z_G和(1-z_G)分别代表字符级别特征表示和词级别特征表示的相对重要性，z_G的计算方式如下：

z_G＝sigmoid(W_Gf′_char+U_Gf′_word+b_G)

其中W_G是字符级特征在重要打分中的影响的权重矩阵，U_G是词级别特征在重要打分中的影响的权重矩阵，b_G则是一个基线偏置量，表示字符级特征的基线重要程度。可选地，当所述预定的混合规则为任务相关混合规则时，所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括：

基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示，其中，所述输入文本的第一混合特征表示用于生成最终触发词块；

基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示，所述输入文本的第二混合特征表示用于确定最终触发词块的事件类别。

如图2所示，利用连接混合规则得到的所述输入文本的第一混合特征表示和第二混合特征表示为：

f_N＝z_Nf′_char+(1-z_N)f′_word，f_T＝z_Tf′_char+(1-z_T)f′_word；

其中，z_N和(1-z_N)分别代表字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性，z_T和(1-z_T)分别代表字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性，z_N和z_T的计算方式如下：

z_T＝sigmoid(W_Nf′_char+U_Nf′_word+b_N)，z_T＝sigmoid(W_Tf′_char+U_Tf′_word+b_T)。

其中，W_N表示的是字符级特征对应于相对重要性Z_N的权重矩阵，U_N是词级别特征对应于相对重要性Z_N的权重矩阵，B_N则是一个基线偏置量。同样地2，W_T表示的是字符级特征对应于相对重要性Z_T的权重矩阵，U_T是词级别特征对应于相对重要性Z_T的权重矩阵，B_T则是一个基线偏置量。

如图3所示，给出对于输入文本“那受了伤的士兵”最终触发词块“受了伤”的生成结果示意图，由于训练数据中98.5％的候选触发词块的长度均小于等于3个字符，因此对于每个字符共有6个包含该字符的候选触发词块，加上NIL标记(即该字符不属于任何触发词块)，一共有7个可能的触发词块类别，分别计算该字符属于各个候选触发词块的得分，并归一化得分从而得到每个候选触发词块的分类概率值。

其中，图3中表格说明：第1列数字为当前字符在对应触发词块中的位置，第2列数字为对应触发词块的长度，第3列显示的是对应触发词块，第4列表示各个触发词块的分类概率值。

本发明实施例还提供一种中文事件检测装置，如图4所示，所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块，所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元；

本发明实施例提供的中文事件检测装置，利用字符级别文本能够揭示触发词块内部的组合结构信息以及词级别文本能够提供精确的语义知识提出了字符的混合特征表示，并基于字符的混合特征表示在每个中文字符上直接识别整个触发词块以及事件类别识别，与现有技术相比，本发明能够避免事件触发词块与词的不匹配问题，从而能够显著提升中文事件检测结果的准确性。

可选地，当所述预定的混合规则为连接混合规则时，所述特征混合单元，用于直接将所述输入文本的字符级别特征表示与词级别特征表示连接，以得到所述输入文本的混合特征表示。

可选地，当所述预定的混合规则为通用混合规则时，所述特征混合单元，用于基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。

可选地，当所述预定的混合规则为任务相关混合规则时，所述特征混合单元，用于基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示，以及基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示；

其中，所述输入文本的第一混合特征表示作为所述触发词块生成模块的输入用于生成最终触发词块；所述输入文本的第二混合特征表示作为所述事件类别分类模块的输入用于确定最终触发词块的事件类别。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种中文事件检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，当所述预定的混合规则为连接混合规则时，所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括：

3.根据权利要求1所述的方法，其特征在于，当所述预定的混合规则为通用混合规则时，所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括：

4.根据权利要求1所述的方法，其特征在于，当所述预定的混合规则为任务相关混合规则时，所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括：

5.一种中文事件检测装置，其特征在于，所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块，所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元；

6.根据权利要求5所述的装置，其特征在于，当所述预定的混合规则为连接混合规则时，所述特征混合单元，用于直接将所述输入文本的字符级别特征表示与词级别特征表示连接，以得到所述输入文本的混合特征表示。

7.根据权利要求5所述的装置，其特征在于，当所述预定的混合规则为通用混合规则时，所述特征混合单元，用于基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。

8.根据权利要求5所述的装置，其特征在于，当所述预定的混合规则为任务相关混合规则时，所述特征混合单元，用于基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示，以及基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示；