CN107122416B

CN107122416B - 一种中文事件抽取方法

Info

Publication number: CN107122416B
Application number: CN201710209305.7A
Authority: CN
Inventors: 曾颖; 杨宏辉; 冯岩松; 贾爱霞; 赵东岩
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2017-03-31
Filing date: 2017-03-31
Publication date: 2021-07-06
Anticipated expiration: 2037-03-31
Also published as: CN107122416A

Abstract

本发明公开了一种中文事件抽取方法。本方法为：1)对待抽取的中文文本进行实体识别，将识别出来的实体作为事件元素的候选词；对该中文文本逐字进行标注，然后根据标注结果，结合标注模式，识别该中文文本中的事件触发词以及该中文文本所描述的事件类型；2)将该中文文本、事件元素的候选词、事件触发词以及事件类型输入到分类模型中，判断每一所述候选词是否为真实的事件元素；3)根据上述得到的事件元素、事件触发词及事件类型，得到完整的事件结构，完成事件抽取。本发明解决了中文事件抽取中事件触发词和文本中的词语不完全匹配的问题，并提高了中文事件抽取的准确性。

Description

一种中文事件抽取方法

技术领域

本发明主要涉及自然语言处理领域，特别涉及一种利用神经网络和条件随机场进行中文事件抽取的方法，属于信息抽取技术领域。

背景技术

随着互联网的普及和发展，网络中的信息规模呈爆炸式地增长，如何从海量自然语言文档中及时准确地找到需要的信息变得日益迫切。信息抽取技术(InformationExtraction，IE)从松散、无结构的普通文本中抽取指定类型的实体、关系、事件等事实信息，并输出结构化的数据。其中，事件抽取(Event Extraction)是信息抽取研究中最具挑战性的任务之一，其主要研究如何从非结构化自然语言文本中抽取出事件的基本信息，例如事件的类型，事件的参与者，发生时间和地点等，并以结构化的形式呈现出来。

事件抽取技术具有广阔的应用场景和重要的现实意义。例如，根据用户感兴趣的话题推送相关事件的周边报道可以提高个性化新闻系统的表现。除了互联网领域，事件抽取还可以辅助其他领域研究。在医疗领域，利用事件抽取器可以从语料库中提取类似蛋白质分子行为的生物学事件；在金融领域，利用事件抽取技术实时监测突发经济新闻，如公司的兼并和收购，股票交易，分红等，帮助决策者迅速应对市场变化。

一些信息抽取领域的国际评测会议，如信息理解研讨会(Message Understandingfor Comprehension，MUC)、自动内容抽取评测(Automatic ContentExtraction，ACE)、文本分析会议(TextAhalysis Conference，TAC)等，针对事件抽取提出了一系列的理论，并推出了一些实用的系统框架。其中，自动内容抽取评测会议是事件抽取领域最有影响的评测会议，目前大多数的研究都是围绕该会议提出的事件抽取框架展开的。ACE 2005会议定义了8种事件类别及33种子类别，35种角色。ACE还为每种事件类别制定了唯一的模板，主要包括事件的参与者和能反应事件特征的属性，部分事件类型及其模板如表1所示。

表1 ACE 2005任务定义的事件模板

在ACE事件抽取框架中，一个事件由一个事件触发词(trigger)、一种事件类型和若干事件元素组成。其中，事件触发词是指文本中最能体现事件发生的词语，事件元素包含了事件的属性和参与者。根据上述定义，事件抽取任务可以分成两个子任务，分别是：事件触发词及类型的识别，和事件元素的识别。例如，对文本“Intel在中国成立了研究中心”进行事件抽取，第一步应该将“成立”识别成触发词，其触发了一个“成立机构”类型的事件；第二步应该将“Intel”、“中国”和“研究中心”识别成事件元素，其角色分别为“设立方”、“地点”和“被成立机构”。

主流的ACE事件抽取技术可以分别两大类：基于特征抽取的传统方法和基于神经网络的方法。基于特征抽取的传统方法把每个子任务都看成一个词分类问题，利用自然语言处理工具提取候选词及其上下文的词义特征和句法特征，并构建特征向量，作为分类器的输入。接下来，在训练阶段，通过传统机器学习方法，例如最大熵模型、支持向量机模型等，学习各种特征的权重以最优化目标函数，并得出分类器。最后，在测试阶段，将测试文本中的每个词视为一个候选触发词(或事件元素)，分类器的分类结果就是最终的识别结果。基于神经网络的方法同样将每个子任务视为词分类问题，但是通过神经网络自动学习和表征与事件抽取相关的特征。相比于基于特征抽取的方法，基于神经网络的方法的优势在于：(1)不需要花费大量的时间去精心设计和实验验证人工设计的特征；(2)不需要借助其他自然语言处理工具(词性标注器、命名实体识别器、句法分析器等)，避免了误差传递。

但是，现有的基于神经网络的方法都没有考虑到中文自然语言处理的特性，因而无法处理事件触发词和文本中的词语不完全匹配的特殊情况。例如，“击毙”一词中“击”和“毙”分别触发了“攻击”和“死亡”两个事件；“凶杀案”一词中“凶杀”是“死亡”事件的触发词。如果将事件触发词的识别任务直接视为词分类问题(即判断“击毙”和“凶杀案”是否为事件触发词)，无法正确识别以上触发词。因此，现有的事件抽取技术中存在着缺陷，不能满足中文事件抽取的需求。

发明内容

本发明提供一种利用神经网络和条件随机场进行事件抽取的方法，同时解决了中文事件抽取中事件触发词和文本中的词语不完全匹配的问题，并提高了中文事件抽取的准确性。

第一方面，本发明提供一种解决事件触发词和文本中的词语不完全匹配问题的方案。将事件抽取的第一个子任务，即事件触发词及类型的识别，转化为字序列标注问题，即对句子中的每个字，而非词进行分类标注。

第二方面，本发明提供一种基于神经网络和条件随机场的事件抽取系统。其步骤包括：

(1)使用LSTM-CNN-CRF模型进行事件触发词及类型的识别；

(2)事件元素候选词的筛选；

(3)使用LSTM-CNN模型事件元素的识别。

其中，LSTM-CNN-CRF神经网络模型的结构如下：

(1)神经网络的输入层：文本中每个字的字向量；

(2)利用双向长短期记忆神经网络(Bidirectional Long Short-Term MemoryNetwork，B-LSTM)记忆历史输入信息的能力，得到表征每个字上下文环境的特征向量；

(3)利用卷积神经网络(Convolutional Neural Network，CNN)捕获局部特征的能力，抽取字附近的语义特征向量；

(4)神经网络的输出层：对文本中每个字，将B-LSTM网络得到的表征其上下文环境的特征向量和CNN网络输出表征其语义特征的向量拼接起来，并通过一个全连接层得到输出矩阵；

(5)使用条件随机场(Conditional Random Field， CRF)模型对神经网络的输出矩阵进行解码，获得全局最优标注序列。

LSTM-CNN神经网络模型的结构如下：

(1)神经网络的输入层：文本中每个字的字向量；

(2)利用B-LSTM网络得到表征句子信息的特征向量；

(3)利用CNN网络抽取句子的语义特征向量；

(4)神经网络的输出层：将两类网络得到的特征向量拼接起来，并通过一个Softmax回归层(Softmax regression)得到分类结果。

本发明的技术方案为：

一种中文事件抽取方法，其步骤为：

1)对待抽取的中文文本进行实体识别，将识别出来的实体作为事件元素的候选词；对该中文文本逐字进行标注，然后根据标注结果，结合标注模式，识别该中文文本中的事件触发词以及该中文文本所描述的事件类型；

2)将该中文文本、事件元素的候选词、事件触发词以及事件类型输入到分类模型中，判断每一所述候选词是否为真实的事件元素；

3)根据上述得到的事件元素、事件触发词及事件类型，得到完整的事件结构，完成事件抽取。

进一步的，识别该中文文本中的事件触发词以及该中文文本所描述的事件类型的方法为：

21)将该中文文本中每个字的字向量输入双向长短期记忆神经网络，训练得到表征每个字上下文信息的特征向量h_t；

22)利用卷积神经网络抽取每个字附近的语义特征向量c_t；

23)将该中文文本中每个字w_t对应的特征向量h_t和语义特征向量c_t拼接起来，并通过一个全连接网络层，得到一特征向量o_t；然后将该中文文本中各字的特征向量o_t组合得到一输出矩阵；

24)使用条件随机场模型对该输出矩阵进行解码，获得全局最优标注序列；

25)结合标注模式和标注序列，事件触发词及其事件类型。

进一步的，得到所述特征向量h_t的方法为：

31)设该中文文本长为n，w_t是其中第t个字，且其对应的字向量为x_t；

32)将该句子X中的字向量逐个输入到单层长短期记忆网络中，得到每个字w_t的前文特征

向量

33)将该句子X中的字向量逆向输入到另一个长短期记忆网络网络中，得到每个字w_t的后文特征向量

34)将每个字w_t的前文特征向量

后文特征向量

拼接起来，即

作为字w_t的上下文特征向量h_t。

进一步的，得到所述语义特征向量c_t的方法为：

41)设该中文文本长为n，w_t是其中第t个字，且其对应的上下文矩阵由其前后k个字的字向量拼接而成，该上下文矩阵的每一行表示一个字向量；利用卷积神经网络对每个字的上下文矩阵进行卷积操作和最大池化操作，得到对应字w_t的特征向量

42)对于每一字w_t，变化其对应的上下文窗口大小k_i，得到不同长度上下文的语义特征向量

43)将得到的各k_i对应的特征向量

拼接起来得到字w_t附近的语义特征向量c_t。

进一步的，使用word2vec模型得到该中文文本每个字的字向量。

进一步的，判断每一所述候选词是否为真实的事件元素的方法为：

61)设该中文文本长为n，w_t是其中第t个字；将该中文文本中每一字w_t在事件元素的候选词、候选词的实体类型、事件触发词以及事件类型的取值与该字w_t的字向量z_t拼接，作为字w_t的输入向量x_t；

62)将该中文文本中各字的输入向量x_t依次输入双向长短期记忆神经网络，将正向长短期记忆神经网络最后时刻的输出向量

和反向长短期记忆神经网络最后时刻的输出向量

拼接起来作为表征该中文文本的特征向量

63)将该中文文本中各字的输入向量{x₁，x₂...x_n}拼接而成一个大小为n×|x_t|的句子矩阵，其中|x_t|表示输入向量的长度；矩阵的每一行表示文本中一个字的输入向量，通过卷积神经网络对该句子矩阵进行卷积操作和最大池化操作，得到表征该中文文本的语义信息的特征向量c；

64)将得到的所述特征向量h、特征向量c拼接并输入双向长短期记忆神经网络的全连接层，得到每一候选词的类别，根据候选词的类别确定该候选词是否为真实的事件元素。

进一步的，使用BIO模式标注该中文文本中的每个字。

本发明的有益效果：

本发明在进行事件抽取时，将事件触发词及类型的识别和事件元素的识别分别视为字序列标注任务和词分类任务。此外，本发明结合神经网络和条件随机场的特性，提出基于神经网络和条件随机场进行事件抽取的模型。本发明能提高中文事件抽取的准确性，同时克服了基于特征抽取的传统机器学习方法对人工设计的特征的依赖，和其他基于神经网络的方法无法处理和分词结果不完全匹配的触发词的不足。

附图说明

图1为本发明实施例中基于神经网络和条件随机场的中文事件抽取方法的框架图示；

图2为本发明实施例中用于事件触发词和事件类型识别基于神经网络和条件随机场的LSTM-CNN-CRF模型具体图示；

图3为本发明实施例中基于神经网络和条件随机场的LSTM-CNN-CRF模型中CNN模块的具体图示；

图4为本发明实施例中用于事件元素识别的LSTM-CNN模型具体图示。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行详细地描述，应说明的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实例是基于ACE 2005这一中文事件评测任务，本领域技术人员应该清楚地明白，在具体实施过程中也可以采用其他类似的，基于预定义的模板开展事件抽取的语料库，例如TAC-KBP 2016中文事件评测数据集。

图1是本发明实施例基于神经网络和条件随机场的事件抽取方法的框架图示，本发明基于神经网络和条件随机场的事件抽取方法包括：

1)事件触发词及类型的识别：将待抽取的中文文本，逐字输入LSTM-CNN-CRF序列标注模型中，并根据标注结果，结合标注模式，找到文本中的事件触发词，得出文本所描述的事件类型。

2)事件元素候选词的筛选：对待抽取的未标注中文文本进行实体识别，识别出来的实体作为事件元素的候选词。

3)事件元素的识别：将待抽取的未标注中文文本、文本中的事件触发词、文本所描述的事件类型以及文本中的每一个事件元素候选词，输入到LSTM-CNN分类模型中，判断该候选词是否为真实的事件元素，并判断其所扮演的角色。

整合上述步骤抽取的事件触发词、事件类型、事件元素得到完整的事件结构，完成事件抽取。

本发明实施例基于神经网络和条件随机场的事件抽取方法的具体模型和实施步骤如图2、图3和图4所示，其中图2的LSTM-CNN-CRF模型用于事件触发词及类别的识别(即步骤101)，图3为LSTM-CNN-CRF模型中卷积神经网络的具体实现，图4的LSTM-CNN模型用于事件元素的识别(即步骤103)：

步骤101：事件触发词及类型的识别。

本发明使用BIO模式标注文本中的每个字。B-type表示当前字是触发词的第一个字，且触发词触发的事件类型为type；I-type表示当前字位于触发词中，且触发词触发的事件类型为type；O表示当前字不在任何触发词中。例如，输入文本“Intel在中国成立了研究中心”的标注结果如下：

Intel/O在/O中/O国/O成/B-成立机构立/I-成立机构了/O研/O究/O中/O心/O。/O

则该文本中“成”字和“立”字分别位于触发词的首部和中间，即该文本中的事件触发词为“成立”，且其触发的事件类型type为“成立机构”。

步骤1011：初始化字向量。本实施例使用word2vec模型在大型中文新闻语料上学习得到字向量。

步骤1012：利用双向长短期记忆神经网络(Bidirectional Long Short-TermMemory Network，B-LSTM)得到表征每个字上下文信息的特征向量h_t。

给定一条长为n的句子X＝(w₁，w₂，..w_t，...，w_n)，其中w_t是句子中的第t个字，且其对应的字向量为x_t(1≤t≤n)。

将句子中的字向量逐个输入到单层长短期记忆网络中，得到每个字w_t的前文特征向量

本实施例中LSTM网络对输入的字向量x_t进行如下计算：

其中σ为sigmoid函数，

为逐点乘法，W_*和b_*为神经网络的参数。

采用相似的形式，将句子再逆向输入到另一个长短期记忆网络网络中，计算得字w_t的后文特征向量

第一个LSTM网络称为前向LSTM神经网络(forward LSTM)，第二个LSTM网络称为反向LSTM神经网络(backward LSTM)。这两个网络的W_*和b_*参数含义和训练方式相同，但是各网络的神经单元之间不共享参数，因此参数的取值不同。对输入的字向量x_t，前向LSTM网络和后向LSTM网络分别通过自己的W_*和b_*参数计算输出向量

和

并将两个网络的输出拼接起来，即

作为字w_t的上下文特征向量。

步骤1013：利用卷积神经网络(Convolutional Neural Network，CNN)抽取每个字附近的语义特征向量c_t。

给定一条长为n的句子X＝(w₁，w₂，...，w_n)，其中w_t是句子中的第t个字，且其对应的上下文矩阵由其前后k个字的字向量拼接而成，即x_t-k：t+k＝[x_t-k；...；x_t；...；x_t+k](1≤t≤n)，矩阵的每一行表示一个字向量。每个字的上下文矩阵x_t-k：t+k通过卷积神经网络的卷积操作和最大池化操作(max-pooling)，得到特征向量

变化上下文窗口的大小，即k＝{k₁，...，k₂}，得到不同长度上下文的语义特征向量

将所有k_i对应的特征向量

拼接起来得到字w_t附近的语义特征向量c_t。本实施例中使用的k为2和3，即

步骤1014：对一条输入文本中每个字w_t，将长短期记忆神经网络层的输出h_t和卷积神经网络层的输出c_t拼接起来，并通过一个全连接网络层，得到最终的d维特征向量o_t，d表示标签的种数。

将所有字的特征向量组合得到神经网络模型的输出矩阵

其中θ为神经网络的参数，

为输入的句子，矩阵简写作f_θ，大小为n×d。矩阵的第t个列向量为字w_t的特征向量o_t，矩阵中的元素[f_θ]_i，t表示第t个字w_t的标签为i的得分。

步骤1015：使用条件随机场(ConditionalRandom Field，CRF)模型对神经网络的输出矩阵进行解码，获得全局最优标注序列。

CRF层的参数为一个状态转移矩阵A。[A]_i，j表示任一时刻，从标签i转移到标签j的得分。因此，LSTM-CNN-CRF网络的参数

给定句子

其标注序列为

的得分为

使用维特比算法(Viterbi)解码求得得分最高的标注序列

作为步骤101的输出结果。根据BIO模式的定义，根据标注序列，即可得到事件触发词及其事件类型。

步骤102：事件元素候选词的筛选。

本实施例使用ACE 2005的中文事件抽取数据集，该数据集已标注了文本中的实体，因此在该步骤中可以省略实体识别。对于没有预先进行实体识别的语料，需要使用额外的实体识别工具进行实体识别。例如，文本“Intel在中国成立了研究中心”的实体有：

{Intel：机构实体，中国：国家实体，研究中心：机构实体}

步骤103：事件元素的识别。

根据步骤101的输出结果(文本中的触发词和描述事件的类型)，以及步骤102的输出结果(文本中的候选事件元素)，通过LSTM-CNN模型对候选事件元素进行分类，如果候选事件元素没有参与事件，则其类别为“NONE”，否则为在事件中扮演的角色。需要注意的是，不同于上述步骤101中的事件触发词识别任务，本发明将事件元素的识别任务依然看作分类任务，而不是序列标注任务。

本实施例中，触发词trigger＝“成立”，事件类型eventType＝“成立机构”，候选的事件元素有entityList＝{Intel：机构实体，中国：国家实体，研究中心：机构实体}。对entityList中的每一个候选事件元素，分别将其实体类型和触发词、事件类型作为特征输入到LSTM-CNN模型中，分类结果如表2所示。

表2实施例关于事件元素识别的输入输出

步骤1031：将当前字w_t与事件元素的候选词、候选词的实体类型、事件触发词及事件类型的关系的取值通过查哈希表(look-up table)的方法转换成特征向量，并与该字的字向量z_t拼接起来，作为字w_t的输入向量x_t。

本实施例中，字w_t特征向量所表征的输入信息包括：

(1)inEntity：当前字w_t是否在事件元素的候选词中，取值为False或True；

(2)entityType：当前字w_t所在事件元素的候选词的实体类型，如果当前字不在实体中，则取值为“NONE”；

(3)inTrigger：当前字w_t是否在事件触发词中，取值为False或True；

(4)triggerType：当前字w_t所在的触发词的事件类型，如果当前字不在触发词中，则取值为“NONE”。

将上述信息分别通过各自的look-up table(哈希表将输入信息的取值转成向量，因为有4类输入信息，关于每类信息都有一个哈希表，也就是4个哈希表)转化成特征向量，x_inEntity、x_entityType、x_inTrigger和x_triggerType，再拼上当前字w_t的字向量z_t，得到神经网络的输入向量x_t，即

x_t＝[x_inEntity，x_entityType，x_inTrigger，x_triggerType，z_t]

步骤1032：利用双向长短期记忆神经网络得到表征文本信息的特征向量h。

本实施例中LSTM单元内部的计算公式和步骤1012一样。将正向LSTM网络最后时刻的输出向量

和反向LSTM网络最后时刻的输出向量

拼接起来作为文本的特征向量

步骤1033：利用卷积神经网络得到表征文本语义信息的特征向量c。

给定一条长为n的句子X＝(w₁，w₂，...，w_n)，将句子里所有字的输入向量{x₁，x₂...x_n}拼接而成一个大小为n×|x_t|的句子矩阵，其中|x_t|表示输入向量的长度，即x_1：n＝[x₁；...；x_t；...；x_n]，矩阵的每一行表示文本中一个字的输入向量。将句子矩阵x_1：n通过卷积神经网络的卷积操作和最大池化操作(max-pooling)，得到特征向量c。

步骤1034：将双向LSTM网络和CNN网络输出的文本的特征向量h和c拼接起来，传入全连接层，得到每一候选词的类别，根据候选词的类别确定该候选词是否为真实的事件元素。

通过上述三个步骤之后，整理第一步和第三步的输出结果，可以得到最终的事件结构。以下举例说明本发明基于神经网络和条件随机场模型进行中文事件抽取的性能。

实验使用ACE 2005数据集作为训练和测试语料，该数据集包含633篇标注文本。因为该语料库没有标准的测试集和训练集的划分，为了获得更准确的实验评价，本发明采用五折交叉验证：将整个语料库等分成五份，依次选择一份做测试集，剩下的四份，随机选择一份做验证集，其余三份做训练集。实验从以下三个方面评价事件抽取模型：

(1)事件触发词的识别：一个触发词是否被正确标注

(2)事件类别的识别：一个事件的类别被正确识别当且仅当事件的触发词被正确识别，且该触发词触发的事件类型被正确识别；

(3)事件元素的识别：事件的一个候选元素被正确识别当且仅当其对应的事件的触发词、事件的类别被正确识别，且改候选元素被正确识别成事件中的角色。

本发明使用正确率(P)、召回率(R)和F1值来衡量这三个方面的表现。现有方法和本发明所描述的方法的测试结果对比如表3：

表3实验结果

表3中前三行是已有方法的结果，最后两行是本发明的结果(在五份测试集上的实验结果的平均值)，其中Baseline在事件触发词和类别的识别中采用的是LSTM-CNN模型对词进行分类；LSTM-CNN-CRF是本发明的完整实现。Char-MEMM和Rich-L模型都是基于特征抽取的传统机器学习方法；HNN模型是基于神经网络的事件检测方法。需要说明的是，Char-MEMM和HNN模型在实验过程中使用的是随机划分的数据集。在本发明的实验过程中发现，随机抽取不同的文章组成测试集，得到的结果差异非常大，因此采用交叉验证评价模型更加严谨。虽然本发明的实验结果无法直接和此模型进行比较，但是本发明在三份测试集上的表现超过了HNN。从实验结果可以看出，本发明的效果要明显好于基于特征抽取的传统模型，同时在部分数据上，也能超越现有的基于神经网络的模型。同时，将事件触发词和类别的识别这一子任务转换成子序列标注任务，效果要好于将其转化成词分类任务的方法，说明本发明能有效解决中文事件触发词识别时，文本中触发词和分词结果不完全匹配的问题。

综上所述，本发明实施例中，以ACE 2005评测数据集为例，通过基于神经网络和条件随机场的模型抽取出事件的结构化信息，实现了准确有效的事件抽取。此外，在识别事件的触发词和类型的子任务中，为了解决触发词和文本分词结果不能完全匹配的问题，将文本看作字序列并对其进行标注，弥补了现有方法的不足，从而提高了事件抽取任务整体的表现。

最后，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。假如对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于神经网络和条件随机场的中文事件抽取方法，其步骤为：

1)对待抽取的中文文本进行实体识别，将识别出来的实体作为事件元素的候选词；对该中文文本逐字进行标注，然后根据标注结果，结合标注模式，采用LSTM-CNN-CRF模型识别该中文文本中的事件触发词以及该中文文本所描述的事件类型；其中，

11)将该中文文本中每个字的字向量输入双向长短期记忆神经网络，训练得到表征每个字上下文信息的特征向量；

12)利用卷积神经网络抽取每个字附近的语义特征向量；

13)将该中文文本中每个字对应的特征向量和语义特征向量拼接起来，并通过一个全连接网络层，得到一特征向量；然后将该中文文本中各字的特征向量组合得到一输出矩阵；其中该中文文本中第t个字w_t对应的特征向量为h_t、语义特征向量为c_t，特征向量h_t与语义特征向量c_t拼接起来，并通过一个全连接网络层，得到一特征向量o_t；

14)使用条件随机场模型对该输出矩阵进行解码，获得全局最优标注序列；

15)结合标注模式和标注序列，得到候选词的事件触发词及其事件类型；

2)将该中文文本、事件元素的候选词、事件触发词以及事件类型输入到分类模型中，判断每一所述候选词是否为真实的事件元素；其中判断每一所述候选词是否为真实的事件元素的方法为：21)设该中文文本长为n，将该中文文本中w_t在事件元素的候选词、候选词的实体类型、事件触发词以及事件类型的取值与该字w_t的字向量z_t拼接，作为字w_t的输入向量x_t，t＝1～n；22)将该中文文本中各字的输入向量依次输入双向长短期记忆神经网络，将正向长短期记忆神经网络最后时刻的输出向量

和反向长短期记忆神经网络最后时刻的输出向量

拼接起来作为表征该中文文本的特征向量

23)将该中文文本中各字的输入向量{x₁，x₂…x_n}拼接而成一个大小为n×|x_t|的句子矩阵，其中|x_t|表示输入向量的长度；矩阵的每一行表示文本中一个字的输入向量，通过卷积神经网络对该句子矩阵进行卷积操作和最大池化操作，得到表征该中文文本的语义信息的特征向量c；24)将得到的所述特征向量h、特征向量c拼接并输入双向长短期记忆神经网络的全连接层，得到每一候选词的类别，根据候选词的类别确定该候选词是否为真实的事件元素；

3)根据步骤24)得到的候选词的事件元素、步骤15)得到的候选词的事件触发词及事件类型，得到完整的事件结构，完成事件抽取。

2.如权利要求1所述的方法，其特征在于，得到所述特征向量h_t的方法为：

31)将该中文文本中的一个句子X中w_t对应的字向量输入到单层长短期记忆网络中，得到w_t的前文特征向量