WO2022048194A1

WO2022048194A1 - 事件主体识别模型优化方法、装置、设备及可读存储介质

Info

Publication number: WO2022048194A1
Application number: PCT/CN2021/095250
Authority: WO
Inventors: 李超; 吴海山; 殷磊
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2020-09-02
Filing date: 2021-05-21
Publication date: 2022-03-10
Also published as: CN112036168A; CN112036168B

Abstract

本申请公开了一种事件主体识别模型优化方法、装置、设备及介质，方法包括：将训练文本输入信息提取模块，提取得到训练文本中的字符信息和事件信息；将字符信息和训练文本的主体标注输入主体识别模块，得到主体识别结果和主体识别损失；将事件信息和主体识别结果输入事件与主体匹配模块得到匹配结果，并基于匹配结果和训练文本对应的事件主体匹配标注计算匹配损失；将事件信息输入事件分类模块得到事件分类结果，并基于事件分类结果和事件类型标注计算分类损失；优化主体识别损失、匹配损失和分类损失以优化事件主体识别模型。

Description

事件主体识别模型优化方法、装置、设备及可读存储介质

优先权信息

本申请要求于2020年9月2日申请的、申请号为202010911064.2的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种事件主体识别模型优化方法、装置、设备及可读存储介质。

背景技术

在现在很多金融场景中，需要分析媒体报道的很多金融事件以帮助投资决策，甚至是构建量化金融建模指标。事件识别(Event Detective，ED)是要识别文本中的事件类型，事件主体识别是要识别文本中事件的主体。现有的事件主体识别模型对文本进行识别，同时识别事件类型和事件主体，复杂度较高，例如当出现一个主体对应多个事件的情况时，容易出现事件类型判别错误的问题。

发明内容

本申请的主要目的在于提供一种事件主体识别模型优化方法、装置、设备及可读存储介质，旨在解决目前的事件主体识别的识别准确率不高的问题。

为实现上述目的，本申请提供一种事件主体识别模型优化方法，所述方法包括以下步骤：

待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述方法包括以下步骤：

将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。

为实现上述目的，本申请提供一种事件主体识别模型优化装置，待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述装置包括：

待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述装置包括：

提取模块，用于将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

识别模块，用于将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

匹配模块，用于将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

分类模块，用于将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化模块，用于优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。

为实现上述目的，本申请还提供一种事件主体识别模型优化设备，所述事件主体识别模型优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的事件主体识别模型优化程序，所述事件主体识别模型优化程序被所述处理器执行时实现如上所述的事件主体识别模型优化方法的步骤。

此外，为实现上述目的，本申请还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有事件主体识别模型优化程序，所述事件主体识别模型优化程序被处理器执行时实现如上所述的事件主体识别模型优化方法的步骤。

本申请中，通过设置包含信息提取模块、主体识别模块、事件分类模块和事件与主体匹配模块的待优化事件主体识别模型，并通过将各类事件对应的训练文本输入信息提取模块，提取得到训练文本中各字符的信息，以及提取训练文本与各类事件相关的事件信息；将字符信息和训练文本对应的主体标注输入主体识别模块进行识别，得到主体识别结果和主体识别损失；将事件信息和主体识别结果输入事件与主体匹配模块进行匹配得到匹配结果，并基于匹配结果和训练文本对应的事件主体匹配标注计算匹配损失；将事件信息输入事件分类模块进行分类得到事件分类结果，并基于事件分类结果和训练文本对应的事件类型标注计算分类损失；优化主体识别损失、匹配损失和分类损失以优化事件主体识别模型。在优化过程中，通过优化主体识别损失，提高主体识别模块识别事件主体的准确率；通过事件分类损失的优化，提高事件分类模块识别事件类别的准确率；并通过设置事件与主体匹配模块根据各类事件的事件信息和主体识别结果，计算各类事件与主体识别结果之间的匹配结果，并通过计算和优化匹配损失，使得模型能够识别到正确的事件类别与事件主体的组合，进而也就进一步优化了事件分类模块进行事件分类的准确率，以及优化了主体识别模块进行主体识别的准确率。本申请中，由事件分类模块来做事件分类，从多类事件中识别一类或多类，由主体识别模块来进行主体识别，从多个词中识别一个或多个，两个模块单独进行识别，都是简单地从多个中选一个或两个，相比于现有模型需要从多个与多个的组合中选一个正确组合的方式，本申请方案简化了分类问题，从而降低了模型出错的概率，进而提高了模型进行事件分类和事件主体识别的准确率。

附图说明

图1为本申请实施例方案涉及的硬件运行环境的结构示意图；

图2为本申请事件主体识别模型优化方法第一实施例的流程示意图；

图3为本申请实施例方案涉及的一种事件主体识别模型的模型结构示意图；

图4为本申请事件主体识别模型优化装置较佳实施例的功能示意图模块图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

需要说明的是，本申请实施例事件主体识别模型优化设备可以是智能手机、个人计算机和服务器等设备，在此不做具体限制。

如图1所示，该事件主体识别模型优化设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的设备结构并不构成对事件主体识别模型优化设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及事件主体识别模型优化程序。其中，待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块。操作系统是管理和控制设备硬件和软件资源的程序，支持事件主体识别模型优化程序以及其它软件或程序的运行。在图1所示的设备中，用户接口1003主要用于与客户端进行数据通信；网络接口1004主要用于服务器建立通信连接；处理器1001可以用于调用存储器1005中存储的事件主体识别模型优化程序，并执行以下操作：

基于上述的结构，提出事件主体识别模型优化方法的各实施例。

参照图2，图2为本申请事件主体识别模型优化方法第一实施例的流程示意图。需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。本申请事件主体识别模型优化方法执行主体可以是智能手机、个人计算机和服务器等设备，以下各个实施例中省略执行主体进行描述。在本实施例中，事件主体识别模型优化方法包括：

步骤S10，将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

目前现有的事件主体识别模型对文本进行识别，是同时识别事件类型和事件主体，也即，事件类型有多个，文本中的每个词也都可能是事件主体，因此，模型需要从各个事件类型与各个词的多对多组合中，选出一个正确的组合，复杂度较高，例如当出现一个主体对应多个事件的情况时，容易出现事件类型判别错误的问题。

在本实施例中，为解决上述问题，可预先设置一个待优化的事件主体识别模型，该事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块。各个模块中都设置有相应的模型参数，这些模型参数可以是初始化的，优化事件主体识别模型即优化这些模型参数，以提高事件主体识别模型的识别准确率，也即提高对文本进行事件分类和事件主体识别的准确率。

其中，信息提取模块设置为用于提取文本中各个字符的字符信息，以及训练文本与各类事件相关的事件信息。并旨在通过优化过程，使得提取到的字符信息中包含文本的事件主体信息，也即，包含表示文本中哪部分字符是潜在的事件主体的信息。例如，文本为“教育部下发考试通知”，其中“教育部”为该文本中的事件主体，其他部分则不属于主体，对事件主体识别模型的优化过程，就是要使得字符信息提取模块学习到从文本中准确地提取出文本中潜在的事件主体信息。还旨在通过优化过程，使得提取到的事件信息能够准确地体现文本的语义与各类事件的关联关系的强弱，从而帮助事件分类模块作出准确的事件分类结果。信息提取模块可以采用常用的文本信息提取模型结构来实现，例如，可采用常用成熟的模型例如BERT(Bidirectional Encoder Representation from Transformers，一种预训练模型)或LSTM(Long Short-Term Memory，长短期记忆网络)来实现，在此不作限制。字符信息和事件信息的数据形式具体不作限制，例如可以设置为矩阵形式或张量形式。

主体识别模块设置为用于基于信息提取模块输出的字符信息进行主体识别，并给出主体识别损失和主体识别结果，进而通过优化主体识别损失的方式，来优化主体识别模块和信息提取模块，以使得信息提取模块能够准确地提取出包含事件主体信息的信字符息，以及使得主体识别模块能够基于字符信息得到准确的事件主体识别结果。主体识别模块可采用常用的命名实体识别器来实现，例如采用条件随机场(CRF)或隐马尔可夫模型(HMM)等。

事件分类模块设置为用于基于信息提取模块输出的事件信息作出事件分类的分类结果，具体可以是二分类也可以是多分类。其中，事件的类别数和名称可以是预先设置好的，例如，设置10种类别的事件，分别是“告警”、“罚款”和“监禁”等等。具体事件的类别数和名称可以根据文本事件识别的应用场景来定，例如，金融领域可设定一些金融事件。事件主体识别模型的优化训练过程，就是要使得事件分类模块学习到如何基于信息提取模块输出的事件信息作出准确的分类结果。

事件与主体匹配模块设置为用于对信息提取模块输出的事件信息和主体识别模块输出的主体识别结果进行匹配，并给出匹配结果，进而通过事件主体匹配标注监督匹配结果的方式，使得事件与主体匹配模块能够做出准确的匹配结果，从而使得事件分类模块作出准确的事件分类结果以及使得主体识别模块作出准确的事件主体识别结果。

预先可采集用于训练事件主体识别模型的各类事件对应的训练文本，也即，各个训练文本所属的事件类型不同。训练文本的采集方式可采用常用的模型训练数据采集方式，在此不进行详细赘述。

在采用训练文本来训练待优化的事件主体识别模型的过程中，要对事件主体识别模型进行至少一轮的优化。一轮优化过程中，将各个训练文本分别输入事件主体识别模型中的信息提取模块，经过信息提取模块处理，提取得到训练文本的字符信息以及训练文本与各类事件相关的事件信息。其中，不需要对训练文本进行分词处理。需要说明的是，各个训练文本是分别处理的，但处理过程相同，故以下描述中，或采用训练文本的描述代表各个训练文本。

步骤S20，将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

将训练文本的字符信息和训练文本对应的主体标注输入主体识别模块进行识别，得到主体识别损失。其中，预先可根据训练文本所属的事件类别，标注出训练文本中与该类别的事件对应的事件主体，并可采用常用的标注工具生成符合格式需求的标注数据，进而得到该训练文本的主体标注。主体识别模型的输入数据设置为字符信息和主体标注，输出为主体识别结果和主体识别损失。其中，主体识别结果可以是表示文本中哪些字符属于事件主体的结果，主体识别损失为表示主体识别结果与主体标注之间差距的损失，主体识别结果和主体识别损失的数据形式在本实施例中不作限制。

步骤S30，将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

将信息提取模块输出的事件信息和主体识别模块输出的主体识别结果输入事件与主体匹配模块进行匹配，得到匹配结果。其中，事件信息包含了训练文本的语义与各类事件之间关联关系的强弱信息，反过来，就是包含了各类事件与训练文本的语义之间关联关系的强弱信息，某类事件与训练文本的关联关系越强，则表示该类事件越可能是该训练文本所属的事件类别。主体识别结果可以是表示文本中哪些字符属于事件主体的结果。事件与主体匹配模块可以是基于该事件信息和该主体识别结果，计算每一类事件分别与每一个字符之间的匹配概率，某类事件与某个字符的匹配概率越大，表示模型预测出训练文本很可能属于该类事件，训练文本中的事件主体很可能是该字符。将匹配概率作为匹配结果。

进一步地，在一实施方式中，所述步骤S30中将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果的步骤包括：

步骤S301，将所述事件信息和所述字符信息输入所述事件与主体匹配模块，以调用所述事件与主体匹配模块基于所述事件信息和所述字符信息计算各类事件分别与所述预测事件主体之间的匹配概率，并将各所述匹配概率作为所述匹配结果。

事件信息可以包括各类事件分别对应的事件信息，也即，每类事件都对应一个事件信息。主体识别结果可以包括训练文本中预测事件主体对应的字符信息，其中，预测事件主体是指主体识别模块预测出的训练文本中属于事件主体的字符，预测事件主体可能有一个或多个。主体识别结果可以是包括了该预测事件主体所对应的字符信息，也即从训练文本的各个字符对应的字符信息中，选出属于预测事件主体的字符信息。将各类事件分别对应的事件信息以及预测事件主体对应的字符信息输入事件与主体匹配模块中，以调用事件与主体匹配模块根据事件信息和字符信息计算各类事件与预测事件主体之间的匹配概率，并将匹配概率作为匹配结果。其中，事件与主体匹配模块可基于一类事件的事件信息和一各预测事件主体的字符信息计算该类事件与该预测事件主体之间的匹配概率，如此计算出每类事件分别与每个预测事件主体之间的匹配概率。

与该匹配结果对应地，训练文本的事件主体标注可以包括每一类事件分别与每一个字符之间的匹配标注，匹配标注表示该训练文本是否属于该类事件且该字符属于事件主体。采用训练文本对应的事件主体匹配标注和该匹配结果计算匹配损失，也即，事件主体匹配标注指示了该训练文本真实的事件类型和事件主体，匹配损失表示了模型预测的事件类型与事件主体，与训练文本真实的事件类型和事件主体之间的差距。其中，事件主体匹配标注可以是预先根据训练文本所属的事件类型和训练文本中的事件主体进行标注的，并可采用常用的标注工具生成符合格式需求的标注数据。

步骤S40，将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

将信息提取模块输出的事件信息输入事件分类模块进行分类处理，得到训练文本对应的事件分类结果。当分类任务是二分类时，即判别文本是否属于某一类型事件时，事件分类结果可以是表示训练文本是属于该类型事件的概率。当分类任务是多分类时，即判别文本属于多类事件中哪一类或哪几类时，事件分类结果可以是包括训练文本分别属于每一类事件的概率。也即，事件分类模块根据事件信息所包含的训练文本的语义与各类事件之间关联关系的强弱信息，预测出训练文本分别属于各类事件的概率。

预先可标注训练文本的事件类型，即标注训练文本属于哪一类事件，并可采用常用的标注工具生成符合格式需求的标注数据，得到事件类型标注。在得到训练文本的事件分类结果后，基于事件分类结果和训练文本对应的事件类型标注计算分类损失。分类损失的计算方式可采用常用的模型分类损失计算方式，在本实施例中不作限制。

步骤S50，优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。

在计算得到主体识别损失、匹配损失和分类损失后，可通过优化主体识别损失、匹配损失和分类损失来优化事件主体识别模型。优化损失即使得损失尽量减小。两个损失可以同时优化，也可以先后优化，优化损失的方式可以采用常用的损失优化方式。至此完成了一轮模型优化过程。

进一步地，所述步骤S50包括：

步骤a，对所述主体识别损失、所述匹配损失和所述分类损失进行加权求和得到总损失；

步骤b，基于所述总损失计算所述事件主体识别模型中各个模型参数对应的梯度值；

步骤c，并根据所述梯度值更新所述各个模型参数，以优化所述事件主体识别模型。

在一实施方式中，可将主体识别损失、匹配损失和分类损失加权求和，以同时优化三个损失，优化损失的方式可以是采用梯度下降算法等常用的损失优化方式。具体地，将主体识别损失、匹配损失和分类损失进行加权求和得到总损失，三个损失对应的权重可以预先设置，权重大小表示三个损失所占的比重；按照梯度下降算法和反向传播算法根据总损失计算得到事件主体识别模型中各个部分的模型参数分别对应的梯度值，模型参数包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块中的模型参数；再根据各个梯度值对应更新的各个模型参数，各个模型参数均得到更新后，事件主体识别模型就得到了更新，也即事件主体识别模型得到了一轮优化。

在经过多轮优化后，若检测到优化后的事件主体识别模型满足预设模型条件，则确定优化后的事件主体识别模型为最终的目标事件主体识别模型。其中，预设模型条件可以是总损失收敛，或达到一个预定的训练时长，或达到一个预定的优化次数，或事件主体识别模型的分类准确率达到一个预定的准确率等等。

得到目标事件主体识别模型后，可采用目标事件主体识别模型对需要进行事件识别和事件主体识别的文本进行识别，得到该文本的事件类型和事件主体。

在本实施例中，通过设置包含信息提取模块、主体识别模块、事件分类模块和事件与主体匹配模块的待优化事件主体识别模型，并通过将各类事件对应的训练文本输入信息提取模块，提取得到训练文本中各字符的信息，以及提取训练文本与各类事件相关的事件信息；将字符信息和训练文本对应的主体标注输入主体识别模块进行识别，得到主体识别结果和主体识别损失；将事件信息和主体识别结果输入事件与主体匹配模块进行匹配得到匹配结果，并基于匹配结果和训练文本对应的事件主体匹配标注计算匹配损失；将事件信息输入事件分类模块进行分类得到事件分类结果，并基于事件分类结果和训练文本对应的事件类型标注计算分类损失；优化主体识别损失、匹配损失和分类损失以优化事件主体识别模型。在优化过程中，通过优化主体识别损失，提高主体识别模块识别事件主体的准确率；通过事件分类损失的优化，提高事件分类模块识别事件类别的准确率；并通过设置事件与主体匹配模块根据各类事件的事件信息和主体识别结果，计算各类事件与主体识别结果之间的匹配结果，并通过计算和优化匹配损失，使得模型能够识别到正确的事件类别与事件主体的组合，进而也就进一步优化了事件分类模块进行事件分类的准确率，以及优化了主体识别模块进行主体识别的准确率。本实施例中，由事件分类模块来做事件分类，从多类事件中识别一类或多类，由主体识别模块来进行主体识别，从多个词中识别一个或多个，两个模块单独进行识别，都是简单地从多个中选一个或两个，相比于现有模型需要从多个与多个的组合中选一个正确组合的方式，本实施例方案简化了分类问题，从而降低了模型出错的概率，进而提高了模型进行事件分类和事件主体识别的准确率。

进一步地，基于上述第一实施例，提出本申请事件主体识别模型优化方法第二实施例，在本实施例中，所述步骤S10包括：

步骤S101，将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息；

在本实施例中，信息提取模块可包括字符信息提取模块和事件信息提取模块两个模块。其中，字符信息提取模块用于提取文本中的字符信息，事件信息提取模块用于基于训练文本和字符信息提取模块提取的字符信息，提取文本与各类事件相关的事件信息。其中，字符信息提取模块和事件信息提取模块都可采用常用的文本信息提取模型结构来实现，在此不作限制。

在优化过程中，将训练文本输入字符信息提取模块，提取得到训练文本中的字符信息。进而将字符信息输入主体识别模块进行主体识别。

步骤S102，将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息。

将训练文本和字符信息输入事件信息提取模块，提取得到训练文本与各类事件相关的事件信息。进而将事件信息输入事件分类模块进行事件分类，以及将事件信息输入事件与主体匹配模块进行事件与主体的匹配。

在本实施例中，如此设置的目的是，将字符信息提取模块输出的字符信息，作为事件信息提取模块的输入，使得事件信息提取模块提取到的事件信息中包含字符信息，或者说使得事件信息提取模块以字符信息作为一个依据来提取事件信息。那么，随着模型不断优化，字符信息提取模块提取的字符信息中逐渐包含正确的事件主体信息，从而使得事件信息中除了包含文本语义与各类事件相关的信息外还包括事件主体信息，将该事件信息输入事件分类模块能够丰富事件分类模块作出事件分类结果的依据，从而提高了事件分类的准确率。

进一步地，在一实施方式中，所述步骤S101包括：

步骤S1011，将所述训练文本输入所述第一语义理解编码器中进行编码，得到所述训练文本中各字符对应的字符编码信息；

在本实施例中，字符信息提取模块可包括第一语义理解编码器和第一事件编码信息。其中，第一语义理解编码器可以采用常用成熟的模型例如BERT(Bidirectional Encoder Representation from Transformers，一种预训练模型)或LSTM(Long Short-Term Memory，长短期记忆网络)来实现，用于对文本进行编码，得到文本中各个字符对应的字符编码信息。第一事件编码信息可以是对各类事件的编码表示(event embedding)，可以随机初始化，并在事件主体识别模型的优化过程中作为模型参数进行优化，以使得各类事件的编码信息有效地代表各类事件。

在优化过程中，将训练文本输入第一语义理解编码器中进行编码，得到训练文本中各个字符对应的字符编码信息。可以理解的是，字符编码信息的准确度是随着优化轮次的增加而逐渐优化的。

步骤S1012，对所述字符编码信息和所述第一事件编码信息进行关联运算，得到所述训练文本中各个字符与各类事件之间的字符事件关联信息，将所述字符事件关联信息作为所述字符信息。

对字符编码信息和第一事件编码信息进行关联运算，得到训练文本中各个字符与各类事件之间的字符事件关联信息。其中，关联运算可以是线性运算，例如加减乘除等运算组合的线性运算，具体不作限制。关联运算后，得到每个字符与每类事件之间的关联关系，构成字符事件关联信息。需要说明的是，在优化开始之前，或者说前面数轮的优化中，字符事件关联信息并不能够准确地表现出各个字符与各类事件之间的关联关系，随着优化轮次逐渐增加，也即，随着主体识别损失的逐渐优化，字符事件关联信息逐渐能够体现出每个字符与每类事件的关联关系的强弱，即能够体现某个或某些字符可能构成了某类事件的事件主体、某些字符可能不属于任何类事件的事件主体这样的信息。具体地，字符编码信息可以是矩阵形式，每一行对应一个字符的编码信息，第一事件编码信息也可以是矩阵形式，每一行对应一类事件的编码信息；经过关联运算后得到的字符事件关联信息也可以是矩阵形式，各个行对应各个字符，各个列对应各类事件，那么矩阵中的元素表示对应行的字符与对应列的该类事件之间的关联关系的强弱，或者，也可以是各个行对应各类事件，各个列对应各个字符；也即，实质上得到了一个字符与事件的注意力矩阵(char attention)。

将字符事件关联信息作为字符信息，也即，将字符事件关联信息作为字符信息输入到事件信息提取模块和主体识别模块中，并进行后续的优化。

在本实施例中，通过设置包括第一语义理解编码器和第一事件编码信息的字符信息提取模块，采用第一语义理解编码器提取训练文本中的字符编码信息，再采用字符编码信息与第一事件编码信息进行关联运算，得到包含训练文本中各个字符与各类事件之间关联关系的字符事件关联信息，并通过优化事件分类损失和主体识别损失，来使得字符信息提取模块提取到的字符事件关联信息中包括文本各个字符与各类事件的事件主体之间的关系，即是否可能是某类事件的事件主体。将包含字符与各类事件的事件主体之间关系的字符事件关联信息输入事件信息提取模块提取到事件信息，再将事件信息输入事件分类模块，能够清晰地指导事件分类模块依据某些类别的事件主体信息作出准确的事件分类。例如，用一个形象的例子来说明其中的原理：事件分类模块依据文本的语义理解信息得到a和b两个事件类型的概率相同且是各类事件类型中最大的，要从这两个事件类型中作出选择时，传统的事件分类模型由于没有更多的分类依据，而容易出错；而本实施例中，由于有字符事件关联信息做依据，该字符事件关联信息中表现为某一字符是a事件类型的潜在事件主体，而没有一个字符是b事件类型的潜在事件主体，则依据该字符事件关联信息，事件分类模块判别出a是文本所属的事件类型。而反过来，准确的事件分类结果能够指导主体识别模块识别得到准确的事件主体识别结果。

进一步地，在一实施方式中，所述方法还包括：

步骤S60，基于所述第一事件编码信息计算各类事件两两之间编码信息的相似度，并将各相似度相加得到事件编码惩罚值；

第一事件编码信息包括各类事件对应的编码信息，第一事件编码信息预先是随机初始化的，在模型优化过程中，通过对关键词识别损失和事件分类损失的优化，使得第一事件编码信息逐渐优化，从而能够更加准确地代表各类事件。

当事件类别较多、划分比较细时，可能会导致事件主体识别模型容易在差异较小的事件类型之间作出错误，例如，A和B两个事件类型很相似，则模型可能容易会将A类型事件的文本判别为B类型，将B类型事件的文本判别为B类型。

在本实施例中，为进一步提高事件主体识别模型在这种情况下的分类准确率，增加一个惩罚机制，该惩罚机制目的在于加大各类事件两两之间编码信息的差异，从而使得事件主体识别模型能够准确地区分各类事件，作出准确地分类结果。

具体地，在优化过程中，基于第一事件编码信息计算各类事件两两之间编码信息的相似度，并将各个相似度相加得到事件编码惩罚值。例如，当事件识别的目标类别有A、B和C三类事件时，第一事件编码信息包括A、B和C三类事件分别对应的编码信息va、vb和vc，计算A、B、C三类事件两两之间编码信息的相似度，也即计算va和vb、va和vc以及vb和vc之间的相似度，将三个相似度相加，得到事件编码惩罚值。其中，计算两个编码信息之间的相似度可以采用简单的对比方法，即判断两者相同的部分占总体部分的比例。当事件的编码信息是向量形式时，也可通过计算两个向量之间的内积，来计算两个编码信息之间的相似度，若两个向量正交，即差异最大时，内积为0，否则内积变大。当第一事件编码信息是矩阵形式，各行分别表示各类事件的编码向量时，也可以采用如下方式来计算事件两两之间编码信息的相似度，即：可以将矩阵中各个元素进行归一化处理，得到归一化矩阵；将归一化矩阵乘以该归一化矩阵的转置，得到一个矩阵；该矩阵中第一行第一列的元素是第一类事件自己与自己的编码信息之间的内积，应当是1，第一行第二列的元素是第一类事件的编码信息与第二类事件的编码信息的内积，第二行第一列的元素是第二类事件的编码信息与第一类事件的编码信息的内积，以此类推；为避免重复，将该矩阵中的上三角元素或下三角元素取出，然后求和就可得到事件编码惩罚值。

所述步骤S50包括：

步骤S501，优化所述事件编码惩罚值、所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。

在计算得到主体识别损失、分类损失、匹配损失和事件编码惩罚值后，可通过优化主体识别损失、分类损失、匹配损失和事件编码惩罚值来优化事件主体识别模型。四个损失可以同时优化，也可以先后优化，优化损失的方式可以采用常用的损失优化方式。至此完成了一轮模型优化过程。

进一步地，在一实施方式中，可将主体识别损失、分类损失、匹配损失和事件编码惩罚值加权求和，以同时优化四个损失，优化损失的方式可以是采用梯度下降算法等常用的损失优化方式。具体地，将主体识别损失、分类损失、匹配损失和事件编码惩罚值进行加权求和得到总损失，四个损失对应的权重可以预先设置，权重大小表示四个损失所占的比重；按照梯度下降算法和反向传播算法根据总损失计算得到事件主体识别模型中各个部分的模型参数分别对应的梯度值，模型参数包括信息提取模块、主体识别模块、事件分类模块和事件与主体匹配模块中的模型参数；再根据各个梯度值对应更新各个模型参数，各个模型参数均得到更新后，事件主体识别模型就得到了更新，也即事件主体识别模型得到了一轮优化。

在本实施例中，通过在事件主体识别模型的损失函数中添加事件编码惩罚值，并优化事件编码惩罚值，使得事件编码惩罚值尽量减小，从而使得各类事件的编码信息之间差异性增大，从而使得事件主体识别模型能够更容易区分各类事件，进而在事件类别多、划分细的情况下，也能够作出准确的事件识别结果。

进一步地，在一实施方式中，所述步骤S102包括：

步骤S1021，将所述训练文本输入所述第二语义理解编码器进行编码，得到所述训练文本对应的文本编码信息；

在本实施例中，事件分类模块包括第二语义理解编码器和第二事件编码信息。其中，第二语义理解编码器可以采用常用成熟的模型例如BERT或LSTM来实现，用于对文本进行编码，得到文本编码信息。第二事件编码信息可以是对各类事件的编码表示，可以随机初始化，并在事件主体识别模型的优化过程中作为模型参数进行优化，以使得各类事件的编码信息有效地代表各类事件。

在优化过程中，将训练文本输入第二语义理解编码器进行编码，得到训练文本对应的文本编码信息。可以理解的是，文本编码信息的准确度是随着优化轮次的增加而逐渐优化的。

步骤S1022，对所述文本编码信息和所述第二事件编码信息进行关联运算，得到所述训练文本与各类事件之间的文本事件关联信息；

在得到训练文本的文本编码信息后，对文本编码信息和第二实际编码信息进行关联运算，得到文本事件关联信息。其中，关联运算可以是线性运算，例如加减乘除等运算组合的线性运算，具体不作限制。关联运算后，得到整个训练文本与每类事件之间的关联关系，构成文本事件关联信息。即，与第一语义理解编码器和第一事件编码信息提取文本中各个字符与各类事件的字符事件关联信息不同，本实施例中的第二语义理解编码器和第二事件编码信息用于提取整个文本的语义信息与各类事件的文本事件关联信息。具体地，文本编码信息可以是向量或矩阵形式，第二事件编码信息也可以是矩阵形式，每一行对应一类事件的编码信息；经过关联运算后得到的文本事件关联信息也可以是矩阵形式，一行为一类事件与训练文本之间的关联关系的向量。也即，实质上得到了一个文本与事件的注意力矩阵(sentence attention)。

步骤S1023，将所述字符信息和所述文本事件关联信息进行组合，得到所述事件信息。

将字符信息和文本事件关联信息进行组合得到事件信息，输入事件分类模块进行分类，得到训练文本对应的事件分类结果。

在本实施例中，通过设置包括第二语义理解编码器、第二事件编码信息和事件分类器的事件分类模块，采用第二语义理解编码器提取训练文本中的文本编码信息，再采用文本编码信息与第二事件编码信息进行关联运算，得到包含训练文本的整体语义与各类事件之间关联关系的文本事件关联信息，将文本事件关联信息和字符信息组合得到事件信息输入事件分类模块进行分类，并计算和优化事件分类损失，以使得事件信息提取模块提取到准确的文本事件关联信息，进而能够指导事件分类器作出准确的事件分类结果。

进一步地，惩罚机制也可以在第二事件编码信息中实现，即基于第二事件编码信息计算事件编码惩罚值，具体计算方法与上述基于第一事件编码信息计算事件编码惩罚值的方式相同。或者可基于第一事件编码信息和第二事件编码信息共同计算编码惩罚值，即基于两个事件编码信息分别计算惩罚值，再将两个惩罚值相加或平均，得到一个最终的惩罚值，将该惩罚值加入损失中进行优化。

在一实施方式中，可结合上述两种实施方式，也即，字符信息提取模块包括第一语义理解编码器和第一事件编码信息，事件信息提取模块包括第二语义理解编码器和第二事件编码信息。这种情况下，两个编码器可采用相同的模型结构来实现，也可以采用不同的模型结构来实现，两个编码器的初始模型参数可以相同也可以不同。若两个编码器采用的模型结构相同，初始模型参数也相同，则在第一轮优化时，第一语义理解编码器输出的字符编码信息与第二语义编码器输出的文本编码信息是相同的；而经过一轮优化后，由于第一语义理解编码器是基于主体识别损失、匹配损失和事件分类损失共同优化而优化的，第二语义理解编码器是基于匹配损失和事件分类损失的优化而优化的，两者接收到的损失信号不同，从而导致第一轮之后，两个编码器输出的结果逐渐不同，且字符编码信息偏向包含文本中单个字符的语义信息，文本编码信息偏向包含文本整体的语义信息。同样地，两个事件编码信息随机初始化时可以相同也可以不同，在第一轮优化以后，由于接收到的损失信号不同，两个事件编码信息会出现差异。

进一步地，如图3所示，与上述实施方式不同的另一实施方式中，也可以是第一语义理解编码器输出的字符编码信息作为字符信息，也即，可以设置字符信息提取模块仅包括一个第一语义理解编码器，将第一语义理解编码器输出的字符编码信息作为字符信息，而事件信息编码模块则可包括第二语义理解编码器、第一事件编码信息和第二事件编码信息。并且，如图3所示，可将字符编码信息与事件信息进行组合后作为事件分类模块的输入，以丰富事件分类模块的分类依据。

进一步地，基于上述第二实施例，提出本申请事件主体识别模型优化方法第三实施例，在本实施例中，所述步骤S20包括：

步骤S201，获取所述训练文本对应的关键词标注；

步骤S202，将所述字符信息、所述关键词标注和所述主体标注输入所述主体识别模块进行识别，得到主体和关键词识别损失，将所述主体和关键词识别损失作为所述主体识别损失。

在本实施例中，主体识别模块为识别主体和关键词的模块，也即与上述实施例的区别是，本实施例中主体识别模块除了识别事件主体外，还识别文本中的关键词。需要说明的是，本实施例中的关键词与基于触发词的事件识别方法中所使用的触发词并不相同，关键词的范围要大于触发词，也即，只要与事件类型相关的词，均可以将其标注为关键词，不一定要达到触发词的条件。并且由于本实施例中的事件主体识别模型是以字符事件关联信息中携带的关键词信息和事件主体信息为辅助进行事件分类，而不是仅依靠关键词进行分类，所以对关键词标注的准确度要求小于触发词，使得关键词标注更加简单，从而降低了人工标注的时间成本，提高了模型的训练效率。

具体地，可预先根据训练文本所属的事件类别，标注出训练文本中与该类别的事件相关的关键词，也即，在标注事件主体的同时，还可标注关键词，并可采用常用的标注工具生成符合格式需求的标注数据，进而得到该训练文本的关键词标注。本实施例中识别主体和关键词的模块，仍然可采用常用的命名实体识别器来实现，例如采用条件随机场(CRF)或隐马尔可夫模型(HMM)等。输入数据则增加了关键词标注，也即，输入数据设置为字符信息、主体标注和关键词标注，输出则增加了关键词识别结果和关键词识别损失。其中，关键词识别结果为表示文本中哪些字符属于关键词的结果，关键词识别损失为表示关键词识别结果与关键词标注之间差距的损失，关键词识别结果和关键词识别损失的数据形式在本实施例中不作限制。

将训练文本的字符信息、关键词标注和主体标注输入主体识别模块进行识别，得到关键词识别损失和主体识别损失。将关键词识别损失和主体识别损失作为主体识别损失，也即，后续通过优化关键词识别损失、主体识别损失和分类损失来优化事件主体识别模型。

在本实施例中，通过设置主体识别模块还识别文本中的关键词，并通过优化关键词识别损失，使得主体识别模块识别关键词的准确率提高，进而使得字符信息提取模块提取到的字符信息中，除了包括各个字符与各类事件的事件主体之间的关联关系外，还包括各个字符与各类事件的关键词之间的关联关系，也即使得字符信息提取模块提取到的字符事件关联信息中携带事件关键词信息；将字符信息和训练文本输入事件信息提取模块，使得提取到的事件信息中既包括训练文本的语义与各类事件相关的信息，还包括各个字符与各类事件的事件主体之间的关联关系，还包括各个字符与各类事件的关键词之间的关联关系，通过事件分类损失的优化，使得事件分类模块能够基于这些信息作出准确的事件分类结果；由于相比于现有的无触发词的事件多分类方法，本实施例中添加了包含事件关键词信息和事件主体信息的字符信息来作为事件分类指导，避免了模型对事件理解不足或方向性错误而导致的事件识别错误问题，提高了事件分类准确率；并且，因为有字符信息作为指导，相比于单依据文本的语义理解信息做分类，分类依据更丰富，从而在样本量少的情况下，也能够有较好的分类准确率；且，相比于触发词本实施例中的关键词的标注要求低，从而使得标注更加简单，降低了标注数据的时间成本，提高了模型优化和部署的效率；又由于本实施例提供的仍然是一种分类模型，从语义理解层面上进行事件分类，从而不存在基于触发词的事件识别方法的诸多问题。即，本实施例提供了一种充分混合无触发词的事件多分类方法和基于触发词事件识别方法的混合方案，既没有两者的缺陷，又融合了两者的优势。

进一步地，在一实施方式中，所述步骤S201包括：

步骤S2011，获取所述训练文本所属事件类型对应的预设种子关键词和备选词；

在本实施例中，为提高关键词的标注效率，可获取训练文本所属事件类型对应的预设种子关键词和备选词。其中，预设种子关键词可以是人工从属于该事件类型的文本中选出的一些关键词，这些关键词可以是少量的，从而节省人工选取的时间。备选词则很广泛，可以将属于该事件类型的大量文本进行分词，分词得到的词均可作为备选词。也即，要基于种子关键词从备选关键词中自动扩展出该事件类型的关键词。

进一步地，预设种子关键词可以是从属于该事件类型的大量文本中提取的高频词，例如，将在大量文本中出现超过N次的词作为种子关键词，其中，N可以根据需要进行设置。

步骤S2012，采用预设词向量模型将所述预设种子关键词和所述备选词分别转换为词向量；

具体地，采用预设词向量模型将预设种子关键词和备选词分别转换为词向量(word embedding)，其中，预设词向量模型可以采用常用的能够将词汇转换为向量表示的模型，例如word2vec模型，该模型是一群用来产生词向量的相关模型。

步骤S2013，计算所述备选词的词向量与所述预设种子关键词的词向量之间的相似度，并选取相似度大于预设相似度的备选词添加至所述事件类型对应的关键词库；

分别计算备选词的词向量与各个预设种子关键词的词向量之间的相似度，若某个备选词的词向量与某个预设种子关键词的词向量之间的相似度大于预设相似度，则将该备选词添加至该事件类型对应的关键词库中，以备采用关键词库中的关键词对该事件类型的文本进行关键词标注。

步骤S2014，将所述训练文本与所述关键词库中各关键词进行匹配，以确定所述训练文本中的关键词，并采用所述训练文本中的关键词对所述训练文本进行序列化标注得到所述关键词标注。

对于该事件类型的训练文本，将该训练文本与该事件类型的关键词库中的各个关键词进行匹配，也即，匹配训练文本中是否存在关键词库中的关键词，若存在，则可确定匹配成功的关键词就是该训练文本的关键词。其中，匹配可以是采用正则匹配方式。采用该训练文本中的关键词对该训练文本进行序列化标注得到关键词标注。其中，序列化标注的目的是使得关键词标注的数据形式满足关键词识别模块的输入数据的形式，故，序列化标注的方式可根据关键词识别模块所采用的模型结构来选取，例如，可以采用BIO标注方法，该方法为常用的序列化标注方法。

在本实施例中，通过获取训练文本所属事件类型对应的预设种子关键词和备选词，采用预设词向量模型将预设种子关键词和备选词分别转换为词向量；计算备选词的词向量与预设种子关键词的词向量之间的相似度，并选取相似度大于预设相似度的备选词添加至事件类型对应的关键词库；将训练文本与关键词库中各关键词进行匹配，以确定训练文本中的关键词，并采用训练文本中的关键词对训练文本进行序列化标注得到关键词标注。使得关键词标注只需要对每类事件选取少量的种子关键词，即可根据种子关键词扩展出大量的关键词，并自动匹配训练文本中的关键词，从而提高了关键词标注的效率。

进一步地，基于上述第一、第二和/或第三实施例，提出本申请事件主体识别模型优化方法第四实施例，在本实施例中，所述方法还包括：

步骤A10，当检测到优化后的事件主体识别模型满足预设模型条件时，将优化后的事件主体识别模型作为目标事件主体识别模型；

当检测到优化后的事件主体识别模型满足预设模型条件时，将优化后的事件主体识别模型作为目标事件主体识别模型。其中，预设模型条件可以是预先设置的优化停止条件，例如，可以是总损失收敛，或达到一个预定的训练时长，或达到一个预定的优化次数，或事件主体识别模型的分类准确率达到一个预定的准确率等等。

若检测到优化后的事件主体识别模型不满足预设模型条件，则将优化后的事件主体识别模型作为下一轮优化的基础，也即再作为待优化的事件主体识别模型，按照上述实施例中的方式进行继续优化，直到检测到满足预设模型条件为止，就得到最终的目标事件主体识别模型。

步骤A20，将待识别文本输入所述目标事件主体识别模型的信息提取模块，提取得到所述待识别文本中的字符信息和所述待识别文本与各类事件相关的事件信息；

可采用目标事件主体识别模型对需要进行事件主体识别的文本进行事件识别。具体地，将该文本作为待识别文本，将待识别文本输入目标事件主体识别模型的信息提取模块，提取得到待识别文本中的字符信息以及待识别文本与各类事件相关的事件信息。提取过程与上述对训练文本进行字符信息和事件信息提取的过程是相同的。

步骤A30，将所述待识别文本的字符信息输入所述目标事件主体识别模型的主体识别模块进行识别，得到所述待识别文本的事件主体识别结果；

将待识别文本的字符信息输入目标事件主体识别模型中的主体识别模块进行分类，得到待识别文本的主体识别结果。主体识别结果可以是表示待识别文本中属于事件主体的字符或词。具体的识别过程与上述对训练文本进行主体识别的过程相同。

步骤A40，将所述待识别文本对应的事件信息输入所述目标事件主体识别模型中的事件分类模块，得到所述待识别文本的事件分类结果。

将待识别文本对应的事件信息输入目标事件主体识别模型中的事件分类模块进行分类，得到待识别文本的事件分类结果。具体的分类过程与上述对训练文本进行事件分类的过程相同。

进一步地，在得到目标事件主体识别模型后，若只需要进行事件识别，而无需进行事件主体识别，则可只执行步骤A20和A40，无需执行步骤A30。若只需要进行事件主体识别，而无需进行事件识别，则可只执行步骤A20和A30，无需执行步骤A40。相比于现有事件主体识别方法只能同时给出事件识别结果和事件主体识别结果，本实施例方案能够仅给出需要的结果，不会给出多余的结果，更加灵活，能够节省计算资源。

进一步地，可将事件分类结果和事件主体识别结果进行可视化输出，以供用户直观地了解待识别文本的事件类型和事件主体。或者，在具体应用场景中，可基于事件分类结果或事件主体识别结果进行下一步的操作，在此不作限制。

在本实施例中，由目标事件主体识别模型中的事件分类模块来做事件分类，从多类事件中识别一类或多类，由主体识别模块来进行主体识别，从多个词中识别一个或多个，两个模块单独进行识别，都是简单地从多个中选一个或两个，相比于现有模型需要从多个与多个的组合中选一个正确组合的方式，本实施例方案简化了分类问题，从而降低了模型出错的概率，进而提高了模型进行事件分类和事件主体识别的准确率。

需要说明的是，也可以是将待识别文本输入目标事件主体识别模型，以通过目标事件主体识别模型中的信息提取模块提取到字符信息和事件信息，通过目标事件主体识别模型中主体识别模块根据字符信息进行识别得到事件主体识别结果，通过目标事件主体识别模型中的事件分类模块根据事件信息进行识别得到事件分类结果。也即，将待识别文本一次输入目标事件主体识别模型，经过模型中各个模块的处理，得到待识别文本的事件分类结果和事件主体识别结果。

此外本申请实施例还提出一种事件主体识别模型优化装置，待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，参照图4，所述装置包括：

提取模块10，用于将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

识别模块20，用于将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

匹配模块30，用于将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

分类模块40，用于将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化模块50，用于优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。

进一步地，所述事件信息包括各类事件分别对应的事件信息，所述主体识别结果包括所述训练文本中预测事件主体对应的字符信息，

所述匹配模块30还用于：

将所述事件信息和所述字符信息输入所述事件与主体匹配模块，以调用所述事件与主体匹配模块基于所述事件信息和所述字符信息计算各类事件分别与所述预测事件主体之间的匹配概率，并将各所述匹配概率作为所述匹配结果。

进一步地，所述信息提取模块包括字符信息提取模块和事件信息提取模块，

所述提取模块10包括：

第一提取单元，用于将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息；

第二提取单元，用于将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息。

进一步地，所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息，

所述第一提取单元包括：

第一编码子单元，用于将所述训练文本输入所述第一语义理解编码器中进行编码，得到所述训练文本中各字符对应的字符编码信息；

第一运算子单元，用于对所述字符编码信息和所述第一事件编码信息进行关联运算，得到所述训练文本中各个字符与各类事件之间的字符事件关联信息，将所述字符事件关联信息作为所述字符信息。

进一步地，所述第一事件编码信息包括各类事件对应的编码信息，

所述装置还包括：

计算模块，用于基于所述第一事件编码信息计算各类事件两两之间编码信息的相似度，并将各相似度相加得到事件编码惩罚值；

所述优化模块50还用于：

优化所述事件编码惩罚值、所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。

进一步地，所述事件信息提取模块包括第二语义理解编码器和第二事件编码信息，

所述第二提取单元包括：

第二编码子单元，用于将所述训练文本输入所述第二语义理解编码器进行编码，得到所述训练文本对应的文本编码信息；

第二运算子单元，用于对所述文本编码信息和所述第二事件编码信息进行关联运算，得到所述训练文本与各类事件之间的文本事件关联信息；

组合子单元，用于将所述字符信息和所述文本事件关联信息进行组合，得到所述事件信息。

进一步地，所述主体识别模块为识别主体和关键词的模块，

所述识别模块20包括：

获取单元，用于获取所述训练文本对应的关键词标注；

识别单元，用于将所述字符信息、所述关键词标注和所述主体标注输入所述主体识别模块进行识别，得到主体和关键词识别损失，将所述主体和关键词识别损失作为所述主体识别损失。

进一步地，所述装置还包括：

确定模块，用于当检测到优化后的事件主体识别模型满足预设模型条件时，将优化后的事件主体识别模型作为目标事件主体识别模型；

所述提取模块10还用于将待识别文本输入所述目标事件主体识别模型的信息提取模块，提取得到所述待识别文本中的字符信息和所述待识别文本与各类事件相关的事件信息；

所述识别模块20还用于将所述待识别文本的字符信息输入所述目标事件主体识别模型的主体识别模块进行识别，得到所述待识别文本的事件主体识别结果；

所述分类模块40还用于将所述待识别文本对应的事件信息输入所述目标事件主体识别模型中的事件分类模块，得到所述待识别文本的事件分类结果。

本申请事件主体识别模型优化装置的具体实施方式的拓展内容与上述事件主体识别模型优化方法各实施例基本相同，在此不做赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述存储介质上存储有事件主体识别模型优化程序，所述事件主体识别模型优化程序被处理器执行时实现如下所述的事件主体识别模型优化方法的步骤。

本申请事件主体识别模型优化设备和计算机可读存储介质的各实施例，均可参照本申请事件主体识别模型优化方法各实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种事件主体识别模型优化方法，其中，待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述方法包括以下步骤：

将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。
如权利要求1所述的事件主体识别模型优化方法，其中，所述事件信息包括各类事件分别对应的事件信息，所述主体识别结果包括所述训练文本中预测事件主体对应的字符信息，

所述将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果的步骤包括：

将所述事件信息和所述字符信息输入所述事件与主体匹配模块，以调用所述事件与主体匹配模块基于所述事件信息和所述字符信息计算各类事件分别与所述预测事件主体之间的匹配概率，并将各所述匹配概率作为所述匹配结果。
如权利要求1所述的事件主体识别模型优化方法，其中，所述信息提取模块包括字符信息提取模块和事件信息提取模块，

所述将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息的步骤包括：

将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息；

将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息。
如权利要求3所述的事件主体识别模型优化方法，其中，所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息，

所述将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息的步骤包括：

将所述训练文本输入所述第一语义理解编码器中进行编码，得到所述训练文本中各字符对应的字符编码信息；

对所述字符编码信息和所述第一事件编码信息进行关联运算，得到所述训练文本中各个字符与各类事件之间的字符事件关联信息，将所述字符事件关联信息作为所述字符信息。
如权利要求4所述的事件主体识别模型优化方法，其中，所述第一事件编码信息包括各类事件对应的编码信息，

所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤之前，还包括：

基于所述第一事件编码信息计算各类事件两两之间编码信息的相似度，并将各相似度相加得到事件编码惩罚值；

所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤包括：

优化所述事件编码惩罚值、所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。
如权利要求3所述的事件主体识别模型优化方法，其中，所述事件信息提取模块包括第二语义理解编码器和第二事件编码信息，

所述将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息的步骤包括：

将所述训练文本输入所述第二语义理解编码器进行编码，得到所述训练文本对应的文本编码信息；

对所述文本编码信息和所述第二事件编码信息进行关联运算，得到所述训练文本与各类事件之间的文本事件关联信息；

将所述字符信息和所述文本事件关联信息进行组合，得到所述事件信息。
如权利要求3所述的事件主体识别模型优化方法，其中，所述主体识别模块为识别主体和关键词的模块，

所述将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失的步骤包括：

获取所述训练文本对应的关键词标注；

将所述字符信息、所述关键词标注和所述主体标注输入所述主体识别模块进行识别，得到主体和关键词识别损失，将所述主体和关键词识别损失作为所述主体识别损失。
如权利要求1至7任一项所述的事件主体识别模型优化方法，其中，所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤之后，还包括：

当检测到优化后的事件主体识别模型满足预设模型条件时，将优化后的事件主体识别模型作为目标事件主体识别模型；

将待识别文本输入所述目标事件主体识别模型的信息提取模块，提取得到所述待识别文本中的字符信息和所述待识别文本与各类事件相关的事件信息；

将所述待识别文本的字符信息输入所述目标事件主体识别模型的主体识别模块进行识别，得到所述待识别文本的事件主体识别结果；

将所述待识别文本对应的事件信息输入所述目标事件主体识别模型中的事件分类模块，得到所述待识别文本的事件分类结果。
一种事件主体识别模型优化装置，其中，待优化的事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述装置包括：

提取模块，用于将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

识别模块，用于将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

匹配模块，用于将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

分类模块，用于将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化模块，用于优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。
一种事件主体识别模型优化设备，其中，所述事件主体识别模型优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的事件主体识别模型优化程序，事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述事件主体识别模型优化程序被所述处理器执行时实现如下步骤：

将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。
如权利要求10所述的事件主体识别模型优化设备，其中，所述事件信息包括各类事件分别对应的事件信息，所述主体识别结果包括所述训练文本中预测事件主体对应的字符信息，

所述将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果的步骤包括：

将所述事件信息和所述字符信息输入所述事件与主体匹配模块，以调用所述事件与主体匹配模块基于所述事件信息和所述字符信息计算各类事件分别与所述预测事件主体之间的匹配概率，并将各所述匹配概率作为所述匹配结果。
如权利要求10所述的事件主体识别模型优化设备，其中，所述信息提取模块包括字符信息提取模块和事件信息提取模块，

所述将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息的步骤包括：

将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息；

将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息。
如权利要求12所述的事件主体识别模型优化设备，其中，所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息，

所述将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息的步骤包括：

将所述训练文本输入所述第一语义理解编码器中进行编码，得到所述训练文本中各字符对应的字符编码信息；

对所述字符编码信息和所述第一事件编码信息进行关联运算，得到所述训练文本中各个字符与各类事件之间的字符事件关联信息，将所述字符事件关联信息作为所述字符信息。
如权利要求13所述的事件主体识别模型优化设备，其中，所述第一事件编码信息包括各类事件对应的编码信息，

所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤之前，还包括：

基于所述第一事件编码信息计算各类事件两两之间编码信息的相似度，并将各相似度相加得到事件编码惩罚值；

所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤包括：

优化所述事件编码惩罚值、所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。
如权利要求12所述的事件主体识别模型优化设备，其中，所述事件信息提取模块包括第二语义理解编码器和第二事件编码信息，

所述将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息的步骤包括：

将所述训练文本输入所述第二语义理解编码器进行编码，得到所述训练文本对应的文本编码信息；

对所述文本编码信息和所述第二事件编码信息进行关联运算，得到所述训练文本与各类事件之间的文本事件关联信息；

将所述字符信息和所述文本事件关联信息进行组合，得到所述事件信息。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有事件主体识别模型优化程序，事件主体识别模型包括信息提取模块、主体识别模块、事件与主体匹配模块和事件分类模块，所述事件主体识别模型优化程序被处理器执行时实现如下步骤：

将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息；

将所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别，得到主体识别结果和主体识别损失；

将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果，并基于所述匹配结果和所述训练文本对应的事件主体匹配标注计算匹配损失；

将所述事件信息输入所述事件分类模块进行分类得到事件分类结果，并基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失；

优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。
如权利要求16所述的计算机可读存储介质，其中，所述事件信息包括各类事件分别对应的事件信息，所述主体识别结果包括所述训练文本中预测事件主体对应的字符信息，

所述将所述事件信息和所述主体识别结果输入所述事件与主体匹配模块进行匹配得到匹配结果的步骤包括：

将所述事件信息和所述字符信息输入所述事件与主体匹配模块，以调用所述事件与主体匹配模块基于所述事件信息和所述字符信息计算各类事件分别与所述预测事件主体之间的匹配概率，并将各所述匹配概率作为所述匹配结果。
如权利要求16所述的计算机可读存储介质，其中，所述信息提取模块包括字符信息提取模块和事件信息提取模块，

所述将各类事件对应的训练文本输入所述信息提取模块，提取得到所述训练文本中的字符信息和所述训练文本与各类事件相关的事件信息的步骤包括：

将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息；

将所述训练文本和所述字符信息输入所述事件信息提取模块，提取得到所述训练文本与各类事件相关的事件信息。
如权利要求18所述的计算机可读存储介质，其中，所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息，

所述将所述训练文本输入所述字符信息提取模块，提取得到所述训练文本中的字符信息的步骤包括：

将所述训练文本输入所述第一语义理解编码器中进行编码，得到所述训练文本中各字符对应的字符编码信息；

对所述字符编码信息和所述第一事件编码信息进行关联运算，得到所述训练文本中各个字符与各类事件之间的字符事件关联信息，将所述字符事件关联信息作为所述字符信息。
如权利要求19所述的计算机可读存储介质，其中，所述第一事件编码信息包括各类事件对应的编码信息，

所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤之前，还包括：

基于所述第一事件编码信息计算各类事件两两之间编码信息的相似度，并将各相似度相加得到事件编码惩罚值；

所述优化所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型的步骤包括：

优化所述事件编码惩罚值、所述主体识别损失、所述匹配损失和所述分类损失以优化所述事件主体识别模型。