CN112464670A

CN112464670A - 识别方法、识别模型的训练方法、装置、设备、存储介质

Info

Publication number: CN112464670A
Application number: CN202110145073.XA
Authority: CN
Inventors: 王斐成; 林金曙; 陈华华; 卢长松; 吕杨苗; 徐平平
Original assignee: Hundsun Technologies Inc
Current assignee: Hundsun Technologies Inc
Priority date: 2021-02-03
Filing date: 2021-02-03
Publication date: 2021-03-09

Abstract

本申请提供一种识别方法、识别模型的训练方法、装置、设备、存储介质，涉及事件主体识别技术领域。该方法包括：获取待识别事件文本和待识别事件文本的事件类别；将待识别事件文本以及待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果,识别结果用于标识待识别事件文本中的至少一个事件主体；其中，事件主体识别模型中包括全连接层和实体识别层，全连接层用于识别至少一个主体，实体识别层用于识别各主体是否为实体；根据预设字典对识别结果进行筛选，得到至少一个目标事件主体。相对于现有技术，避免了由于监督信号过于单一，从而造成抽取结果不准确的问题。

Description

识别方法、识别模型的训练方法、装置、设备、存储介质

技术领域

本申请涉及事件主体识别技术领域，具体而言，涉及一种识别方法、识别模型的训练方法、装置、设备、存储介质。

背景技术

互联网时代海量的资讯信息让用户无法高效地获得与目标事件相关的资讯信息，因此需要通过对海量的资讯信息进行整理抽取，将与目标事件相关的资讯信息以事件主体的形式提供给用户。其中，事件主体是指与目标事件相关的命名名称列表，命名名称包括人名、地名、组织机构名、事件名等，且该命名名称列表中的命名名称按照相对目标事件的重要程度降序排列。在对资讯信息进行整理抽取时,可以预先训练得到事件抽取模型,利用事件抽取海量资讯信息中的事件主体。

现有技术中，事件抽取模型大部分是针对通用的事件类型设计的,如针对通用的新闻资讯设计的事件主体抽取方法等；一般仅采用主体信息的开始位置和结束位置这一个特征作为监督信号进行事件抽取。

但是这样的事件抽取方式，由于监督信号过于单一，从而造成抽取结果不准确的问题。

发明内容

本申请的目的在于，针对上述现有技术中的不足，提供一种识别方法、识别模型的训练方法、装置、设备、存储介质，以解决现有技术中监督信号过于单一，从而造成抽取结果不准确的问题。

为实现上述目的，本申请实施例采用的技术方案如下：

第一方面，本申请一实施例提供了一种事件主体识别方法，所述方法包括：

获取待识别事件文本和所述待识别事件文本的事件类别；

将所述待识别事件文本以及所述待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果,所述识别结果用于标识所述待识别事件文本中的至少一个事件主体；其中，所述事件主体识别模型中包括全连接层和实体识别层，所述全连接层用于识别至少一个主体，所述实体识别层用于识别各所述主体是否为实体；

根据预设字典对所述识别结果进行筛选，得到至少一个目标事件主体。

可选地，所述识别结果中包括：至少一个事件主体和各所述事件主体的概率值；

所述根据预设字典对识别结果进行筛选，得到至少一个目标事件主体，包括：

根据各所述事件主体的概率值对各所述事件主体进行排序；

将所述概率值排名在第一预设个数内的所述事件主体作为待筛选事件主体；

根据所述预设字典对所述待筛选事件主体进行筛选，将通过筛选的所述待筛选事件主体作为所述目标事件主体。

可选地，所述根据各所述事件主体的概率值对各所述事件主体进行排序之前，所述方法还包括：

根据所述事件主体识别模型中的所述全连接层确定事件主体的起始位置和结束位置；

根据所述起始位置和所述结束位置，确定各所述事件主体。

可选地，所述根据所述起始位置和所述结束位置，确定各所述事件主体，包括：

确定所述起始位置对应的概率值排名在第二预设个数内的所述起始位置为目标起始位置；

确定所述结束位置对应的概率值排名在第二预设个数内的所述结束位置为目标结束位置；

根据预设组合方法对所述目标起始位置和所述目标结束位置进行组合，得到至少一个位置组；其中，每个所述位置组中均包括一个所述目标起始位置和所述目标结束位置；

确定各所述位置组中的所述目标起始位置和所述目标结束位置之间的内容为各所述事件主体。

可选地，所述将所述待识别事件文本以及所述待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果，包括：

将所述待识别事件文本以及所述待识别事件文本的事件类别输入所述事件主体识别模型，由所述事件主体识别模型根据预设语句信息表征算法，分别提取所述事件类别对应的事件类别的语义表征，和所述待识别事件文本对应的待识别事件文本语义表征，并根据所述事件类别的语义表征，和所述待识别事件文本语义表征，对所述待识别事件文本中的至少一个事件主体进行识别，得到所述识别结果。

第二方面，本申请另一实施例提供了一种事件主体识别模型的训练方法，所述方法包括：

获取训练样本文本和所述训练样本的事件类别；其中，所述训练样本文本中标注有事件主体的位置；

将所述训练样本文本和所述训练样本的事件类别输入初始识别模型中，所述初始识别模型中包括：全连接层和实体识别层；

根据所述初始识别模型的全连接层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第一损失函数；

根据所述初始识别模型的实体识别层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第二损失函数；

根据所述第一损失函数和所述第二损失函数确定目标损失函数；

根据所述目标损失函数，对所述初始识别模型进行修正，并在修正后的初始识别模型满足预设条件时，将修正后的初始识别模型作为事件主体识别模型。

可选地，所述根据所述初始识别模型的全连接层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第一损失函数之前，所述方法还包括：

使用预先训练获取的语义识别模型分别识别并获取所述训练样本文本对应的样本文字语义表征，和所述事件类别对应的语义表征；

对应的，所述根据所述初始识别模型的全连接层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第一损失函数，包括：

根据所述初始识别模型的全连接层的输出结果、所述训练样本文本的标注信息、所述样本文字语义表征，和所述事件类别对应的语义表征确定各所述事件主体对应的第一损失函数；

根据所述初始识别模型的实体识别层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第二损失函数，包括：

根据所述初始识别模型的实体识别层的输出结果、所述训练样本文本的标注信息、所述样本文字语义表征，和所述事件类别对应的语义表征确定各所述事件主体对应的第二损失函数。

可选地，所述事件主体位置包括：事件主体起始位置和事件主体结束位置；

所述根据所述初始识别模型的全连接层的输出结果以及所述训练样本文本的标注信息，包括：

所述全连接层根据所述训练样本，确定至少一个所述事件主体起始位置和所述事件主体结束位置；

根据所述事件主体起始位置与具有标注的事件主体起始位置，所述事件主体结束位置和具有标注的事件主体结束位置，确定第一损失函数。

可选地，所述在修正后的初始识别模型满足预设条件时，将修正后的初始识别模型作为事件主体识别模型，包括：

若预设次数内所述目标损失函数均没有下降，则确定修正后的初始识别模型为训练得到的目标事件主体识别模型。

第三方面，本申请一实施例提供了一种事件主体的识别装置，所述装置包括：获取模块、确定模块和筛选模块，其中：

所述获取模块，用于获取待识别事件文本和所述待识别事件文本的事件类别；

所述确定模块，用于将所述待识别事件文本以及所述待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果,所述识别结果用于标识所述待识别事件文本中的至少一个事件主体；其中，所述事件主体识别模型中包括全连接层和实体识别层，所述全连接层用于识别至少一个主体，所述实体识别层用于识别各所述主体是否为实体；

所述筛选模块，用于根据预设字典对所述识别结果进行筛选，得到至少一个目标事件主体。

可选地，所述识别结果中包括：至少一个事件主体和各所述事件主体的概率值；该装置还包括：排序模块，用于根据各所述事件主体的概率值对各所述事件主体进行排序；

所述确定模块，具体用于将所述概率值排名在第一预设个数内的所述事件主体作为待筛选事件主体；

所述筛选模块，具体用于根据所述预设字典对所述待筛选事件主体进行筛选，将通过筛选的所述待筛选事件主体作为所述目标事件主体。

可选地，所述确定模块，具体用于根据所述事件主体识别模型中的所述全连接层确定事件主体的起始位置和结束位置；根据所述起始位置和所述结束位置，确定各所述事件主体。

可选地，该装置还包括：组合模块，其中：

所述确定模块，具体用于确定所述起始位置对应的概率值排名在第二预设个数内的所述起始位置为目标起始位置；确定所述结束位置对应的概率值排名在第二预设个数内的所述结束位置为目标结束位置；

所述组合模块，用于根据预设组合方法对所述目标起始位置和所述目标结束位置进行组合，得到至少一个位置组；其中，每个所述位置组中均包括一个所述目标起始位置和所述目标结束位置；

所述确定模块，具体用于确定各所述位置组中的所述目标起始位置和所述目标结束位置之间的内容为各所述事件主体。

可选地，所述确定模块，具体用于将所述待识别事件文本以及所述待识别事件文本的事件类别输入所述事件主体识别模型，由所述事件主体识别模型根据预设语句信息表征算法，分别提取所述事件类别对应的事件类别的语义表征，和所述待识别事件文本对应的待识别事件文本语义表征，并根据所述事件类别的语义表征，和所述待识别事件文本语义表征，对所述待识别事件文本中的至少一个事件主体进行识别，得到所述识别结果。

第四方面，本申请一实施例提供了一种事件主体识别模型的训练装置，所述装置包括：获取模块、输入模块、确定模块和修正模块，其中：

所述获取模块，用于获取训练样本文本和所述训练样本的事件类别；其中，所述训练样本文本中标注有事件主体的位置；

所述输入模块，用于将所述训练样本文本和所述训练样本的事件类别输入初始识别模型中，所述初始识别模型中包括：全连接层和实体识别层；

所述确定模块，用于根据所述初始识别模型的全连接层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第一损失函数；根据所述初始识别模型的实体识别层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第二损失函数；根据所述第一损失函数和所述第二损失函数确定目标损失函数；

所述修正模块，用于根据所述目标损失函数，对所述初始识别模型进行修正，并在修正后的初始识别模型满足预设条件时，将修正后的初始识别模型作为事件主体识别模型。

可选地，所述获取模块，具体用于使用预先训练获取的语义识别模型分别识别并获取所述训练样本文本对应的样本文字语义表征，和所述事件类别对应的语义表征；

所述确定模块，具体用于根据所述初始识别模型的全连接层的输出结果、所述训练样本文本的标注信息、所述样本文字语义表征，和所述事件类别对应的语义表征确定各所述事件主体对应的第一损失函数；根据所述初始识别模型的实体识别层的输出结果、所述训练样本文本的标注信息、所述样本文字语义表征，和所述事件类别对应的语义表征确定各所述事件主体对应的第二损失函数。

可选地，所述确定模块，具体用于所述全连接层根据所述训练样本，确定至少一个所述事件主体起始位置和所述事件主体结束位置；根据所述事件主体起始位置与具有标注的事件主体起始位置，所述事件主体结束位置和具有标注的事件主体结束位置，确定第一损失函数。

可选地，所述确定模块具体用于若预设次数内所述目标损失函数均没有下降，则确定修正后的初始识别模型为训练得到的目标事件主体识别模型。

第五方面，本申请另一实施例提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如上述第一方面或第二方面任一所述方法的步骤。

第六方面，本申请另一实施例提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如上述第一方面或第二方面任一所述方法的步骤。

本申请的有益效果是：本申请提供的事件主体的识别方法由于预先训练获得的事件主体识别模型中包括全连接层和实体识别层，可以将获取的待识别事件文本和待识别事件文本的事件类别输入事件主体识别模型中，得到识别结果，随后根据预设字典对识别结果进行筛选，得到至少一个目标事件主体，由于全连接层可以视为一个监督信号，用于监督并识别待识别事件中的至少一个主体，实体识别层可以视为另一个监督信号，用于监督各主体是否为实体，因此采用本申请提供的事件主体的识别方法，可以解决现有技术中由于监督信号过于单一，从而造成抽取结果不准确的问题，达到提高抽取得到的主体的准确性的作用。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请一实施例提供的事件主体的识别场景的场景示意图；

图2为本申请一实施例提供的事件主体的识别方法的流程示意图；

图3为本申请另一实施例提供的事件主体的识别方法的流程示意图；

图4为本申请一实施例提供的一种事件主体识别模型的训练方法的流程示意图；

图5为本申请一实施例提供的目标事件主体识别模型的结构示意图；

图6为本申请另一实施例提供的一种事件主体识别模型的训练方法的流程示意图；

图7为本申请一实施例提供的事件主体的识别装置的结构示意图；

图8为本申请另一实施例提供的事件主体的识别装置的结构示意图；

图9为本申请一实施例提供的事件主体识别模型的训练装置的结构示意图；

图10为本申请一实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。

通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

另外，本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

为使得本申请的方案更容易被理解，下述对本申请涉及的一些名词进行解释说明：

事件：发生过的历史事件、现实事件或资讯信息，例如可以包括：金融事件、法律事件、社会事件、历史事件、自然事件等。

事件主体：是指与目标事件相关的命名名称列表，命名名称包括人名、地名、组织机构名等，且该命名名称列表中的命名名称按照相对目标事件的重要程度降序排列。可以通过事件主体获取相关的咨询信息，用于识别风险、辅助决策以及确定事件的发展趋势等，从而实现通过事件主体反向索引相关的资讯信息。

命名实体识别(Name Entity Recognition，NER)模型：是信息提取的一个子任务，旨在将文本中的命名实体定位并分类为预先定义的类别，如人员、组织、位置、时间表达式、数量、货币值、百分比等。

自适应矩估计(Adaptive moment estimation，adam)算法：一种基于一阶梯度的自适应优化算法。

全连接层（Fully Connected Layer）：全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。全连接层可以整合前面神经网络层中具有类别区分性的局部信息，如果在全连接层后连接一个softmax层（softmax layer）进行输出，可以得到多个分类的概率分布，从而实现分类。

实体识别层：使用某种方法从一段文本中识别出人名、地名、组织名、日期等，本申请中的实体识别层就是为了识别出金融实体名称。

在本申请提出申请之前，现有技术通常仅采用主体信息的开始位置和结束位置这一个特征作为监督信号进行事件抽取，但是这种方法监督信号过于单一，所以会造成抽取结果不准确的问题。

本申请提供的事件主体的识别方法由于预先训练获得的事件主体识别模型中包括全连接层和实体识别层，可以将获取的待识别事件文本和待识别事件文本的事件类别输入事件主体识别模型中，得到识别结果，随后根据预设字典对识别结果进行筛选，得到至少一个目标事件主体，由于全连接层输出的主体的起始位置可以视为一个监督信号，用于监督并识别待识别事件中的至少一个主体，实体识别层输出的实体类型标签可以视为另一个监督信号，用于判断各主体是否为实体，因此采用本申请提供的事件主体的识别方法，可以解决现有技术中由于监督信号过于单一，从而造成抽取结果不准确的问题，达到提高抽取得到的主体的准确性的作用。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景金融事件主体的识别方法，给出以下实施方式。对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕金融事件主体的识别进行描述，但是应该理解，这仅是一个示例性实施例，本申请可以应用于各种需要进行事件主体识别的场景中，例如：法律事件的主体识别、社会事件的主体识别或历史事件的主体识别等任意需要对事件主体进行识别的场景中，并不以本申请上述实施例给出的为限。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

图1为本申请一实施例提供的事件主体的识别场景的场景示意图，如图1所示，可以应用于使用预先训练获得的事件主体识别模型进行事件主体识别的场景中。

预先训练获得的事件主体识别模型例如可以为安装在用户终端设备上的，或安装在服务器中的，用户例如可以通过打开预设事件主体识别网页、或预设事件主体识别应用程序，并在确认待识别事件文本成功输入后，通过预设事件主体识别网页或预设主体识别应用程序调用事件主体识别模型对事件主体进行识别。

下述实施例以事件主体识别模型为安装在用户终端设备上，且事件主体识别模型为通过预设事件主体识别应用程序调用的为例进行说明，其中，用户可以通过预设事件主体应用程序的输入界面输入，待识别事件文本和事件类别，并通过点击确定按键、或通过预设确认快捷键，或通过预设确认快捷手势，确认待识别事件文本和事件类别成功输入后，调用事件主体识别模型根据事件类别对待识别事件文本进行识别，得到待识别事件文本在该事件类别下对应的事件主体。

示例地，在一些可能的实施例中，事件类别的输入方式例如可以为用户在多个预设事件类别中，通过点击或触摸操作确定的目标事件类别；或用户直接以文字或语音形式输入的事件类别；或预设分类模型通过对待识别事件文本的分析和预测，确定的待识别事件文本对应的事件类别；待识别事件文本的输入方式例如可以为：通过网络爬取输入的事件文本、文字形式输入的事件文本、图片形式输入的事件文本或文档形式输入的事件文本，只需待识别事件文本为包括事件文字信息的事件文本即可，举例说明：例如可以通过复制网页链接的形式，在待识别事件文本输入框内输入复制的网页链接；或用户直接在事件文本输入框输入事件文本的完整文字；或用户通过上传图像，或将图像拖拽至事件文本输入框的方式，在事件文本输入框输入图像；或用户通过上传文档，或拖拽文档至事件文本输入框的方式，在事件文本输入框输入文档，具体事件类别的确定方式和待识别事件文本的类型可以根据用户需要灵活调整，并不以上述实施例给出的为限。

举例说明，待识别事件文本例如可以包括：标题文本和内容文本，例如标题文本可以为“刚被立案调查又曝债务违约，这家市值近200亿的公司陷入工资难发困境”，内容文本例如可以为“夏天来了，但债市的信用寒潮却连环来袭！继某环保公司、某消防公司、某能源公司等接连曝出债务违约风险后，刚被证监会立案调查的张三生态，也曝出债务违约，一个市值近200亿的公司，竟陷入员工工资难发的困境。6大核心问题将公司的资金链危机曝晒在烈日下。多重风险综合作用，公司的舆论导向又如何呢；记者在各大投资者交流平台中注意到，不解、疑惑、愤怒是主基调，很多投资者对于公司的“突然掉线”纷纷表示不满，还有投资者帮忙反思：张三生态到底怎么了。”，事件类别为“债务危机”，此时经过事件主体识别模型识别，得到该待识别事件文本在该事件类别下的事件主体为“张三生态”。

如下结合多个具体的应用示例，对本申请实施例所提供的一种事件主体的识别方法进行解释说明。图2为本申请一实施例提供的一种事件主体的识别方法的流程示意图，如图2所示，该方法包括：

S101：获取待识别事件文本和待识别事件文本的事件类别。

可选地，在本申请的一个实施例中，待识别事件文本可以包括标题文本和内容文本，事件类别例如可以为预设分类模型通过对待识别事件文本的分析和预测确定的。

S102：将待识别事件文本以及待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果。

其中，待识别标题文本、待识别内容文本和事件类别作为输入数据，输入至事件主体识别模型中，事件主体识别模型通过对输入数据的分析和处理，输出识别结果；识别结果用于标识待识别事件文本中的至少一个事件主体；其中，事件主体识别模型中包括全连接层和实体识别层，全连接层输出主体的起始位置作为一个监督信号，在待识别标题文本和待识别内容文本中识别得到至少一个主体，实体识别层作输出的实体标签作为另一个监督信号，用于识别各主体是否为实体entity，两个监督信号的设置可以大大提高识别结果的准确性。

S103：根据预设字典对识别结果进行筛选，得到至少一个目标事件主体。

示例地，识别结果中包括至少一个事件主体，在一些可能的实施例中，预设字典例如可以为一个主体规范化的字典，字典中包括多个事件主体名称，可以通过预设字典对识别结果中的各事件主体的名称进行过滤，将识别结果中的各事件主体与字典中包括的多个事件主体名称进行比较，确定名称经过比较后结果为一致的事件主体为目标事件主体。

可选地，预设字典例如可以为通过哈希Hash值对各事件主体信息进行存储的字典，例如可以在第一字典中通过事件主体名称确定该事件主体名称对应的目标哈希值，随后根据目标哈希值在第二字典中获取该事件主体名称对应的事件主体信息；也可以为直接对事件主体信息进行存储的字典，具体预设字典的形式可以根据用户需要灵活调整，只需字典中包括完整的事件主体信息即可。

举例说明，例如以金融事件的应用场景为例进行说明，则通过哈希值对各事件主体信息进行存储的方式例如可以为表1所示：

表1

其中，如表1所示，字典1的名称为security_name2hash_dict.json，字典2的名称为hash2security_info_dict.json，字典1中包括的数据信息的数量为1234653，字典2中包括的数据信息的数量为372946，字典1的说明用于表示字典1可以根据各事件主体的名称，确定该事件主体的名称对应的事件主体的哈希值，字典2的说明用于表示字典2可以根据各事件主体的哈希值，确定该哈希值对应的事件主体信息，从而根据字典1和字典2，可以实现根据事件主体的名称确定事件主体信息，备注为各字段分别对应的备注信息，用于指示各字典中分别包括的字段。在表1给出的字典中，若用户需要获取事件主体信息，则需要先通过字典1对识别结果中的各事件主体的名称进行过滤，将识别结果中的各事件主体的名称与字典1中包括的多个事件主体名称进行比较，确定名称经过比较后结果为一致的事件主体为目标事件主体，随后根据字典2确定各目标事件主体信息，并将确定得到的目标事件主体信息返回给查询用户。

其中，第一字典中包括的内容形式例如为下述内容：

“{

"King ": "7317578760262514147",

"第一金融实业有限公司": "7317578760262514147",

"First financial industry Limited.": "7317578760262514147",

"第金": "7317578760262514147",

"第一实业": "7317578760262514147",

"第一控股有限公司": "6077529080459691924",

"First Holdings Limited ": "6077529080459691924",

"第一控股": "6077529080459691924",

"First holding ": "6077529080459691924",

"Second gas ": "3166771026494408418",

"第二煤气": "3166771026494408418",

"第二煤气有限公司": "3166771026494408418",

"Second gas Company Limited ": "3166771026494408418",

……”

第二字典中包括的内容形式例如为下述内容：

{

"7317578760262514147": {

"SecuCode": [

" First ",

"00001"

],

"ChiName": [

"第一金融实业有限公司"

],

"EngName": [

" First financial industry Limited."

],

"EngNameAbbr": [

" First holdings",

" First financial industry Limited."

],

"SecuAbbr": [

"King ",

"第金"

],

"FormerName": [

"第一实业"

],

"CompanyCode": [

"7012326",

"1000001"

]

},

"6077529080459691924": {

"SecuCode": [

"00002",

" Firstphy"

],

具体第一字典和第二字典中包括的内容和展示形式可以根据用户需要灵活调整，上述实施例仅为示例性说明，本申请在此不做任何限制。

可选地，在本申请的一个实施例中，字典可以为根据金融实体数据库建立的，可能存在部分事件主体的某些表达方式查询不到的情况，字典可以根据使用过程中的实际情况进行不断更新。

本申请提供的事件主体的识别方法由于预先训练获得的事件主体识别模型中包括全连接层和实体识别层，可以将获取的待识别事件文本和待识别事件文本的事件类别输入事件主体识别模型中，得到识别结果，随后根据预设字典对识别结果进行筛选，得到至少一个目标事件主体，由于全连接层输出的主体起始位置可以视为一个监督信号，用于监督并识别待识别事件中的至少一个主体，实体识别层输出的实体标签可以视为另一个监督信号，用于监督各主体是否为实体，因此采用本申请提供的事件主体的识别方法，可以解决现有技术中由于监督信号过于单一，从而造成抽取结果不准确的问题，达到提高抽取得到的主体的准确性的作用。

可选地，在上述实施例的基础上，本申请实施例还可提供一种事件主体的识别方法，如下结合附图对上述方法中得到目标事件主体的实现过程进行示例说明。图3为本申请另一实施例提供的一种事件主体的识别方法的流程示意图，识别结果中包括：至少一个事件主体和各事件主体的概率值；如图3所示，S103可包括：

S104：根据各事件主体的概率值对各事件主体进行排序。

示例地，在本申请的一个实施例中，在对各事件主体进行排序之前，还需要根据事件主体识别模型中的全连接层确定事件主体的起始位置和结束位置；根据起始位置和结束位置(START/END Span)，确定各事件主体。

其中，事件主体的起始位置可以为一个事件主体的名称的第一个字在整个待识别事件文本中的位置信息，位置信息的表示方式例如可以在待识别事件文本中确定第i行的第j个字为一个事件主体的起始位置，或在待识别事件文本中确定第l个字为一个事件主体的结束位置，或是在待识别事件文本中确定第m段第n行的第q个字为一个事件主体的起始位置，其中，上述i、j、l、m、n、q分别为大于等于0的整数。事件主体的结束位置为事件主体的名称的最后一个字在整个待识别事件文本中的位置信息，确定事件主体的结束位置的方法与确定事件主体的起始位置的方法相同，本申请在此不再赘述，应当理解上述位置信息的表示方式仅为示例性说明，具体位置信息的表示方式可以根据用户需要灵活调整，并不以上述实施例给出的为限。

S105：将概率值排名在第一预设个数内的事件主体作为待筛选事件主体。

可选地，在一些可能的实施例中，还可以根据预设概率阈值对事件主体进行筛选，筛选事件主体的概率值大于预设概率阈值的事件主体为待筛选事件主体，具体筛选事件主体的方法可以根据用户需要灵活调整，并不以上述实施例给出的为限。

示例地，在一些可能的实施例中，可以确定起始位置对应的概率值排名在第二预设个数内的起始位置为目标起始位置；确定结束位置对应的概率值排名在第二预设个数内的结束位置为目标结束位置；根据预设组合方法对目标起始位置和目标结束位置进行组合，得到至少一个位置组；其中，每个位置组中均包括一个目标起始位置和目标结束位置；确定各位置组中的目标起始位置和目标结束位置之间的内容为各事件主体。其中，目标起始位置和目标结束位置之间的内容可以为目标起始位置和目标结束位置之间的字构成的内容，例如事件文本中包括“发生了一件金融事件”，并且确定“金”为目标起始位置，“件”为目标结束位置，则此时目标起始位置和目标结束位置之间的内容为“金融事件”。

举例说明，例如待识别事件文本中包括“金融事件”和“债务违约”其中“金”为目标起始位置的概率为0.9，“金”为目标结束位置的概率为0.4；“融”为目标起始位置的概率为0.4，“融”为目标结束位置的概率为0.85；“事”为目标起始位置的概率为0.8，“事”为目标结束位置的概率为0.49；“件”为目标起始位置的概率为0.32，“件”为目标结束位置的概率为0.9；“债”为目标起始位置的概率为0.79，“债”为目标结束位置的概率为0.36；“务”为目标起始位置的概率为0.43，“务”为目标结束位置的概率为0.78；“违”为目标起始位置的概率为0.76，“违”为目标结束位置的概率为0.29；“约”为目标起始位置的概率为0.3，“约”为目标结束位置的概率为0.84。

此时筛选目标结束位置的概率排名前3的“件”“融”“约”，筛选目标起始位置的概率排名前3的“金”“事”“债”，并将筛选得到的目标开始位置和目标结束位置进行两两组合，从而可以得到9个事件主体，分别为：“金融”、“金件”、“金约”、“事件”、“事融”、“事约”、“债约”、“债件”和“债融”。

S106：根据预设字典对待筛选事件主体进行筛选，将通过筛选的待筛选事件主体作为目标事件主体。

示例地，在本申请的一个实施例中，得到识别结果的方式例如可以为：将待识别事件文本以及待识别事件文本的事件类别输入事件主体识别模型，由事件主体识别模型根据预设语句信息表征算法，分别提取事件类别对应的事件类别的语义表征，和待识别事件文本对应的待识别事件文本语义表征，并根据事件类别的语义表征，和待识别事件文本语义表征，对待识别事件文本中的至少一个事件主体进行识别，得到识别结果。

采用本申请提供的事件主体的识别方法，由于预先训练获得的事件主体识别模型中包括全连接层和实体识别层，可以将获取的待识别事件文本和待识别事件文本的事件类别输入事件主体识别模型中，得到识别结果，随后根据预设字典对识别结果进行筛选，得到至少一个目标事件主体，由于全连接层输出的主体起始位置可以视为一个监督信号，用于监督并识别待识别事件中的至少一个主体，实体识别层输出的实体标签可以视为另一个监督信号，用于监督各主体是否为实体，并且在确定了事件主体后还会根据预设字典对事件主体进行筛选，得到至少一个目标事件主体，因此采用本申请提供的事件主体的识别方法，可以解决现有技术中由于监督信号过于单一，从而造成抽取结果不准确的问题，达到提高抽取得到的事件主体的准确性的作用。

可选地，在上述实施例的基础上，本申请实施例还可提供一种事件主体识别模型的训练方法，如下结合附图对上述方法的实现过程进行示例说明。图4为本申请一实施例提供的一种事件主体识别模型的训练方法的流程示意图，如图4所示，该方法可包括：

S201：获取训练样本文本和训练样本的事件类别。

其中，训练样本文本中标注有事件主体的位置。标注方式例如可以为：在训练样本文本的各事件主体文字内容的起始位置，即各事件主体文字内容中的第一个字标注“起始位置信息”，用于指示该字为一个事件主体的起始位置，在训练样本文本的各事件主体的结束位置，即各事件主体文字内容中的最后一个字标注“结束位置信息”，用于指示该字为一个事件主体的结束位置，并对各完整的事件主体内容标注有该完整的事件主体内容对应的事件类别；这样的标注方式不需要预先进行分词处理，也不需要预先标注触发词，因此减少了前期标注的人力成本和事件成本。

S202：将训练样本文本和训练样本的事件类别输入初始识别模型中。

初始识别模型中包括：全连接层和实体识别层。

S203：根据初始识别模型的全连接层的输出结果以及训练样本文本的标注信息，确定各事件主体对应的第一损失函数。

示例地，在本申请的一个实施例中，事件主体位置包括：事件主体起始位置和事件主体结束位置；则确定第一损失函数的方式例如可以为：全连接层根据训练样本，确定至少一个事件主体起始位置和事件主体结束位置；根据事件主体起始位置与具有标注的事件主体起始位置，事件主体结束位置和具有标注的事件主体结束位置，确定第一损失函数。

S204：根据初始识别模型的实体识别层的输出实体标签结果以及训练样本文本的标注信息，确定各事件主体对应的第二损失函数。

S205：根据第一损失函数和第二损失函数确定目标损失函数。

示例地，在本申请的一个实施例中，目标损失函数为根据第一损失函数和第二损失函数累加求和得到的。

S206：根据目标损失函数，对初始识别模型进行修正，并在修正后的初始识别模型满足预设条件时，将修正后的初始识别模型作为事件主体识别模型。

示例地，在本申请的一个实施例中，若预设次数内目标损失函数均没有下降，则确定修正后的初始识别模型为训练得到的目标事件主体识别模型，预设次数例如可以5次，本申请在此不做任何限制。

图5为本申请一实施例提供的目标事件主体识别模型的结构示意图，如图5所示，该目标事件主体识别模型的训练方法可以如下：

在获取到训练样本文本和训练样本文本的事件类别后，首先根据目标事件主体识别模型中的全连接层，计算训练样本文本中各事件主体的起始位置start span和结束位置endspan，并根据起始位置和结束位置以及训练样本文本的标注信息，确定各事件主体对应的第一损失函数loss_1；随后根据目标事件主体识别模型中的实体识别层：确定实体识别的结果，并根据实体识别的结果和训练样本文本的标注信息，确定各事件主体对应的第二损失函数loss_2；随后根据loss_1和loss_2确定目标损失函数loss，其中，目标损失函数的确定方式为根据第一损失函数和第二损失函数累加求得，即loss=loss_1+loss_2；最后使用adam算法，计算事件主体识别模型中各参数的一介梯度，并根据计算结果对模型中的各个参数进行，其中，若连续预设次数内目标损失函数均没有下降，则可以提前终止对模型的更新，确定修正后的初始识别模型为训练得到的目标事件主体识别模型。

上述方法为事件主体的识别方法中，事件主体识别模型的训练方法，因此带来的有益效果与上述识别方法带来的有益效果相同，本申请在此不再赘述。

可选地，在上述实施例的基础上，本申请实施例还可提供一种事件主体识别模型的训练方法，如下结合附图对上述方法的实现过程进行示例说明。图6为本申请另一实施例提供的一种事件主体识别模型的训练方法的流程示意图，如图6所示，S203之前，该方法还包括：

S207：使用预先训练获取的语义识别模型分别识别并获取训练样本文本对应的样本文字语义表征，和事件类别对应的语义表征。

对应的，S203可包括：

S208：根据初始识别模型的全连接层的输出结果、训练样本文本的标注信息、样本文字语义表征，和事件类别对应的语义表征确定各事件主体对应的第一损失函数。

示例地，在本申请的一个实施例中，可以对训练样本中的每个汉字通过标记器tokenizer进行转化，每个汉字均转换为一个对应的身份标识号（Identity document，ID）值，再通过预训练模型Albert-Chinese得到每个汉字对应的令牌token的编码，然后加入每个token的位置信息编码，通过Transformer模型学习每个token的语义表征，得到token的语义表征编码。

S204可包括：

S209：根据初始识别模型的实体识别层的输出结果、训练样本文本的标注信息、样本文字语义表征，和事件类别对应的语义表征确定各事件主体对应的第二损失函数。

下述结合附图对本申请所提供的事件主体的识别装置进行解释说明，该事件主体的识别装置可执行上述图1-图6任一事件主体的识别方法，其具体实现以及有益效果参照上述，如下不再赘述。

采用本申请提供的方法对129类事件类型，共5285条数据进行了主体识别抽取任务的对比实验。实验1中的第一事件主体识别模型Albert-Chinese-tiny1为仅包括全连接层的模型，即仅使用事件主体的位置信息作为监督信号对模型进行训练；实验2中的第二事件主体识别模型Albert-Chinese-tiny2中包括全连接层和实体识别层，即同时使用主体的位置信息和实体信息两个监督信号来对模型进行训练，实验基本设置情况如下：

总体测试结果如下：

从上述对比实验结果可以看出，采用本申请提供的事件主体识别方法得到的测试结果高于仅使用一种监督信号的模型1%左右，这说明在模型训练的时候由于采用了主体的位置信息和实体信息两个监督信号作为监督信息，所以提高了最终训练得到的模型的准确率，从而使得训练得到的模型预测的效果更好，验证了本方案的有效性。

图7为本申请一实施例提供的事件主体的识别装置的结构示意图，如图7所示，该装置包括：获取模块301，确定模块302和筛选模块303，其中：

获取模块301，用于获取待识别事件文本和待识别事件文本的事件类别。

确定模块302，用于将待识别事件文本以及待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果,识别结果用于标识待识别事件文本中的至少一个事件主体；其中，事件主体识别模型中包括全连接层和实体识别层，全连接层用于识别至少一个主体，实体识别层用于识别各主体是否为实体。

筛选模块303，用于根据预设字典对识别结果进行筛选，得到至少一个目标事件主体。

图8为本申请另一实施例提供的事件主体的识别装置的结构示意图，在本申请的一个实施例中，识别结果中包括：至少一个事件主体和各事件主体的概率值；如图8所示，该装置还包括：排序模块304，用于根据各事件主体的概率值对各事件主体进行排序。

确定模块302，具体用于将概率值排名在第一预设个数内的事件主体作为待筛选事件主体。

筛选模块303，具体用于根据预设字典对待筛选事件主体进行筛选，将通过筛选的待筛选事件主体作为目标事件主体。

可选地，确定模块302，具体用于根据事件主体识别模型中的全连接层确定事件主体的起始位置和结束位置；根据起始位置和结束位置，确定各事件主体。

如图8所示，该装置还包括：组合模块305，其中：

确定模块302，具体用于确定起始位置对应的概率值排名在第二预设个数内的起始位置为目标起始位置；确定结束位置对应的概率值排名在第二预设个数内的结束位置为目标结束位置。

组合模块305，用于根据预设组合方法对目标起始位置和目标结束位置进行组合，得到至少一个位置组；其中，每个位置组中均包括一个目标起始位置和目标结束位置。

确定模块302，具体用于确定各位置组中的目标起始位置和目标结束位置之间的内容为各事件主体。

可选地，确定模块302，具体用于将待识别事件文本以及待识别事件文本的事件类别输入事件主体识别模型，由事件主体识别模型根据预设语句信息表征算法，分别提取事件类别对应的事件类别的语义表征，和待识别事件文本对应的待识别事件文本语义表征，并根据事件类别的语义表征，和待识别事件文本语义表征，对待识别事件文本中的至少一个事件主体进行识别，得到识别结果。

图9为本申请一实施例提供了一种事件主体识别模型的训练装置的结构示意图，如图9所示，该装置包括：获取模块401、输入模块402、确定模块403和修正模块404，其中：

获取模块401，用于获取训练样本文本和训练样本的事件类别；其中，训练样本文本中标注有事件主体的位置。

输入模块402，用于将训练样本文本和训练样本的事件类别输入初始识别模型中，初始识别模型中包括：全连接层和实体识别层。

确定模块403，用于根据初始识别模型的全连接层的输出结果以及训练样本文本的标注信息，确定各事件主体对应的第一损失函数；根据初始识别模型的实体识别层的输出结果以及训练样本文本的标注信息，确定各事件主体对应的第二损失函数；根据第一损失函数和第二损失函数确定目标损失函数。

修正模块404，用于根据目标损失函数，对初始识别模型进行修正，并在修正后的初始识别模型满足预设条件时，将修正后的初始识别模型作为事件主体识别模型。

可选地，获取模块401，具体用于使用预先训练获取的语义识别模型分别识别并获取训练样本文本对应的样本文字语义表征，和事件类别对应的语义表征。

确定模块403，具体用于根据初始识别模型的全连接层的输出结果、训练样本文本的标注信息、样本文字语义表征，和事件类别对应的语义表征确定各事件主体对应的第一损失函数；根据初始识别模型的实体识别层的输出结果、训练样本文本的标注信息、样本文字语义表征，和事件类别对应的语义表征确定各事件主体对应的第二损失函数。

可选地，确定模块403，具体用于全连接层根据训练样本，确定至少一个事件主体起始位置和事件主体结束位置；根据事件主体起始位置与具有标注的事件主体起始位置，事件主体结束位置和具有标注的事件主体结束位置，确定第一损失函数。

可选地，确定模块403，具体用于若预设次数内目标损失函数均没有下降，则确定修正后的初始识别模型为训练得到的目标事件主体识别模型。

上述装置用于执行前述实施例提供的方法，其实现原理和技术效果类似，在此不再赘述。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路（Application Specific Integrated Circuit，简称ASIC），或，一个或多个微处理器（digital singnal processor，简称DSP），或，一个或者多个现场可编程门阵列（Field Programmable Gate Array，简称FPGA）等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器（CentralProcessing Unit，简称CPU）或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统（system-on-a-chip，简称SOC）的形式实现。

图10为本申请一实施例提供的电子设备的结构示意图，该电子设备可以集成于终端设备或者终端设备的芯片。

该电子设备包括：处理器501、存储介质502和总线503。

处理器501用于存储程序，处理器501调用存储介质502存储的程序，以执行上述图1-图6对应的方法实施例。具体实现方式和技术效果类似，这里不再赘述。

可选地，本申请还提供一种程序产品，例如存储介质，该存储介质上存储有计算机程序，包括程序，该程序在被处理器运行时执行上述方法对应的实施例。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）或处理器（英文：processor）执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（英文：Read-Only Memory，简称：ROM）、随机存取存储器（英文：Random Access Memory，简称：RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种事件主体的识别方法，其特征在于，所述方法包括：

获取待识别事件文本和所述待识别事件文本的事件类别；

2.如权利要求1所述的方法，其特征在于，所述识别结果中包括：至少一个事件主体和各所述事件主体的概率值；

根据各所述事件主体的概率值对各所述事件主体进行排序；

3.如权利要求2所述的方法，其特征在于，所述根据各所述事件主体的概率值对各所述事件主体进行排序之前，所述方法还包括：

根据所述起始位置和所述结束位置，确定各所述事件主体。

4.如权利要求3所述的方法，其特征在于，所述根据所述起始位置和所述结束位置，确定各所述事件主体，包括：

5.如权利要求1-4任一项所述的方法，其特征在于，所述将所述待识别事件文本以及所述待识别事件文本的事件类别输入预先训练获得的事件主体识别模型，得到识别结果，包括：

6.一种事件主体识别模型的训练方法，其特征在于，所述方法包括：

7.如权利要求6所述的方法，其特征在于，所述根据所述初始识别模型的全连接层的输出结果以及所述训练样本文本的标注信息，确定各所述事件主体对应的第一损失函数之前，所述方法还包括：

8.如权利要求6所述的方法，其特征在于，所述事件主体位置包括：事件主体起始位置和事件主体结束位置；

9.如权利要求6所述的方法，其特征在于，所述在修正后的初始识别模型满足预设条件时，将修正后的初始识别模型作为事件主体识别模型，包括：

10.一种事件主体的识别装置，其特征在于，所述装置包括：获取模块、确定模块和筛选模块，其中：

11.一种事件主体识别模型的训练装置，其特征在于，所述装置包括：获取模块、输入模块、确定模块和修正模块，其中：

12.一种电子设备，其特征在于，所述设备包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当所述电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行上述权利要求1-9任一项所述的方法。

13.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述权利要求1-9任一项所述的方法。