CN113836297B

CN113836297B - 文本情感分析模型的训练方法及装置

Info

Publication number: CN113836297B
Application number: CN202110838606.2A
Authority: CN
Inventors: 王凯; 王金刚; 任磊; 郑爽; 张富峥; 武威
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-07-23
Filing date: 2021-07-23
Publication date: 2023-04-14
Anticipated expiration: 2041-07-23
Also published as: CN113836297A

Abstract

本公开提供了一种文本情感分析模型的训练方法及装置。所述方法包括：获取第一样本语句；对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句；所述第一样本语句和所述第二样本语句对应于目标情感类别；将所述第一样本语句和所述第二样本语句输入至初始文本情感分析模型，以获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率；根据目标情感类别和预测概率，确定初始文本情感分析模型的损失值；在损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。本公开可以提高违法文本识别的准确率，减少违法信息的错判和漏判。

Description

文本情感分析模型的训练方法及装置

技术领域

本公开的实施例涉及模型训练技术领域，尤其涉及一种文本情感分析模型的训练方法及装置。

背景技术

近年来，人工智能技术的飞速发展，在计算机视觉、自然语言处理、语音识别等多个领域展现出其强大的应用价值，人工智能技术的安全性问题也随着这些应用的推广变得越来越受到重视。

目标，多数大型互联网企业通常是基于自身业务安全管理过程中所积累的海量标准样本库，开展对违法信息识别的建模训练，纷纷推出了基于人工智能的违法信息检测服务。

然而，现在很多恶意评论等文本通过添加特殊字符(如大小字母等)，导致现有的情感分析模型对恶意评论等文本中违法信息识别的准确率较低，造成违法信息的错判和漏判。

发明内容

本公开的实施例提供一种文本情感分析模型的训练方法及装置，用以可以提高文本违反信息识别的准确率，降低违法信息的错判和漏判。

根据本公开的实施例的第一方面，提供了一种文本情感分析模型的训练方法，包括：

获取第一样本语句；

对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句；所述第一样本语句和所述第二样本语句对应于目标情感类别；

将所述第一样本语句和所述第二样本语句输入至初始文本情感分析模型，以获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率；

根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值；

在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。

可选地，所述对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句，包括：

对所述第一样本语句进行分词处理，得到所述第一样本语句对应的多个分词；

获取所述多个分词对应的分词重要指数；

根据所述分词重要指数，确定所述多个分词中的目标分词；

对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句。

根据所述目标分词对应的情感类别，确定所述目标分词对应的候选词集合；

获取所述目标分词与所述候选词集合中的每个候选词之间的相似度；

根据所述相似度，确定所述候选词集合中的所述目标分词对应的目标候选词；

基于所述目标候选词，对所述第一样本语句中的目标分词进行替换处理，得到所述第二样本语句。

在所述第一样本语句中所述目标分词关联的位置处添加目标字符，生成所述第一样本语句对应的第二样本语句。

可选地，所述初始文本情感分析模型包括：情感分析层和字符识别层，

所述获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率，包括：

调用所述情感分析层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第一预测概率；

调用所述字符识别层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第二预测概率。

可选地，所述根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值，包括：

根据所述目标情感类别和所述第一预测概率，计算得到所述情感分析层的第一损失值；

根据所述目标情感类别和所述第二预测概率，计算得到所述字符识别层的第二损失值；

获取所述第一损失值和所述第二损失值的和值，并将该和值作为所述初始文本情感分析模型的损失值。

根据本公开的实施例的第二方面，提供了一种文本情感分析模型的训练装置，包括：

第一样本语句获取模块，用于获取第一样本语句；

第二样本语句获取模块，用于对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句；所述第一样本语句和所述第二样本语句对应于目标情感类别；

预测概率获取模块，用于将所述第一样本语句和所述第二样本语句输入至初始文本情感分析模型，以获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率；

损失值确定模块，用于根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值；

目标模型获取模块，用于在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。

可选地，所述第二样本语句获取模块包括：

多个分词获取单元，用于对所述第一样本语句进行分词处理，得到所述第一样本语句对应的多个分词；

分词重要指数获取单元，用于获取所述多个分词对应的分词重要指数；

目标分词确定单元，用于根据所述分词重要指数，确定所述多个分词中的目标分词；

第二样本语句获取单元，用于对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句。

可选地，所述第二样本语句获取单元包括：

候选词集合确定子单元，用于根据所述目标分词对应的情感类别，确定所述目标分词对应的候选词集合；

相似度获取子单元，用于获取所述目标分词与所述候选词集合中的每个候选词之间的相似度；

目标候选词确定子单元，用于根据所述相似度，确定所述候选词集合中的所述目标分词对应的目标候选词；

第二样本语句获取子单元，用于基于所述目标候选词，对所述第一样本语句中的目标分词进行替换处理，得到所述第二样本语句。

可选地，所述第二样本语句获取单元包括：

第二样本语句生成子单元，用于在所述第一样本语句中所述目标分词关联的位置处添加目标字符，生成所述第一样本语句对应的第二样本语句。

所述预测概率获取模块包括：

第一预测概率获取单元，用于调用所述情感分析层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第一预测概率；

第二预测概率获取单元，用于调用所述字符识别层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第二预测概率。

可选地，所述损失值确定模块包括：

第一损失值计算单元，用于根据所述目标情感类别和所述第一预测概率，计算得到所述情感分析层的第一损失值；

第二损失值计算单元，用于根据所述目标情感类别和所述第二预测概率，计算得到所述字符识别层的第二损失值；

损失值获取单元，用于获取所述第一损失值和所述第二损失值的和值，并将该和值作为所述初始文本情感分析模型的损失值。

根据本公开的实施例的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的文本情感分析模型的训练方法。

根据本公开的实施例的第四方面，提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的文本情感分析模型的训练方法。

本公开的实施例提供了一种文本情感分析模型的训练方法及装置，通过获取第一样本语句，对第一样本语句中的目标分词进行处理，得到第一样本语句对应的第二样本语句，所述第一样本语句和所述第二样本语句对应于目标情感类别，将第一样本语句和第二样本语句输入至初始文本情感分析模型，以获取由初始文本情感分析模型输出的第一样本语句和第二样本语句为目标情感类别的预测概率，根据目标情感类别和预测概率，确定初始文本情感分析模型的损失值，在损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。本公开的实施例通过结合文本处理的语句作为训练样本，从而可以使得到的情感分析模型能够提高违法文本信息的识别准确率，减少违法文本信息的错判和漏判。

附图说明

为了更清楚地说明本公开的实施例的技术方案，下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开的实施例提供的一种文本情感分析模型的训练方法的步骤流程图；

图2为本公开的实施例提供的另一种文本情感分析模型的训练方法的步骤流程图；

图3为本公开的实施例提供的一种文本情感分析模型的训练装置的结构示意图；

图4为本公开的实施例提供的另一种文本情感分析模型的训练装置的结构示意图。

具体实施方式

下面将结合本公开的实施例中的附图，对本公开的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开的实施例一部分实施例，而不是全部的实施例。基于本公开的实施例中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开的实施例保护的范围。

实施例一

参照图1，示出了本公开的实施例提供的一种文本情感分析模型的训练方法的步骤流程图，如图1所示，该文本情感分析模型的训练方法具体可以包括如下步骤：

步骤101：获取第一样本语句。

本公开的实施例可以应用于结合处理后的样本语句和未处理的样本语句进行情感分析模型训练的场景中。

第一样本语句是指获取的用于对文本情感分析模型进行训练的语句，在具体实现中，第一样本语句可以为从语句数据库中选择的文本语句，也可以为从互联网上下载的文本语句等，对于第一样本语句的获取方式可以根据业务需求而定，本实施例对此不加以限制。

在需要对文本情感分析模型进行训练时，可以获取第一样本语句。

在获取到第一样本语句之后，执行步骤102。

步骤102：对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句；所述第一样本语句和所述第二样本语句对应于目标情感类别。

目标分词是指第一样本语句中重要程度较高的分词。

第二样本语句是指对第一样本语句中的目标分词进行处理之后，得到的第一样本语句对应的文本语句。

目标情感类别是指第一样本语句和第二样本语句对应的情感类别。

在获取到第一样本语句之后，可以对第一样本语句中的目标分词进行处理，以得到第一样本语句对应的第二样本语句，具体地，可以对第一样本语句进行分词处理，得到多个分词，然后计算每个分词的重要指数，并根据重要指数获取第一样本语句中的目标分词，然后对目标分词进行替换和/或插入特殊字符的处理，以得到第二样本语句，对于该过程将在下述实施例二中进行详细描述，本实施例在此不再加以赘述。

在对第一样本语句中的目标分词进行处理得到第一样本语句对应的第二样本语句之后，执行步骤103。

步骤103：将所述第一样本语句和所述第二样本语句输入至初始文本情感分析模型，以获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率。

初始文本情感分析模型是指还未进行训练的文本情感分析模型。

预测概率是指初始文本情感分析模型预测得到的第一样本语句和第二样本语句属于目标情感类别的概率。

在得到第一样本语句和第二样本语句之后，可以将第一样本语句和第二样本语句输入至初始文本情感分析模型，然后，由初始文本情感分析模型对第一样本语句和第二样本语句进行处理，以得到由初始文本情感分析模型预测的第一样本语句和第二样本语句为目标情感类别的预测概率。具体地，将在下述实施例二中进行详细描述，本实施例在此不再加以赘述。

在获取到由初始文本情感分析模型输出的第一样本语句和第二样本语句为目标情感类别的预测概率之后，执行步骤104。

步骤104：根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值。

在得到初始文本情感分析模型输出的第一样本语句和第二样本语句为目标情感类别的预测概率之后，可以根据目标情感类别和预测概率确定出初始文本情感分析模型的损失值，对于该过程将在下述实施例二中进行详细描述，本实施例在此不再加以赘述。

在根据目标情感类别和预测概率确定出初始文本情感分析模型的损失值之后，执行步骤105。

步骤105：在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。

预设范围是指由业务人员预先设定的用于判定文本情感分析模型的训练程度是否满足业务需求的损失值范围，对于预设范围的具体数值可以根据业务需求而定，本实施例对此不加以限制。

在得到初始文本情感分析模型的损失值之后，可以判断该损失值是否处于预设范围内。

若该损失值未处于预设范围内，此时，可以结合第一样本语句和第二样本语句对初始文本情感分析模型进行训练，直至损失值处于预设范围内。

若该损失值处于预设范围内，则可以将训练后的初始文本情感分析模型作为目标文本情感分析模型，该目标文本情感分析模型可以应用于后续的文本语句中的违法信息的识别过程。

本公开的实施例通过结合文本处理的语句作为训练样本，从而可以使得到的情感分析模型能够提高违法文本信息的识别准确率，减少违法文本信息的错判和漏判。

本公开的实施例提供的文本情感分析模型的训练方法，通过获取第一样本语句，对第一样本语句中的目标分词进行处理，得到第一样本语句对应的第二样本语句，所述第一样本语句和所述第二样本语句对应于目标情感类别，将第一样本语句和第二样本语句输入至初始文本情感分析模型，以获取由初始文本情感分析模型输出的第一样本语句和第二样本语句为目标情感类别的预测概率，根据目标情感类别和预测概率，确定初始文本情感分析模型的损失值，在损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。本公开的实施例通过结合文本处理的语句作为训练样本，从而可以使得到的情感分析模型能够提高违法文本信息的识别准确率，减少违法文本信息的错判和漏判。

实施例二

参照图2，示出了本公开的实施例提供的另一种文本情感分析模型的训练方法的步骤流程图，如图2所示，该文本情感分析模型的训练方法具体可以包括如下步骤：

步骤201：获取第一样本语句。

在获取到第一样本语句之后，执行步骤202。

步骤202：对所述第一样本语句进行分词处理，得到所述第一样本语句对应的多个分词。

在获取到第一样本语句之后，可以对第一样本语句进行分词处理，以得到第一样本语句对应的多个分词，具体地分词处理方式可以采用现有技术中常用的文本分词方式，本实施例对于具体地文本分词方式不加以限制。

在对第一样本语句进行分词处理得到第一样本语句对应的多个分词之后，执行步骤203。

步骤203：获取所述多个分词对应的分词重要指数。

分词重要指数可以用于指示多个分词在第一样本语句中的重要程度，在实际应用中，分词重要指数越高表示分词的重要程度越高，反之，分词重要指数越低表示分词的重要程度越低。

在对第一样本语句进行分词处理得到第一样本语句对应的多个分词之后，可以获取多个分词对应的分词重要指数，具体地，可以将多个分词输入至情感分析模型，以获取由情感分析模型输出的多个分词的分词重要指数，例如，设分词处理后，输入句子为[w₁,w₂,...,w_n]，其中，w_i(1≤i≤1)表示样本语句中的第i个分词，得到的情感分析模型输出的多个分词的分词重要指数可以如下表示：

Significance_i＝F(w₁,w₂,...w_n)-F(w₁,w₂,...,w_i-1,w_i+1,...w_n)

其中，F是情感分析模型，函数值为预测正确类别的概率。Significance_i是词w_i的重要性分数，该分数越大，说明相应的词对于预测结果来说越重要。

步骤204：根据所述分词重要指数，确定所述多个分词中的目标分词。

在得到多个分词的分词重要指数之后，可以根据分词重要指数确定出多个分词中的目标分词。具体地，可以将多个分词中分词重要指数最高的分词作为目标分词，也可以预先设置一个指数阈值，将多个分词中分词重要指数超过指数阈值的分词作为目标分词等，具体地结合分词重要指数确定目标分词的方式可以根据业务需求而定，本实施例对此不加以限制。

在根据分词重要指数确定出多个分词中的目标分词之后，执行步骤205。

步骤205：对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句。

在根据分词重要指数确定出多个分词中的目标分词之后，可以对第一样本语句中的目标分词进行处理，以得到第一样本语句对应的第二样本语句，具体地处理方式可以结合下述具体实现方式进行详细描述。

在本公开的一种具体实现方式中，上述步骤205可以包括：

子步骤S1：根据所述目标分词对应的情感类别，确定所述目标分词对应的候选词集合。

在本实施例中，在获取到第一样本语句中的目标分词之后，可以根据目标分词的情感类别确定目标分词对应的候选词集合，具体地，可以根据当前重要词的情感类型，从情感词典中筛选出一个近义词子集作为用于替换的候选词集合。

在根据目标分词对应的情感类别确定出目标分词对应的候选词集合之后，执行子步骤S2。

子步骤S2：获取所述目标分词与所述候选词集合中的每个候选词之间的相似度。

在确定出目标分词对应的候选词集合之后，可以获取目标分词与候选词集合中的每个候选词之间的相似度，具体地，可以根据目标分词和每个候选词分别对应的表征向量，计算得到目标分词与每个候选词之间的余弦相似度，并将该余弦相似度作为目标分词与每个候选词之间的相似度等。

在获取到目标分词与候选词集合中的每个候选词之间的相似度之后，执行子步骤S3。

子步骤S3：根据所述相似度，确定所述候选词集合中的所述目标分词对应的目标候选词。

在获取到目标分词与候选词集合中的每个候选词之间的相似度之后，可以根据目标分词与每个候选词之间的相似度，确定出候选词集合中的目标分词对应的目标候选词，具体地，可以将候选词集合中相似度最大的候选词作为目标候选词等。

在根据相似度确定出候选词集合中的目标分词对应的目标候选词之后，执行子步骤S4。

子步骤S4：基于所述目标候选词，对所述第一样本语句中的目标分词进行替换处理，得到所述第二样本语句。

在得到目标候选词之后，可以基于目标候选词对第一样本语句中的目标分词进行替换处理，从而可以得到第二样本语句，即将第一样本语句中的目标分词替换为目标候选词即可得到第二样本语句。

在本公开的另一种具体实现方式中，上述步骤205可以包括：

子步骤M1：在所述第一样本语句中所述目标分词关联的位置处添加目标字符，生成所述第一样本语句对应的第二样本语句。

在本实施例中，在确定出第一样本语句中的目标分词之后，可以在第一样本语句中目标分词关联的位置处添加目标字符，从而可以生成第一样本语句对应的第二样本语句，例如，在当前重要词的前后或单字之间插入无关字符*等，生成新的对抗样本，即第二样本语句等。

对于对抗样本的生成过程可以结合下述代码进行描述。

输入：情感分析模型F和原始数据

输出：包含对抗样本的新数据

for i＝1 to m do

words←Filter(words)according to Significance

for w_k in words do

//新数据包含原始数据

s_j++′’←s_i

y_j++′’←y_i

z_j++′’←0

//用近义词替换重要词

CandidateWords←GenerateWordSubset(w_k)

CandidateWords←Filter(CandidateWords)according to Similarity

for w_t’in CandidateWords do

s_j++′’←replace w_kwith w_t’in s_i

y_j++′’←y_i

z_j++′’←0

end for

//在重要词附近插入干扰字符π

[c₁,c₂,...,c_n]←Split(w_k)

for p＝0 to n do

w_p′w_p′’←Concat([c₁,c₂,...,c_p,π,c_p+1,...c_n])

s_j++′’←replace w_k with w_p’in s_i

y_j++′’←y_i

z_j++′’←1

end for

在对第一样本语句中的目标分词进行处理得到第一样本语句对应的第二样本语句之后，执行步骤206。

步骤206：调用所述情感分析层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第一预测概率。

在本示例中，初始文本情感分析模型可以包括情感分析层和字符识别层，其中，字符识别层可以用于判断是否插入或替换其它字符。

在将第一样本语句和第二样本语句输入至初始文本情感分析模型之后，可以调用情感分析层对第一样本语句和第二样本语句进行处理，以得到情感分析层输出的第一样本语句和第二样本语句属于目标情感类别的第一预测概率。

步骤207：调用所述字符识别层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第二预测概率。

在将第一样本语句和第二样本语句输入至初始文本情感分析模型之后，可以调用字符识别层对第一样本语句和第二样本语句进行处理，以得到字符识别层输出的第一样本语句和第二样本语句属于目标情感类别的第二预测概率。

步骤208：根据所述目标情感类别和所述第一预测概率，计算得到所述情感分析层的第一损失值。

在获取到第一预测概率之后，可以根据目标情感类别和第一预测概率计算得到情感分析层对应的损失值，即第一损失值，具体地计算方式可以如下述公式(1)所示：

上述公式(1)中，L_sen为第一损失值，y_i'为目标情感类别的标签值，y_i″为第一预测概率，m为第二样本语句的数据量，K为情感分类的类别数目。

步骤209：根据所述目标情感类别和所述第二预测概率，计算得到所述字符识别层的第二损失值。

在获取到第二预测概率之后，可以根据目标情感类别和第二预测概率计算得到字符识别层的第二损失值，具体地计算方式可以如下述公式(2)所示：

上述公式(2)中，L_ins为第二损失值，z_i为第二预测概率，m为第二样本语句的数量，

为目标情感类别的标签值。

步骤210：获取所述第一损失值和所述第二损失值的和值，并将该和值作为所述初始文本情感分析模型的损失值。

在计算得到第一损失值和第二损失值之后，可以获取第一损失值和第二损失值的和值，并将该和值作为初始文本情感分析模型的损失值。

在获取到初始文本情感分析模型的损失值之后，执行步骤210。

步骤211：在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。

实施例三

参照图3，示出了本公开的实施例提供的一种文本情感分析模型的训练装置的结构示意图，如图3所示，该文本情感分析模型的训练装置300具体可以包括如下模块：

第一样本语句获取模块310，用于获取第一样本语句；

第二样本语句获取模块320，用于对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句；所述第一样本语句和所述第二样本语句对应于目标情感类别；

预测概率获取模块330，用于将所述第一样本语句和所述第二样本语句输入至初始文本情感分析模型，以获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率；

损失值确定模块340，用于根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值；

目标模型获取模块350，用于在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。

本公开的实施例提供的文本情感分析模型的训练装置，通过获取第一样本语句，对第一样本语句中的目标分词进行处理，得到第一样本语句对应的第二样本语句，所述第一样本语句和所述第二样本语句对应于目标情感类别，将第一样本语句和第二样本语句输入至初始文本情感分析模型，以获取由初始文本情感分析模型输出的第一样本语句和第二样本语句为目标情感类别的预测概率，根据目标情感类别和预测概率，确定初始文本情感分析模型的损失值，在损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。本公开的实施例通过结合文本处理的语句作为训练样本，从而可以使得到的情感分析模型能够提高违法文本信息的识别准确率，减少违法文本信息的错判和漏判。

实施例四

参照图4，示出了本公开的实施例提供的一种文本情感分析模型的训练装置的结构示意图，如图4所示，该文本情感分析模型的训练装置400具体可以包括如下模块：

第一样本语句获取模块410，用于获取第一样本语句；

第二样本语句获取模块420，用于对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句；所述第一样本语句和所述第二样本语句对应于目标情感类别；

预测概率获取模块430，用于将所述第一样本语句和所述第二样本语句输入至初始文本情感分析模型，以获取由所述初始文本情感分析模型输出的所述第一样本语句和所述第二样本语句为所述目标情感类别的预测概率；

损失值确定模块440，用于根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值；

目标模型获取模块450，用于在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型。

可选地，所述第二样本语句获取模块420包括：

多个分词获取单元421，用于对所述第一样本语句进行分词处理，得到所述第一样本语句对应的多个分词；

分词重要指数获取单元422，用于获取所述多个分词对应的分词重要指数；

目标分词确定单元423，用于根据所述分词重要指数，确定所述多个分词中的目标分词；

第二样本语句获取单元424，用于对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句。

可选地，所述第二样本语句获取单元424包括：

所述预测概率获取模块430包括：

第一预测概率获取单元431，用于调用所述情感分析层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第一预测概率；

第二预测概率获取单元432，用于调用所述字符识别层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第二预测概率。

可选地，所述损失值确定模块440包括：

第一损失值计算单元441，用于根据所述目标情感类别和所述第一预测概率，计算得到所述情感分析层的第一损失值；

第二损失值计算单元442，用于根据所述目标情感类别和所述第二预测概率，计算得到所述字符识别层的第二损失值；

损失值获取单元443，用于获取所述第一损失值和所述第二损失值的和值，并将该和值作为所述初始文本情感分析模型的损失值。

本公开的实施例还提供了一种电子设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现前述实施例的文本情感分析模型的训练方法。

本公开的实施例还提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述实施例的文本情感分析模型的训练方法。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开的实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的实施例的内容，并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的实施例的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

本公开的实施例的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述仅为本公开的实施例的较佳实施例而已，并不用以限制本公开的实施例，凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本公开的实施例的保护范围之内。

以上所述，仅为本公开的实施例的具体实施方式，但本公开的实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的实施例的保护范围之内。因此，本公开的实施例的保护范围应以权利要求的保护范围为准。

Claims

1.一种文本情感分析模型的训练方法，其特征在于，包括：

获取第一样本语句；

在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型；

所述初始文本情感分析模型包括：情感分析层和字符识别层，

调用所述字符识别层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第二预测概率；所述字符识别层用于判断是否插入或替换其它字符。

2.根据权利要求1所述的方法，其特征在于，所述对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句，包括：

获取所述多个分词对应的分词重要指数；

根据所述分词重要指数，确定所述多个分词中的目标分词；

3.根据权利要求2所述的方法，其特征在于，所述对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句，包括：

4.根据权利要求2所述的方法，其特征在于，所述对所述第一样本语句中的目标分词进行处理，得到所述第一样本语句对应的第二样本语句，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述目标情感类别和所述预测概率，确定所述初始文本情感分析模型的损失值，包括：

6.一种文本情感分析模型的训练装置，其特征在于，包括：

第一样本语句获取模块，用于获取第一样本语句；

目标模型获取模块，用于在所述损失值处于预设范围内的情况下，将训练后的初始文本情感分析模型作为目标文本情感分析模型；

所述初始文本情感分析模型包括：情感分析层和字符识别层，所述预测概率获取模块包括：

第二预测概率获取单元，用于调用所述字符识别层对所述第一样本语句和所述第二样本语句进行处理，得到所述第一样本语句和所述第二样本语句为所述目标情感类别的第二预测概率；所述字符识别层用于判断是否插入或替换其它字符。

7.根据权利要求6所述的装置，其特征在于，所述第二样本语句获取模块包括：

8.一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至5中任一项所述的文本情感分析模型的训练方法。

9.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行权利要求1至5中任一项所述的文本情感分析模型的训练方法。