WO2022156065A1

WO2022156065A1 - 一种文本情感分析方法、装置、设备及存储介质

Info

Publication number: WO2022156065A1
Application number: PCT/CN2021/083804
Authority: WO
Inventors: 刘翔; 丁甲
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-01-21
Filing date: 2021-03-30
Publication date: 2022-07-28
Also published as: CN112860841A; CN112860841B

Abstract

一种文本情感分析方法、装置、设备及存储介质，涉及人工智能领域，该方法包括：获取携带指定实体的训练文本数据，对训练文本数据添加情感类别标签；将训练文本数据输入bert模型，得到指定实体的情感类别的预测结果，并确定训练文本数据情感分类的损失函数值；根据损失函数值调整bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入情感分析模型进行分析，确定出与待测试文本数据对应的情感类型。这种方式可以自动识别不同实体的情感类别，提高识别实体的情感类别的准确性。该方法涉及区块链技术，如可将训练文本数据写入区块链中，以用于数据取证等场景。

Description

一种文本情感分析方法、装置、设备及存储介质

本申请要求于2021年1月21日提交中国专利局、申请号为202110084691.8，发明名称为“一种文本情感分析方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，尤其涉及一种文本情感分析方法、装置、设备及存储介质。

背景技术

互联网多样的时代，在社交平台中呈现了巨量而又丰富的文本情感信息，运用这些文本信息，可以挖掘文本内部信息并作情感分析，这对人机交互和人工智能有重大的现实意义。传统的文本情感分析研究主要面向篇章和句子级别文本，实现相应的情感极性判断。这些研究在一些应用领域都体现了很好的应用价值，例如网络舆论分析、股评分析、服务评价。然而，随着应用的深入，人们提出了更高的要求，例如进一步获取评价对象属性所对应的情感分析结果。

发明人意识到，传统的解决文本情感分析的方法主要有机器学习算法、回归、分类、以及深度学习算法，该些方法对实现不存在实体的文本，仅仅对句子描述的判断正确率可以达到很好的效果。因此，如何实现对于存在不同实体所对应不同的情感识别非常重要。

技术问题

本申请实施例提供了一种文本情感分析方法、装置、设备及存储介质，可以自动识别不同实体的情感类别，同时对实体相对应的文本信息可以捕捉的更清晰，提高了识别实体的情感类别的准确性。

技术解决方案

第一方面，本申请实施例提供了一种文本情感分析方法，所述方法包括：获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

第二方面，本申请实施例提供了一种文本情感分析装置，包括：获取单元，用于获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；确定单元，用于将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；训练单元，用于根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；测试单元，用于将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

第三方面，本申请实施例提供了一种计算机设备，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储支持文本情感分析装置执行上述方法的计算机程序，所述计算机程序包括程序，所述处理器被配置用于调用所述程序执行：获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

有益效果

本申请实施例可以自动识别不同实体的情感类别，提高识别实体的情感类别的准确性。

附图说明

图1是本申请实施例提供的一种文本情感分析方法的示意流程图。

图2是本申请实施例提供的一种文本情感分析装置的示意框图。

图3是本申请实施例提供的一种计算机设备的示意框图。

本发明的实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的技术方案涉及人工智能和/或大数据技术领域，以实现文本情感分析，推动智慧城市的建设。可选的，本申请涉及的数据如训练文本数据和/或情感类型等可存储于数据库中，或者可以存储于区块链中，本申请不做限定。

本申请实施例提供的文本情感分析方法可以应用于一种文本情感分析装置，在某些实施例中，所述文本情感分析装置设置于计算机设备中。在某些实施例中，所述计算机设备包括但不限于智能手机、平板电脑、膝上型电脑等中的一种或者多种。

下面结合附图1对本申请实施例提供的文本情感分析方法进行示意性说明。

请参见图1，图1是本申请实施例提供的一种文本情感分析方法的示意流程图，如图1所示，该方法可以由文本情感分析装置执行，所述文本情感分析装置设置于计算机设备中。具体地，本申请实施例的所述方法包括如下步骤。

S101：获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别。

本申请实施例中，文本情感分析装置可以获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别。在某些实施例中，所述正面情感类别包括中性情感类别。

在某些实施例中，所述指定实体为指定类型的实体，所述指定实体可以包括但不限于目标对象，所述目标对象可以为人、物、事件等信息，例如，所述指定实体可以为公司信息，所述公司信息可以包括但不限于公司名称、公司统一识别码等。

在一个实施例中，文本情感分析装置在获取携带指定实体的训练文本数据时，可以从数据库中获取携带有指定实体的待处理文本数据，也可以从外网中查找一些关于存在指定实体的待处理文本数据，并按指定比例将所述待处理文本数据划分为训练文本数据和待测试文本数据。例如，在按指定比例将所述待处理文本数据划分为训练文本数据和待测试文本数据时，可以对训练文本数据和测试文本数据进行4:1划分。

在一个实施例中，在对所述训练文本数据添加情感类别标签时，可以对所述携带指定实体的训练文本数据人工添加情感类别标签。在某些实施例中，所述情感类别标签包括但不限于数字、字母、文字等中的一种或多种。在一个示例中，可以对第二情感类别的情感类别标签标记为0，对第一情感类别的情感类别标签标记为1。

S102：将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值。

本申请实施例中，文本情感分析装置可以将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值。

在一个实施例中，文本情感分析装置在将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果之前，可以对添加情感类别标签后的训练文本数据进行分类处理，将所述训练文本数据分为三类数据，所述三类数据包括携带指定实体的训练文本数据、实体数据和标签数据；并将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果。在某些实施例中，所述实体数据用于指示所述指定实体，其中，所述实体数据可以包括但不限于实体名称等。

在一个实施例中，文本情感分析装置在将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果时，可以将所述训练文本数据中携带指定实体的训练文本数据、实体数据和标签数据输入所述bert模型，得到所述训练文本数据中所述指定实体对应情感类别的词向量；根据所述词向量确定与所述训练文本数据中的所述指定实体对应的情感类别的预测结果。

在一个实施例中，文本情感分析装置在根据所述预测结果确定所述训练文本数据情感分类的损失函数值时，可以获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量；根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值。

在一个实施例中，文本情感分析装置在获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量时，可以获取所述训练文本数据中所述指定实体的位置索引；并根据所述训练文本数据中所述指定实体的位置索引计算与所述训练文本数据中所述指定实体关联的相关字的索引；以及根据所述指定实体的位置索引和所述相关字的索引确定所述训练文本数据中所述指定实体对应的权重词向量。

例如，假设实体A公司股票大涨，而实体B公司股票大跌，股票大涨和股票大跌相对于实体A公司，距离分别是近和远，同时相对应的权重也分别是大和小。如果w1、w2分别表示股票大涨和股票大跌的权重，c1、c2分别表示实体A公司股票大涨和实体B公司股票大跌的词向量，则实体A公司股票大涨的词向量变为权重词向量w1*c1，实体B公司股票大跌的词向量变为权重词向量w2*c2。

在一个实施例中，文本情感分析装置在根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值时，可以对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量；并根据所述目标词向量确定所述训练文本数据情感分类的损失函数值，所述损失函数值包括正面情感类型的第一损失函数值和负面情感类型的第二损失函数值。

例如，在对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量时，假设实体A公司的权重词向量为：[0.1,0.2,0.3…0.9]，实体A公司通过bert模型得到的所述训练文本数据中所述实体A公司对应情感类别的词向量为：[1.1,1.2,1.3…1.9]，对[0.1,0.2,0.3…0.9]和[1.1,1.2,1.3…1.9]进行拼接处理，得到目标词向量：[0.1,0.2,0.3…1.8,1.9]。

S103：根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型。

本申请实施例中，文本情感分析装置可以根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型。

在一个实施例中，文本情感分析装置可以根据所述正面情感类型的第一损失函数值和负面情感类型的第二损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型。

S104：将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

本申请实施例中，文本情感分析装置可以将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

在一个实施例中，文本情感分析装置在将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型时，可以将所述待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类别的概率；并根据所述待测试文本数据对应的情感类别的概率，确定最大概率的情感类别为所述待测试文本数据对应的情感类型。

本申请实施例中，文本情感分析装置可以获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。通过这种实施方式，可以自动识别不同实体的情感类别，提高识别实体的情感类别的准确性。

本申请实施例还提供了一种文本情感分析装置，该文本情感分析装置用于执行前述任一项所述的方法的单元。具体地，参见图2，图2是本申请实施例提供的一种文本情感分析装置的示意框图。本实施例的文本情感分析装置包括：获取单元201、确定单元202、训练单元203以及测试单元204。

获取单元201，用于获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别。

确定单元202，用于将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值。

训练单元203，用于根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型。

测试单元204，用于将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

进一步地，所述确定单元202将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果之前，还用于：对添加情感类别标签后的训练文本数据进行分类处理，将所述训练文本数据分为三类数据，所述三类数据包括携带指定实体的训练文本数据、实体数据和标签数据；所述确定单元202将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果时，具体用于：将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果。

进一步地，所述确定单元202将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果时，具体用于：将所述训练文本数据中携带指定实体的训练文本数据、实体数据和标签数据输入所述bert模型，得到所述训练文本数据中所述指定实体对应情感类别的词向量；根据所述词向量确定与所述训练文本数据中的所述指定实体对应的情感类别的预测结果。

进一步地，所述确定单元202根据所述预测结果确定所述训练文本数据情感分类的损失函数值时，具体用于：获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量；根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值。

进一步地，所述确定单元202获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量时，具体用于：获取所述训练文本数据中所述指定实体的位置索引；根据所述训练文本数据中所述指定实体的位置索引计算与所述训练文本数据中所述指定实体关联的相关字的索引；根据所述指定实体的位置索引和所述相关字的索引确定所述训练文本数据中所述指定实体对应的权重词向量。

进一步地，所述确定单元202根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值时，具体用于：对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量；根据所述目标词向量确定所述训练文本数据情感分类的损失函数值，所述损失函数值包括正面情感类型的第一损失函数值和负面情感类型的第二损失函数值。

进一步地，所述测试单元204将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型时，具体用于：将所述待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类别的概率；根据所述待测试文本数据对应的情感类别的概率，确定最大概率的情感类别为所述待测试文本数据对应的情感类型。

参见图3，图3是本申请实施例提供的一种计算机设备的示意框图。如图所示的本实施例中的设备可以包括：一个或多个处理器301；一个或多个输入设备302，一个或多个输出设备303和存储器304。上述处理器301、输入设备302、输出设备303和存储器304通过总线305连接。存储器304用于存储计算机程序，所述计算机程序包括程序，处理器301 用于执行存储器304存储的程序。其中，处理器301被配置用于调用所述程序执行：获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。

进一步地，所述处理器301将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果时，具体用于：将所述训练文本数据中携带指定实体的训练文本数据、实体数据和标签数据输入所述bert模型，得到所述训练文本数据中所述指定实体对应情感类别的词向量；根据所述词向量确定与所述训练文本数据中的所述指定实体对应的情感类别的预测结果。

进一步地，所述处理器301根据所述预测结果确定所述训练文本数据情感分类的损失函数值时，具体用于：获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量；根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值。

进一步地，所述处理器301获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量时，具体用于：获取所述训练文本数据中所述指定实体的位置索引；根据所述训练文本数据中所述指定实体的位置索引计算与所述训练文本数据中所述指定实体关联的相关字的索引；根据所述指定实体的位置索引和所述相关字的索引确定所述训练文本数据中所述指定实体对应的权重词向量。

进一步地，所述处理器301根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值时，具体用于：对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量；根据所述目标词向量确定所述训练文本数据情感分类的损失函数值，所述损失函数值包括正面情感类型的第一损失函数值和负面情感类型的第二损失函数值。

进一步地，所述处理器301将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型时，具体用于：将所述待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类别的概率；根据所述待测试文本数据对应的情感类别的概率，确定最大概率的情感类别为所述待测试文本数据对应的情感类型。

本申请实施例中，计算机设备可以获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。通过这种实施方式，可以自动识别不同实体的情感类别，提高识别实体的情感类别的准确性。

应当理解，在本申请实施例中，所称处理器301可以是中央处理单元 (CenSral Processing UniS，CPU)，该处理器还可以是其他通用处理器、数字信号处理器 (DigiSal Signal Processor，DSP)、专用集成电路 (ApplicaSion Specific InSegraSed CircuiS，ASIC)、现成可编程门阵列 (Field-Programmable GaSe Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备302可以包括触控板、麦克风等，输出设备303可以包括显示器（LCD等）、扬声器等。

该存储器304可以包括只读存储器和随机存取存储器，并向处理器301 提供指令和数据。存储器304的一部分还可以包括非易失性随机存取存储器。例如，存储器304还可以存储设备类型的信息。

具体实现中，本申请实施例中所描述的处理器301、输入设备302、输出设备303可执行本申请实施例提供的图1所述的方法实施例中所描述的实现方式，也可执行本申请实施例图2所描述的文本情感分析装置的实现方式，在此不再赘述。

本申请实施例中还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现图1所对应实施例中描述的文本情感分析方法，也可实现本申请图2所对应实施例的文本情感分析装置，在此不再赘述。

可选的，本申请涉及的存储介质如计算机可读存储介质可以是非易失性的，也可以是易失性的。

所述计算机可读存储介质可以是前述任一实施例所述的文本情感分析装置的内部存储单元，例如文本情感分析装置的硬盘或内存。所述计算机可读存储介质也可以是所述文本情感分析装置的外部存储装置，例如所述文本情感分析装置上配备的插接式硬盘，智能存储卡（SmarS Media Card, SMC），安全数字（Secure DigiSal, SD）卡，闪存卡（Flash Card）等。进一步地，所述计算机可读存储介质还可以既包括所述文本情感分析装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述文本情感分析装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个计算机可读存储介质中，包括若干指令用以使得一台计算机设备 ( 可以是个人计算机，终端，或者网络设备等 ) 执行本申请各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括：U 盘、移动硬盘、只读存储器 (ROM，Read-Only Memory)、随机存取存储器 (RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

需要强调的是，为进一步保证上述数据的私密和安全性，上述数据还可以存储于一区块链的节点中。其中，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所述，仅为本申请的部分实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。

Claims

一种文本情感分析方法，其中，所述方法包括：

获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；

将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；

根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；

将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。
根据权利要求1所述的方法，其中，所述将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果之前，还包括：

对添加情感类别标签后的训练文本数据进行分类处理，将所述训练文本数据分为三类数据，所述三类数据包括携带指定实体的训练文本数据、实体数据和标签数据；

所述将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，包括：

将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果。
根据权利要求2所述的方法，其中，所述将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，包括：

将所述训练文本数据中携带指定实体的训练文本数据、实体数据和标签数据输入所述bert模型，得到所述训练文本数据中所述指定实体对应情感类别的词向量；

根据所述词向量确定与所述训练文本数据中的所述指定实体对应的情感类别的预测结果。
根据权利要求3所述的方法，其中，所述根据所述预测结果确定所述训练文本数据情感分类的损失函数值，包括：

获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量；

根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值。
根据权利要求4所述的方法，其中，所述获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量，包括：

获取所述训练文本数据中所述指定实体的位置索引；

根据所述训练文本数据中所述指定实体的位置索引计算与所述训练文本数据中所述指定实体关联的相关字的索引；

根据所述指定实体的位置索引和所述相关字的索引确定所述训练文本数据中所述指定实体对应的权重词向量。
根据权利要求4所述的方法，其中，所述根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值，包括：

对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量；

根据所述目标词向量确定所述训练文本数据情感分类的损失函数值，所述损失函数值包括正面情感类型的第一损失函数值和负面情感类型的第二损失函数值。
根据权利要求1所述的方法，其中，所述将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型，包括：

将所述待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类别的概率；

根据所述待测试文本数据对应的情感类别的概率，确定最大概率的情感类别为所述待测试文本数据对应的情感类型。
一种文本情感分析装置，包括：

获取单元，用于获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；

确定单元，用于将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；

训练单元，用于根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；

测试单元，用于将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。
一种计算机设备，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序，所述处理器被配置用于调用所述程序，执行以下方法：

获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；

将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；

根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；

将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。
根据权利要求9所述的计算机设备，其中，所述将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果之前，所述处理器还用于执行：

对添加情感类别标签后的训练文本数据进行分类处理，将所述训练文本数据分为三类数据，所述三类数据包括携带指定实体的训练文本数据、实体数据和标签数据；

所述将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，包括：

将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果。
根据权利要求10所述的计算机设备，其中，执行所述将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，包括：

将所述训练文本数据中携带指定实体的训练文本数据、实体数据和标签数据输入所述bert模型，得到所述训练文本数据中所述指定实体对应情感类别的词向量；

根据所述词向量确定与所述训练文本数据中的所述指定实体对应的情感类别的预测结果。
根据权利要求11所述的计算机设备，其中，执行所述根据所述预测结果确定所述训练文本数据情感分类的损失函数值，包括：

获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量；

根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值。
根据权利要求12所述的计算机设备，其中，执行所述获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量，包括：

获取所述训练文本数据中所述指定实体的位置索引；

根据所述训练文本数据中所述指定实体的位置索引计算与所述训练文本数据中所述指定实体关联的相关字的索引；

根据所述指定实体的位置索引和所述相关字的索引确定所述训练文本数据中所述指定实体对应的权重词向量；

执行所述根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值，包括：

对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量；

根据所述目标词向量确定所述训练文本数据情感分类的损失函数值，所述损失函数值包括正面情感类型的第一损失函数值和负面情感类型的第二损失函数值。
根据权利要求9所述的计算机设备，其中，执行所述将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型，包括：

将所述待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类别的概率；

根据所述待测试文本数据对应的情感类别的概率，确定最大概率的情感类别为所述待测试文本数据对应的情感类型。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：

获取携带指定实体的训练文本数据，并对所述训练文本数据添加情感类别标签，其中，所述情感类别标签包括第一情感类别标签和第二情感类别标签，所述第一情感类别标签用于指示正面情感类别，所述第二情感类别标签用于指示负面情感类别；

将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，并根据所述预测结果确定所述训练文本数据情感分类的损失函数值；

根据所述损失函数值调整所述bert模型的权重参数，并对调整权重参数后的bert模型进行重新训练，得到情感分析模型；

将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型。
根据权利要求15所述的计算机可读存储介质，其中，所述将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果之前，所述计算机程序被处理器执行时还用于实现：

对添加情感类别标签后的训练文本数据进行分类处理，将所述训练文本数据分为三类数据，所述三类数据包括携带指定实体的训练文本数据、实体数据和标签数据；

所述将所述训练文本数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，包括：

将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果。
根据权利要求16所述的计算机可读存储介质，其中，执行所述将所述携带指定实体的训练文本数据、实体数据和标签数据输入预设的bert模型，得到与所述训练文本数据中的指定实体对应的情感类别的预测结果，包括：

将所述训练文本数据中携带指定实体的训练文本数据、实体数据和标签数据输入所述bert模型，得到所述训练文本数据中所述指定实体对应情感类别的词向量；

根据所述词向量确定与所述训练文本数据中的所述指定实体对应的情感类别的预测结果。
根据权利要求17所述的计算机可读存储介质，其中，执行所述根据所述预测结果确定所述训练文本数据情感分类的损失函数值，包括：

获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量；

根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值。
根据权利要求18所述的计算机可读存储介质，其中，执行所述获取所述训练文本数据距离所述训练文本数据中的所述指定实体的权重词向量，包括：

获取所述训练文本数据中所述指定实体的位置索引；

根据所述训练文本数据中所述指定实体的位置索引计算与所述训练文本数据中所述指定实体关联的相关字的索引；

根据所述指定实体的位置索引和所述相关字的索引确定所述训练文本数据中所述指定实体对应的权重词向量；

执行所述根据所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量，确定所述训练文本数据情感分类的损失函数值，包括：

对所述权重词向量和所述bert模型得到的所述训练文本数据中所述指定实体对应情感类别的词向量进行拼接处理，得到目标词向量；

根据所述目标词向量确定所述训练文本数据情感分类的损失函数值，所述损失函数值包括正面情感类型的第一损失函数值和负面情感类型的第二损失函数值。
根据权利要求15所述的计算机可读存储介质，其中，执行所述将待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类型，包括：

将所述待测试文本数据输入训练得到的情感分析模型进行分析，确定出与所述待测试文本数据对应的情感类别的概率；

根据所述待测试文本数据对应的情感类别的概率，确定最大概率的情感类别为所述待测试文本数据对应的情感类型。