WO2021134177A1

WO2021134177A1 - 说话内容的情感标注方法、装置、设备及存储介质

Info

Publication number: WO2021134177A1
Application number: PCT/CN2019/129836
Authority: WO
Inventors: 冯中发; 黄东延; 熊友军
Original assignee: 深圳市优必选科技股份有限公司
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2021-07-08
Also published as: CN111164589A

Abstract

一种说话内容的情感标注方法、说话内容的情感标注装置、设备及存储介质，该方法包括：获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述(102)；根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签(104)；将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签(106)；根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签(108)。该方法通过对原始语料库进行收集、标注、筛选降噪，使得最终获得的说话内容都是带有精确情感标签的，提高了说话内容的情感标注的精准度，此外，通过预设情感分类器进行自动输出，提高了情感标注的效率。

Description

说话内容的情感标注方法、装置、设备及存储介质

技术领域

本申请涉及情感分析领域，尤其涉及一种说话内容的情感标注方法、装置、设备及存储介质。

背景技术

现有的情感标注方法从海量小说的对话文本中抽取各式各样的说话内容，从对应的说话人的描述中抽取情感词作为说话内容的情感倾向标签，通过现有的情感标注方法可以实现大规模情感文本数据的自动标注。

技术问题

但是现有这种对小说对话内容中的说话内容进行自动标注的方法，得到的情感标注是不精确的。

技术解决方案

基于此，有必要针对上述问题，提供一种说话内容的情感标注方法、装置、设备及存储介质。

第一方面，本申请实施例提供一种说话内容的情感标注方法，该方法包括：

获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述；

根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签；

将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签；

根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，预设情感分类器通过以下步骤进行训练：

获取训练样本集，训练样本集中包括多个训练样本，每个训练样本包括：训练说话内容和与训练说话内容对应的训练情感类别标注；

将训练说话内容作为预设情感分类器的输入，将训练情感类别标注作为预设情感分类器期望的输出，对预设情感分类器进行训练，得到训练好的预设情感分类器。

在一个实施例中，获取训练样本集，包括：

获取说话内容；

根据所述预设情感词典对所述训练说话内容进行情感词识别；

当识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，将所述训练说话内容的情感类别标注为识别到的情感词对应的情感类别；

当没有识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，根据标注指令对所述训练说话内容标注情感类别。

在一个实施例中，根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签，包括：

当说话内容对应的第一情感标签和第二情感标签的情感类别一致时，则保留说话内容对应的数据；

当说话内容对应的第一情感标签和第二情感标签的情感类别不一致时，则删除说话内容对应的数据；

根据保留的说话内容对应的情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，在根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签的步骤之后，还包括：

将第一情感标签根据对应的情感类别进行基础情感归类，得到与相应的说话内容对应的第三情感标签；

根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签,包括：

根据第三情感标签和第二情感标签确定与说话内容对应的精确情感标签。

计算每条说话内容与其他所有第一情感标签对应的说话内容的相似度；

若计算得到的任一相似度大于预设阈值，则将说话内容确定为无情感标签。

第二方面，本申请实施例提供一种说话内容的情感标注装置，该装置包括：

第一获取模块，用于获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述；

第一情感标签确定模块，用于根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签；

第二情感标签确定模块，将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签；

精确情感标签确定模块，用于根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，精确情感标签确定模块还用于：

第三方面，本申请实施例提供一种说话内容的情感标注设备，包括存储器和处理器，存储器中储存有计算机程序，计算机程序被处理器执行时，使得处理器执行如下步骤：

第四方面，本申请实施例提供一种存储介质，储存有计算机程序，计算机程序被处理器执行时，使得处理器执行如下步骤：

有益效果

实施本申请实施例，将具有如下有益效果：

通过上述说话内容的情感标注方法、装置、设备及存储介质，对原始语料库进行收集、标注、筛选降噪，使得最终获得的说话内容的都是带有精确情感标签的，提高了说话内容的情感标注的精准度，此外，通过预设情感分类器进行自动输出，提高了情感标注的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为本申请一个实施例中说话内容的情感标注方法的流程图；

图2为本申请一个实施例中预设情感分类器训练过程的流程图；

图3为本申请一个实施例中获取训练样本的流程图；

图4为本申请一个实施例中得到精确情感标签的流程图；

图5为本申请另一个实施例中说话内容的情感标注方法的流程图；

图6为本申请一个实施例中说话内容的情感标注装置的结构示意图；

图7为本申请一个实施例中说话内容的情感标注设备的内部结构示意图。

本发明的实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，在一个实施例中，提出一种说话内容的情感标注方法，该方法包括：

步骤102，获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述。

其中，原始语料库是指需要进行情感标注的语料库，在该语料库中包含有相应业务领域及相关需求的不同的小说对话，每一条小说对话都包含说话内容和说话人描述两个部分。其中说话人描述具体的是指对说话人表达出对应说话内容时的一个结合说话情境的带有情感的描述，例如“他高兴的说：‘明天放假’”，其中‘高兴’即是对‘他’表达出‘明天放假’这个段说话内容的一个情感描述。

步骤104，根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签。

其中，预设情感词典是预先构建的专业情感词典，该词典中包含有不同的情感词汇，包括形容词、副词、动词等。每一种情感词都有与之对应的情感倾向。通过预设情感词典对说话人描述进行情感词识别，由于每一条小说对话中的说话人描述都会有情感词描述，因此据此可以得到与相应的说话内容对应的第一情感标签，例如通过对“他高兴的说：‘明天放假’”进行识别，就可以得到‘明天放假’对应的‘高兴’情感标签。

步骤106，将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签。

其中，预设情感分类器是基于机器学习的一个用于情感识别分类的虚拟模块，通过将说话内容输入到该预设情感分类器中，可得到与相应说话内容对应的第二情感标签，该第二情感标签是基于对说话内容进行情感词识别处理得到。

步骤108，根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签。

其中，结合第一情感标签和第二情感标签，判断两者的差异情况，最终确定精确的情感标签。

通过对原始语料库进行收集、标注、筛选降噪，使得最终获得的说话内容的都是带有精确情感标签的，提高了说话内容的情感标注的精准度，此外，通过预设情感分类器进行自动输出，提高了情感标注的效率。

如图2所示，在一个实施例中，预设情感分类器通过以下步骤进行训练：

步骤202，获取训练样本集，训练样本集中包括多个训练样本，每个训练样本包括：训练说话内容和与训练说话内容对应的训练情感类别标注。

其中，训练样本集也就是原始语料库中的一部分小说对话，通过一部分小说对话来训练预设情感分类器，预设情感分类器是基于BERT（Bidirectional Encoder Representation from Transformers）的分类模型。BERT是一个双向的transformer，用于对大量未标记的文本数据进行预训练，以学习一种语言表示形式，这种语言表示形式可用于对特定及其学习任务进行微调。

步骤204，将训练说话内容作为预设情感分类器的输入，将训练情感类别标注作为预设情感分类器期望的输出，对预设情感分类器进行训练，得到训练好的预设情感分类器。

其中，将训练样本中的说话内容分别都作为预设情感分类器的输入，将确定了的相应说话内容对应的情感标注作为期望输出，通过输入和期望输出不断的训练预设情感分类器，根据实际输出和期望输出的差值来调整预设情感分类器的权重参数，最终在满足预设条件时完成训练，得到训练好的预设情感分类器。

通过不断的使用样本训练预设情感分类器，从而得到一个较为优越的情感分类器，使得最终输出的结果更加精准，提高了整个情感标注结果的精确度。

如图3所示，在一个实施例中，获取训练样本集，包括：

步骤302，获取说话内容。

其中，说话内容即指用于训练样本集中的说话内容。

步骤304，根据预设情感词典对训练说话内容进行情感词识别。

其中，说话内容是体现情感倾向最直接的地方，因此通过预设情感词典对说话内容进行情感词识别。

步骤306，当识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，将所述训练说话内容的情感类别标注为识别到的情感词对应的情感类别。

其中，通过预设情感词典进行识别时，若说话内容中包含有情感词，则将该情感词对应的情感标注作为该条说话内容样本的期望输出。

步骤308，当没有识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，根据标注指令对所述训练说话内容标注情感类别。

其中，同理的，通过预设情感词典进行识别时，若说话内容中没有包含有情感词，则进行人工判定，接受人工判定的情感标注作为期望输出。具体的根据说话内容中隐含的情感倾向进行判定，例如‘这个桌子上太多灰了’，可以推测出该句话隐含的是偏向低落情感的，因此将低落作为‘这个桌子上太多灰了’的情感标签，并在训练时作为期望输出。

通过建立精确的样本输入和样本期望输出，不断的训练预设情感分类器达到实际输出接近期望输出的目的，使得情感标注的结果更加精准。

如图4所示，在一个实施例中，根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签，包括：

步骤402，当说话内容对应的第一情感标签和第二情感标签的情感类别一致时，则保留说话内容对应的数据。

其中，在得到同一说话内容的第一情感标签和第二情感标签后，进一步判断第一情感标签和第二情感标签的一致性，若一致，则将保留该条数据，实际上也就确定该条说话内容的情感标签是精确的。

步骤404，当说话内容对应的第一情感标签和第二情感标签的情感类别不一致时，则删除说话内容对应的数据。

其中，当判断结果为不一致时，说明该条说话内容的情感标签存在精度问题，因此将该条数据进行删除。在另一个实施例中，也可以保留并将第二情感标签确定为精确的情感标签。

步骤406，根据保留的说话内容对应的情感标签确定与说话内容对应的精确情感标签。

其中，遍历所有说话内容后，保留下来的说话内容皆为经过进一步判断后确定为精确情感标签。

通过进一步判断第一情感标签和第二情感标签的一致性，最终确定出精确的情感标签，使得得到的情感标注精度较高。

在一个实施例中，在根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签的步骤之后，还包括：将第一情感标签根据对应的情感类别进行基础情感归类，得到与相应的说话内容对应的第三情感标签；

根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签,包括：根据第三情感标签和第二情感标签确定与说话内容对应的精确情感标签。

其中，基础情感类别是指常用的情感大类别，一般为几种，比如喜、怒、悲、惊、恐等，而第一情感标签则是对应的具体情感，比如开心、舒畅、愤怒、不满等，通过基础情感类别则可以将上述开心和舒畅确定为喜，对应的将愤怒和不满确定为怒，同理的还可以将其他具体情感类别进行分类。

其中，在本实施中，第二情感标签对应的为基础情感类别，而在上述实施例中，第二情感标签则对应的为具体情感类别。

通过将具体的情感类别进行归并分类，使得得到的情感标注更具有适用性。

在一个实施例中，在根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签的步骤之后，还包括：计算每条说话内容与其他所有第一情感标签对应的说话内容的相似度；若计算得到的任一相似度大于预设阈值，则将说话内容确定为无情感标签。

其中，由于小说对话中对说话人的描述是基于特定场景的，有些话语本身是不含有情感倾向的，但在特定场景中说话人的情感状态使得对应的话具有的情感标签。因此通过进一步判断不同情感标签中说话内容之间的相似度，若相似度大于了预设阈值，说明该说话内容是不含有情感倾向的，不应带有情感标签，则将其确定为无情感标签。例如‘今天是6月20日’该句话本身不含有情感，但在小说对话场景中，若‘6月20日’是说话人的生日或者其他值得开心的日子，则说话人描述会是‘开心’之类的，对应的情感标签也会是‘开心’；然而在另一个场景中‘6月20日’是说话人十分悲伤的一天，因此在该场景下，说话人描述会是‘悲伤’，因此将此类说话内容确定为无情感倾向类别。具体的，若检测到存在与某条说话内容相似度大于预设阈值的其他说话内容时，就判定该说话内容为无情感倾向类别；在另一个实施例中也可以对大于预设阈值的说话内容的数量进行进一步限制。

通过提取出无情感倾向的说话内容，使得情感标注更加精准，也使得数据能够最大化的保留，避免被排除。

如图5所示，在一个实施例中，本申请提供一种说话内容的情感标注方法，该方法包括：

步骤502，获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述。

步骤504，根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签。

步骤506，将第一情感标签根据对应的情感类别归并多个基础情感类别，得到与相应的说话内容对应的第三情感标签。

步骤508，计算每条说话内容与其他所有第一情感标签对应的说话内容的相似度。

步骤510，若计算得到的任一相似度大于预设阈值，则将说话内容确定为无情感标签。

步骤512，将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签。

步骤514，根据第三情感标签和第二情感标签确定与说话内容对应的精确情感标签。

其中，第二情感标签和第三情感标签都为基础情感类别，并且相似度比较时提到的类别也为基础类别。

通过对说话内容的搜集、初步情感标注、归类、排除无情感类别、进一步情感标注、筛选出精确的情感标签，整个过程结合了小说对话中说话内容的特性，一步步的降噪，使得得到的情感标注是十分精确的。

如图6所示，在一个实施例中，本申请提供一种说话内容的情感标注装置，该装置包括：

第一获取模块602，用于获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述；

第一情感标签确定模块604，用于根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签；

第二情感标签确定模块606，将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签；

精确情感标签确定模块608，用于根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，第二情感标签确定模块还用于获取训练样本集，训练样本集中包括多个训练样本，每个训练样本包括：训练说话内容和与训练说话内容对应的训练情感类别标注；将训练说话内容作为预设情感分类器的输入，将训练情感类别标注作为预设情感分类器期望的输出，对预设情感分类器进行训练，得到训练好的预设情感分类器。

在一个实施例中，第二情感标签确定模块还用于获取说话内容；根据所述预设情感词典对所述训练说话内容进行情感词识别；当识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，将所述训练说话内容的情感类别标注为识别到的情感词对应的情感类别；当没有识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，根据标注指令对所述训练说话内容标注情感类别。

在一个实施例中，精确情感标签确定模块还用于当说话内容对应的第一情感标签和第二情感标签的情感类别一致时，则保留说话内容对应的数据；当说话内容对应的第一情感标签和第二情感标签的情感类别不一致时，则删除说话内容对应的数据；根据保留的说话内容对应的情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，上述说话内容的情感标注装置还包括：

第三情感标签确定模块，用于将第一情感标签根据对应的情感类别进行基础情感归类，得到与相应的说话内容对应的第三情感标签。

精确情感标签确定模块还用于根据第三情感标签和第二情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，上述说话内容的情感标注装置还包括：

无情感标签确定模块，用于计算每条说话内容与其他所有第一情感标签对应的说话内容的相似度；若计算得到的任一相似度大于预设阈值，则将说话内容确定为无情感标签。

在一个实施例中，本申请提供一种说话内容的情感标注设备，该说话内容的情感标注设备的内部结构图如图7所示。该说话内容的情感标注设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该说话内容的情感标注设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现说话内容的情感标注方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行说话内容的情感标注方法。本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的说话内容的情感标注设备的限定，具体的说话内容的情感标注设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供的一种说话内容的情感标注方法可以实现为一种计算机程序的形式，计算机程序可在如图7所示的说话内容的情感标注设备上运行。说话内容的情感标注设备的存储器中可存储组成一种说话内容的情感标注装置的各个程序模块。比如，第一获取模块602、第一情感标签确定模块604、第二情感标签确定模块606、精确情感标签确定模块608。

一种说话内容的情感标注设备，包括处理器和存储器，存储器中储存有计算机程序，计算机程序被处理器执行时，使得处理器执行如下步骤：获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述；根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签；将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签；根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，预设情感分类器通过以下步骤进行训练：获取训练样本集，训练样本集中包括多个训练样本，每个训练样本包括：训练说话内容和与训练说话内容对应的训练情感类别标注；将训练说话内容作为预设情感分类器的输入，将训练情感类别标注作为预设情感分类器期望的输出，对预设情感分类器进行训练，得到训练好的预设情感分类器。

在一个实施例中，获取训练样本集，包括：获取说话内容；根据所述预设情感词典对所述训练说话内容进行情感词识别；当识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，将所述训练说话内容的情感类别标注为识别到的情感词对应的情感类别；当没有识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，根据标注指令对所述训练说话内容标注情感类别。

在一个实施例中，根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签，包括：当说话内容对应的第一情感标签和第二情感标签的情感类别一致时，则保留说话内容对应的数据；当说话内容对应的第一情感标签和第二情感标签的情感类别不一致时，则删除说话内容对应的数据；根据保留的说话内容对应的情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，在根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签的步骤之后，计算机程序被处理器执行时，使得处理器还执行如下步骤：将第一情感标签根据对应的情感类别进行基础情感归类，得到与相应的说话内容对应的第三情感标签；根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签,包括：根据第三情感标签和第二情感标签确定与说话内容对应的精确情感标签。

在一个实施例中，在根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签的步骤之后，计算机程序被处理器执行时，使得处理器还执行如下步骤：计算每条说话内容与其他所有第一情感标签对应的说话内容的相似度；若计算得到的任一相似度大于预设阈值，则将说话内容确定为无情感标签。

在一个实施例中，本申请提供一种存储介质，储存有计算机程序，计算机程序被处理器执行时，使得处理器执行如下步骤：获取原始语料库，原始语料库中包含不同的小说对话，小说对话包括：说话内容和说话人描述；根据预设情感词典对说话人描述进行情感词识别，得到与相应的说话内容对应的第一情感标签；将说话内容输入到预设情感分类器中，获取预设情感分类器输出的第二情感标签；根据第一情感标签和第二情感标签确定与说话内容对应的精确情感标签。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。请输入具体实施内容部分。

Claims

一种说话内容的情感标注方法，其特征在于，所述方法包括：

获取原始语料库，所述原始语料库中包含不同的小说对话，所述小说对话包括：说话内容和说话人描述；

根据预设情感词典对所述说话人描述进行情感词识别，得到与相应的所述说话内容对应的第一情感标签；

将所述说话内容输入到预设情感分类器中，获取所述预设情感分类器输出的第二情感标签；

根据所述第一情感标签和所述第二情感标签确定与所述说话内容对应的精确情感标签。
根据权利要求1所述的方法，其特征在于，所述预设情感分类器通过以下步骤进行训练：

获取训练样本集，所述训练样本集中包括多个训练样本，每个训练样本包括：训练说话内容和与所述训练说话内容对应的训练情感类别标注；

将所述训练说话内容作为所述预设情感分类器的输入，将所述训练情感类别标注作为所述预设情感分类器期望的输出，对所述预设情感分类器进行训练，得到训练好的所述预设情感分类器。
根据权利要求2所述的方法，其特征在于，所述获取训练样本集，包括：

获取说话内容；

根据所述预设情感词典对所述训练说话内容进行情感词识别；

当识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，将所述训练说话内容的情感类别标注为识别到的情感词对应的情感类别；

当没有识别到所述训练说话内容中包含有所述预设情感词典中的情感词时，根据标注指令对所述训练说话内容标注情感类别。
根据权利要求1所述的方法，其特征在于，所述根据所述第一情感标签和所述第二情感标签确定与所述说话内容对应的精确情感标签，包括：

当所述说话内容对应的所述第一情感标签和所述第二情感标签的情感类别一致时，则保留所述说话内容对应的数据；

当所述说话内容对应的所述第一情感标签和所述第二情感标签的情感类别不一致时，则删除所述说话内容对应的数据；

根据保留的说话内容对应的情感标签确定与所述说话内容对应的精确情感标签。
根据权利要求1所述的方法，其特征在于，在所述根据预设情感词典对所述说话人描述进行情感词识别，得到与相应的所述说话内容对应的第一情感标签的步骤之后，还包括：

将所述第一情感标签根据对应的情感类别进行基础情感归类，得到与相应的所述说话内容对应的第三情感标签；

所述根据所述第一情感标签和所述第二情感标签确定与所述说话内容对应的精确情感标签,包括：

根据所述第三情感标签和所述第二情感标签确定与所述说话内容对应的精确情感标签。
根据权利要求1所述的方法，其特征在于，在所述根据预设情感词典对所述说话人描述进行情感词识别，得到与相应的所述说话内容对应的第一情感标签的步骤之后，还包括：

计算每条所述说话内容与其他所有所述第一情感标签对应的说话内容的相似度；

若计算得到的任一相似度大于预设阈值，则将所述说话内容确定为无情感标签。
一种说话内容的情感标注装置，其特征在于，所述装置包括：

第一获取模块，用于获取原始语料库，所述原始语料库中包含不同的小说对话，所述小说对话包括：说话内容和说话人描述；

第一情感标签确定模块，用于根据预设情感词典对所述说话人描述进行情感词识别，得到与相应的所述说话内容对应的第一情感标签；

第二情感标签确定模块，将所述说话内容输入到预设情感分类器中，获取所述预设情感分类器输出的第二情感标签；

精确情感标签确定模块，用于根据所述第一情感标签和所述第二情感标签确定与所述说话内容对应的精确情感标签。
根据权利要求7所述的装置，其特征在于，所述精确情感标签确定模块还用于：

当所述说话内容对应的所述第一情感标签和所述第二情感标签的情感类别一致时，则保留所述说话内容对应的数据；

当所述说话内容对应的所述第一情感标签和所述第二情感标签的情感类别不一致时，则删除所述说话内容对应的数据；

根据保留的说话内容对应的情感标签确定与所述说话内容对应的精确情感标签。
一种说话内容的情感标注设备，包括存储器和处理器，所述存储器中储存有计算机程序，其特征在于，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1-6所述任一种方法的步骤。
一种存储介质，储存有计算机程序，其特征在于，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1-6所述任一种方法的步骤。