CN114065742B

CN114065742B - 一种文本检测方法和装置

Info

Publication number: CN114065742B
Application number: CN202111375440.1A
Authority: CN
Inventors: 李长林; 蒋宁; 王洪斌; 吴海英; 权佳成; 曹磊
Original assignee: Mashang Xiaofei Finance Co Ltd
Current assignee: Mashang Xiaofei Finance Co Ltd
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2023-08-25
Anticipated expiration: 2041-11-19
Also published as: CN114065742A

Abstract

本发明公开一种文本检测方法和装置，用以解决文本检测不准确和普适性差的问题。本方案包括：获取至少一个待检测文本，待检测文本包括通讯记录，通讯记录包括基于顺序的多条语句；将待检测文本输入情感识别模型，得到待检测文本的情感极性集合，情感极性集合用于按序表征多条语句各自对应的情感极性；根据情感极性集合确定待检测文本的情感评分值；根据情感评分值确定待检测文本的文本类型。上述情感极性集合能表征文本的情感变化顺序。基于情感变化顺序确定待检测文本的情感评分值，能使情感评分值准确表达待检测文本的情感，进而有效提高文本分类的准确性。而且，本方案可以应用通用型的情感识别模型，无需针对应用场景做模型训练，普适性强。

Description

一种文本检测方法和装置

技术领域

本发明涉及文本检测领域，尤其涉及一种文本检测方法和装置。

背景技术

在文本检测领域，可以通过识别文本内容进行文本分类。由于不同的应用场景要进行的检测往往不同，所以通常要预先训练适用于场景的模型。在训练过程中，需要依赖大量标注样本执行训练，而这些样本需要耗费大量的人力与时间进行打标。训练得到的模型能够适配于所需的应用场景，但不便于扩展迁移到其他应用场景，普适性差。

虽然现有技术中有通用型的情感识别模型，能简单识别单句文本的情感，但这种模型难以对整段、整篇文本的情感进行识别。离散地识别出文本中各句表达的情感，也无法准确确定文本整体表达的情感，识别准确性差。

如何提高文本检测的准确性和普适性，是本申请所要解决的技术问题。

发明内容

本申请实施例的目的是提供一种文本检测方法和装置，用以解决文本检测不准确和普适性差的问题。

第一方面，提供了一种文本检测方法，包括：

获取至少一个待检测文本，所述待检测文本包括通讯记录，所述通讯记录包括基于顺序的多条语句；

将所述待检测文本输入情感识别模型，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；

根据所述情感极性集合确定所述待检测文本的情感评分值；

根据所述情感评分值确定所述待检测文本的文本类型，其中，所述文本类型包括第一类文本以及第二类文本。

第二方面，提供了一种文本检测装置，包括：

获取模块，获取至少一个待检测文本，所述待检测文本包括通讯记录，所述通讯记录包括基于顺序的多条语句；

识别模块，将所述待检测文本输入情感识别模型，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；

第一确定模块，根据所述情感极性集合确定所述待检测文本的情感评分值；

第二确定模块，根据所述情感评分值确定所述待检测文本的文本类型，其中，所述文本类型包括第一类文本以及第二类文本。

第三方面，提供了一种电子设备，该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序，该计算机程序被该处理器执行时实现如第一方面的方法的步骤。

第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质上存储计算机程序，该计算机程序被处理器执行时实现如第一方面的方法的步骤。

在本申请实施例中，通过获取至少一个待检测文本，所述待检测文本包括通讯记录，所述通讯记录包括基于顺序的多条语句；将所述待检测文本输入情感识别模型，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；根据所述情感极性集合确定所述待检测文本的情感评分值；根据所述情感评分值确定所述待检测文本的文本类型，其中，所述文本类型包括第一类文本以及第二类文本。本发明实施例的方案，基于情感识别模型输出的情感极性集合对文本进行评分并分类。其中，情感极性集合中的多个情感极性按序排列，能表征文本的情感变化顺序。随后，基于该情感极性集合中表征的情感变化顺序确定待检测文本的情感评分值，能使情感评分值准确表达待检测文本的情感，进而有效提高文本分类的准确性。而且，本方案可以应用通用型的情感识别模型，无需针对应用场景做模型训练，普适性强。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1a是本发明的一个实施例一种文本检测方法的流程示意图之一。

图1b是本发明的一个实施例预设情感识别模型的训练与应用流程示意图。

图2是本发明的一个实施例一种文本检测方法的流程示意图之二。

图3是本发明的一个实施例一种文本检测方法的流程示意图之三。

图4a是本发明的一个实施例一种文本检测方法的流程示意图之四。

图4b是本发明的一个实施例应用预设评分规则进行评分并存入字典的流程示意图。

图5a是本发明的一个实施例一种文本检测方法的流程示意图之五。

图5b是本发明的一个实施例将录音转换为文本的流程示意图。

图6是本发明的一个实施例一种文本检测装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。本申请中附图编号仅用于区分方案中的各个步骤，不用于限定各个步骤的执行顺序，具体执行顺序以说明书中描述为准。

文本检测技术可以广泛应用于各种应用场景，通过对文本进行检测可以确定文本的类型，进而确定对文本或文本对应的用户执行的后续操作。具体而言，可以检测文本的情感极性，并基于文本表征的情感极性对文本进行分类。

举例而言，在服务领域，为提升用户体验，服务人员往往需要根据用户的情绪变化调整沟通内容。为了提高用户情感状态识别的效率，可以应用预先训练的情感识别模型分析确定用户的情感状态，或者，也可以检测服务人员在对话过程中的情感状态，进而根据服务过程中的情感状态对这段对话进行评价分类。但是，这种情感识别模型往往需要结合实际应用场景基于大量打标签的样本进行训练，且训练得到的模型往往只适用于上述样本对应的场景，不能良好应用于其他的场景中。虽然通用型的语义识别模型能够根据通信内容简单分析语义表层的用户情绪，但实际应用中这种通用模型的识别结果准确性差。

为了解决现有技术中存在的问题，本申请实施例提供一种文本检测方法。在本实施例中，将本方案应用于服务坐席人员与客户的对话场景中进行说明。应理解的是，本方案也可以用于对其他场景的通讯记录进行检测分类，比如，可以对聊天软件中的群聊记录、电商平台的卖家与买家的沟通记录、会议记录等文本进行检测。通讯记录可以包括一个用户发出的内容文本，也可以包括多个用户相互沟通的内容文本。如图1a所示，本方案包括：

S11：获取至少一个待检测文本，所述待检测文本包括通讯记录，所述通讯记录包括基于顺序的多条语句。

其中，待检测文本可以是通讯用户通过通讯软件、短信、邮件等方式发送或接收到的内容，也可以是基于通讯用户电话录音、语音聊天记录或其他语音形式的内容识别得到的文本内容。该通讯记录中的多条语句按顺序排列，其中，如果通讯记录中的各条语句对应有时间戳，则多条语句按照对应的时间戳的先后顺序排列。如果语句不对应有时间戳，则多条语句按照接收或发送的先后顺序排列。

可选的，对于对应有时间戳的多条语句，可以基于语句对应的时间戳确定不同的语句内容之间间隔的时间长度，该时间长度可以用于辅助确定用户的情感状态。比如，用户在短时间内多次发送语句内容，则可以推断用户这段时间内情感比较强烈。

S12：将所述待检测文本输入情感识别模型，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性。

本实施例中的情感识别模型具体可以根据实际需求选定或者基于已标注样本预先训练得到。比如说，参见图1b，利用已标注文本对机器学习模型进行训练，得到训练后的模型。随后就可以将待识别文本输入训练后的模型，由模型进行识别，以输出文本对应的情感极性。

本方案中，具体可以应用朴素贝叶斯、最大熵和支持向量机等机器学习算法，深度学习算法可以使用Bert(Bidirectional Encoder Representations from Transformers)模型、索罗模型(Robert model)、长短期记忆(Long short-term memory,LSTM)等。

上述已标注样本可以包括样本语句内容和标注的情感标签，其中情感标签可以包括多种，比如情感标签包括“正向”、“中性”、“负向”，用以表明对应的语句内容的情感极性。或者，情感标签也可以按等级标注，例如可以是1～5共五个等级，1表明情感非常消极，5表明情感非常积极，2～4阶梯性地表明消极与积极之间的情感极性。

训练后的情感识别模型能对输入的语句内容进行识别，输出相对应的情感极性。在实际应用中，可以直接将通讯记录中的多条语句依序输入情感识别模型，由情感识别模型对各条语句的内容逐一识别，依次输出对应的情感标签。

可选的，上述情感识别模型输出的情感极性集合中的情感极性的数量与输入的语句数量一致，且情感极性集合中的多个情感极性的排列顺序与通讯记录中多条语句的排列顺序一致，使情感极性集合能按序表征多条语句各自对应的情感极性。

为了便于后续处理，可选的，情感识别模型输出的情感极性集合的格式可以对应于输入的通讯记录。比如，将原通讯记录中各条语句分别替换成相对应的情感极性，以得到情感极性集合。或者，也可以根据实际数据处理需求变更上述情感极性集合的存储格式。如果通讯记录中包含多个用户的语句，还可以对不同用户的语句的情感极性进行分类存储。

S13：根据所述情感极性集合确定所述待检测文本的情感评分值。

在本步骤中，根据上述情感极性集合中各个情感极性与排列顺序确定待检测文本的情感评分值。其中，评分规则可以根据实际需求预先设定。

举例而言，假设情感极性集合中包括“正向”、“负向”、“中性”共三类情感极性。那么，待检测文本的情感评分值可以根据情感极性集合中各类情感极性的数量确定。比如说，正向情感极性的数量越多则情感评分值越高，确定的情感评分值能表征待检测文本正向情感的程度。

或者，待检测文本的情感评分值也可以根据情感极性中各类情感极性的连续性确定。比如说，情感极性集合中连续出现同一种情感极性的数量越多则情感评分值越高，确定的情感评分值能表征待检测文本情感的连续程度。

S14：根据所述情感评分值确定所述待检测文本的文本类型，其中，所述文本类型包括第一类文本以及第二类文本。

本步骤中基于上述步骤确定的情感评分值进一步确定待检测文本的文本类型，上述文本类型的划分方式可以与上述步骤中确定情感评分值的方式相匹配。

举例而言，如果上述步骤中确定的情感评分值能表征待检测文本正向情感的程度，那么在本步骤中，可以基于上述情感评分值的大小将待检测文本划分为正向情感文本或负向情感文本，正向情感文本即上述第一类文本，负向情感文本即上述第二类文本。具体而言，将情感评分值大于预设正向文本情感评分值的待检测文本确定为正向情感文本。

如果上述步骤中确定的情感评分值能表征待检测文本情感的连续程度，那么在本步骤中，可以基于上述情感评分值的大小将待检测文本划分为情感连续文本和情感不连续文本，情感连续文本即上述第一类文本，情感不连续文本即上述第二类文本。具体而言，将情感评分值大于预设连续文本情感评分值的待检测文本确定为情感连续文本。

应理解的是，上述文本类型也可以包括更多数量的类型，各类文本的划分标准可以根据实际需求预先设定。

在本申请实施例中，基于情感识别模型输出的情感识别模型对文本进行评分并分类。其中，情感极性集合中的多个情感极性按序排列，能表征文本的情感变化顺序，有效提高文本分类的准确性。而且，本方案能灵活应用于多种场景中，无需基于特定场景的训练样本训练模型，可以应用通用的情感识别模型对各种场景下的通信记录文本进行检测分类。

基于上述实施例提供的方案，可选的，所述情感极性包括负向情感极性。

本申请实施例提供的方案可以针对于负向情感极性进行文本评分与分类。举例而言，在服务领域，为提升用户体验，服务人员往往需要根据用户的情绪变化调整沟通内容。在实际应用中，受制于服务平台、服务内容、技术需求的限制，为用户提供的服务人员的数量可能有多个，不同的服务人员可以在不同的阶段为用户提供不同的服务。后阶段提供服务的人员往往难以了解前阶段服务过程中用户的情绪。通过本实施例提供的方案，能快速准确地识别目标用户在历史时段内的主要情感，准确实现文本分类。如果通过本方案确定用户的沟通文本是负向情感文本，则可以有针对性地优化对该用户的服务。本方案有利于服务人员快速得知目标用户在历史时段内的情感状态，以及时调整沟通内容，从而提高目标用户的服务感知体验。

再比如，基于上述实例中所述的用户与服务人员沟通的应用场景，可以针对于服务人员的沟通文本进行评分与分类。如果通过本方案确定服务人员的文本是负向情感文本，则表明服务人员在提供服务的过程中表达了负向情感的内容，可能导致用户不满，进而可以对服务人员进行提醒与追责，以优化用户的服务体验。

本申请实施例提供的方案以服务坐席人员与客户的对话场景为例进行了说明。上述对话场景具体可以是指服务坐席人员与客户基于社交软件或插件，以及时通信的方式进行沟通的场景。

除了上述实例所述的服务领域的即时通信场景，本方案也可以应用于非即时通信的场景中。比如可以应用于论坛贴吧留言区、视频评论区、视频弹幕等，可以用于对非即时通信的多用户的留言文本进行评分与分类。分类结果可以表明用户的评论习惯，比如，用户的多个留言文本属于负向情感文本，则表明用户留言可能属于消极评论、引战评论，进而可以针对经常连续发送负向情感文本的用户做进一步限制处理等，以优化网络环境。

通过本申请实施例提供的方案，当情感极性集合中包括负向情感极性时，能基于负向情感极性对待检测文本进行评分，进而确定待检测文本的文本类型，从而有针对性地监测文本表达的负向情感。

基于上述实施例提供的方案，可选的，如图2所示，上述步骤S13，包括：

S21：根据所述情感极性集合中的所述负向情感极性确定所述待检测文本对应的多个类别的特征参数，且每个类别的特征参数的数量为至少一个。

本申请实施例提供的方案中，假设情感极性集合中包括“正向”、“负向”、“中性”共三类情感极性。具体而言，情感极性集合中包括顺序排列的情感极性，依次表达待检测文本中各句文本的情感极性。本步骤中，针对情感极性集合中的负向情感极性确定多个类别的特征参数。其中，特征参数可以用于表达负向情感极性的数量、连续性、在情感极性集合中的占比、与其他种类的情感极性的数量大小比较结果等。

举例而言，上述多个类别的特征参数中包括负向情感超过负向阈值的特征参数，该类别的特征参数具体可以包括基于不同负向阈值的多个特征参数。具体而言，该类别的特征参数可以包括情感极性集合中连续出现2个以上负向情感极性的次数、连续出现3个以上负向情感极性的次数、连续出现4个以上负向情感极性的次数等。

S22：根据预设评分规则对所述特征参数进行评分，得到每一所述特征参数对应的第一评分值。

本步骤中所述的预设评分规则可以包括上述特征参数与评分的对应关系，比如说，当特征参数大于预设特征参数时，确定该特征参数对应的第一评分值为1，当特征参数小于或等于预设特征参数时，确定该特征参数对应的第一评分值为0。

其中，预设评分规则可以根据待检测文本的类型、情感识别模型的类型、情感极性集合中的情感极性类型或其他因素预先设定。该预设评分规则可以是应用于多个类别的特征参数的评分规则，也可以对不同类别的特征参数应用不同的评分规则。

S23：根据所述第一评分值确定所述待检测文本的情感评分值。

通过上述步骤能确定多个特征参数分别对应的第一评分值，在本步骤中，根据这些第一评分值确定待检测文本的情感评分值。具体的，可以将上述多个第一评分值进行加和以确定情感评分值，或者，基于预设权重对上述多个第一评分值进行加权以确定情感评分值，又或者，将上述多个第一评分值的中位数、众数、平均数或其他统计参数确定为情感评分值。

通过本申请实施例提供的方案，能针对负向情感极性确定特征参数，通过对特征参数进行评分以确定待检测文本的情感评分值。本方案能对待检测文本表达的负向情感从多种特征的角度进行评分，使确定的情感评分值能更全面地表征待检测文本表达的负向情感。

基于上述实施例提供的方案，可选的，所述特征参数包括第一类特征参数，第二类特征参数，第三类特征参数，其中，所述第一类特征参数用于表征统计所述情感极性集合中所述负向情感极性的总个数，所述第二类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值，所述第三类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数。

下面，基于坐席服务人员与客户沟通的应用场景，结合实例对本方案进行说明。在本实例中，假设坐席服务人员与客户对话的文本为待检测文本，且特征参数包括三类，分别用于表征情感极性集合中所述负向情感极性的总个数、所述情感极性集合中连续出现所述负向情感极性次数的极值、情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数。

在随后的步骤中，可以根据特征参数相对应的预设评分规则分别对特征参数进行评分。比如，预设评分规则包括多个数值区间以及与多个数值区间分别对应的评分。那么，在对特征参数进行评分时，先确定特征参数归属于哪个数值区间，然后将该数值区间对应的评分确定为该特征参数的评分。

举例而言，本方案中的特征参数包括以下各项：

1、Id_neg_emo_num：会话中负向情绪的句子总数，此特征参数属于上述第一类特征参数，用于表征统计所述情感极性集合中所述负向情感极性的总个数。

2、Id_continue_neg_emo_max_num：会话中连续出现负向情绪句子的最大个数，此特征参数属于上述第二类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值。

3、Id_continue_neg_emo_more_num2：会话中连续出现负向情绪句子数量超过2次的数量，此特征参数属于上述第三类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数。

4、Id_continue_neg_emo_more_num3：会话中连续出现负向情绪句子数量超过3次的数量，此特征参数属于上述第三类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数。

应理解的是，本实施例中所述的第一预设阈值可以根据需求自由设定。

基于上述4个特征参数，相对应的预设评分规则如下：

Regulation_1：[30,+∞)，8分；[20,30)，6分；[10,20)，4分；[0,10)，2分。

Regulation_2：[10,+∞)，10分；[6,10)，8分；[2,6)，6分；[0,2)，4分。

Regulation_3：[6,+∞)，6分；[4,6)，4分；[2,4)，2分；[0,2)，1分。

Regulation_4：[6,+∞)，10分；[4,6)，8分；[2,4)，6分；[0,2)，4分。

在确定特征参数之后，对上述4个特征参数分别基于相对应的预设评分规则打分。举例而言，对于上述第一个特征参数，如果会话中负向情绪的句子总数是23个，那么基于相对应的评分规则Regulation_1，23属于[20,30)，因此该特征参数的评分值是6分。

再比如，对于上述第二个特征参数，如果会话中连续出现负向情绪句子的最大个数是3，那么基于相对应的评分规则Regulation_2，3属于[0,2)，因此该特征参数的评分值是4分。

基于上述实例，分别确定各个特征参数的评分值，随后，可以将这些评分值的加和确定为该待检测文本的情感评分值。

本申请实施例中，上述第二类和第三类特征参数是与连续出现负向情感极性相关的特征参数。在情感极性集合中，连续出现负向情感极性能表明负向情感持续且强烈。在实际应用中，也可以针对情感极性集合中的正向情感极性或中性情感极性进行评分与分类。

举例而言，假设一个情感极性集合中顺序排列的情感极性是“正向”“正向”“中性”，另一个情感极性集合中顺序排列的情感极性是“正向”“中性”“正向”。虽然这两个情感极性集合都具有两个正向情感极性和一个中性情感极性，可以确定这两个情感极性集合对应的文本所表达的的情感都是正向。但基于顺序排列结果，第一个情感极性集合中的两个正向连续排列，可以确定出第一个文本表达的正向情感比第二个文本表达的正向情感更持续、程度更强。通过本申请实施例提供的方案，能基于文本顺序表达的情感更准确地对文本进行分类。

其中，第二类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值。比如说，负向情感极性在情感极性结合中出现了5条、3条、4条，那么本实施例中第二类特征参数为5。

通过本申请实施例提供的方案，能够基于负向情感极性从三种特征参数的角度进行评分，这三种特征参数分别表征负向情感极性的总数、极值和连续性，从而使得随后确定的情感评分值能更全面地表征出待检测文本表达的负向情感。

基于上述实施例提供的方案，可选的，如图3所示，每一所述特征参数对应一个预设评分子规则，上述步骤S22，包括；

S31：根据与每一所述特征参数对应的所述预设评分子规则对所述特征参数进行评分，得到每一所述特征参数对应的所述第一评分值。

上述实例中的4个特征参数，与4个评分子规则可以一一对应，其中，预设评分子规则可以基于相对应的特征参数的数值范围设定，从而使得确定的评分值能准确表达特征参数的情感程度。

举例而言，上述Regulation_3对应于会话中连续出现负向情绪句子数量超过2次的数量，上述Regulation_4对应于会话中连续出现负向情绪句子数量超过3次的数量。相比较下，连续出现3次负向比连续出现2次负向的情感程度更大。基于此，在Regulation_3与Regulation_4中对同一区间的数量设定的评分值不同。

举例而言，如果会话中连续出现2次负向的次数是3，基于相对应的评分规则Regulation_3，由于3属于[2,4)，所以确定该特征参数相对应的评分值是2。如果会话中连续出现3次负向的次数是3，基于相对应的评分规则Regulation_4，由于3属于[2,4)，所以确定该特征参数相对应的评分值是6。

由此可见，对于上述两个特征参数，由于连续出现3次负向比连续出现2次负向的情感程度更大，在次数都是3的情况下，连续出现3次负向的评分值6大于连续出现2次负向的评分值2。由此可见，根据与每一所述特征参数对应的预设评分子规则对特征参数进行评分，能更准确地以评分值的形式表达相对应的特征参数，进而使得确定的情感评分值更准确。

本申请实施例提供的方案也可以针对于多用户对话中的某一个用户的文本进行评分与分类。比如说，基于坐席服务人员与客户沟通的应用场景中，针对坐席服务人员的沟通文本进行评分与分类。

首先，可以将坐席与客户对话的文本进行分类，提取出坐席的沟通文本。然后，将坐席的沟通文本作为待检测文本输入情感识别模型，以得到相对应的情感极性集合。接着，根据情感极性集合中的负向情感极性确定特征参数，为了与上述实施例的1～4项特征参数区分，本方案中的特征参数编号为5～8，具体可以包括以下4个：

5、Agent_neg_emo_num：会话中坐席负向情绪的句子总数，此特征参数属于上述第一类特征参数，用于表征统计所述情感极性集合中所述负向情感极性的总个数。

6、Agent_continue_neg_emo_max_num：会话中坐席连续出现负向情绪句子的最大个数，此特征参数属于上述第二类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值。

7、Agent_continue_neg_emo_more_num2：会话中坐席连续出现负向情绪句子数量超过2次的数量，此特征参数属于上述第三类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第二预设阈值的次数。

8、Agent_continue_neg_emo_more_num3：会话中坐席连续出现负向情绪句子数量超过3次的数量，此特征参数属于上述第三类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第二预设阈值的次数。

应理解的是，本方案中所述的第二预设阈值可以与上述实施例中所述的第一预设阈值相同或不同，可以根据实际需求设定。

基于上述4～8项特征参数，相对应的预设评分规则如下：

Regulation_5：[10,+∞)，8分；[6,10)，6分；[2,6)，4分；[0,2)，2分。

Regulation_6：[10,+∞)，10分；[6,10)，8分；[2,6)，6分；[0,2)，4分。

Regulation_7：[6,+∞)，6分；[4,6)，4分；[2,4)，2分；[0,2)，1分。

Regulation_8：[6,+∞)，10分；[4,6)，8分；[2,4)，6分；[0,2)，4分。

本申请实施例中，对本实施例中5～8项特征参数确定评分值的方式与上述实施例中确定1～4项特征参数的评分值的方式相同。根据特征参数的数值大小在相对应的预设评分规则中所属的分类确定相应的评分值。随后，基于各个特征参数的评分值加和确定情感评分值。本实施例确定的情感评分值能够表征坐席与客户对话过程中，坐席负向情感的强烈程度。

可选的，本方案也可以用于针对客户的沟通文本进行评分与分类。首先，可以将坐席与客户对话的文本进行分类，提取出客户的沟通文本。然后，将客户的沟通文本作为待检测文本输入情感识别模型，以得到相对应的情感极性集合。接着，根据情感极性集合中的负向情感极性确定特征参数，为了与上述实施例的1～8项特征参数区分，本方案中的特征参数编号为9～12，具体可以包括以下4个：

9、Customer_neg_emo_num：会话中客户负向情绪的句子总数，此特征参数属于上述第一类特征参数，用于表征统计所述情感极性集合中所述负向情感极性的总个数。

10、Customer_continue_neg_emo_max_num：会话中客户连续出现负向情绪句子的最大个数，此特征参数属于上述第二类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值。

11、Customer_continue_neg_emo_more_num2：会话中客户连续出现负向情绪句子数量超过2次的数量，此特征参数属于上述第三类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第三预设阈值的次数。

12、Customer_continue_neg_emo_more_num3：会话中客户连续出现负向情绪句子数量超过3次的数量，此特征参数属于上述第三类特征参数，用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第三预设阈值的次数。

基于上述9～12项特征参数，相对应的预设评分规则如下：

Regulation_9：[20,+∞)，8分；[10,20)，6分；[5,10)，4分；[0,5)，2分。

Regulation_10：[10,+∞)，6分；[6,10)，4分；[2,6)，2分；[0,2)，1分。

Regulation_11：[6,+∞)，3分；[4,6)，2分；[2,4)，1分；[0,2)，0分。

Regulation_12：[6,+∞)，5分；[4,6)，4分；[2,4)，3分；[0,2)，2分。

本申请实施例中，对本实施例中9～12项特征参数确定评分值的方式与上述实施例中确定1～8项特征参数的评分值的方式相同。根据特征参数的数值大小在相对应的预设评分规则中所属的分类确定相应的评分值。随后，基于各个特征参数的评分值加和确定情感评分值。本实施例确定的情感评分值能够表征坐席与客户对话过程中，客户负向情感的强烈程度。

基于上述实施例提供的方案，也可以结合上述1～12项特征参数综合确定坐席与客户对话文本的情感评分值。比如，将上述12项特征参数的加和确定为对话文本的情感评分值。该情感评分值可以表征对话过程中坐席与客户的负面情感程度，情感评分值越大则表明坐席的负面情感程度越大，进而可以确定历史时段内的沟通过程中，坐席导致沟通出现负面情绪的责任更多。因此，可以预先设置负向情感评分值，如果确定的情感评分值大于预设的负向情感评分值，则将对话文本确定为负向文本，进而可以对负向文本对应的坐席追责。

基于上述实施例提供的方案，可选的，如图4a所示，上述步骤S14，包括：

S41：选取N个所述待检测文本，其中，N为大于等于2的正整数，所述选取的待检测文本的情感评分值大于未被选取的待检测文本的情感评分值；

S42：将所述N个所述待检测文本的文本类型确定为所述第一类文本。

在本实施例中，N为大于等于2正整数，该数值大小可以根据实际需求设定。在选取N个待检测文本的步骤中，可以先对多个待检测文本基于情感评分值的大小进行排序，将数值大的N个数量的待检测文本选取出来并确定为第一类文本。选取的N个待检测文本的情感评分值中的任一个待检测文本的情感评分值都大于未被选取的待检测文本的情感评分值。

通过本申请实施例提供的方案，可以根据情感评分值对多个待检测文本实现分类与筛选。举例而言，多个待检测文本可以是多个坐席人员分别与客户进行沟通的文本，通过本申请实施例提供的方案，能从中选出负向情感程度大的N个文本。该第一类文本可以用作数据基础对相应的坐席人员发送告警信息，以提醒坐席人员调整沟通情绪，提高服务质量。

当待检测文本数量较多时，可以将待检测文本与情感评分值对应存储至字典，如图4b所示，可以将上述实施例中的1～12特征参数的评分值加和存储至字典。字典的格式例如为{对话ID：score}。其中，“对话ID”为该通对话的标识符；“score”为该对话的总得分。进一步的，还可以基于字典中的情感评分值的大小对这些对话文本进行排序，能用于确定出导致沟通出现负面情绪责任较大的对话。

举例而言，假设现有A、B、C三位坐席人员，其中坐席人员A与客户进行了两次沟通，生成了两个待检测文本。坐席人员B和坐席人员C分别与客户进行了一次沟通，分别生成了一个待检测文本。通过本方案实施例，分别对这4个待检测文本确定情感评分值。随后，将待检测文本的标识符与相对应的情感评分值存入字典，可以包括以下4项内容：

{A01：17}{A02：25}{B01：4}{C01：29}

其中A01和A02分别表示坐席人员A与客户进行的两次沟通生成的待检测文本，B01和C01分别表示坐席人员B与坐席人员C分别与客户进行沟通生成的待检测文本。在本实例中，待检测文本和对应的情感评分值以预设格式关联存储至字典中。

上述实例中，待检测文本的标识符根据坐席人员标识确定。可选的，上述待检测文本的标识符也可以是其他形式，比如，可以根据沟通的起始时刻、终止时刻、时间长度确定，或者，根据客户的账户、手机号或其他身份信息确定。另外，待检测文本的标识符也可以表征坐席人员与客户进行沟通所通过的沟通平台。

基于字典中存储的内容，对各项情感评分值按大小顺序进行排序，排序结果如下：

{C01：29}{A02：25}{A01：17}{B01：4}

基于排序后的结果，从中选出负向情感程度大的N个文本。在本实例中，假设N是2。那么，选出的负向情感程度大的文本是C01和A02。进一步的，还可以根据这两个文本的标识确定相对应的坐席人员、客户、沟通时段等关联信息，可以用于进一步追究责任并改善服务。

除了本实例所述的以预设格式存储至字典的形式以外，上述待检测文本与相对应的情感评分值也可以按其他格式存储。

基于上述实施例提供的方案，可选的，如图5a所示，上述步骤S11，包括：

S51：获取多个用户之间的通信录音；

S52：将所述通信语音输入语音识别模型，得到所述语音识别模型输出的至少一个与所述用户对应的待检测文本。

本申请实施例提供的方案可以应用于语音通话的场景中，先将通信录音先识别为文字，以生成待检测文本，随后应用上述任一种实施例提供的方案进行文本分类。上述通信录音可以是多个用户之间打电话、视频通话的录音，也可以是社交软件用户群中多个用户发送的短语音集合。

对于包含有多个用户语音的通信录音，在本实施例中通过语音识别模型对通信录音进行识别。基于音色、语音语调、说话方式等特征对通信录音进行识别，确定用户与语句记录的对应关系，并将音频形式的语句记录转换为文字形式的文本记录。并且，还可以基于通信录音中的时间轴对多条语句文本记录按时间顺序排序进行输出。

举例而言，如图5b所示，本申请实施例首先应用自动语音识别技术(AutomaticSpeech Recognition，ASR)，这是一种是将人的语音转换为文本的技术，能将输入的通话语音转换为文本ID_text。随后，将将ID_text划分为坐席文本Agent_text和客户文本Customer_text。再将这两种文本分别输入情感识别模型Emo_model，分别得到坐席文本的情感极性集合Agent_result和客户文本的情感极性集合Customer_result。

通过本申请实施例提供的方案，能够对音频形式的通信记录进行识别并转换为文字形式，能广泛应用于包含录音的应用场景中。

进一步的，本方案也可以应用于既包含音频形式语句，又包含文本形式语句的场景中。在一些社交软件中，用户可以根据个人喜好选择以文本形式发送内容或者以音频形式发送内容。通过本申请实施例提供的方案，应用语音识别模型，对音频形式的语句记录进行识别并转换为文本形式，以将同时包含有音频和文本形式的通信记录转换为统一的文本形式。随后，可以基于上述任一种实施例提供的方案对文本进行分类。

举例而言，在直播平台、视频平台中，发起直播和观看直播的用户可以通过不同的形式发送语句。比如说，在直播过程中，主播所说的话以语音形式向直播间内的观众播放，观众以输入文字的形式向直播间内的观众和主播发送评论、弹幕等。在此应用场景中，可以生成包含有音频形式语句和文本形式语句的通信记录，进而可以通过本申请任一种实施例提供的方案将通信记录统一转换为文本形式，进而确定主播或观众的情感评分值并对文本进行分类。本方案有利于对网络用户的情绪状态进行自动监听，有利于净化网络环境，加强对网络平台的管理。

本申请实施例能通过构建坐席、客户端情感识别、文本情绪识别、通话质检评价逻辑以及输出有责通话的步骤完成有责文本的检测。在解决现有技术中存在的问题时，往往需要针对于应用场景进行模型的训练，而本方案可以使用通用的情感识别模型，模型只需对文本的情感状态进行识别即可，可以灵活应用于不同的应用场景中。如果需要变更应用场景，可以通过调整预设评分规则等方式提高对新场景的适用性。另外，本方案能够自动实现文本分类，有效降低人工成本，并提高文本分类准确性。

另外，在用户与服务人员沟通的的场景下，假设用户的服务人员从售前服务人员变更为售后服务人员，服务人员可以基于本申请实施例提供的方案快速准确地获知用户与售前服务人员沟通的文本类别，确定用户所处的情感。其中，用户最后一段时间内所处的情感可能延续至今。通过本实施例提供的方案，售后服务人员可以根据文本分类结果确定相应的服务策略，以优化用户的服务体验。

本方案能针对用户的持续的情感极性进行评分与分类，这比简单地根据用户每句话的情感极性识别用户整体的情感极性更准确。举例而言，文本中包含目标用户的50句话，如果分别对这50句话识别情感极性，可以得到25句情感特征为“负向”，25句情感特征为“正向”，从数值上无法准确地确定目标用户在这段时间内那种情感更强烈。而采用本申请实施例提供的方案，能识别出20句连续负向(其他的5句负向穿插在正向中)，可以明显看出本方案能识别出用户的负向情绪，而不只是离散地识别了结果，能更有效地确定文本表达的情感，进而更准确地实现文本分类。

可选的，本方案中的待检测文本中可以是多个用户对话生成的文本，文本中可以包括用户的信息，用以表明文本中的各语句分别是哪个用户发送的。用户的信息可以是用户的身份信息，比如昵称、手机号、终端设备号等，用户的信息能用于对文本中不同的用户进行区分，有利于分别确定不同用户的情感评分值，进而提高文本分类准确性。

为了解决现有技术中存在的问题，如图6所示，本申请实施例还提供一种文本检测方法装置60，包括：

获取模块61，获取至少一个待检测文本，所述待检测文本包括通讯记录，所述通讯记录包括基于顺序的多条语句；

识别模块62，将所述待检测文本输入情感识别模型，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；

第一确定模块63，根据所述情感极性集合确定所述待检测文本的情感评分值；

第二确定模块64，根据所述情感评分值确定所述待检测文本的文本类型，其中，所述文本类型包括第一类文本以及第二类文本。

通过本申请实施例提供的装置，获取至少一个待检测文本，所述待检测文本包括通讯记录，所述通讯记录包括基于顺序的多条语句；将所述待检测文本输入情感识别模型，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；根据所述情感极性集合确定所述待检测文本的情感评分值；根据所述情感评分值确定所述待检测文本的文本类型，其中，所述文本类型包括第一类文本以及第二类文本。本发明实施例的方案，基于情感识别模型输出的情感识别模型对文本进行评分并分类。其中，情感极性集合中的多个情感极性按序排列，能表征文本的情感变化顺序，有效提高文本分类的准确性。而且，本方案能灵活应用于多种场景中，无需基于特定场景的训练样本训练模型，可以应用通用的情感识别模型对各种场景下的通信记录文本进行检测分类。

其中，本申请实施例提供的装置中的上述模块还可以实现上述方法实施例提供的方法步骤。或者，本申请实施例提供的装置还可以包括除上述模块以外的其他模块，用以实现上述方法实施例提供的方法步骤。且本申请实施例提供的装置能够实现上述方法实施例所能达到的技术效果。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种文本检测方法，其特征在于，包括：

将所述待检测文本输入情感识别模型_，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；

根据所述情感极性集合确定所述待检测文本的情感评分值，包括：根据所述情感极性集合中的负向情感极性确定所述待检测文本对应的特征参数，根据所述待检测文本对应的特征参数确定所述待检测文本的情感评分值；其中，所述特征参数包括第二类特征参数和第三类特征参数，所述第二类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值，所述第三类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数；

2.如权利要求1所述的方法，其特征在于，根据所述待检测文本对应的特征参数确定所述待检测文本的情感评分值，包括：

根据预设评分规则对所述待检测文本对应的特征参数进行评分，得到每一所述特征参数对应的第一评分值，每个类别的特征参数的数量为至少一个；

根据所述第一评分值确定所述待检测文本的情感评分值。

3.如权利要求1所述的方法，其特征在于，所述特征参数还包括第一类特征参数，其中，所述第一类特征参数用于表征统计所述情感极性集合中所述负向情感极性的总个数。

4.如权利要求2所述的方法，其特征在于，每一所述特征参数对应一个预设评分子规则，所述根据预设评分规则对所述特征参数进行评分，得到每一所述特征参数对应的第一评分值，包括；

根据与每一所述特征参数对应的所述预设评分子规则对所述特征参数进行评分，得到每一所述特征参数对应的所述第一评分值。

5.如权利要求1所述的方法，其特征在于，所述根据所述情感评分值确定所述待检测文本的文本类型，包括：

选取N个所述待检测文本，其中，N为大于等于2的正整数，所述选取的待检测文本的情感评分值大于未被选取的待检测文本的情感评分值；

将所述N个所述待检测文本的文本类型确定为所述第一类文本。

6.如权利要求1所述的方法，其特征在于，获取至少一个待检测文本，包括：

获取多个用户之间的通信录音；

将所述通信语音输入语音识别模型，得到所述语音识别模型输出的至少一个与所述用户对应的待检测文本。

7.一种文本检测方法装置，其特征在于，包括：

识别模块，将所述待检测文本输入情感识别模型_，得到所述待检测文本的情感极性集合，所述情感极性集合用于按序表征所述多条语句各自对应的情感极性；

第一确定模块，根据所述情感极性集合确定所述待检测文本的情感评分值，包括：根据所述情感极性集合中的负向情感极性确定所述待检测文本对应的特征参数，根据所述待检测文本对应的特征参数确定所述待检测文本的情感评分值；其中，所述特征参数包括第二类特征参数和第三类特征参数，所述第二类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值，所述第三类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数；

8.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的方法的步骤。