CN116303938A

CN116303938A - 静默检测模型的训练方法、异常会话检测方法及相关设备

Info

Publication number: CN116303938A
Application number: CN202310132163.4A
Authority: CN
Inventors: 白安琪; 蒋宁; 夏粉; 吴海英; 肖冰
Original assignee: Mashang Xiaofei Finance Co Ltd
Current assignee: Mashang Xiaofei Finance Co Ltd
Priority date: 2023-02-17
Filing date: 2023-02-17
Publication date: 2023-06-23

Abstract

本申请公开了一种静默检测模型的训练方法、异常会话检测方法及相关设备。所述训练方法包括：获取多个会话文本数据以及每个会话文本数据所属的业务场景，每个会话文本数据属于一通会话，每个会话文本数据包括多个句子文本以及每个句子文本的会话信息；基于多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征；基于多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，所述样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息；基于所述多个会话文本数据以及所述多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练。

Description

静默检测模型的训练方法、异常会话检测方法及相关设备

技术领域

本申请涉及自然语言处理技术领域，尤其涉及一种静默检测模型的训练方法、异常会话检测方法及相关设备。

背景技术

目前的自然语言处理(Natural Language Processing，NLP)任务主要是在对语言基本语义的理解，以CLUE为例，该任务主要集中于：语义相似度、文本分类、自然语言推理等。NLP的语义理解主要从“有声/已言”去梳理语义，但其实在人类的语言表达中，“无声/未言”的部分也是理解整体语义的不可或缺的一部分，某些情况下，对“无声/未言”部分解析的重要性甚至超过了“有声/已言”部分，正可谓“此处无声胜有声”。

通常认为“未言”的含义可以梳理为两者：一种是“已言”语义的隐含义(比如蕴含义、预设以等)，第二种是“已言”前后的静默段。在第二种“未言”中，可能会包含会话者的无言情绪、其他操作等，因而对于NLP任务而言十分为重要。

传统意义上的静默检测通常是从语音识别的角度，检测语音是静默状态还是激活状态，保证送进语音识别模型的是一段完整的语音。但是，这种方式易受到噪音干扰，检测结果不准确。

发明内容

本申请实施例的目的提供一种模型的训练方法、异常会话检测方法及相关设备，用于从文本分类的角度，根据会话文本数据及其对应的样本静默标签训练静默检测模型，以及利用训练后的静默检测模型识别会话中的静默段信息，从而提高静默检测的准确性。

为了实现上述目的，本申请实施例采用下述技术方案：

第一方面，本申请实施例提供一种静默检测模型的训练方法，包括：

获取多个会话文本数据以及每个会话文本数据所属的业务场景，其中，每个会话文本数据属于一通会话，每个会话文本数据包括多个句子文本以及每个句子文本的会话信息；

基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征；

基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，每个样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息；

基于所述多个会话文本数据以及所述多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练，训练完成的静默检测模型用于对任意一段会话文本数据进行静默检测。

本申请实施例提供的静默检测模型的训练方法，首先，以句子为粒度，根据会话文本数据中的句子文本以及句子文本的会话信息对会话文本数据进行初步的静默检测，确定出会话文本数据中能够反映所属会话中的静默段信息的会话静默特征，该会话静默特征实际上是一种无声的特征；进一步，在会话文本数据的显性的会话文本(有声)的基础上，融合会话静默特征(无声)，为会话文本数据打上对应的样本静默标签，以表示会话文本数据所属会话中的静默段信息；然后，从文本分类的角度，利用会话文本数据及其对应的样本静默标签训练静默检测模型，使得训练后的静默检测模型能够基于待处理会话的会话文本数据，即可识别出待处理会话中的静默段信息，从而可以避免噪音对静默检测过程的干扰，有利于提高静默检测的准确性。

第二方面，本申请实施例提供一种异常会话检测方法，包括：

获取目标会话文本数据，所述目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息；

通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于第一方面所述的静默检测模型的训练方法训练得到；

基于所述静默检测结果，确定所述目标会话文本数据所属的会话是否异常。

本申请实施例提供的异常会话检测方法，从文本分类的角度，利用训练后的静默检测模型对待处理会话的会话文本数据进行分类识别，从而准确识别出待处理会话中是否包含静默段；由于待处理会话中的静默段可能会包含会话者的无言情绪、其他操作等，在准确得到静默段检测结果的基础上，基于静默检测结果，即可准确识别出待处理会话是否异常。

第三方面，本申请实施例提供一种静默检测模型的训练装置，包括：

获取单元，用于获取多个会话文本数据以及每个会话文本数据所属的业务场景，其中，每个会话文本数据属于一通会话，每个会话文本数据包括多个句子文本以及每个句子文本的会话信息；

确定单元，用于基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征；

所述确定单元，还用于基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，每个样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息；

训练单元，用于基于所述多个会话文本数据以及所述多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练，训练完成的静默检测模型用于对任意一段会话文本数据进行静默检测。

第四方面，本申请实施例提供一种异常会话检测装置，包括：

获取单元，用于获取目标会话文本数据，所述目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息；

检测单元，用于通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于第一方面所述的静默检测模型的训练方法训练得到；

确定单元，用于基于所述静默检测结果，确定所述目标会话文本数据所属的会话是否异常。

第五方面，本申请实施例提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如第一方面所述的方法；或者，所述处理器被配置为执行所述指令，以实现如第二方面所述的方法。

第六方面，本申请实施例提供一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如第一方面所述的方法；或者，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如第二方面所述的方法。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的技术方案的应用场景示意图；

图2为本申请的一个实施例提供的一种静默检测模型的训练方法的流程示意图；

图3为本申请的另一个实施例提供的一种静默检测模型的训练方法的流程示意图；

图4为本申请的又一个实施例提供的一种静默检测模型的训练方法的流程示意图；

图5为本申请的一个实施例提供的一种异常会话检测方法的流程示意图；

图6为本申请的一个实施例提供的一种业务优化方法的流程示意图；

图7为本申请的一个实施例提供的一种静默检测模型的训练装置的结构示意图；

图8为本申请的一个实施例提供的一种异常会话检测装置的结构示意图；

图9为本申请的一个实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应理解，这样使用的数据在适当情况下可以互换，以便本申请实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，本说明书和权利要求书中“和/或”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。

相关概念说明：

自然语言处理(NLP)：是人工智能的一个分支，它使计算机能够像人类一样理解、处理和生成语言，即把计算机作为语言研究的强大工具，在计算机的支持下对语言信息进行定量化的研究，并提供可供人与计算机之间能够共同使用的语言描写。自然语言处理包括自然语言理解(Natural Language Understanding，NLU)和自然语言生成(NaturalLanguage Generation，NLG)两部分。

自然语言理解(NLU)：是所有支持机器理解文本内容的方法模型或任务的总称。NLU在文本信息处理系统中扮演者非常重要的角色，是推荐、问答、搜索等系统的必备模块。

自然语言生成(NLG)：是研究使计算机具有人一样的表达和协作的功能，即能够提供一些关键信息及其在机器内部的表达形式，经过一个规划过程，来自动生成一段高质量的自然语言文本。

如背景技术所述，传统意义上的静默检测通常是从语音识别的角度，检测语音是静默状态还是激活状态，保证送进语音识别模型的是一段完整的语音。但是，这种方式易受到噪音干扰，检测结果不准确。

有鉴于此，本申请实施例旨在提出一种静默检测模型的训练方法，首先，以句子为粒度，根据会话文本数据中的句子文本以及句子文本的会话信息对会话文本数据进行初步的静默检测，确定出会话文本数据中能够反映所属会话中的静默段信息的会话静默特征，该会话静默特征实际上是一种无声的特征；进一步，在会话文本数据的显性的会话文本(有声)的基础上，融合会话静默特征(无声)，为会话文本数据打上对应的样本静默标签，以表示会话文本数据所属会话中的静默段信息；然后，从文本分类的角度，利用会话文本数据及其对应的样本静默标签训练静默检测模型，使得训练后的静默检测模型能够基于待处理会话的会话文本数据，即可识别出待处理会话中的静默段信息，从而可以避免噪音对静默检测过程的干扰，有利于提高静默检测的准确性。

进一步，本申请实施例还提出一种异常检测方法，从文本分类的角度，利用训练后的静默检测模型对待处理会话的会话文本数据进行分类识别，从而准确识别出待处理会话中是否包含静默段；由于待处理会话中的静默段可能会包含会话者的无言情绪、其他操作等，在准确得到静默段检测结果的基础上，基于静默检测结果，即可准确识别出待处理会话是否异常。进一步的，如果确定出待处理会话存在异常，可以基于待处理会话对其所属的目标业务场景中业务处理流程进行优化。

应理解，本申请实施例提出的静默检测模型的训练方法以及异常会话检测方法，均可以由电子设备或安装在电子设备中的软件执行。此处所谓的电子设备可以包括终端设备，比如智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端、飞行器等；或者，电子设备还可以包括服务器，比如独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。

为了便于本领域技术人员理解本申请实施例提供的技术方案，下面结合图1所示的一种实际应用场景，对本申请实施例提供的技术方案进行详细说明。应理解，本申请实施例提供的技术方案应用于图1所示的场景只是一种示例性的说明，并不应理解为对本申请实施例的应用场景的限定。

如图1所示，为本申请的一个实施例提供的技术方案应用的一种实际场景。在图1中，各会话者的终端设备1分别通过网络与服务器2通信连接，使得各会话者之间可通过各自的终端设备1进行会话，比如坐席与客户之间可通过终端设备1进行会话。其中，会话形式可以例如包括但不限于语音、视频以及文字等。

在各会话者进行会话的过程中，服务器2可获取并存储每通会话的会话文本数据及每通会话所属的业务场景。一通会话通常包含至少一轮会话，一通会话的会话文本数据可以包括多个句子文本以及每个句子文本的会话信息，句子文本的会话信息可以例如包括但不限于句子文本的会话起止时间、所属的角色(比如客户或坐席)、情感倾向(比如正向或负向)等。可选地，每通会话的会话文本数据还可以包括每通会话的会话标识及备注，会话标识用于唯一标识一通会话，备注可用于协助了解本通会话的主要业务操作及问题等。

实际应用中，若会话的会话形式为语音，则服务器2可利用自动语音识别技术(Automatic Speech Recognition，ASR)对会话的语音数据进行识别和转换，得到会话的会话文本数据。

进一步，服务器2可从文本分类的角度，基于多通会话的会话文本数据及所属的业务场景，为每通会话的会话文本数据打上相应的样本静默标签，以表示每通会话中的静默段信息；进一步，基于多通会话的会话文本数据及对应的样本静默标签，训练一个能够基于会话文本数据对会话进行静默检测的静默检测模型，而后可利用训练后的静默检测模型识别待检测会话中的静默段信息，从而可以避免噪音对静默检测过程的干扰，有利于提高静默检测的准确性。

以下结合附图，详细说明本申请各实施例提供的技术方案。

请参见图2，为本申请的一个实施例提供的一种静默检测模型的训练方法的流程示意图，该方法可以包括如下步骤：

S202，获取多个会话文本数据以及每个会话文本数据所属的业务场景。

其中，每个会话文本数据属于一通会话。每个会话文本数据包括多个句子文本以及每个句子文本的会话信息。每个会话文本数据中的多个句子文本是对每通会话的会话文本以句子为粒度进行划分得到的。每个句子文本的会话信息可以例如包括但不限于句子文本的会话起止时间、所属的角色(比如客户或坐席)、情感倾向(比如正向或负向)等。可选地，每通会话的会话文本数据还可以包括每通会话的会话标识及备注，会话标识用于唯一标识一通会话，备注可用于协助了解本通会话的主要业务操作及问题等。

示例地，如下示出了一通会话的会话文本数据的示例：

call_id＝'0bf02ea3-2077-4494-a211-e57a187c5f71'

text_result＝”[('您好，请问有什么帮到您'–'坐席'–N–负向–1.48–4.36)–('呃你好，你我刚才打过电话，然后说的是还款人是A。这次我还嗯，我现在改了，我自己还。'–'客户'–N–负向–3.5–12.28)–('你把那个什么给调过来吧，我自己还。'–'客户'–N–负向–12.3–15.5)–('嗯，这里是您还款。然后就之前没有沟通过的，主要是协商一个还款的那个问题是吧？'–'坐席'–N–负向–15.38–22.7)–('嗯，你稍等一下'–'客户'–N–负向–23.66–25.48)–('啊，不是我不想。'–'客户'–M–中性–26.32–27.84)–('哎，好的。'–'坐席'–P–正向–26.7–28.12)–('五分钟后。'–'客户'–N–负向–42.3–43.5)–('但是在这个哈'–'客户'–N–负向–47.62–49.58)”

remark＝”已发送专属对公账户，等待客户还款”

scene＝”贷后还款”

在上述会话文本数据中，call_id表示会话文本数据所属会话的会话标识，text_result表示会话文本数据，remark表示会话文本数据对应的备注，secene表示会话文本对应的业务场景。以会话文本数据中的文本句子'您好，请问有什么帮到您'为例，'坐席'表示该文本句子所属的角色为坐席，N和负向表示该文本句子的情感倾向为负向，1.48表示该文本句子在所属会话中的会话开始时间为1.48秒，4.38表示该文本句子在所属会话中的会话结束时间为4.38秒。

S204，基于多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定多个会话文本数据各自的会话静默特征。

本申请实施例中，会话文本数据的会话静默特征是指用于表示会话文本数据中的静默段信息的特征，是一种无声的非文本特征。考虑到不同业务场景下的业务处理流程以及话术配置等不同，为了准确识别不同业务场景下的会话文本数据的会话静默特征，每个业务场景可具有相匹配的静默检测策略，以用于初步检测该业务场景下的会话中的静默段信息，得到会话文本数据的会话静默特征。

本申请实施例中，每个业务场景匹配的静默检测策略可根据实际需要预先配置，本申请实施例对此不作限定。可选地，考虑到静默段通常是两个句子之间的一种“无言”片段，对此，每个业务场景匹配的静默检测策略可以包括该业务场景对应的静默时长阈值。实际应用中，可使用静默时长参数字典的形式对各个业务场景对应的静默时长阈值进行存储，示例地，一种静默时长参数字典为{'提前还款':'120s','逾期还款':'140s'}，其表示提前还款这一业务场景对应的静默时长阈值为120秒，逾期还款这一业务场景下对应的静默时长阈值为140秒。相应地，在上述S204中，可针对每个会话文本数据，基于该会话文本数据中每个句子的会话信息和该会话文本数据所对应的业务场景的静默时长阈值，对该会话文本数据进行初步静默检测，从而确定出该会话文本数据的会话静默特征。

具体而言，上述S204可以包括如下步骤：基于目标会话文本数据中每个句子文本的会话起止时间，确定目标会话文本数据中每个句子文本的静默时长，其中，每个句子文本的静默时长是指该句子文本的会话开始时间与上一个句子文本的会话结束时间之间的间隔时长，目标会话文本数据为上述多个会话文本数据中的任一个；接着，从目标会话文本数据中选取静默时长超过所属业务场景对应的静默时长阈值的句子文本，确定为静默句子文本，其中，静默句子文本是指与上一个句子文本之间出现静默段的句子文本，或者说，静默句子文本是指位于静默段之后的句子文本；进一步，基于目标会话文本数据中的静默句子文本的静默时长和会话信息，确定目标会话文本数据的会话静默特征。

示例地，针对目标会话文本数据中的每个句子文本，若该句子文本的静默时长超过该句子文本所属业务场景对应的静默时长阈值，则为该句子文本打上对应的标签label＝1，以表示该句子文本为静默句子文本；若该句子文本的静默时长未超过该句子文本所属业务场景对应的静默时长阈值，则为该句子文本打上对应的标签label＝0，以表示该句子文本为非静默句子文本。进一步，将目标会话文本数据中每个句子文本对应的标签存储在数据库表中pre_silence_tag列，以供后续查询和使用。

本申请实施例中，为了准确表征会话文本数据中的静默段信息，以便提高后续对会话文本数据进行打标的准确性，会话文本数据的会话静默特征可以包括会话文本数据在多个静默检测维度下的子特征，例如具体可以包括但不限于：静默次数，每个静默句子文本的静默时长，每个静默句子文本的静默绝对位置及静默相对位置，每个静默句子文本的静默前后角色组合，相邻静默距离等。

其中，会话文本数据的静默次数为会话文本数据中的静默句子文本数量；每个静默句子文本的静默绝对位置是指该静默句子文本在所属会话文本数据中的绝对索引(从1开始)；每个静默句子文本的静默相对位置是指该静默句子文本在所属会话文本数据中的绝对索引与该会话文本数据包含的句子文本数量之间的比值；每个静默句子文本的静默前后角色组合包括该静默句子文本的前一个句子文本的角色与该静默句子文本的角色，静默前后角色组合有四种可能的情况：(坐席，坐席)，(坐席，客户)，(客户，坐席)，(客户，客户)；相邻静默距离是指在会话文本数据中包括至少两个静默句子文本时，相邻两个静默句子文本之间间隔的句子文本数量。例如，某个静默句子文本为所属会话文本数据中的第10个句子文本，相邻的上一个静默句子文本为所属会话文本数据中的第8个句子文本，那么，相邻静默距离为2。

S206，基于多个会话文本数据各自的会话静默特征，确定多个会话文本数据各自对应的样本静默标签。

其中，每个样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息。具体地，样本静默标签可用于表示对应的会话文本数据所属会话中是否出现静默段以及出现静默段的情况下所属的静默类别。示例地，样本静默标签可以采用如下层级标签，比如label1＝非静默，label2＝静默-业务查询/办理类静默，label3＝静默-挂机前静默，label4＝静默＝情绪静默等。

由于每个会话文本数据的会话静默特征能够表征该会话文本数据所属会话中的静默段信息，在上述S206中，基于每个会话文本数据的会话静默特征，即可对每个会话文本数据标注相应的样本静默标签。

在一种可选的实现方式中，如图3所示，上述S206可以包括如下步骤：

S261，基于多个会话文本数据各自的会话静默特征和分类模型，确定多个会话文本数据各自对应的第一候选静默标签。

其中，第一候选静默标签可以表示对应的会话文本数据所属会话中是否出现静默以及所出现的静默段的静默类别，或者，第一候选静默标签可以表示对应的会话文本数据所属会话分别在非静默以及各种类型的静默对应的概率。

为了确保第一候选静默标签的准确性，以便提高后续对静默检测模型进行训练的效果，如图4所示，上述S261可以包括如下步骤：

步骤A1，基于各会话文本数据的会话静默特征，从多个会话文本数据中确定各会话文本数据所属会话中出现静默段的第一会话文本数据。

示例地，对于每个会话文本数据，若该会话文本数据的静默次数为0，则可确定该会话文本数据所属会话中未出现静默段；若该会话文本数据的静默次数不为0，则可确定该会话文本数据所属会话中出现静默段。

步骤A2，将第一会话文本数据以及第一会话文本数据的会话静默特征发送给审核平台进行打标处理，以得到第一会话文本数据对应的第一候选静默标签。

示例地，审核平台中预置有打标规则，其可基于打标规则对第一会话文本数据的会话静默特征进行分析和复核，以确定第一会话文本数据所属的会话中的静默段信息，进而为第一会话文本数据打上对应的第一候选静默标签。或者，审核平台也可以将第一会话文本数据的会话静默特征展示给审核人员，由审核人员依据经验对会话静默特征进行复核，进而为第一会话文本数据打上对应的第一候选静默标签。

步骤A3，基于第一会话文本数据的会话静默特征以及第一会话文本数据对应的第一候选静默标签，对分类模型进行训练。

其中，分类模型为具有文本分类能力的模型，比如朴素贝叶斯模型、决策树模型等，具体类型可根据实际需要进行选择，本申请实施例对此不作限定。

可选地，在上述步骤A3中，可以将第一会话文本数据的会话静默特征作为分类模型的训练样本，将第一会话文本数据对应的第一候选静默标签作为训样本对应的标签以提供监督信号，基于训练样本及其对应的标签对分类模型进行迭代训练，以得到最终用于推理的分类模型。

示例地，每轮迭代训练过程如下：通过分类模型对第一会话文本数据进行分类，以确定第一会话文本数据对应的预测静默类别；接着，基于第一会话文本数据对应的预测静默类别和第一候选静默标签，确定分类模型的预测损失；进一步，基于分类模型的预测损失，调整分类模型的模型参数；重复上述过程多次，直至满足预设训练停止条件为止。

值得说明的是，这里的预测静默类别包括非静默和多种静默类别。分类模型的模型参数可以包括但不限于分类模型中各网络层的节点(如神经元)的数量、不同网络层中的节点之间的连接关系及连接边权重、各网络层中的节点对应的偏置等。预设训练停止条件可以包括分类模型的预测损失小于预设损失阈值，或者，分类模型的预测准确率大于预设准确率阈值，或者，迭代训练轮数达到预设轮数等，具体可根据实际需要进行设置，本申请实施例对此不作限定。

可选地，由于第一会话文本数据中的句子文本能够以文本的角度表征会话参与者的意思表示，进而能够反映出第一会话文本数据所属会话中可能出现的静默，比如若会话中出现“非常抱歉让您久等了”这类特殊表达，该会话中有很大可能会出现静默段等，基于此，在分类模型的训练过程中还可融合第一会话文本数据中包含的文本特征，以辅助分类模型从文本语义的角度增强对第一会话文本数据的语义理解，从而能够准确识别出会话文本数据中的静默段信息。

具体而言，在上述步骤A3中，可通过预训练语言模型对第一会话文本数据中的多个句子文本进行编码，得到第一会话文本数据的文本编码特征；进一步，将第一会话文本数据的文本编码特征和会话静默特征作为训练样本，将第一会话文本数据对应的第一候选静默标签作为训练样本对应的标签，对分类模型进行训练。其中，预训练语言模型对句子文本进行编码，是指在理解句子文本的语义的基础上，将句子文本以能够被计算机识别的形式(比如向量)表示，得到句子文本的文本编码特征；由此，第一会话文本数据的文本编码特征即包含了多个句子文本各自的文本编码特征。

实际应用中，预训练语言模型可以采用本领域常用的各种具有文本编码能力的预训练模型，例如roberta、Bert等，具体可根据实际需要进行选择，本申请实施例对此不作限定。优选地，预训练语言模型可以为robert模型，其引入了注意力(Attention)机制，利用每个句子文本及其在第一会话文本数据中的上下文，对每个句子文本进行编码，由此得到的文本编码特征能够准确表征每个句子文本的语义，进而有利于分类模型在训练过程中准确梳理和理解第一会话文本数据的语义，提高分类模型的训练效果。

步骤A4，通过训练后的分类模型基于第二会话文本数据的会话静默特征，对第二会话文本数据进行分类，以得到第二会话文本数据对应的第一候选静默标签。

其中，第二会话文本数据为上述多个会话文本数据中除第一会话文本数据以外的其他会话文本数据。示例地，将第二会话文本数据的会话静默特征输入分类模型，即可得到第二会话文本数据对应的预测静默类别，进而基于预测静默类别即可确定出第二会话文本数据对应的第一候选静默标签。

可选地，在上述步骤A4之后，本申请实施例提供的静默检测模型的训练方法还可以包括：基于上述多个会话文本数据各自的会话静默特征以及上述多个会话文本数据各自对应的第一候选静默标签，调整上述多个会话文本数据各自所属的业务场景匹配的静默检测策略。

示例地，可按照所属业务场景，对上述多个会话文本数据进行分组，得到每个业务场景对应的会话文本数据；然后，针对每个业务场景，具有该业务场景对应的会话文本数据的会话静默特征及第一候选静默标签，确定出现静默段的会话文本数据的会话静默特征的共性、出现静默段的会话文本数据与未出现静默段的会话文本数据在会话静默特征上的差异、会话静默特征中与静默强相关的静默检测维度下的子特征、句子文本中与静默强相关的关键词及静默前后角色组合等，从而梳理出该业务场景下的静默检测基准并更新该业务场景匹配的静默检测策略。

示例地，假设开始时从经验出发，“提前还款”这一业务场景下的静默时长阈值为120秒，但这种静默检测策略是主观的，通过该业务场景下的会话文本数据的会话静默特征及第一候选静默标签进行分析后，得出出现静默段的会话的静默时长通常在110秒以上，且静默前后角色组合通常为(坐席，坐席)等，由此可将该业务场景下的静默检测策略更新为：静默时长阈值为110秒、且静默前后角色组合为(坐席，坐席)。

可以理解的是，在得到上述多个会话文本数据各自对应的第一候选静默标签之后，利用这些会话文本数据各自的会话静默特征及第一候选静默标签，调整相应业务场景匹配的静默检测策略，不仅有利于提高静默检测策略的准确性，还可便于业务人员更好地理解业务，反哺业务。

S262，基于多个会话文本数据各自的会话静默特征对多个会话文本数据进行聚类，以及基于聚类结果确定多个会话文本数据各自对应的第二候选静默标签。

其中，第二候选静默标签可以表示对应的会话文本数据所属会话中是否出现静默以及所出现的静默段的静默类别，或者，第二候选静默标签可以表示对应的会话文本数据所属会话分别在非静默以及各种类型的静默对应的概率。

为了确保第二候选静默标签的准确性，以便提高后续对静默检测模型进行训练的效果，如图4所示，上述S262可以包括如下步骤：

步骤B1，从多个会话文本数据中选取部分会话文本数据作为第三会话文本数据。

可选地，在上述步骤B1中，可从多个会话文本数据中随机选取部分会话文本数据作为第三会话文本数据。

可选地，为了避免某种原因过度影响一种静默类别的判断，可从不同静默检测维度对上述多个第三会话文本数据进行划分，尽量找到使各个静默检测维度与各类静默标签的组合，使后续二次打标过程中见到更加丰富多彩的数据，提高二次打标结果的准确性，从而提高后续训练后的静默检测模型的预测准确性。具体而言，在上述步骤B1中，首先，基于多个会话文本数据各自在多个静默检测维度下的子特征以及多个静默检测维度各自对应的划分阈值，将多个会话文本数据划分为多个子集，每个子集包含至少一个会话文本数据，同一子集中的会话文本数据在各静默检测维度下的子特征与划分阈值之间的大小关系相同；接着，基于预设抽取策略和目标子集中的会话文本数据在多个静默检测维度下的子特征，从目标子集中抽取至少一个会话文本数据作为第三会话文本数据。其中，目标子集为上述多个子集中的任一个，预设抽取策略包括：目标子集中的会话文本数据与从目标子集中抽取出的会话文本数据之间在每个静默检测维度下的子特征分布一致。值得说明的是，各个静默检测维度对应的拆分阈值可根据实际需要进行设置，本申请实施例对此不作限定。

示例地，可将上述多个会话文本数据中在每个静默检测维度的子特征均达到对应的拆分阈值的会话文本数据划分到一个子集中，以及将上述多个会话文本数据中在每个静默检测维度的子特征均未达到对应的拆分阈值的会话文本数据划分到另一个子集中，由此得到多个子集。接着，针对每一个子集，以其中一个静默检测维度“静默次数”为例，若该子集包含0和2两种静默次数的会话文本数据，且这两种静默次数的会话文本数据的数量之比为1:2，从该子集中抽取出的会话文本数据中这两种静默次数的会话文本数据的数量也为1:2，则表示该子集中的会话文本数据与从该子集中抽取出的会话文本数据之间在“静默次数”这一静默检测维度下的子特征分布一致。基于此，可针对每个子集，将使该子集中的会话文本数据与从该子集中抽取出的会话文本数据之间在所有静默检测维度下的子特征均分布一致为目标，从该子集中抽取出部分或全部会话文本数据，作为第三会话文本数据。当然，值得说明的是，若某个子集中仅包含一个会话文本数据，也可以将该会话文本数据作为第三会话文本数据。

步骤B2，将第三会话文本数据以及第三会话文本数据对应的会话静默特征发送至审核平台进行打标处理，以得到第三会话文本数据对应的第二候选静默标签。

需要说明的是，步骤B2的具体实现方式与上述步骤A2的具体实现方式类似，具体可参见上文对步骤A2的详细说明，不再赘述。

步骤B3，基于第三会话文本数据对应的第二候选静默标签对第四会话文本数据进行聚类处理，以得到第四会话文本数据对应的第二候选静默标签。

其中，第四会话文本数据为多个会话文本数据中除第三会话文本数据以外的其他会话文本数据。

具体而言，可采用半监督聚类算法，用一小批具有标签的数据对不具有标签的数据进行聚类，以调整类别数目、距离等，达到为不具有标签的数据完成打标的效果。

可选地，在进行半监督聚类的过程中，首先，可将每个第三会话文本数据作为一个初始的簇中心，基于第三会话文本数据与第四会话文本数据之间的距离，对第四会话文本数据进行聚类，得到当前的多个聚类簇以及每个聚类簇中各会话文本数据对应的伪标签；然后，基于各个会话文本数据对应的伪标签以及其中的第三会话文本数据对应的第二候选静默标签，调整簇中心，并重复上述过程，直至满足预设聚类停止条件为止，其中，预设聚类停止条件可以根据实际需要进行设置，本申请实施例对此不作限定。

可选地，为了提高打标准确性，减少对已有标签的数据的错误识别情况，半监督聚类算法可以采用预设的深度对齐聚类(DeepAligned)算法，上述步骤B3可以包括：基于第三会话文本数据的会话静默特征和第四会话文本数据的会话静默特征，确定第三会话文本数据与第四会话文本数据之间的距离；接着，基于第三会话文本数据对应的第二候选静默标签、第三会话文本数据与第四会话文本数据之间的距离以及预设深度对齐聚类算法，对多个会话文本数据进行聚类，得到多个聚类簇，每个聚类簇对应一种静默标签；进一步，将第四会话文本数据所属聚类簇对应的静默标签，作为第四会话文本数据对应的第二候选静默标签。

其中，第三会话文本数据与第四会话文本数据之间的距离可以采用本领域常用的各种距离表示，比如欧式距离、汉明距离等，具体可根据实际需要进行选择，本申请实施例对此不作限定。

对于预设深度对齐聚类算法，该算法分为两个步骤，即无监督聚类和利用对齐伪标签进行自监督学习。示例地，可首先利用K-means算法等进行无监督聚类，产生多个聚类簇和簇中心；然后根据每个聚类簇中的会话文本数据，确定第四会话文本数据当前对应的伪标签，用于会话静默特征的自监督学习；然后，将第四会话文本数据当前对应的伪标签与所属簇中心进行对齐映射，得到第四会话文本数据对应的对齐伪标签；进一步，利用第四会话文本数据对应的对齐伪标签作为自监督学习目标，通过下游分类任务微调模型参数，得到第四会话文本数据对应的第二候选静默标签。

S263，基于各会话文本数据各自对应的第一候选静默标签和第二候选静默标签，确定各会话文本数据对应的样本静默标签。

示例地，针对每个会话文本数据，若该会话文本数据对应的第一候选静默标签和第二候选静默标签均表示该会话文本数据所属会话中出现业务查询/办理类静默，那么，可确定该会话文本数据所属会话中出现业务查询/办理类静默，进而为该会话文本数据打上相应的样本静默标签。

又如，针对每个会话文本数据，若该会话文本数据对应的第一候选静默标签表示该会话文本数据所属会话中出现业务查询/办理类静默的概率为0.7，第二候选静默标签表示该会话文本数据所属会话中出现业务查询/办理类静默的概率为0.8，那么，通过对第一候选静默标签和第二候选静默标签进行加权处理，得到该会话文本数据所属会话中出现业务查询/办理类静默的概率为0.75，大于预设概率阈值0.5，那么，可确定该会话文本数据所属会话中出现业务查询/办理类静默，进而为该会话文本数据打上相应的样本静默标签。

本申请实施例在此示出了上述S206的一种具体实现方式。当然，应理解，上述S206还可以通过其他方式实现，比如将每个会话文本数据及其会话静默特征发送给审核平台进行打标处理，得到每个会话文本数据对应的样本静默标签；又如，基于上述多个会话文本数据各自的会话静默特征对上述多个会话文本数据进行聚类，进而基于聚类结果确定上述多个会话文本数据各自对应的样本静默标签，等等，本申请实施例对此不作限定。

S208，基于多个会话文本数据以及多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练。

训练完成的静默检测模型用于对任意一段会话文本数据进行静默检测。其中，静默检测模型为具有文本分类能力的模型，其具体结构可以根据实际需要进行设置，本申请实施例对此不作限定。可选地，静默检测模型可以包括预训练语言模型和文本分类模型，其中，预训练语言模型用于对输入的会话文本数据中的句子文本进行编码，以得到会话文本数据的文本编码特征；文本分类模型用于基于会话文本数据的文本编码特征和会话静默特征对会话文本数据进行分类，以得到会话文本数据中的静默段信息。

在上述S208中，可将多个会话文本数据按照预设比例(比如8:2)拆分为训练集和测试集，利用训练集中的会话文本数据及其对应的样本静默标签，对静默检测模型进行训练；然后，利用测试集中的会话文本数据集其对应的样本静默标签，对训练后的静默检测模型进行测试。重复上述过程多次，直至静默检测模型满足预设训练停止条件为止，其中，预设训练停止条件可以包括静默检测模型的预测损失小于预设损失阈值，或者，静默检测模型的预测准确率大于预设准确率阈值，或者，迭代训练轮数达到预设轮数等，具体可根据实际需要进行设置，本申请实施例对此不作限定。

上述S208的具体实现方式与上文中步骤A3的具体实现方式类似，具体可参见上文对步骤A3的详细说明，不再赘述。

本申请的一个或多个实施例提供的静默检测模型的训练方法，首先，以句子为粒度，根据会话文本数据中的句子文本以及句子文本的会话信息对会话文本数据进行初步的静默检测，确定出会话文本数据中能够反映所属会话中的静默段信息的会话静默特征，该会话静默特征实际上是一种无声的特征；进一步，在会话文本数据的显性的会话文本(有声)的基础上，融合会话静默特征(无声)，为会话文本数据打上对应的样本静默标签，以表示会话文本数据所属会话中的静默段信息；然后，从文本分类的角度，利用会话文本数据及其对应的样本静默标签训练静默检测模型，使得训练后的静默检测模型能够基于待处理会话的会话文本数据，即可识别出待处理会话中的静默段信息，从而可以避免噪音对静默检测过程的干扰，有利于提高静默检测的准确性。

基于上述训练后的静默检测模型，本申请实施例还提出一种异常会话检测方法。请参见图5，为本申请的一个实施例提供的一种异常会话检测方法的流程示意图，该方法可以包括如下步骤：

S502，获取目标会话文本数据。

其中，目标会话文本数据是指待检测会话的会话文本数据。目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息。

S504，通过静默检测模型基于目标会话文本数据，对目标会话文本数据进行静默检测，得到静默检测结果。

具体地，将目标会话文本数据输入静默检测模型，即可得到静默检测结果。其中，静默检测结果包括目标会话文本数据所属文本中的静默段信息，具体可以例如包括但不限于：静默次数，每个静默段的开始时间及结束时间，每个静默段对应的静默类别等。

示例地，目标会话文本数据为：

{"call_id":"0bf02ea3-2077-4494-a211-e57a187c5f71",

"text_result":"[('您好，请问有什么帮您？'-'坐席'-N-负向-1.48-3.46)-('呃你好，你我刚才打过电话，然后说的是还款人是庄家。这次我还嗯，我现在改了，我自己花。'-'客户'-N-负向-3.5-12.28)-('你把那个什么给给调过来吧，我自己画。'-'客户'-N-负向-12.3-15.5)-('嗯，这里是您是还款。然后就之前没有沟通过的，主要是协商一个还款的那个问题是吧？'-'坐席'-N-负向-15.38-22.7)-('嗯，你稍等一下。'-'客户'-N-负向-23.66-25.48)-('啊，不是我不想。'-'客户'-M-中性-26.32-27.84)-('哎，好的。'-'坐席'-P-正向-26.7-28.12)-('五分钟后。'-'客户'-N-负向-42.3-43.5)-('但是在这个哈。'-'客户'-N-负向-47.62-49.58)]",

"remark":"已发送专属对公账户等待客户还款<msxf>客户表示每月会还款，不希望催收联系，已转接还款部门"

}

得到的静默检测结果为：

{"call_id":"0bf02ea3-2077-4494-a211-e57a187c53c1",

"silence_times":2

"silence_details":[(117.50,136.89,"业务查询与办理"),(997.50,1009.54,"结束语前")]

}

其中，silence_times表示静默次数；(117.50,136.89,"业务查询与办理")表示第一个静默段出现在会话中的117.50秒～136.89秒，其静默类别为业务查询与办理；(997.50,1009.54,"结束语前")表示第二个静默段出现在会话中的997.50秒～1009.54秒，其静默类别为结束语前。

S506，基于静默检测结果，确定目标会话文本数据所属的会话是否异常。

示例地，若静默检测结果指示目标会话文本数据所属会话中包含预设静默类别的静默段，比如生气类静默等，则可确定该会话异常；又如，若静默检测结果指示目标会话文本数据所属会话中的静默次数超过预设次数阈值，则可确定该会话异常，等等。

本申请的一个或多个实施例提供的异常会话检测方法，从文本分类的角度，利用训练后的静默检测模型对待处理会话的会话文本数据进行分类识别，从而准确识别出待处理会话中是否包含静默段；由于待处理会话中的静默段可能会包含会话者的无言情绪、其他操作等，在准确得到静默段检测结果的基础上，基于静默检测结果，即可准确识别出待处理会话是否异常。

本申请实施例提供的异常会话检测方法可应用于各种需要进行异常会话检测的场景，比如业务优化等，本申请实施例对此不作限定。下面以业务优化为例，对本申请实施例提供的异常会话检测方法进行说明。

对于业务优化场景而言，目标会话文本数据是指目标业务场景下的多个业务会话文本数据中任意一个。请参见图6，为本申请的又一个实施例提供的一种异常会话检测方法的流程示意图，该方法可以包括如下步骤：

S602，获取目标会话文本数据。

其中，目标会话文本数据是指目标业务场景下的多个业务会话文本数据中任意一个。目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息。

S604，通过静默检测模型基于目标会话文本数据，对目标会话文本数据进行静默检测，得到静默检测结果。

上述S604的具体实现方式与图5所示实施例中S504的具体实现方式类似，具体可参见前文对S504的详细说明，不再赘述。

S606，基于静默检测结果，确定目标会话文本数据所属的会话是否异常。

上述S606的具体实现方式与图5所示实施例中S604的具体实现方式类似，具体可参见前文对S604的详细说明，不再赘述。

S608，若基于静默检测结果确定目标会话文本数据所属的会话异常，则将目标会话文本数据添加至异常数据集。

其中，异常数据集用于存储所述目标业务场景中所属会话异常的业务会话文本数据

S610，基于异常数据集中各个业务会话文本数据，对目标业务场景的业务处理流程进行优化。

示例地，若异常会话中出现生气类静默段，则可基于该异常会话中生气类静默段的前后句子文本，对业务处理流程中的相关话术进行优化；又如，若异常会话中出现困惑类静默段，则可基于该异常会话中困惑类静默段的前后句子文本，确定业务处理流程中导致会话者存在困惑的处理操作，并对该处理操作进行优化，等等。

本申请的一个或多个实施例提供的异常会话检测方法，从文本分类的角度，利用训练后的静默检测模型对业务会话文本数据进行分类识别，从而准确识别出业务会话文本数据所属的会话中是否包含静默段；由于会话中的静默段可能会包含会话者的无言情绪、其他操作等，在准确得到静默段检测结果的基础上，基于静默检测结果，即可准确识别出业务会话文本数据所属的会话是否异常；由于目标业务场景下异常会话的业务会话文本数据能够反映目标业务处理过程中存在的问题，基于异常会话的业务会话文本数据可以准确挖掘无声处提现出的业务处理流程异常，进而可以为业务流程优化提供可行性建议，进一步降低重复进线率，提高业务达成率，减少人工检测业务异常的成本。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

与上述图2所示的静默检测模型的训练方法相对应地，本申请实施例还提出一种静默检测模型的训练装置。请参见图7，为本申请的一个实施例提供的一种静默检测模型的训练装置700的结构示意图，该装置700包括：获取单元710，用于获取多个会话文本数据以及每个会话文本数据所属的业务场景，其中，每个会话文本数据属于一通会话，每个会话文本数据包括多个句子文本以及每个句子文本的会话信息；确定单元720，用于基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征；所述确定单元720，还用于基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，每个样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息；训练单元730，用于基于所述多个会话文本数据以及所述多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练，训练完成的静默检测模型用于对任意一段会话文本数据进行静默检测。

可选地，所述确定单元，基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，包括：基于所述多个会话文本数据各自的会话静默特征和分类模型，确定所述多个会话文本数据各自对应的第一候选静默标签；基于所述多个会话文本数据各自的会话静默特征对所述多个会话文本数据进行聚类，以及基于聚类结果确定所述多个会话文本数据各自对应的第二候选静默标签；基于各会话文本数据各自对应的第一候选静默标签和第二候选静默标签，确定各会话文本数据对应的样本静默标签。

可选地，所述确定单元，基于所述多个会话文本数据各自的会话静默特征和分类模型，确定所述多个会话文本数据各自对应的第一候选静默标签，包括：基于各会话文本数据的会话静默特征，从所述多个会话文本数据中确定各会话文本数据所属会话中出现静默段的第一会话文本数据；将所述第一会话文本数据以及所述第一会话文本数据的会话静默特征发送给审核平台进行打标处理，以得到所述第一会话文本数据对应的第一候选静默标签；基于所述第一会话文本数据的会话静默特征以及所述第一会话文本数据对应的第一候选静默标签，对所述分类模型进行训练；通过训练后的分类模型基于第二会话文本数据的会话静默特征，对所述第二会话文本数据进行分类，以得到所述第二会话文本数据对应的第一候选静默标签，所述第二会话文本数据为所述多个会话文本数据中除所述第一会话文本数据以外的其他会话文本数据。

可选地，所述确定单元，基于所述第一会话文本数据的会话静默特征以及所述第一会话文本数据对应的第一候选静默标签，对所述分类模型进行训练，包括：通过预训练语言模型对所述第一会话文本数据中的多个句子文本进行编码，得到所述第一会话文本数据的文本编码特征；将所述第一会话文本数据的文本编码特征和会话静默特征作为训练样本，将所述第一会话文本数据对应的第一候选静默标签作为所述训练样本对应的标签，对所述分类模型进行训练。

可选地，所述装置700还包括：优化单元，用于在所述确定单元基于所述多个会话文本数据各自的会话静默特征和分类模型，确定所述多个会话文本数据各自对应的第一候选静默标签之后，基于所述多个会话文本数据各自的会话静默特征以及所述多个会话文本数据各自对应的第一候选静默标签，调整与所述多个会话文本数据各自所属的业务场景匹配的静默检测策略。

可选地，所述确定单元，基于所述多个会话文本数据各自的会话静默特征对所述多个会话文本数据进行聚类，以及基于聚类结果确定所述多个会话文本数据各自对应的第二候选静默标签，包括：从所述多个会话文本数据中选取部分会话文本数据作为第三会话文本数据，将所述第三会话文本数据以及所述第三会话文本数据对应的会话静默特征发送至审核平台进行打标处理，以得到所述第三会话文本数据对应的第二候选静默标签；基于所述第三会话文本数据对应的第二候选静默标签，对第四会话文本数据进行聚类处理，以得到所述第四会话文本数据对应的第二候选静默标签，所述第四会话文本数据为所述多个会话文本数据中除所述第三会话文本数据以外的其他会话文本数据。

可选地，每个会话文本数据的会话静默特征包括每个会话文本数据在多个静默检测维度下的子特征，每个静默检测维度具有对应的划分阈值；

所述确定单元，从所述多个会话文本数据中选取部分会话文本数据作为第三会话文本数据，包括：基于所述多个会话文本数据各自在多个静默检测维度下的子特征以及所述多个静默检测维度各自对应的划分阈值，将所述多个会话文本数据划分为多个子集，每个子集包含至少一个会话文本数据，同一子集中的会话文本数据在各静默检测维度下的子特征与划分阈值之间的大小关系相同；基于预设抽取策略和目标子集中的会话文本数据在多个静默检测维度下的子特征，从所述目标子集中抽取至少一个会话文本数据作为第三会话文本数据，其中，所述目标子集为所述多个子集中的任一个，所述预设抽取策略包括所述目标子集中的会话文本数据与从所述目标子集中抽取出的会话文本数据之间在每个静默检测维度下的子特征分布一致。

可选地，所述确定单元，基于所述第三会话文本数据对应的第二候选静默标签，对第四会话文本数据进行聚类处理，以得到所述第四会话文本数据对应的第二候选静默标签，包括：基于所述第三会话文本数据的会话静默特征和所述第四会话文本数据的会话静默特征，确定所述第三会话文本数据与所述第四会话文本数据之间的距离；基于所述第三会话文本数据对应的第二候选静默标签、所述第三会话文本数据与所述第四会话文本数据之间的距离以及预设深度对齐聚类算法，对所述多个会话文本数据进行聚类，得到多个聚类簇，每个聚类簇对应一种静默标签；将所述第四会话文本数据所属聚类簇对应的静默标签，作为所述第四会话文本数据对应的第二候选静默标签。

可选地，每个业务场景对应的静默检测策略包括业务场景对应的静默时长阈值，每个句子文本的会话信息至少包括每个句子文本的会话起止时间和角色；

所述确定单元，基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征，包括：基于目标会话文本数据中每个句子文本的会话起止时间，确定所述目标会话文本数据中每个句子文本的静默时长，其中，每个句子文本的静默时长为对应的句子文本的会话开始时间与上一个句子文本的会话结束时间之间的间隔时长，所述目标会话文本数据为所述多个会话文本数据中的任一个；从所述目标会话文本数据中选取静默时长超过所属业务场景对应的静默时长阈值的句子文本，确定为静默句子文本；基于所述目标会话文本数据中的静默句子文本的静默时长和会话信息，确定所述目标会话文本数据的会话静默特征。

显然，本申请实施例提供的静默检测模型的训练装置能够作为图2所示的静默检测模型的训练方法的执行主体，例如图2所示的静默检测模型的训练方法中，步骤S202可由图7所示的静默检测模型的训练装置中的获取单元执行，步骤S204和S206可由图7所示的静默检测模型的训练装置中的确定单元执行，步骤S208可由图7所示的静默检测模型的训练装置中的训练单元执行。

根据本申请的另一个实施例，图7所示的静默检测模型的训练装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其他实施例中，静默检测模型的训练装置也可以包括其他单元，在实际应用中，这些功能也可以由其他单元协助实现，并且可以由多个单元协作实现。

根据本申请的另一个实施例，可以通过在包括中央处理单元(CentralProcessing Unit，CPU)、随机存取存储介质(Random Access Memory，RAM)、只读存储介质(Read-Only Memory，ROM)等处理元件和存储元件的例如计算机的通用计算设备上，运行能够执行如图2所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图7中所示的静默检测模型的训练装置，以及来实现本申请实施例的静默检测模型的训练方法。所述计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质转载于电子设备中，并在其中运行。

此外，与上述图5所示的异常会话检测方法相对应地，本申请实施例还提供一种文本处理装置。请参考图8，为本申请的一个实施例提供的一种异常会话检测装置800的结构示意图，该装置800可以包括：获取单元810，用于获取目标会话文本数据，所述目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息；检测单元820，用于通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于本申请实施例提供的静默检测模型的训练方法训练得到；确定单元830，用于基于所述静默检测结果，确定所述目标会话文本数据所属的会话是否异常。

可选地，所述目标会话文本数据是指目标业务场景下的多个业务会话文本数据中任意一个；在所述基于所述静默检测结果确定所述目标会话文本数据所属的会话是否异常之后，所述装置还包括：存储单元，用于若基于所述静默检测结果，确定所述目标会话文本数据所属的会话异常，则将所述目标会话文本数据添加至异常数据集，所述异常数据集用于存储所述目标业务场景中所属会话异常的业务会话文本数据；优化单元，用于基于所述异常数据集中各个业务会话文本数据，对所述目标业务场景的业务处理流程进行优化。

显然，本申请实施例提供的异常会话检测装置能够作为图5所示的异常会话检测方法的执行主体，例如图5所示的异常会话检测方法中，步骤S502可由图8所示的异常会话检测装置中的获取单元执行，步骤S504可由图8所示的异常会话检测装置中的检测单元执行，步骤S506可由图8所示的异常会话检测装置中的确定单元执行。

根据本申请的另一个实施例，图8所示的异常会话检测装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其他实施例中，异常会话检测装置也可以包括其他单元，在实际应用中，这些功能也可以由其他单元协助实现，并且可以由多个单元协作实现。

根据本申请的另一个实施例，可以通过在包括CPU、RAM、ROM等处理元件和存储元件的例如计算机的通用计算设备上，运行能够执行如图5所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图8中所示的异常会话检测装置，以及来实现本申请实施例的异常会话检测方法。所述计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质转载于电子设备中，并在其中运行。

图9是本申请的一个实施例电子设备的结构示意图。请参考图9，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成静默检测模型的训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：获取多个会话文本数据以及每个会话文本数据所属的业务场景，其中，每个会话文本数据属于一通会话，每个会话文本数据包括多个句子文本以及每个句子文本的会话信息；基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征；基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，每个样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息；基于所述多个会话文本数据以及所述多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练，训练完成的静默检测模型用于对任意一段会话文本数据进行静默检测。

或者，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成异常会话检测装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：获取目标会话文本数据，所述目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息；通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于本申请实施例提供的静默检测模型的训练方法训练得到；基于所述静默检测结果，确定所述目标会话文本数据所属的会话是否异常。

上述如本申请图2所示实施例揭示的静默检测模型的训练装置执行的方法可以应用于处理器中，或者由处理器实现；或者，上述如本申请图5所示实施例揭示的异常会话检测装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图2的方法，并实现静默检测模型的训练装置在图2至图4所示实施例的功能；或者，该电子设备还可执行图5的方法，并实现异常会话检测装置在图5、图6所示实施例的功能，本申请实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图2所示实施例的方法，并具体用于执行以下操作：获取多个会话文本数据以及每个会话文本数据所属的业务场景，其中，每个会话文本数据属于一通会话，每个会话文本数据包括多个句子文本以及每个句子文本的会话信息；基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征；基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，每个样本静默标签用于表示对应的会话文本数据所属会话中的静默段信息；基于所述多个会话文本数据以及所述多个会话文本数据各自对应的样本静默标签，对静默检测模型进行训练，训练完成的静默检测模型用于对任意一段会话文本数据进行静默检测。

或者，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图5所示实施例的方法，并具体用于执行以下操作：获取目标会话文本数据，所述目标会话文本数据包括多个目标句子文本以及每个目标句子文本的会话信息；通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于本申请实施例提供的静默检测模型的训练方法训练得到；基于所述静默检测结果，确定所述目标会话文本数据所属的会话是否异常。

总之，以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

1.一种静默检测模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述多个会话文本数据各自的会话静默特征，确定所述多个会话文本数据各自对应的样本静默标签，包括：

基于所述多个会话文本数据各自的会话静默特征和分类模型，确定所述多个会话文本数据各自对应的第一候选静默标签；

基于所述多个会话文本数据各自的会话静默特征对所述多个会话文本数据进行聚类，以及基于聚类结果确定所述多个会话文本数据各自对应的第二候选静默标签；

基于各会话文本数据各自对应的第一候选静默标签和第二候选静默标签，确定各会话文本数据对应的样本静默标签。

3.根据权利要求2所述的方法，其特征在于，所述基于所述多个会话文本数据各自的会话静默特征和分类模型，确定所述多个会话文本数据各自对应的第一候选静默标签，包括：

基于各会话文本数据的会话静默特征，从所述多个会话文本数据中确定各会话文本数据所属会话中出现静默段的第一会话文本数据；

将所述第一会话文本数据以及所述第一会话文本数据的会话静默特征发送给审核平台进行打标处理，以得到所述第一会话文本数据对应的第一候选静默标签；

基于所述第一会话文本数据的会话静默特征以及所述第一会话文本数据对应的第一候选静默标签，对所述分类模型进行训练；

通过训练后的分类模型基于第二会话文本数据的会话静默特征，对所述第二会话文本数据进行分类，以得到所述第二会话文本数据对应的第一候选静默标签，所述第二会话文本数据为所述多个会话文本数据中除所述第一会话文本数据以外的其他会话文本数据。

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一会话文本数据的会话静默特征以及所述第一会话文本数据对应的第一候选静默标签，对所述分类模型进行训练，包括：

通过预训练语言模型对所述第一会话文本数据中的多个句子文本进行编码，得到所述第一会话文本数据的文本编码特征；

将所述第一会话文本数据的文本编码特征和会话静默特征作为训练样本，将所述第一会话文本数据对应的第一候选静默标签作为所述训练样本对应的标签，对所述分类模型进行训练。

5.根据权利要求2所述的方法，其特征在于，在基于所述多个会话文本数据各自的会话静默特征和分类模型，确定所述多个会话文本数据各自对应的第一候选静默标签之后，所述方法还包括：

基于所述多个会话文本数据各自的会话静默特征以及所述多个会话文本数据各自对应的第一候选静默标签，调整与所述多个会话文本数据各自所属的业务场景匹配的静默检测策略。

6.根据权利要求2所述的方法，其特征在于，所述基于所述多个会话文本数据各自的会话静默特征对所述多个会话文本数据进行聚类，以及基于聚类结果确定所述多个会话文本数据各自对应的第二候选静默标签，包括：

从所述多个会话文本数据中选取部分会话文本数据作为第三会话文本数据，将所述第三会话文本数据以及所述第三会话文本数据对应的会话静默特征发送至审核平台进行打标处理，以得到所述第三会话文本数据对应的第二候选静默标签；

基于所述第三会话文本数据对应的第二候选静默标签，对第四会话文本数据进行聚类处理，以得到所述第四会话文本数据对应的第二候选静默标签，所述第四会话文本数据为所述多个会话文本数据中除所述第三会话文本数据以外的其他会话文本数据。

7.根据权利要求6所述的方法，其特征在于，每个会话文本数据的会话静默特征包括每个会话文本数据在多个静默检测维度下的子特征，每个静默检测维度具有对应的划分阈值；

所述从所述多个会话文本数据中选取部分会话文本数据作为第三会话文本数据，包括：

基于所述多个会话文本数据各自在多个静默检测维度下的子特征以及所述多个静默检测维度各自对应的划分阈值，将所述多个会话文本数据划分为多个子集，每个子集包含至少一个会话文本数据，同一子集中的会话文本数据在各静默检测维度下的子特征与划分阈值之间的大小关系相同；

基于预设抽取策略和目标子集中的会话文本数据在多个静默检测维度下的子特征，从所述目标子集中抽取至少一个会话文本数据作为第三会话文本数据，其中，所述目标子集为所述多个子集中的任一个，所述预设抽取策略包括所述目标子集中的会话文本数据与从所述目标子集中抽取出的会话文本数据之间在每个静默检测维度下的子特征分布一致。

8.根据权利要求6所述的方法，其特征在于，所述基于所述第三会话文本数据对应的第二候选静默标签，对第四会话文本数据进行聚类处理，以得到所述第四会话文本数据对应的第二候选静默标签，包括：

基于所述第三会话文本数据的会话静默特征和所述第四会话文本数据的会话静默特征，确定所述第三会话文本数据与所述第四会话文本数据之间的距离；

基于所述第三会话文本数据对应的第二候选静默标签、所述第三会话文本数据与所述第四会话文本数据之间的距离以及预设深度对齐聚类算法，对所述多个会话文本数据进行聚类，得到多个聚类簇，每个聚类簇对应一种静默标签；

将所述第四会话文本数据所属的聚类簇对应的静默标签，作为所述第四会话文本数据对应的第二候选静默标签。

9.根据权利要求1所述的方法，其特征在于，每个业务场景对应的静默检测策略包括业务场景对应的静默时长阈值，每个句子文本的会话信息至少包括每个句子文本的会话起止时间和角色；

所述基于所述多个会话文本数据以及每个会话文本数据所属的业务场景匹配的静默检测策略，确定所述多个会话文本数据各自的会话静默特征，包括：

基于目标会话文本数据中每个句子文本的会话起止时间，确定所述目标会话文本数据中每个句子文本的静默时长，其中，每个句子文本的静默时长为对应的句子文本的会话开始时间与上一个句子文本的会话结束时间之间的间隔时长，所述目标会话文本数据为所述多个会话文本数据中的任一个；

从所述目标会话文本数据中选取静默时长超过所属业务场景对应的静默时长阈值的句子文本，确定为静默句子文本；

基于所述目标会话文本数据中的静默句子文本的静默时长和会话信息，确定所述目标会话文本数据的会话静默特征。

10.一种异常会话检测方法，其特征在于，包括：

通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于权利要求1至9中任一项所述的静默检测模型的训练方法训练得到；

11.根据权利要求10所述的方法，其特征在于，所述目标会话文本数据是指目标业务场景下的多个业务会话文本数据中任意一个；在所述基于所述静默检测结果确定所述目标会话文本数据所属的会话是否异常之后，所述方法还包括：

若基于所述静默检测结果，确定所述目标会话文本数据所属的会话异常，则将所述目标会话文本数据添加至异常数据集，所述异常数据集用于存储所述目标业务场景中所属会话异常的业务会话文本数据；

基于所述异常数据集中各个业务会话文本数据，对所述目标业务场景的业务处理流程进行优化。

12.一种静默检测模型的训练装置，其特征在于，包括：

13.一种异常会话检测装置，其特征在于，包括：

检测单元，用于通过静默检测模型基于所述目标会话文本数据，对所述目标会话文本数据进行静默检测，得到静默检测结果，其中，所述静默检测模型为基于权利要求1至9中任一项所述的静默检测模型的训练方法训练得到；

14.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至9中任一项所述的方法；或者，所述处理器被配置为执行所述指令，以实现如权利要求10或11所述的方法。

15.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至9中任一项所述的方法；或者，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求10或11所述的方法。