CN113724738B

CN113724738B - 语音处理方法、决策树模型训练方法、装置、设备及存储介质

Info

Publication number: CN113724738B
Application number: CN202111016575.9A
Authority: CN
Inventors: 梁国铿
Original assignee: Silicon Based Kunshan Intelligent Technology Co ltd
Current assignee: Silicon Based Kunshan Intelligent Technology Co ltd
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2024-04-23
Anticipated expiration: 2041-08-31
Also published as: CN113724738A

Abstract

本申请涉及人工智能技术和智慧城市领域，具体公开了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质，所述方法包括：获取坐席当前的通话文本；获取预设产品对应的标准话术，根据标准话术中的条款将标准话术中的多个语句进行拼接，得到多个第一拼接语句；将通话文本拆分分割成多个语句，计算多个语句与多个第一拼接语句的相似度，并根据相似度将多个所述语句进行拼接，得到多个第二拼接语句；计算第二拼接语句与第一拼接语句的语句相似度，以及根据通话文本的词频表计算每个第二拼接语句相对词频表的词频分值；将第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到坐席质检结果。

Description

语音处理方法、决策树模型训练方法、装置、设备及存储介质

技术领域

本申请涉及人工智能领域，尤其涉及一种语音处理方法、决策树模型训练方法、装置、设备及存储介质。

背景技术

坐席在通过电话给客户介绍产品时，需要正确完整地介绍产品，比如产品的条款、产品的构成、产品的方案等均需要给客户一一介绍，坐席介绍的内容不可以有遗漏和错误，比如要介绍a产品的条款却说了b产品。为了提高坐席的服务质量，因此需要对坐席进行质检，即检查坐席是否完整地介绍产品内容。目前的坐席质检方式是通过人工监听录音的方式实现对坐席质检的，人工监听效率较低。

发明内容

本申请提供了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质，以提高坐席质检的准确率，尤其对坐席是否完整地介绍产品内容，可以给出较好的质检结果。

第一方面，本申请提供了一种基于坐席质检系统的语音处理方法，所述坐席质检系统包括电话系统和检测装置，所述检测装置用于对所述电话系统的通话进行检测，所述方法包括：

获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本；

获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句；

将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；

计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值；

将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到所述坐席质检结果。

第二方面，本申请还提供了一种决策树模型训练方法，所述决策树模型训练方法包括：

获取预设产品的标准话术和训练样本，所述训练样本包括多个样本；

根据所述标准话术的条款将每个所述条款下的多个语句进行拼接，得到多个第一拼接语句；

将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；

获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值；

将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数，利用决策树模型进行训练，得到训练好的决策树模型。

第三方面，本申请还提供了一种语音处理装置，所述语音处理装置包括：

获取识别模块，用于获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本；

获取拼接模块，用于获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句；

计算拼接模块，用于将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；

参数计算模块，用于计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值；

输入质检模块，用于将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到所述坐席质检结果。

第四方面，本申请还提供了一种决策树模型训练装置，所述决策树模型训练装置包括：

样本获取模块，用于获取预设产品的标准话术和训练样本，所述训练样本包括多个样本；

第一拼接模块，用于根据所述标准话术的条款将每个所述条款下的多个语句进行拼接，得到多个第一拼接语句；

第二拼接模块，用于将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；

分值计算模块，用于获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值；

模型训练模块，用于将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数，利用决策树模型进行训练，得到训练好的决策树模型。

第五方面，本申请还提供了一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器用于存储计算机程序；所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如本申请实施例提供任意一种所述的语音处理方法，或者任意一种所述的决策树模型训练方法。

第六方面，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如本申请实施例提供任意一种所述的语音处理方法，或者任意一种所述的决策树模型训练方法。

本申请公开了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质，其中决策树模型训练方法用于给坐席质检系统训练决策树模型，语音处理方法利用训练好的决策树模型，能够快速准确地检测出坐席是否完整地介绍产品内容，提高质检效率和准确率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种坐席质检系统的示意性框图；

图2是本申请实施例提供的一种决策树模型训练方法的示意流程图；

图3是本申请实施例提供一种语音处理方法的示意流程图；

图4是本申请实施例提供的一种语音处理装置的示意性框图；

图5是本申请实施例提供一种训练装置的示意性框图；

图6是本申请实施例提供的一种计算机设备的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

坐席在通过电话给客户介绍产品时，需要正确完整地介绍产品，比如产品的条款、产品的构成、产品的方案等均需要给客户一一介绍，坐席介绍的内容不可以有遗漏和错误，比如要介绍a产品的条款却说了b产品。为了提高坐席的服务质量，因此需要对坐席进行质检，即检查坐席是否完整地介绍产品内容。传统的坐席质检是通过人工听录音的方式进行检查，比如设置专门的检查岗位，通过监听通话的方式对坐席进行质检，这种检测方式质检效率较慢，并且不够全面。

为了对坐席是否完整地介绍产品内容进行质检，并提高质检的准确率和坐席质检效率，本申请提供了一种基于坐席质检系统的语音处理方法、决策树模型训练方法、装置、设备及存储介质。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参阅图1，图1示出了本申请实施例提供的一种坐席质检系统的示意性框图。如图1所示，该坐席质检系统100包括电话系统11和检查装置12，坐席可以通过电话系统11给客户进行拨打电话并通过电话给客户介绍产品，检查装置12可以监听并获取坐席通过电话系统11与客户的通话时的语音信息，并对该语音信息进行质检。

需要说明的是，本申请提供的语音处理方法可以应用于检查装置12，还需要说明的是，该检查装置12可以是独立于电话系统11的设备，也可以是电话系统11的部分设备。

还需要说明的是，本申请实施例可以基于人工智能技术对相关的数据进行获取和处理，比如基于NLP模型对语音信息进行识别。其中，人工智能（Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

请参阅图2，图2是本申请实施例提供的一种决策树模型训练方法的示意流程图。该决策树模型训练方法主要是为坐席质检训练决策树模型，利用该决策树模型对坐席进行质检，主要是检测坐席是否完整地介绍产品内容。

如图2所示，该决策树模型训练方法，具体包括：步骤S101至步骤S105。

S101、获取预设产品的标准话术和训练样本，所述训练样本包括多个样本。

其中，标准话术为根据预设产品（比如待推荐产品）的需要介绍的内容而确定的条款所对应的话术，训练样本为用于训练决策树模型的样本数据，该训练样本包括多个样本，每个样本为根据坐席给客户介绍产品时的历史语音信息转换成的文本。

由于不同的产品对应的条款、产品的构成、产品的方案均不相同，因此为了提高坐席质检的准确性，可以针对不同的产品训练不同的决策树模型，即每个产品对应一个决策树模型，当然也可以一系列的产品对应同一个决策树模型。因此要求训练样本为某一个产品（待推荐产品）下的样本数据。

S102、根据所述标准话术的条款将每个所述条款下的多个语句进行拼接，得到多个第一拼接语句。

标准话术包括多项条款，每项条款又包括多个语句，示例性的，比如每项条款包括2个语句，根据标准话术中的条款将所述标准话术中的多个语句进行拼接得到多个第一拼接语句，即为根据每项条款将每项条款下多个语句拼接成每个条款对应的第一拼接语句。

示例性的，比如标准话术中包括3项条款，分别条款A、条款B和条款C；每项条款包括2个语句，分别为条款A包括语句A1和语句A2，条款B包括语句B1和语句B2，条款C包括语句C1和语句C2。根据标准话术中的条款将每项条款下的多个语句进行拼接得到多个第一拼接语句，具体可以得到3个第一拼接语句，分别为第一拼接语句A1A2、第一拼接语句B1B2和第一拼接语句C1C2。

S103、将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句。

将训练样本中的每个样本对应的文本分割成多个语句，具体可以采用语义分割等得到每个样本对应的多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度的大小将每个所述样本的多个语句进行拼接，具体为将与第一拼接语句的相似度较高的多个语句拼接成一个语句，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同。

具体地，可以对标准话术的多个第一拼接语句和训练样本的每个样本对应的文本进行onehot编码，得到标准话术对应的编码向量和训练样本对应的编码向量，以便计算两者之间的相似度。其中，在本申请的实施方式，具体可以使用余弦相似度计算公式计算，余弦相似度计算公式具体表示为：

在该余弦相似度公式中， cos（θ）表示余弦相似度，A_i表示标准话术编码后的编码向量中第i个量， B_i表示训练样本编码后的编码向量中第i个量。

在一些实施例中，将训练样本中的每个样本的文本分割成多个语句，具体可以采用标点对每个样本的文本进行拆分，得到多个语句；当然也可以根据语义将每个样本的文本拆分为多个语句，或者是使用其他方式将每个样本对应的文本拆分为多个语句。

示例性的，比如样本E包括4个语句，分别为语句E1、语句E2、语句E3和语句E4，标准话术的第一拼接语句包括第一拼接语句A1A2、第一拼接语句B1B2和第一拼接语句C1C2。计算每个样本的每个语句与标准话术中每个第一拼接语句的相似度，具体需要计算语句E1与第一拼接语句A1A2、第一拼接语句B1B2和第一拼接语句C1C2的相似度，语句E2与第一拼接语句A1A2、第一拼接语句B1B2和第一拼接语句C1C2的相似度，语句E3与第一拼接语句A1A2、第一拼接语句B1B2和第一拼接语句C1C2的相似度，语句E4与第一拼接语句A1A2、第一拼接语句B1B2和第一拼接语句C1C2的相似度。

根据该相似度的大小将每个样本的多个语句进行拼接，得到多个第二拼接语句，由于相关联的语句均会与某个第一拼接语句具有相似性，因此可以利用与第一拼接语句的相似度，将多个语句进行拼接得到第二拼接语句，并且第二拼接语句的数量与第一拼接语句的数量相同，比如第一拼接语句和第二拼接语句的数量均为3个。

S104、获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值。

具体可以通过两种方式获取到第二拼接语句与第一拼接语句的相似度，一种是利用相似度计算公式重新计算第二拼接语句与第一拼接语句的相似度，另一种是在根据该相似度的大小将训练样本的语句进行拼接得到多个第二拼接语句时，获取第二拼接语句包括的多个语句的相似度，计算多个语句的相似度的平均值，或者选取最大相似度值，将该平均值和最大相似度值作为第二拼接语句与第一拼接语句的语句相似度。

在一些实施例中，可以针对训练样本中的每个样本的文本进行分词，并计算每个样本分词后的词频，根据词频提取该样本对应的关键词，比如将词频大于预设阈值的词作为关键词，或者是按照词频的大小进行从大至小排列，得到排列顺序，从排列顺序中选取TopN词频对应词作为关键词。其中，TopN中的N具体可以是预设的，或者也可以由用户进行实时设定，N具体为正整数。选出来的关键词组成词频表，具体可以将该关键词写入与该样本对应的预设词频表中。

根据词频表计算每个样本的第二拼接语句相对词频表的词频分值，具体为对每个第二拼接语句进行分词，得到第二拼接语句的多个词，判断该词是否出现在词频表中，若该词出现在词频表中，即每匹配一个词加1分，即可以得到每个样本的第二拼接语句的词频分值，如样本包括三个第二拼接语句，这样就可以得到三个第二拼接语句分别对应的3个词频分值。

S105、将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数，利用决策树模型进行训练，得到训练好的决策树模型。

在本申请的实施方式，选择决策树模型，将训练样本中的每个样本的第二拼接语句的语句相似度和词频分值作为该决策树模型的特征参数，进行模型训练，得到训练好的决策树模型，该训练好的决策树模型可以用于对坐席进行质检，尤其是检测坐席是否完整地介绍完预设产品的内容。

示例性的，比如将训练样本中每个样本的第二拼接语句的3个余弦相似度的值与3个关键词分值作为特征参数，使用决策树模型进行训练，得到决策树模型，当然后续还可以不断通过增加样本来优化模型，训练好的决策树模型的输出结果为0与1，0代表违规，1代表合规。

请参阅图3，图3是本申请实施例提供的一种语音处理方法的示意流程图。该语音处理方法主要是检测坐席是否完整地介绍产品内容，以提高坐席质检的准确率，进而提高坐席的服务质量。

下面将结合图1中的坐席质检系统100介绍本申请实施例提供的语音处理方法，其中，该语音处理方法具体应用于坐席质检系统100的检测装置12。

需要说明的是，在本实施例中，可以将上述训练好的决策树模型预先保存在检测装置12中，或者也可以将该训练好的决策树模型保存服务器或云端服务器中，检测装置12通过接口访问该决策树模型。

如图3所示，该语音处理方法，具体包括：步骤S201至步骤S205。

S201、获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本。

该预设产品即为坐席的待推荐产品，即坐席需要给客户介绍的产品。当坐席通过电话系统与客户当前通话介绍预设产品时，通过检测装置获取坐席通过电话系统与客户当前通话时的语音信息，利用语音识别技术对该语音信息进行识别，得到该当前的语音信息对应的文本，即通话文本。

S202、获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句。

由于为了对服务于不同产品的坐席进行质检，因此每个预设产品均会对应有标准话术，由此可以获取所述预设产品对应的标准话术，根据标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句。

S203、将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同。

具体地，将训练样本中的每个样本对应的文本分割成多个语句，具体可以采用语义分割等得到每个样本对应的多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度的大小将每个所述样本的多个语句进行拼接，具体为将与第一拼接语句的相似度较高的多个语句拼接成一个语句，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同。

在一些实施例中，所述计算多个所述语句与多个所述第一拼接语句的相似度，具体为：对多个语句与多个第一拼接语句进行onehot编码，得到所述通话文本的第一编码向量和所述标准话术的第二编码向量；根据所述第一编码向量和所述第二编码向量，利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度。

示例性的，相似度公式为余弦相似度公式，所述余弦相似度公式为：

在该余弦相似度公式中，cos（θ）表示余弦相似度，A_i表示所述第一编码向量中第i个量， B_i表示所述第二编码向量中第i个量。

S204、计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值。

具体地，可以利用上述余弦相似度公式计算第二拼接语句与第一拼接语句的语句相似度。

在一些实施例中，所述语音处理方法还包括：对所述通话文本进行分词，并计算分词后每个词的词频；根据所述词频提取所述通话文本的关键词，将提取的关键词组成词频表。

在一些实施例中，根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值，具体为：对每个所述第二拼接语句进行分词，得到第二拼接语句的多个词；根据第二拼接语句的词是否出现在词频表中，确定所述第二拼接语句相对所述词频表的词频分值。

具体地，对每个第二拼接语句进行分词得到第二拼接语句的多个词，判断该词是否出现在词频表中，若该词出现在词频表中，即每匹配一个词加1分，即可以得到每个样本的第二拼接语句的词频分值。

S205、将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到所述坐席质检结果。

具体地，将第二拼接语句的语句相似度和词频分值输入至预先训练好的决策树模型，该决策树模型的输出结果为0与1，0代表违规，1代表合规，即为该坐席质检结果。

上述实施例提供的语音处理方法，通过将标准话术和训练样本的语句进行合理的拼接，在计算拼接后的语句相似度以及词频分值，作为特征参数来训练决策树模型，由此可以提高决策树模型对坐席的介绍内容完整性的质检的准确率和效率。

请参阅图4，图4是本申请的实施例还提供一种语音处理装置的示意性框图，该语音处理装置300用于执行前述的语音处理方法。其中，该语音处理装置可以配置于服务器或终端中。

其中，服务器可以为独立的服务器，也可以为服务器集群，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)以及大数据和人工智能平台等基础云计算服务的云服务器。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。

如图4所示，语音处理装置300包括：获取识别模块301、获取拼接模块302、计算拼接模块303、参数计算模块304和输入质检模块305。

获取识别模块301，用于获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本。

获取拼接模块302，用于获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句。

计算拼接模块303，用于将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同。

其中，计算拼接模块303，具体还可以用于对多个语句与多个第一拼接语句进行onehot编码，得到所述通话文本的第一编码向量和所述标准话术的第二编码向量；根据所述第一编码向量和所述第二编码向量，利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度。

参数计算模块304，用于计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值。

其中，参数计算模块304，具体还用于对所述通话文本进行分词，并计算分词后每个词的词频；根据所述词频提取所述通话文本的关键词，将提取的关键词组成词频表。

其中，参数计算模块304，具体还用于对每个所述第二拼接语句进行分词，得到第二拼接语句的多个词；根据所述第二拼接语句的词是否出现在词频表中，确定所述第二拼接语句相对所述词频表的词频分值。

输入质检模块305，用于将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到所述坐席质检结果。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的语音处理装置和各模块的具体工作过程，可以参考前述语音处理方法实施例中的对应过程，在此不再赘述。

请参阅图5，图5是本申请的实施例还提供一种决策树模型训练装置的示意性框图，该决策树模型训练装置400用于执行前述的决策树模型训练方法。其中，该决策树模型训练装置可以配置于服务器或终端中。

如图5所示，决策树模型训练装置400包括：样本获取模块401、第一拼接模块402、第二拼接模块403、分值计算模块404和模型训练模块405。

样本获取模块401，用于获取预设产品的标准话术和训练样本，所述训练样本包括多个样本。

第一拼接模块402，用于根据所述标准话术的条款将每个所述条款下的多个语句进行拼接，得到多个第一拼接语句。

第二拼接模块403，用于将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同。

分值计算模块404，用于获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值。

模型训练模块405，用于将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数，利用决策树模型进行训练，得到训练好的决策树模型。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的决策树模型训练装置和各模块的具体工作过程，可以参考前述决策树模型训练方法实施例中的对应过程，在此不再赘述。

上述的语音处理装置可以实现为一种计算机程序的形式，该计算机程序可以在如图6所示的计算机设备上运行。

请参阅图6，图6是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。

参阅图6，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口，其中，存储器可以包括存储介质和内存储器，存储介质包括非易失性存储介质和易失性存储介质。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种语音处理方法，或者决策树模型训练方法。

处理器用于提供计算和控制能力，支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种语音处理方法或者决策树模型训练方法。

该网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器可以是中央处理单元 (Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路 (Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

示例性的，在一个实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

获取预设产品的标准话术和训练样本，所述训练样本包括多个样本；根据所述标准话术的条款将每个所述条款下的多个语句进行拼接，得到多个第一拼接语句；将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值；将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数，利用决策树模型进行训练，得到训练好的决策树模型。

获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本；获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句；将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值；将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到所述坐席质检结果。

在一些实施例中，所述处理器在实现所述计算多个所述语句与多个所述第一拼接语句的相似度时，具体用于实现：

对多个语句与多个第一拼接语句进行onehot编码，得到所述通话文本的第一编码向量和所述标准话术的第二编码向量；根据所述第一编码向量和所述第二编码向量，利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度。

在一些实施例中，所述相似度公式为余弦相似度公式，所述余弦相似度公式为：

在该余弦相似度公式中， cos（θ）表示余弦相似度，A_i表示所述第一编码向量中第i个量， B_i表示所述第二编码向量中第i个量。

在一些实施例中，所述处理器还用于实现：对所述通话文本进行分词，并计算分词后每个词的词频；根据所述词频提取所述通话文本的关键词，将提取的关键词组成词频表。

在一些实施例中，所述处理器实现所述根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值时，还具体用于实现：

对每个所述第二拼接语句进行分词，得到第二拼接语句的多个词；根据所述第二拼接语句的词是否出现在词频表中，确定所述第二拼接语句相对所述词频表的词频分值。

本申请的实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述处理器执行所述程序指令，实现本申请实施例提供的任一项语音处理方法，或者实现本申请实施例提供的任一项决策树模型训练方法。

其中，所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元，例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备，例如所述计算机设备上配备的插接式硬盘、智能存储卡(SmartMedia Card，SMC)、安全数字(Secure Digital，SD)卡、闪存卡(Flash Card)等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种决策树模型训练方法，其特征在于，所述方法包括：

将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；其中，所述计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，包括：对所述标准话术的多个第一拼接语句和训练样本的每个样本对应的文本进行onehot编码，得到所述标准话术对应的编码向量和训练样本对应的编码向量；根据所述标准话术对应的编码向量和训练样本对应的编码向量，利用相似度公式计算所述相似度；所述相似度公式为余弦相似度公式，所述余弦相似度公式为：

在所述余弦相似度公式中，cos（θ）表示余弦相似度， A表示所述标准话术对应的编码向量，B表示所述训练样本对应的编码向量，A_i表示所述标准话术对应的编码向量中第i个量，B_i表示所述训练样本对应的编码向量中第i个量；

获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值；其中，所述第二拼接语句与所述第一拼接语句的语句相似度的计算公式采用所述相似度公式；

2.一种基于坐席质检系统的语音处理方法，其特征在于，所述坐席质检系统包括电话系统和检测装置，所述检测装置用于对所述电话系统的通话进行检测，所述方法包括：

将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；其中，所述计算多个所述语句与多个所述第一拼接语句的相似度，包括：对多个语句与多个第一拼接语句进行onehot编码，得到所述通话文本的第一编码向量和所述标准话术的第二编码向量；根据所述第一编码向量和所述第二编码向量，利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度；所述相似度公式为余弦相似度公式，所述余弦相似度公式为：

在所述余弦相似度公式中，cos（θ）表示余弦相似度，A表示所述第一编码向量，B表示所述第二编码向量，A_i表示所述第一编码向量中第i个量，B_i表示所述第二编码向量中第i个量；

计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值；其中，所述第二拼接语句与所述第一拼接语句的语句相似度的计算公式采用所述余弦相似度公式；

将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到坐席质检结果。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

对所述通话文本进行分词，并计算分词后每个词的词频；

根据所述词频提取所述通话文本的关键词，将提取的关键词组成词频表。

4.根据权利要求2所述的方法，其特征在于，所述根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值，包括：

对每个所述第二拼接语句进行分词，得到第二拼接语句的多个词；

根据所述第二拼接语句的词是否出现在词频表中，确定所述第二拼接语句相对所述词频表的词频分值。

5.一种决策树模型训练装置，其特征在于，包括：

第二拼接模块，用于将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；其中，所述计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，包括：对所述标准话术的多个第一拼接语句和训练样本的每个样本对应的文本进行onehot编码，得到所述标准话术对应的编码向量和训练样本对应的编码向量；根据所述标准话术对应的编码向量和训练样本对应的编码向量，利用相似度公式计算所述相似度；所述相似度公式为余弦相似度公式，所述余弦相似度公式为：

分值计算模块，用于获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值；其中，所述第二拼接语句与所述第一拼接语句的语句相似度的计算公式采用所述相似度公式；

6.一种语音处理装置，其特征在于，包括：

计算拼接模块，用于将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；其中，所述计算多个所述语句与多个所述第一拼接语句的相似度，包括：对多个语句与多个第一拼接语句进行onehot编码，得到所述通话文本的第一编码向量和所述标准话术的第二编码向量；根据所述第一编码向量和所述第二编码向量，利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度；所述相似度公式为余弦相似度公式，所述余弦相似度公式为：

参数计算模块，用于计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值；其中，所述第二拼接语句与所述第一拼接语句的语句相似度的计算公式采用所述余弦相似度公式；

输入质检模块，用于将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到坐席质检结果。

7.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1所述的决策树模型训练方法，或者，权利要求2至4中任一项所述的语音处理方法。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1所述的决策树模型训练方法，或者，权利要求2至4中任一项所述的语音处理方法。