WO2021078298A1

WO2021078298A1 - 话务质检方法、装置、存储介质及服务器

Info

Publication number: WO2021078298A1
Application number: PCT/CN2020/123657
Authority: WO
Inventors: 刘波
Original assignee: 中兴通讯股份有限公司
Priority date: 2019-10-25
Filing date: 2020-10-26
Publication date: 2021-04-29
Also published as: CN112714217A

Abstract

本申请实施例公开了一种话务质检方法、装置、存储介质及服务器，属于网络监控技术领域。所述方法包括：在话务员与用户进行通话时，获取通话过程中生成的实时音频流；对所述实时音频流进行质检；生成所述实时音频流的质检结果。

Description

话务质检方法、装置、存储介质及服务器

交叉引用

本发明要求在2019年10月25日提交中国专利局、申请号为201911021502.1、发明名称为“话务质检方法、装置、存储介质及服务器”的中国专利申请的优先权，该申请的全部内容通过引用结合在本发明中。

技术领域

本申请实施例涉及网络监控技术领域，特别涉及一种话务质检方法、装置、存储介质及服务器。

背景技术

为了考察和审核话务员的工作情况，规范话务部门的工作，需要对联络中心的话务进行质检。

联络中心通常会对话务员和用户之间的通话内容进行录音，所以，传统的话务质检主要是对录音库中的录音进行抽样，再对抽样得到的录音进行质检。

由于录音库中录音的数量较多，所以，抽样质检的效率较低。另外，在抽样录音时，受限于抽样算法的随机性，可能会遗漏重要和典型的录音，从而导致话务质检存在局限性。

发明内容

本申请实施例提供了一种话务质检方法、装置、存储介质及服务器，用于解决话务质检的效率较低以及存在局限性的问题。所述技术方案如下。

一方面，提供了一种话务质检方法，所述方法包括：在话务员与用户进行通话时，获取通话过程中生成的实时音频流；对所述实时音频流进行质检；生成所述实时音频流的质检结果。

一方面，提供了一种话务质检装置，所述装置包括：获取模块，用于在话务员与用户进行通话时，获取通话过程中生成的实时音频流；质检模块，用于对所述实时音频流进行质检；生成模块，用于生成所述实时音频流的质检结果。

一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的话务质检方法。

一方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如上所述的话务质检方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的话务质检方法的方法流程图；

图2是本申请另一实施例提供的话务质检方法的方法流程图；

图3是本申请另一实施例提供的话务质检方法的流程示意图；

图4是本申请再一实施例提供的话务质检装置的结构框图；

图5是本申请再一实施例提供的话务质检装置的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

请参考图1，其示出了本申请一个实施例提供的话务质检方法的方法流程图，该话务质检方法可以应用于服务器中。该话务质检方法，可以包括以下步骤。

步骤101，在话务员与用户进行通话时，获取通话过程中生成的实时音频流。

话务员和用户之间的通话可以由用户发起，也可以由话务员发起。比如，当用户想要进行业务咨询或业务投诉或给出业务建议时，可以通过用户的终端呼叫联络中心坐席，联络中心坐席会将该通话分配个一个业务员进行接听；或者，当话务员想要向用户推送业务或资讯时，可以通过联络中心坐席呼叫用户的终端，本实施例不对话务员与用户之间的通话发起方式作限定。

在话务员与用户的通话接通时，可以开始采集音频流，在每隔预定时间段后，利用RTP(Real-time Transport Protocol，实时传输协议)对当前时间段内采集到的一段音频流进行编码，得到RTP协议数据包，再通过通信核心网或媒体服务器将该RTP协议数据包发送给服务器。服务器对接收到的每个RTP协议数据包进行解包和解码，再将解码得到的各段音频流组合成实时音频流。

步骤102，对实时音频流进行质检。

服务器可以对实时音频流进行质检，质检流程详见下文中的描述，此处不作赘述。

步骤103，生成实时音频流的质检结果。

本实施例中，服务器可以在质检时实时生成质检结果，也可以在通话结束后生成质检结果，本实施例不作限定。

综上所述，本申请实施例提供的话务质检方法，通过在话务员与用户进行通话时，获取通话过程中生成的实时音频流，再对该实时音频流进行质检，生成该实时音频流的质检结果，这样，可以在通话时进行质检，而无需对通话内容进行录音，再对录音进行抽检，可以提高质检的效率；另外，所有通话都可进行质检，避免出现抽样时遗漏重要和典型的录音的问题，从而提高质检的全面性。

请参考图2，其示出了本申请另一实施例提供的话务质检方法的方法流程图，该话务质检方法可以应用于服务器中。该话务质检方法，可以包括以下步骤。

步骤201，在话务员与用户进行通话时，获取通话过程中生成的实时音频流。

在话务员与用户的通话接通时，可以开始采集音频流，在每隔预定时间段后，利用RTP对当前时间段内采集到的一段音频流进行编码，得到RTP协议数据包，再通过通信核心网或媒体服务器将该RTP协议数据包发送给服务器。服务器对接收到的每个RTP协议数据包进行解包和解码，再将解码得到的各段音频流组合成实时音频流。

步骤202，将实时音频流划分成多个音频片段。

其中，服务器可以预设实时音频流的划分方式，并按照该划分方式对该实时音频流进行划分，得到多个音频片段。比如，划分方式是从实时音频流中截取单位时间的音频，将该音频作为一个音频片段。其中，单位时间可以是任意数值，比如，单位时间可以是1-5秒，本实施例不作限定。

假设单位时间为5秒，则服务器可以从接收到的实时音频流中截取第1-5秒的音频作为第一个音频片段，再从该实时音频流中截取第6-10秒的音频作为第二个音频片段，依此类推，直至截取到实时音频流中最后一个音频片段后停止。

步骤203，对全部或部分音频片段进行质检，得到音频片段的评价信息。

本实施例中，服务器可以在通话结束后，对得到的音频片段进行质检；或者，为了提高质检的实时性，服务器可以在通话过程中实时对得到的音频片段进行质检，这样，在通话结束时即可得到该实时音频流的质检结果，从而提高质检的效率。

若在通话结束后对得到的音频片段进行质检，则服务器可以对得到的全部音频片段进行质检，从而保证质检的全面性；或者，服务器还可以从得到的全部音频片段中筛选出部分音频片段，对该部分音频片段进行质检，从而通过减少质检的音频片段的数量来减少服务器的处理压力，提高质检效率。其中，服务器筛选部分音频片段的方式有很多种，比如，服务器可以每间隔预定个音频片段后选择一个音频片段，或者，服务器可以对每个音频片段进行预处理，根据预处理结果选择音频片段，或者，服务器可以随机选择音频片段，本实施例不作限定。

若在通话过程中实时对得到的音频片段进行质检，则服务器可以在每得到一个音频片段后，对该音频片段进行质检，从而保证质检的全面性；或者，服务器还可以在得到一个音频片段且判断出需要对该音频片段进行质检后，再对该音频片段进行质检，在得到一个音频片段且判断出无需对该音频片段进行质检后，不对该音频片段进行质检，从而通过减少质检的音频片段的数量来减少服务器的处理压力，提高质检效率。其中，服务器判断是否需要对音频片段进行质检的方式有很多种，详见上文中的描述，此处不作赘述。

评价信息是对一个音频片段进行质检所得到的结果。其中，评价信息可以包括音频片段的评分、关键词等等，本实施例不作限定。

其中，生成音频片段的评价信息的实施方式有很多种，比如，当评价信息包括评分时，服务器可以预先对音频片段设置多个质检项，并对每个质检项设置对应的分值，将该音频片段满足的各个质检项的分值相加后得到评分；或者，服务器可以预设评价模型，并对每个评价模型设置对应的分值，将与该音频片段相匹配的分值作为评分。下面以预设评价模型为例，对三种可能的实施方式进行举例说明。

在第一种实施方式中，对全部或部分音频片段中的每个音频片段进行质检，得到音频片段的评价信息，可以包括以下步骤。

1)对于全部或部分音频片段中的每个音频片段，将音频片段转换为文本。

本实施例中，服务器可以在每得到一个需要进行质检的音频片段后，执行步骤1-4来生成该音频片段的评价信息，直至得到所有需要进行质检的音频片段的评价信息后停止。

其中，服务器可以利用任意的语音转文本技术来将音频片段转换为文本，本实施例不对转换方式作限定。

2)从文本中提取关键词。

本实施例中，服务器可以预先设置关键词的提取规则，并根据该提取规则从文本中提取关键词。比如，当提取规则是提取敬语时，可以从文本中提取“您”、“请”之类的关键词；当提取规则是提取业务术语时，假设通话内容是话务员向用户介绍移动宽带业务，则可以从文本中提取“移动宽带业务”、“资费”、“带宽”之类的关键词。

3)从语义模型库中确定与关键词相匹配的语义模型，语义模型与通话内容相关。

语义模型是评价模型的一种，且语义模型与通话内容相关，用于对通话的通话内容进行质检。

本实施例中，每个语义模型对应于一组关键词，则服务器可以将从文本中提取的关键词与每个语义模型的一组关键词进行比对，当从文本中提取的关键词与某一个语义模型的一组关键词相同(即关键词完全相同)或相似(即相同的关键词的比例达到预定比例阈值)时，可以确定该语义模型与从文本中提取的关键词相匹配。

4)根据语义模型生成音频片段的评价信息。

本实施例中，每个语义模型对应于一个分值，则服务器可以将该语义模型的分值作为音频片段的评分，得到该音频片段的评价信息。另外，还可以将该音频片段的关键词也添加到评价信息中。

在第二种实施方式中，对全部或部分音频片段中的每个音频片段进行质检，得到音频片段的评价信息，可以包括以下步骤。

1)对于全部或部分音频片段中的每个音频片段，从该音频片段中提取情绪参数，该情绪参数用于指示话务员或用户在通话过程中的情绪。

本实施例中，服务器可以在每得到一个需要进行质检的音频片段后，执行步骤1-3来生成该音频片段的评价信息，直至得到所有需要进行质检的音频片段的评价信息后停止。

在一个应用场景中，当话务员与用户的沟通不顺畅时，话务员或用户可能会改变自己的语音，以表达自己的不满。语音的改变可以通过语音特征参数体现，该语音特征参数可以包括音量、音调等。可见，可以将通话时的语音特征参数作为一种情绪参数，此时，从音频片段中提取情绪参数，可以包括：从音频片段中提取语音特征参数，将该语音特征参数作为情绪参数。

在另一个应用场景中，当话务员与用户的沟通不顺畅时，话务员或用户可能会在言语中表达自己的不满，比如，通话中出现侮辱性的词汇。可见，可以将通话时的关键词作为一种情绪参数，此时，从音频片段中提取情绪参数，包括：将音频片段转换为文本，从该文本中提取关键词，将该关键词作为情绪参数。

在又一个应用场景中，还可以将通话时的语音特征参数和关键词都作为一种情绪参数，此时，从音频片段中提取情绪参数，包括：从音频片段中提取语音特征参数，并将该音频片段转换为文本，从该文本中提取关键词，将该关键词和该语音特征参数作为情绪参数。

2)从情绪模型库中确定与情绪参数相匹配的情绪模型，该情绪模型与情绪相关。

情绪模型是评价模型的一种，且情绪模型与情绪相关，用于对通话时双方的情绪(即话务员的服务态度和用户的沟通态度)进行质检。

当情绪参数包括语音特征参数时，每个情绪模型对应于一个语音特征参数区间，则服务器可以将提取的语音特征参数与每个情绪模型的一个语音特征参数区间进行比对，当提取的语音特征参数属于某一个情绪模型的一个语音特征参数区间内时，可以确定该情绪模型与提取的语音特征参数相匹配。

当情绪参数包括关键词时，每个情绪模型对应于一组关键词，则服务器可以将从文本中提取的关键词与每个情绪模型的一组关键词进行比对，当从文本中提取的关键词与某一个情绪模型的一组关键词相同(即关键词完全相同)或相似(即相同的关键词的比例达到预定比例阈值)时，可以确定该情绪模型与从文本中提取的关键词相匹配。

当情绪参数包括语音特征参数和关键词时，每个情绪模型对应于一个语音特征参数区间和一组关键词，则服务器可以将提取的语音特征参数与每个情绪模型的一个语音特征参数区间进行比对，并将从文本中提取的关键词与每个情绪模型的一组关键词进行比对，当提取的语音特征参数属于某一个情绪模型的一个语音特征参数区间内，且提取的关键词与某一个情绪模型的一组关键词相同(即关键词完全相同)或相似(即相同的关键词的比例达到预定比例阈值)时，可以确定该情绪模型与提取的语音特征参数和关键词相匹配。

3)根据情绪模型生成该音频片段的评价信息。

本实施例中，每个情绪模型对应于一个分值，则服务器可以将该情绪模型的分值作为音频片段的评分，得到该音频片段的评价信息。另外，当情绪参数还包括关键词时，还可以将该音频片段的关键词也添加到评价信息中。

在第三种实施方式中，还可以将第一种和第二种实施方式进行结合，即服务器可以确定与音频片段相匹配的语义模型和情绪模型，再根据该语义模型和情绪模型生成音频片段的评价信息。此时，服务器可以计算语义模型和情绪模型对应的分值的平均值，并将该平均值作为音频片段的评分，得到该音频片段的评价信息。另外，当情绪参数还包括关键词时，服务器还可以将该音频片段的关键词也添加到评价信息中。

需要说明的是，由于在匹配语义模型时需要进行关键词提取，当情绪参数包括关键词时也需要进行关键词提取，所以，在第三种实施方式中，只需进行一次关键词提取即可，以提高质检效率。

步骤204，根据当前得到的所有评价信息生成实时音频流的质检结果。

若在通话结束后生成质检结果，则服务器可以在通话结束后，根据得到的所有评价信息生成一条质检结果；若在通话过程中实时生成质检结果，则服务器可以在通话过程中的任意时刻，根据得到的所有评价信息生成一条质检结果。比如，服务器可以在得到第一条评价信息的时刻，根据第一条评价信息生成一条质检结果；在得到第二条评价信息的时刻，根据第一条和第二条评价信息生成一条质检结果；在得到第三条评价信息的时刻，根据第一条、第二条和第三条评价信息生成一条质检结果，依此类推。

在一实施方式中，当评价信息包括评分时，在得到所有评价信息后，可以计算所有评价信息中的评分的平均值，将该平均值作为实时音频流的质检结果。

在一实施方式中，当评价信息包括评分和关键词时，根据所有评价信息生成实时音频流的质检结果，可以包括：获取通话对应的话务类型；根据话务类型确定实时音频流的评价标准；根据评价标准和所有音频片段的评价信息生成实时音频流的质检结果。

其中，话务类型可以包括业务咨询、投诉、业务推荐等等，本实施例不作限定。不同的话务类型可以对应不同的评价标准。比如，当话务类型是业务咨询时，评价标准可以是根据是否能够为用户提供业务解答来确定业务分；当话务类型是业务投诉时，评价标准可以是根据是否能够为用户解决问题来确定业务分；当话务类型是业务推荐时，评价标准可以是根据是否可以说服用户开通某项业务来确定业务分，或，评价标准可以是根据是否可以向用户介绍的业务的数量来确定业务分。

此时，可以根据所有评价信息中的关键词确定话务类型，再根据关键词和评价标准确定实时音频流的业务分，再确定该实时音频流的评分，最后对业务分和评分进行加权运算得到该实时音频流的质检结果。

本实施例中，在根据当前得到的所有评价信息生成实时音频流的质检结果之后，该方法还可以包括：当实时音频流的质检结果不满足预设条件时，根据评价标准和当前得到的所有评价信息生成改进信息，该改进信息用于指示话务员提升话务水平。

其中，预设条件可以是预设分值，即，当质检结果的分值小于预设分值时，可以生成改进信息，并向话务员展示改进信息，以使话务员能够根据改进信息对自己整个通话过程有一个全面的了解和评估，并对做的不够到位的地方进行改进，从而提升话务水平。

比如，话务员的质检结果的分值较低时，根据评价标准确定话务员向用户推荐的业务的数量较少，则可以生成向用户多推荐业务的改进信息；或者，话务员的质检结果的分值较低时，根据评价标准确定话务员的服务态度不好，则可以生成提升服务态度的改进信息。

在通话结束后即可生成质检结果，并根据质检结果生成改进信息，从而实时对话务员的工作过程给出评价和建议，而非事后的静态考评，可以提升用户的满意度。

本实施例中，在对全部或部分音频片段中的每个音频片段进行质检后，若发现通话过程中出现问题或突发情况，则还可以对通话进行操控，以实时介入干预通话，从而能够实时处理问题，为用户提供更高效高质的服务。那么，在对全部或部分音频片段中的每个音频片段进行质检，得到音频片段的评价信息之后，该方法还包括：对于全部或部分音频片段中的每个音频片段，确定该音频片段的评价信息是否满足操控条件；当该音频片段的评价信息满足操控条件时，对通话进行操控。

在一实施方式中，当评价信息包括评分时，服务器可以将评分与预定评分阈值进行比较；当该评分低于预定评分阈值时，确定该评分信息满足操控条件；当该评分高于预定评分阈值时，确定该评分信息不满足操控条件，则结束操控流程。

在另一实施方式中，当评价信息包括关键词时，服务器可以将关键词与预定关键词进行比较；当该关键词与预定关键词相匹配时，确定该评分信息满足操控条件；当该关键词与预定关键词不匹配时，确定该评分信息不满足操控条件，则结束操控流程。比如，关键词与预定关键词“无法解答”相匹配时，说明话务员无法解答用户的问题，则需要对通话进行操控。

其中，对通话进行操控，可以包括以下步骤。

1)获取通话对应的话务类型。

其中，确定话务类型的实现流程详见上文中的描述，此处不作赘述。

2)获取音频片段的评价信息对应的问题等级，该问题等级用于指示通话中出现的问题的等级。

在一实施方式中，当评价信息包括评分时，可以设置每个问题等级对应的一个评分区间，并将该评分与每个评分区间进行比对，当该评分属于某一个评分区间内时，服务器可以将该评分区间对应的问题等级作为该音频片段的问题等级。

在另一实施方式中，当评价信息包括关键词时，可以设置每个问题等级对应的一组关键词，并将该关键词与每组关键词进行比对，当该关键词与某一组关键词相同或相似时，服务器可以将该组关键词对应的问题等级作为该音频片段的问题等级。

3)根据话务类型和问题等级确定控制操作。

本实施例中的控制操作可以包括拦截、监听、插话、三方会议、强拆中的至少一种。其中，拦截是指将用户与话务员之间的通话切换为用户与质检员质检的通话；监听是指质检员对用户与话务员之间的通话进行监听；插话是指质检员可以在用户与话务员之间的通话中插入语音；三方会议是指将用户与话务员之间的两方通话切换为用户、话务员和质检员之间的三方通话；强拆是指强行终断用户与话务员之间的通话。

在一实施方式中，可以预设话务类型和问题等级和控制操作之间的对应关系。比如，话务类型为业务咨询、问题等级为低级、控制操作为插话的对应关系；话务类型为业务咨询、问题等级为中级、控制操作为三方会议的对应关系；话务类型为业务咨询、问题等级为高级、控制操作为拦截的对应关系等等，本实施例不作限定。

4)对通话执行控制操作。

本实施例中，还可以将操控通话和质检进行结合，则请参考图3，其示出了一种话务质检方法的流程示意图。

步骤301，获取音频数据包(即RTP协议数据包)。

本步骤可以由服务器中的音频流采集模块执行。

步骤302，对音频数据包进行解码，得到实时音频流。

本步骤可以由服务器中的话务处理模块执行。

步骤303，将实时音频流划分成音频片段，再对音频片段转换为文本，并提取参数，该参数包括关键词、语音特征参数等。

本步骤可以由服务器中的音频流处理模块执行。

步骤304，根据关键词从语义模型库中获取与音频片段相匹配的语义模型。

步骤305，根据语音特征参数和/或关键词从情绪模型库中获取与音频片段相匹配的情绪模型。

步骤306，根据语义模型和情绪模型获取评分(即评价信息)。

步骤304-306可以由服务器中的模型匹配模块执行。

步骤307，根据评分确定是否转监控坐席(即是否操控通话)；若转监控坐席，则执行步骤308；若不转监控坐席，则执行步骤309。

步骤308，对通话进行监控操作，执行步骤309。

步骤307-308可以由服务器中的监控模块执行。

步骤309，对评分进行存储，并在得到所有音频片段的评分后生成总评价(即质检结果)。

本步骤可以由服务器中的评价模型执行。

请参考图4，其示出了本申请一个实施例提供的话务质检装置的结构框图，该话务质检装置可以应用于服务器中。该话务质检装置，可以包括以下模块。

获取模块410，用于在话务员与用户进行通话时，获取通话过程中生成的实时音频流

质检模块420，用于对实时音频流进行质检

生成模块430，用于生成实时音频流的质检结果。

在一实施方式中，质检模块420，还用于将实时音频流划分成多个音频片段；对全部或部分音频片段进行质检，得到音频片段的评价信息

生成模块430，还用于根据当前得到的所有评价信息生成实时音频流的质检结果。

在一实施方式中，质检模块420，还用于对于全部或部分音频片段中的每个音频片段，将该音频片段转换为文本；从文本中提取关键词；从语义模型库中确定与关键词相匹配的语义模型，语义模型与通话内容相关；根据语义模型生成该音频片段的评价信息。

在一实施方式中，质检模块420，还用于对于全部或部分音频片段中的每个音频片段，从该音频片段中提取情绪参数，情绪参数用于指示话务员或用户在通话过程中的情绪；从情绪模型库中确定与情绪参数相匹配的情绪模型，情绪模型与情绪相关；根据情绪模型生成该音频片段的评价信息。

在一实施方式中，质检模块420，还用于从音频片段中提取语音特征参数，将语音特征参数作为情绪参数；或，将音频片段转换为文本，从文本中提取关键词，将关键词作为情绪参数；或，从音频片段中提取语音特征参数，并将音频片段转换为文本，从文本中提取关键词，将关键词和语音特征参数作为情绪参数。

在一实施方式中，生成模块430，还用于获取通话对应的话务类型；根据话务类型确定实时音频流的评价标准；根据评价标准和当前得到的所有评价信息生成实时音频流的质检结果。

在一实施方式中，生成模块430，还用于在根据评价标准和当前得到的所有评价信息生成实时音频流的质检结果之后，当实时音频流的质检结果不满足预设条件时，根据评价标准和所有音频片段的评价信息生成改进信息，改进信息用于指示话务员提升话务水平。

在一实施方式中，请参考图5，该装置还包括以下模块。

确定模块440，用于在对全部或部分音频片段进行质检，得到音频片段的评价信息之后，对于全部或部分音频片段中的每个音频片段，确定该音频片段的评价信息是否满足操控条件

操控模块450，还用于当该音频片段的评价信息满足操控条件时，对通话进行操控。

在一实施方式中，操控模块450，还用于获取通话对应的话务类型；获取音频片段的评价信息对应的问题等级，问题等级用于指示通话中出现的问题的等级；根据话务类型和问题等级确定控制操作；对通话执行控制操作。

综上所述，本申请实施例提供的话务质检装置，通过在话务员与用户进行通话时，获取通话过程中生成的实时音频流，再对该实时音频流进行质检，生成该实时音频流的质检结果，这样，可以在通话时进行质检，而无需对通话内容进行录音，再对录音进行抽检，可以提高质检的效率；另外，所有通话都可进行质检，避免出现抽样时遗漏重要和典型的录音的问题，从而提高质检的全面性。

在对全部或部分音频片段中的每个音频片段进行质检后，若发现通话过程中出现问题或突发情况，则还可以对通话进行操控，以实时介入干预通话，从而能够实时处理问题，为用户提供更高效高质的服务。

本申请一个实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的话务质检方法。

本申请一个实施例提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如上所述的话务质检方法。

此外，本发明实施例还提供了一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述任意方法实施例中的方法。

需要说明的是：上述实施例提供的话务质检装置在进行话务质检时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将话务质检装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的话务质检装置与话务质检方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请实施例的保护范围之内。

Claims

一种话务质检方法，其中，所述方法包括：

在话务员与用户进行通话时，获取通话过程中生成的实时音频流；

对所述实时音频流进行质检；

生成所述实时音频流的质检结果。
根据权利要求1所述的方法，其中，

所述对所述实时音频流进行质检，包括：将所述实时音频流划分成多个音频片段；对全部或部分音频片段进行质检，得到所述音频片段的评价信息；

所述生成所述实时音频流的质检结果，包括：根据当前得到的所有评价信息生成所述实时音频流的质检结果。
根据权利要求2所述的方法，其中，所述对全部或部分音频片段进行质检，得到所述音频片段的评价信息，包括：

对于所述全部或部分音频片段中的每个音频片段，将所述音频片段转换为文本；

从所述文本中提取关键词；

从语义模型库中确定与所述关键词相匹配的语义模型；

根据所述语义模型生成所述音频片段的评价信息。
根据权利要求2所述的方法，其中，所述对全部或部分音频片段进行质检，得到所述音频片段的评价信息，包括：

对于所述全部或部分音频片段中的每个音频片段，从所述音频片段中提取情绪参数，所述情绪参数用于指示所述话务员或所述用户在通话过程中的情绪；

从情绪模型库中确定与所述情参数相匹配的情绪模型；

根据所述情绪模型生成所述音频片段的评价信息。
根据权利要求4所述的方法，其中，所述从所述音频片段中提取情绪参数，包括：

从所述音频片段中提取语音特征参数，将所述语音特征参数作为所述情绪参数；或

将所述音频片段转换为文本，从所述文本中提取关键词，将所述关键词作为所述情绪参数；或

从所述音频片段中提取语音特征参数，并将所述音频片段转换为文本，从所述文本中提取关键词，将所述关键词和所述语音特征参数作为所述情绪参数。
根据权利要求2所述的方法，其中，所述根据当前得到的所有评价信息生成所述实时音频流的质检结果，包括：

获取所述通话对应的话务类型；

根据所述话务类型确定所述实时音频流的评价标准；

根据所述评价标准和当前得到的所有评价信息生成所述实时音频流的质检结果。
根据权利要求6所述的方法，其中，在所述根据所述评价标准和当前得到的所有评价信息生成所述实时音频流的质检结果之后，所述方法还包括：

当所述实时音频流的质检结果不满足预设条件时，根据所述评价标准和所有音频片段的评价信息生成改进信息，所述改进信息用于指示所述话务员提升话务水平。
根据权利要求2至7中任一项所述的方法，其中，在所述对全部或部分音频片段进行质检，得到所述音频片段的评价信息之后，所述方法还包括：

对于所述全部或部分音频片段中的每个音频片段，确定所述音频片段的评价信息是否满足操控条件；

当所述音频片段的评价信息满足所述操控条件时，对所述通话进行操控。
根据权利要求8所述的方法，其中，所述对所述通话进行操控，包括：

获取所述通话对应的话务类型；

获取所述音频片段的评价信息对应的问题等级，所述问题等级用于指示所述通话中出现的问题的等级；

根据所述话务类型和所述问题等级确定控制操作；

对所述通话执行所述控制操作。
一种话务质检装置，其中，所述装置包括：

获取模块，用于在话务员与用户进行通话时，获取通话过程中生成的实时音频流；

质检模块，用于对所述实时音频流进行质检；

生成模块，用于生成所述实时音频流的质检结果。
一种计算机可读存储介质，其中，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至9任一所述的话务质检方法。
一种服务器，其中，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如权利要求1至9任一所述的话务质检方法。