CN114374768A

CN114374768A - 语音对话的测试方法、装置以及存储介质

Info

Publication number: CN114374768A
Application number: CN202011098548.6A
Authority: CN
Inventors: 李宽; 吴海英; 蒋宁; 王洪斌; 权圣
Original assignee: Beijing Finite Element Technology Co Ltd
Current assignee: Beijing Finite Element Technology Co Ltd
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2022-04-19

Abstract

本申请公开了一种语音对话的测试方法、装置以及存储介质。其中，该方法包括：响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及将第一信息、第二信息推送至呼叫中心的网页进行显示。

Description

语音对话的测试方法、装置以及存储介质

技术领域

本申请涉及智能语音对话测试技术领域，特别是涉及一种语音对话的测试方法、装置以及存储介质。

背景技术

智能聊天机器人目前在各领域广泛应用，包括智能客服，智能音箱，娱乐产品等，而智能语音机器人作为其进阶形态，以更自然方便的交互方式(语音)，越来越受到业界的青睐。现在一般的智能语音会对接TTS(机器人的嘴)、ASR(机器人的耳)、流程引擎(机器人的大脑)，由运营人员根据需求配置好后交付使用(比如电销和催收语音机器人的话术流程和TTS的说话人声音可能就不尽相同)。使用之前需要进行测试，目前测试很不方便，需要上传测试人员的呼叫名单(手机号)，创建任务，把电话打到测试人员的手机上，然后测试人员和语音机器人进行交互，完成后去查看后台的电话记录(包括文本化后的类似于微信聊天界面的聊天记录和录音)，如果有问题上述过程要反复进行，费时费力，影响产品快速交付。并且，项目落地过程验证阶段对电话线路有强依赖，线路没配好就测不了。项目运行中配置新的智能语音机器人验证的话会无谓占用电话线路和消耗话费。电话线路有时候配置有问题，会对智能语音流程的验证产生不必要的干扰。

针对上述的现有技术中存在的语音机器人在测试的过程中过于依赖电话线路，并且测试过程中出现问题需要反复进行测试，因此造成费时费力、影响产品交付的技术问题，目前尚未提出有效的解决方案。

发明内容

本公开的实施例提供了一种语音对话的测试方法、装置以及存储介质，以至少解决现有技术中存在的语音机器人在测试的过程中过于依赖电话线路，并且测试过程中出现问题需要反复进行测试，因此造成费时费力、影响产品交付的技术问题。

根据本公开实施例的一个方面，提供了一种语音对话的测试方法，包括：响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及将第一信息、第二信息推送至呼叫中心的网页进行显示。

根据本公开实施例的另一个方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时由处理器执行以上任意一项所述的方法。

根据本公开实施例的另一个方面，还提供了一种语音对话的测试装置，包括：连接建立模块，用于响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；第一信息确定模块，用于确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；第二信息确定模块，用于根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及信息显示模块，用于将第一信息、第二信息推送至呼叫中心的网页进行显示。

根据本公开实施例的另一个方面，还提供了一种语音对话的测试装置，包括：处理器；以及存储器，与处理器连接，用于为处理器提供处理以下处理步骤的指令：响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及将第一信息、第二信息推送至呼叫中心的网页进行显示。

在本公开实施例中，在对智能语音机器人进行测试的过程中，测试人员可以采用软电话的形式向FS上的短号(对应于语音机器人)进行拨打，并且可以记录交互过程中产生的与机器人播报音频相关的第一信息和与用户应答音频相关的第二信息，并且将第一信息和第二信息在网页页面上进行显示。从而，与现有技术相比，本方案可以通过软电话的形式完成对语音机器人的测试，并且可以进行多次反复测试，因此可以节省时间和成本，进而加快产品交付速度。此外，本方案还可以将测试过程中产生的信息进行可视化展示，因此便于直接查看每个步骤的测试结果。因此达到了节省时间和成本且便于查看测试结果的技术效果。进而解决了现有技术中存在的语音机器人在测试的过程中过于依赖电话线路，并且测试过程中出现问题需要反复进行测试，因此造成费时费力、影响产品交付的技术问题。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图；

图2是根据本公开实施例1所述的呼叫中心的系统的示意图；

图3是根据本公开实施例1所述的呼叫中心系统的前后端交互过程示意图；

图4是根据本公开实施例1的第一个方面所述的语音对话的测试方法的流程示意图；

图5是根据本公开实施例1所述的测试流程图；

图6是根据本公开实施例2所述的语音对话的测试装置的示意图；

图7是根据本公开实施例3所述的语音对话的测试装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本公开的技术方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本实施例，还提供了一种语音对话的测试方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现语音对话的测试方法的计算设备的硬件结构框图。如图1所示，计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算设备还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器可用于存储应用软件的软件程序以及模块，如本公开实施例中的语音对话的测试方法对应的程序指令/数据存储装置，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的语音对话的测试方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中，传输装置包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算设备的用户界面进行交互。

此处需要说明的是，在一些可选实施例中，上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是，图1仅为特定具体实例的一个实例，并且旨在示出可存在于上述计算设备中的部件的类型。

图2是根据本实施例所述的呼叫中心的系统的示意图。参照图2所示，该系统包括：前端客户端210以及系统后台220(Java后台)，其中系统后台220例如部署有开源的电话软交换平台软件FreeSWITCH(以下简称为FS)。参考图3所示，测试人员(用户)可以登陆呼叫中心的客户端210的web页面(前端页面)，该web页面通过SDK与FS连接，然后通过FS可以连接到语音机器人上。用户可以在web页面对特定的短号打电话(即利用软电话拨打智能语音)，其中短号对应的就是要测试的Lua脚本(语音机器人)，Lua脚本对应的就是要测试的流程，即语音机器人在人机交互过程中执行的流程。其中，在测试过程中Lua脚本可以调用智能语音机器人的流程引擎模块，其中流程引擎模块例如可以根据用户的音频确定话术。此外，Lua脚本还可以调用智能语音机器人的TTS和ASR功能，并记录相关信息。然后，将相关信息发送至系统后台220(例如Java后台)的呼叫管理组件，其中Lua脚本例如可以通过ESL事件将相关信息传递给呼叫中心java后台的呼叫管理组件。需要说明的是，系统中的前端客户端210以及系统后台220均可适用上面所述的硬件结构。

在上述运行环境下，根据本实施例的第一个方面，提供了一种语音对话的测试方法，该方法例如由图2中所示的呼叫中心的系统后台220实现，具体地可以由该Lua脚本实现。图4示出了该方法的流程示意图，参考图4所示，该方法包括：

S402：响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；

S404：确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；

S406：根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及

S408：将第一信息、第二信息推送至呼叫中心的网页进行显示。

正如背景技术中所述的，目前测试很不方便，需要上传测试人员的呼叫名单(手机号)，创建任务，把电话打到测试人员的手机上，然后测试人员和语音机器人进行交互，完成后去查看后台的电话记录(包括文本化后的类似于微信聊天界面的聊天记录和录音)，如果有问题上述过程要反复进行，费时费力，影响产品快速交付。并且，项目落地过程验证阶段对电话线路有强依赖，线路没配好就测不了。项目运行中配置新的智能语音机器人验证的话会无谓占用电话线路和消耗话费。电话线路有时候配置有问题，会对智能语音流程的验证产生不必要的干扰。

针对背景技术中存在的技术问题，参考图4和图5所示，本实施例技术方案在步骤S402中，系统后台220首先响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接。在实际操作中，用户(测试人员)首先通过测试账号登陆到客户端210的网页页面上，其中该账号例如是具有相应权限的坐席账号，然后该页面会显示拨号盘，从而用户可以利用该拨号盘以软电话的形式向FS上的短号(智能语音机器人)进行拨号。在这种情况下，系统后台220的Lua脚本可以响应于用户拨号的触发操作，建立与用户进行软交换的连接，即用户可以与测试的语音机器人(Lua脚本)进行交互。

进一步地，在建立连接之后，智能语音机器人需要与用户进行音频交互，即向用户进行音频播报。其中，播报的音频可以根据实际的应用场景而定，例如播报的音频包括：问候语、产品介绍、产品推销等。在这种情况下，系统后台220的Lua脚本可以确定针对用户进行播报的第一音频，并确定与第一音频相关的第一信息。(对应于步骤S404)

然后，在交互过程中用户(测试人员)需要对第一音频进行应答或者回复，在这种情况下，系统后台220的Lua脚本首先确定用户针对第一音频应答的第二音频(用户回答的音频)，然后根据第二音频确定第二信息，该第二信息与用户应答的第二音频相关。(对应于步骤S406)。此外，参考图5所示，在实际应用中，测试人员与智能语音机器人在一次交互中可能会涉及到多次的播报与应答，多次的播报与应答产生信息的方式同理于上述的S404与S406步骤此处不再赘述，直至用户挂机结束。

最终，在步骤S408中，将第一信息、第二信息(以及多次的播报与应答的信息)推送至呼叫中心的网页进行显示，即由客户端210的web页面进行可视化显示。

从而通过这种方式，在对智能语音机器人进行测试的过程中，测试人员可以采用软电话的形式向FS上的短号(对应于语音机器人)进行拨打，并且可以记录交互过程中产生的与机器人播报音频相关的第一信息和与用户应答音频相关的第二信息，并且将第一信息和第二信息在网页页面上进行显示。从而，与现有技术相比，本方案可以通过软电话的形式完成对语音机器人的测试，并且可以进行多次反复测试，因此可以节省时间和成本，进而加快产品交付速度。此外，本方案还可以将测试过程中产生的信息进行可视化展示，因此便于直接查看每个步骤的测试结果。因此达到了节省时间和成本且便于查看测试结果的技术效果。进而解决了现有技术中存在的语音机器人在测试的过程中过于依赖电话线路，并且测试过程中出现问题需要反复进行测试，因此造成费时费力、影响产品交付的技术问题。

可选地，确定针对用户进行播报的第一音频，包括：通过预先设置的测试流程引擎确定针对用户进行播报的话术文本；以及对话术文本进行语音合成，确定第一音频。

具体地，在确定针对用户进行播报的第一音频的操作中，Lua脚本首先通过预先设置的测试流程引擎确定针对用户进行播报的话术文本，参考图5所示即：调用智能语音机器人预设的流程引擎模块，该流程引擎模块包含了针对用户进行交互的话术流程，例如：开场话术以及针对用户的应答回答的话术。进一步地，Lua脚本可以调用TTS(例如可以是现有技术中的语音合成技术)将话术文本合成为该第一音频。从而通过这种方式，可以实现在测试过程中与用户进行音频交互的效果。

可选地，确定与第一音频相关的第一信息，包括：确定与第一音频对应的话术文本、第一音频的起止时间信息、第一音频是否合成成功的指示信息以及第一音频是否被打断的打断信息。

具体地，在实际应用中，测试例如包括对流程引擎的测试、对TTS功能进行测试，其中对流程引擎的测试可以通过确定的话术文本进行体现，对TTS功能进行测试可以通过第一音频是否合成成功进行体现。从而，在确定与第一音频相关的第一信息的操作中，可以确定与第一音频对应的话术文本、第一音频的起止时间信息、第一音频是否合成成功的指示信息。此外，第一音频在播报过程中可能会被用户打断，因此还可以确定第一音频是否被打断的打断信息。从而，与第一音频对应的话术文本、第一音频的起止时间信息、第一音频是否合成成功的指示信息以及第一音频是否被打断的打断信息共同构成该第一信息，此外，第一信息还可以包括其他的相关信息，此处不再赘述。从而通过这种方式，可以实现对机器人的流程引擎以及文本转语音的功能进行测试。

可选地，确定与第二音频相关的第二信息，包括：确定与第二音频对应的应答文本、第二音频是否成功转化文本的指示信息、第二音频的起止时间信息以及第二音频包含的用户意图信息。

具体地，测试还可以包括对ASR(语音识别)功能的测试，因此在确定与第二音频相关的第二信息的操作中，还可以调用ASR将第二音频转化为对应的应答文本，并且确定是否转化成功。此外，还可以通过执行引擎确定第二音频中用户的意图信息。因此，与第二音频对应的应答文本、第二音频是否成功转化文本的指示信息、第二音频的起止时间信息以及第二音频包含的用户意图信息等信息构成该第二信息。

可选地，将第一信息、第二信息推送至呼叫中心的网页进行显示，包括：将第一信息、第二信息发送至呼叫中心的系统后台；以及通过系统后台将第一信息、第二信息推送至呼叫中心的网页进行显示。

具体地，在将第一信息、第二信息推送至呼叫中心的网页进行显示的操作中，由于Lua脚本不能直接将信息发送至前端页面进行显示，因此Lua脚本首先将第一信息、第二信息发送至呼叫中心的系统后台220(Java后台)，在一个优选实例中，Lua脚本通过ESL事件传递给呼叫中心java后台呼叫管理组件。然后通过系统后台将第一信息、第二信息推送至呼叫中心的网页进行显示，例如：呼叫管理组件通过websocket连接把第一信息和第二信息推送给前端页面进行显示。

可选地，将第一信息、第二信息推送至呼叫中心的网页进行显示之前，还包括：确定第一信息、第二信息的顺序编号；以及根据顺序编号，将第一信息、第二信息推送至呼叫中心的网页进行显示。

具体地，本实施例还可以确定第一信息、第二信息的顺序编号，即：将交互过程中产生的交互信息(第一信息、第二信息...)进行排序编号。进一步地，根据顺序编号，将第一信息、第二信息推送至呼叫中心的网页进行显示。从而测试人员可以直观的查看交互的过程。

可选地，将第一信息、第二信息推送至呼叫中心的网页进行显示之前，还包括：确定与第一信息对应的第一标识，确定第二信息对应的第二标识；以及根据第一标识、第二标识，将第一信息、第二信息推送至呼叫中心的网页进行显示。

具体地，本实施例还可以确定与第一信息对应的第一标识，确定第二信息对应的第二标识，该标识例如可以是唯一编号或者名称，例如：0表示机器人说的话，1表示人说的话。然后，根据第一标识、第二标识，将第一信息、第二信息推送至呼叫中心的网页进行显示。从而，可以清楚地区分机器人产生的信息和用户产生的信息。

可选地，将第一信息、第二信息推送至呼叫中心的网页进行显示之前，还包括：确定第一信息、第二信息的显示位置；以及根据显示位置将第一信息、第二信息推送至呼叫中心的网页进行显示。

具体地，本实施例还可以确定第一信息、第二信息的显示位置，其中显示位置例如可以参考现有技术中的聊天软件(例如微信聊天界面)，第一信息和第二信息分成左右两列分别显示。然后，根据显示位置将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，还包括：获取用户在应答过程中触发操作，并确定与触发操作对应的标识信息；以及根据触发操作对应的标识信息确定第二信息。

具体地，用户在应答过程中可以包括多种形式，例如：上述的语音应答，此外还可以按键输入(web页面弹出拨号盘)，还包括挂机以及转人工等。因此，本方案还可以获取用户在应答过程中触发操作，并确定与触发操作对应的标识信息，例如：0表示下一步接收按键(web页面弹出拨号盘)，1表示接收语音(Lua启动ASR)，2表示挂机(Lua挂机)，3表示转接技能组(Lua转接人工坐席)。然后，根据触发操作对应的标识信息确定第二信息。

此外，页面还可以显示次要文本，比如在机器人话术文本下的节点名称(小字显示)(询问节点、跳转节点)，人说的话对应文本下的该句话的意图(小字显示)。

此外，参考图1所示，根据本实施例的第二个方面，提供了一种存储介质。所述存储介质包括存储的程序，其中，在所述程序运行时由处理器执行以上任意一项所述的方法。

在一个具体实例中，本方案的流程如下：

1)测试人员用一个测试账号登录到呼叫中心坐席页面上

2)用页面拨号盘以软电话的形式向fs(桥梁连接到语音机器人上)上特定的短号打电话(短号对应的就是要测试的Lua脚本，Lua脚本对应的就是要测试的流程；Web页面通过SDK与fs连接)

3)Lua脚本除了进行流程应答外还会记录所有必要的信息(比如TTS播放情况，ASR识别情况，起止时间点等)，通过ESL(发送事件)的方式通知java后台呼叫管理组件，所有需要发送的字段如下：

Text-Order：文本先后顺序，取值范围[1,n]，4)中显示时可按先后顺序排列

Text-Type：0表示机器人说的话，1表示人说的话，显示时可以分成左右两列分别显示

Text-Main：机器人和人说的话对应的文本

Text-Sub：要显示次要文本，比如在机器人话术文本下的节点名称(小字显示)(询问节点、跳转节点)，人说的话对应文本下的该句话的意图(小字显示)

Next-Step：下一步动作，0表示下一步接收按键(web页面弹出拨号盘)，1表示接收语音(Lua启动ASR)，2表示挂机(Lua挂机)，3表示转接技能组(Lua转接人工坐席)

Time-Start：这句话在录音中的起始时间点，单位ms

Time-End：这句话在录音中的结束时间点，单位ms

Break-Result：0表示未打断，1表示播报中被打断

Login-Name：坐席登录名，用来对应该坐席的显示页面

4)java后台呼叫管理组件通过websocket连接把上述信息传递给前端页面进行显示，比如：机器人和人说的话的文本分开有序排列(参考微信的聊天记录布局)，可以听整通对话的录音，点击任一条文本可以单独听这条文本的录音，如果是机器人说的话，用图标指出该句TTS是否合成成功，是否被打断，如果是人说的话，显示该句话的意图是什么(结果来自于流程引擎对接的意图识别模块)，如果该节点需要按键(比如输入身份证号码)，验证过程中前端页面会自动弹出拨号盘供测试人员使用。

5)本轮交互完成后，测试人员可开始本通对话的下一轮交互，或选择挂机。

从而根据本实施例，在对智能语音机器人进行测试的过程中，测试人员可以采用软电话的形式向FS上的短号(对应于语音机器人)进行拨打，并且可以记录交互过程中产生的与机器人播报音频相关的第一信息和与用户应答音频相关的第二信息，并且将第一信息和第二信息在网页页面上进行显示。从而，与现有技术相比，本方案可以通过软电话的形式完成对语音机器人的测试，并且可以进行多次反复测试，因此可以节省时间和成本，进而加快产品交付速度。此外，本方案还可以将测试过程中产生的信息进行可视化展示，因此便于直接查看每个步骤的测试结果。因此达到了节省时间和成本且便于查看测试结果的技术效果。进而解决了现有技术中存在的语音机器人在测试的过程中过于依赖电话线路，并且测试过程中出现问题需要反复进行测试，因此造成费时费力、影响产品交付的技术问题。

此外，本方案无需在生产系统进行真实的电话外呼，只需要登录呼叫中心页面拨打软电话即可快速验证智能语音机器人流程，快捷、准确、方便反复验证。并且本实施例采用直接在网页上打电话与智能语音机器人交互，并在页面上显示各种交互信息(包括语音对应的文本信息，TTS是否合成成功信息，TTS播报中是否被打断的信息，人说的话的意图识别结果信息，录音信息)来验证智能语音流程中的各个方面，使用简单、验证准确全面、可轻松反复验证；而现有的用真实电话验证的方法操作繁琐，不利于反复验证，同时会无谓消耗线路和话费资源，电话线路出问题时还会干扰对智能语音流程的验证。此外，利用纯互联网交互来验证智能语音流程，可消除项目落地过程验证阶段对电话线路的依赖，一来可加快落地流程；二来可排除电话线路的干扰；三来验证需要的信息集中在页面上展示、操作简便，易于重复，避免了用真实电话线路带来的上传名单、创建外呼任务等繁琐操作(这些操作其实跟智能语音流程的验证无关)。把测试人员从无关的前置操作中解放出来，使其可以专注于智能语音流程验证，提高了工作效率和准确度，进一步保障了项目质量。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

图6示出了根据本实施例所述的语音对话的测试装置600，该装置600与根据实施例1的第一个方面所述的方法相对应。参考图6所示，该装置600包括：连接建立模块610，用于响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；第一信息确定模块620，用于确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；第二信息确定模块630，用于根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及信息显示模块640，用于将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，第一信息确定模块620，包括：话术确定子模块，用于通过预先设置的测试流程引擎确定针对用户进行播报的话术文本；以及音频合成子模块，用于对话术文本进行语音合成，确定第一音频。

可选地，第一信息确定模块620，包括：第一信息确定子模块，用于确定与第一音频对应的话术文本、第一音频的起止时间信息、第一音频是否合成成功的指示信息以及第一音频是否被打断的打断信息。

可选地，第二信息确定模块630，包括：第二信息确定子模块，用于确定与第二音频对应的应答文本、第二音频是否成功转化文本的指示信息、第二音频的起止时间信息以及第二音频包含的用户意图信息。

可选地，信息显示模块640，包括：信息发送子模块，用于将第一信息、第二信息发送至呼叫中心的系统后台；以及信息显示子模块，用于通过系统后台将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，装置600还包括：编号确定模块，用于确定第一信息、第二信息的顺序编号；以及编号显示模块，用于根据顺序编号，将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，装置600还包括：标识确定模块，用于确定与第一信息对应的第一标识，确定第二信息对应的第二标识；以及标识显示模块，用于根据第一标识、第二标识，将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，装置600还包括：显示位置确定模块，用于确定第一信息、第二信息的显示位置；以及位置显示模块，用于根据显示位置将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，装置600还包括：触发模块，用于获取用户在应答过程中触发操作，并确定与触发操作对应的标识信息；以及标识确定信息模块，用于根据触发操作对应的标识信息确定第二信息。

从而根据本实施例，在对智能语音机器人进行测试的过程中，测试人员可以采用软电话的形式向FS上的短号(对应于语音机器人)进行拨打，并且在可以记录交互过程中产生的与机器人播报音频相关的第一信息和与用户应答音频相关的第二信息，并且将第一信息和第二信息在网页页面上进行显示。从而，与现有技术相比，本方案可以通过软电话的形式完成对语音机器人的测试，并且可以进行多次反复测试，因此可以节省时间和成本，进而加快产品交付速度。此外，本方案还可以将测试过程中产生的信息进行可视化展示，因此便于直接查看每个步骤的测试结果。因此达到了节省时间和成本且便于查看测试结果的技术效果。进而解决了现有技术中存在的语音机器人在测试的过程中过于依赖电话线路，并且测试过程中出现问题需要反复进行测试，因此造成费时费力、影响产品交付的技术问题。

实施例3

图7示出了根据本实施例所述的语音对话的测试装置700，该装置700与根据实施例1的第一个方面所述的方法相对应。参考图7所示，该装置700包括：处理器710；以及存储器720，与处理器710连接，用于为处理器710提供处理以下处理步骤的指令：响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与用户进行软交换的连接；确定针对用户进行播报的第一音频以及与第一音频相关的第一信息；根据用户针对第一音频应答的第二音频，确定与第二音频相关的第二信息；以及将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，存储器720还用于为处理器710提供处理以下处理步骤的指令：将第一信息、第二信息推送至呼叫中心的网页进行显示之前，确定第一信息、第二信息的顺序编号；以及根据顺序编号，将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，存储器720还用于为处理器710提供处理以下处理步骤的指令：将第一信息、第二信息推送至呼叫中心的网页进行显示之前，确定与第一信息对应的第一标识，确定第二信息对应的第二标识；以及根据第一标识、第二标识，将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，存储器720还用于为处理器710提供处理以下处理步骤的指令：将第一信息、第二信息推送至呼叫中心的网页进行显示之前，确定第一信息、第二信息的显示位置；以及根据显示位置将第一信息、第二信息推送至呼叫中心的网页进行显示。

可选地，存储器720还用于为处理器710提供处理以下处理步骤的指令：获取用户在应答过程中触发操作，并确定与触发操作对应的标识信息；以及根据触发操作对应的标识信息确定第二信息。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种语音对话的测试方法，其特征在于，包括：

响应于用户在呼叫中心的网页上拨打测试号码的触发操作，建立与所述用户进行软交换的连接；

确定针对所述用户进行播报的第一音频以及与所述第一音频相关的第一信息；

根据所述用户针对所述第一音频应答的第二音频，确定与所述第二音频相关的第二信息；以及

将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示。

2.根据权利要求1所述的方法，其特征在于，确定针对所述用户进行播报的第一音频，包括：

通过预先设置的测试流程引擎确定针对所述用户进行播报的话术文本；以及

对所述话术文本进行语音合成，确定所述第一音频。

3.根据权利要求2所述的方法，其特征在于，确定与所述第一音频相关的第一信息，包括：

确定与所述第一音频对应的所述话术文本、所述第一音频的起止时间信息、所述第一音频是否合成成功的指示信息以及所述第一音频是否被打断的打断信息。

4.根据权利要求1所述的方法，其特征在于，确定与所述第二音频相关的第二信息，包括：

确定与所述第二音频对应的应答文本、所述第二音频是否成功转化文本的指示信息、所述第二音频的起止时间信息以及所述第二音频包含的用户意图信息。

5.根据权利要求1所述的方法，其特征在于，将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示，包括：

将所述第一信息、所述第二信息发送至所述呼叫中心的系统后台；以及

通过所述系统后台将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示。

6.根据权利要求1所述的方法，其特征在于，将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示之前，还包括：

确定所述第一信息、所述第二信息的顺序编号；以及

根据所述顺序编号，将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示。

7.根据权利要求1所述的方法，其特征在于，将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示之前，还包括：

确定与所述第一信息对应的第一标识，确定所述第二信息对应的第二标识；以及

根据所述第一标识、所述第二标识，将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示。

8.根据权利要求1所述的方法，其特征在于，将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示之前，还包括：

确定所述第一信息、所述第二信息的显示位置；以及

根据所述显示位置将所述第一信息、所述第二信息推送至所述呼叫中心的网页进行显示。

9.根据权利要求1所述的方法，其特征在于，还包括：

获取所述用户在应答过程中触发操作，并确定与所述触发操作对应的标识信息；以及

根据所述触发操作对应的标识信息确定所述第二信息。

10.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时由处理器执行权利要求1至9中任意一项所述的方法。