CN111696576A

CN111696576A - 一种智能语音机器人话术测试系统

Info

Publication number: CN111696576A
Application number: CN202010434523.2A
Authority: CN
Inventors: 张晋
Original assignee: Shengzhi Information Technology Nanjing Co ltd
Current assignee: Shengzhi Information Technology Nanjing Co ltd
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2020-09-22

Abstract

本发明公开了一种智能语音机器人话术测试系统，包括呼叫服务器和对话测试服务器，其中，呼叫服务器，用于根据对话测试服务器的指令来发起呼叫或者接收来自待测试智能语音机器人呼入的呼叫；对话测试服务器，用于负责与智能语音机器人做媒体上的交互，即对话或通话；通话从呼叫服务器建立以后,对话测试服务器与待测试的智能语音机器人就建立起了语音媒体连接；对话测试服务器包括测试语料加载模块、对话预期加载模块、语句识别模块、语音播放模块、通话记录分析模块、路径判定模块和结果输出模块；以下的系统均指智能语音机器人话术测试系统；本发明完成对智能语音机器人的测试过程，从而解放测试生产力，提高生产效率。

Description

一种智能语音机器人话术测试系统

技术领域

本发明涉及智能语音技术领域，特别是一种智能语音机器人话术测试系统。

背景技术

随着以深度学习为代表的人工智能技术的发展，ASR(语音识别)和TTS(文本转语音，亦语音合成)也得到进一步发展与提升。智能化的语音机器人也相继面世。

智能语音机器人，这里“语音”不仅仅指通过电话信道做呼叫的方式，同时也包含了IP层的VOIP语音方式。这里“智能”指的是包含根据业务场景设定的话术，机器人将在话术范畴内做出回应。

目前市面上各式各样的智能语音机器人被不断创造出来，智能语音机器人所依赖的话术随着业务复杂性的增长，也变得越来越难以被充分测试。

在智能语音机器人刚起步的阶段，业务一般比较简单，话术并不复杂，测试方法大多是人工完成。通过电话/VOIP等方式验证话术的正确性。

但是随着业务的发展，话术越来越复杂。人工测试便变得越来越低效了。而且，随着NLP(自然语言处理)技术的发展，对于意图的理解也从关键字理解升级为通过深度学习训练模型来匹配意图。这一种情况更难以用人工完成了。

综上现在主要存在的问题可以概括为，缺乏一个行之有效的智能语音机器人测试系统。具体问题有：

1.人工测试低效而且无法测试所有复杂的业务分支；

2.人工测试无法完成特殊场景测试，比如某种噪音下的语音，如办公室背景，或者大街上等测试场景。

发明内容

本发明所要解决的技术问题是克服现有技术的不足而提供一种智能语音机器人话术测试系统，本发明通过模拟人与智能语音机器人交互的过程，完成对智能语音机器人的测试过程，从而解放测试生产力，提高生产效率；具有普适性，可以完全代替真人去做呼叫测试。

本发明为解决上述技术问题采用以下技术方案：

根据本发明提出的一种智能语音机器人话术测试系统，包括呼叫服务器和对话测试服务器，其中，

呼叫服务器，用于根据对话测试服务器的指令来发起呼叫或者接收来自待测试智能语音机器人呼入的呼叫；

对话测试服务器，用于负责与智能语音机器人做媒体上的交互，即对话或通话；通话从呼叫服务器建立以后,对话测试服务器与待测试的智能语音机器人就建立起了语音媒体连接；

对话测试服务器包括测试语料加载模块、对话预期加载模块、语句识别模块、语音播放模块、通话记录分析模块、路径判定模块和结果输出模块；以下的系统均指智能语音机器人话术测试系统；其中，

测试语料加载模块，用于将测试语料加载入系统中；

对话预期加载模块，用于负责将对话预期输入系统；

语句识别模块，用于处理待测试智能语音机器人输入的音频、识别出完整的语句，并输出播放音频的路径至语音播放模块；输出播放音频的路径至语音播放模块作为对待测试智能语音机器人输入音频的回答；

语音播放模块，用于根据接收的播放音频的路径，播放其路径上的音频文件；

通话记录分析模块，用于在测试呼叫结束后，将智能语音机器人的通话记录导入，并将通话记录过程中的机器人意图分支记录下来形成话术路径；

路径判定模块，是对通话记录模块生成的话术路径与对话预期做对比，并判断是否测试通过；

结果输出模块，是对路径判定模块结果的汇总，并形成规范化的输出报表结果。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，如果待测试智能语音机器人是通过电话信道呼叫，则在系统中增加电话信道语音线路设备；如果待测试智能语音机器人是通过IP层VOIP呼叫，则在系统中增加IP层语音线路设备。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，所述测试语料是指模拟测试用的模拟用户说话的音频和时间线配置信息；测试用的模拟用户说话音频和时间线用于该系统在何时做出何种语音的应答。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，所述对话预期，是指智能语音机器人与测试系统对话结束后，生成的对话是否与预期一致；对话预期是以表格的形式记录对话过程中，每句话的意图分支是否与期望一致，并记录下每个分支的实际情况。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，语句识别模块采用VAD算法对智能语音机器人的音频做端点检测,检测出语音机器人说话的开始与结束，从而识别出完整的语句；

端点检测采用短时能量检测，

其中，E_n为x_n(m)的短时能量，x_n(m)为第n帧中第m毫秒语音信号，m为第n帧第m毫秒，N为帧长。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，所述媒体连接，是指两个终端或者服务器之间建立起实时传输协议RTP流，语音媒体通过udp/tcp协议传输的过程。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，还包括特殊音频合成模块，特殊音频合成模块，用于针对预设的测试场景，对测试用的音频做背景白噪添加处理，处理后的音频将由语音播放模块播放。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，所述通话记录，是指在智能语音机器人完成一通通话时，会产生一个文本记录；用于记录机器人和用户之间的对话。

作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案，话术是树状结构，或是图状结构，无论是哪种结构都会从起始点经过一系列的节点，最终到达结束点；所述话术路径，即指从开始节点到结束节点过程中的一系列节点的集合。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

本发明通过模拟人与智能语音机器人交互的过程，完成对智能语音机器人的测试过程，从而解放测试生产力，提高生产效率。

附图说明

图1是话术树状结构举例。

图2为一种智能语音机器人话术测试系统架构图。

图3为一种智能语音机器人话术测试系统工作流程图(Outbound call外呼)。

图4为使用无线语音网关对接待测试智能语音机器人图。

图5为使用IP语音网关对接智能语音机器人图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明：

本发明的实施样例流程，如图3，这里阐述一下具体工作流程。

(S1)在测试开始时，准备好测试语料与测试预期，并导入系统。测试语料的形式可以如下,但不一定拘泥于如下形式，

例如，

第一句话结束后500毫秒，播放语音文件1.wav

第二句话结束后300毫秒，播放语音文件2.wav

......

第N句话结束后500毫秒，播放语音文件n.wav

测试预期的形式可以如下，但不一定拘泥于如下形式，

以图1话术为例，例如，

第二句话预期意图为接受，话术分支会走C1

......

系统中的测试语料加载模块和对话预期加载模块会分别处理测试语料和测试预期。为呼叫做好准备。图2为一种智能语音机器人话术测试系统架构图。

(S2)准备好后，使用待测试的智能语音机器人对测试系统发起呼叫。呼叫服务器接收到来自待测试的智能语音机器人的呼叫，建立通话。语句识别模块负责处理待测试语音机器人的说话，并判定说话结束。

(S3)待测试智能语音机器人的话术是否结束，如果结束，智能语音机器人会主动挂机。如果没有结束，智能语音机器人会按照话术的定义播放下一条语音。

(S4)智能语音机器人说话，说话语音被对话测试服务器接收。语句识别模块会识别出句子是否结束。

(S5)句子结束后，系统会从测试语料中选出回复的语音。根据实际需要，如增加背景噪声，可以通过特殊音频合成模块对回复语音。

(S6)播放语音模块负责将语音“回复”给智能语音机器人。

(S7)对话结束后，测试系统收取到待测试机器人的通话记录。通话记录处理模块根据通话记录做意图分支等记录，处理完后将结果发送给路径判定模块。

(S8)路径判定模块根据通话记录收集通话过程中的路径信息。

(S9)结果输出模块负责将按照指定格式打印出来。

有关本发明中测试系统与待测试语音机器人通信层对接举如下两个实施样例，但具体方式不限于此。

A.对接使用电话信道通信的智能语音机器人，请参考图4。具体对接实施过程如下，

电话信道的呼叫会从运营商网络路由过来，最终由无线语音网络接收。无线网关将信令信号传递给呼叫服务器，呼叫服务器接收到信令信号，进而通过信令交互建立呼叫。

B.对接使用IP层通信的智能语音机器人，请参考图5.具体对接实施过程如下，

IP层信道从IP网络路由过来，最终由IP语音网络接收。无线网关将信令信号传递给呼叫服务器，呼叫服务器接受到信令信息，进而通过信令交互建立呼叫。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围内。

Claims

1.一种智能语音机器人话术测试系统，其特征在于，包括呼叫服务器和对话测试服务器，其中，

测试语料加载模块，用于将测试语料加载入系统中；

对话预期加载模块，用于负责将对话预期输入系统；

2.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，如果待测试智能语音机器人是通过电话信道呼叫，则在系统中增加电话信道语音线路设备；如果待测试智能语音机器人是通过IP层VOIP呼叫，则在系统中增加IP层语音线路设备。

3.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，所述测试语料是指模拟测试用的模拟用户说话的音频和时间线配置信息；测试用的模拟用户说话音频和时间线用于该系统在何时做出何种语音的应答。

4.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，所述对话预期，是指智能语音机器人与测试系统对话结束后，生成的对话是否与预期一致；对话预期是以表格的形式记录对话过程中，每句话的意图分支是否与期望一致，并记录下每个分支的实际情况。

5.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，语句识别模块采用VAD算法对智能语音机器人的音频做端点检测,检测出语音机器人说话的开始与结束，从而识别出完整的语句；

端点检测采用短时能量检测，

6.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，所述媒体连接，是指两个终端或者服务器之间建立起实时传输协议RTP流，语音媒体通过udp/tcp协议传输的过程。

7.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，还包括特殊音频合成模块，特殊音频合成模块，用于针对预设的测试场景，对测试用的音频做背景白噪添加处理，处理后的音频将由语音播放模块播放。

8.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，所述通话记录，是指在智能语音机器人完成一通通话时，会产生一个文本记录；用于记录机器人和用户之间的对话。

9.根据权利要求1所述的一种智能语音机器人话术测试系统，其特征在于，话术是树状结构，或是图状结构，无论是哪种结构都会从起始点经过一系列的节点，最终到达结束点；所述话术路径，即指从开始节点到结束节点过程中的一系列节点的集合。