CN111696576A - 一种智能语音机器人话术测试系统 - Google Patents

一种智能语音机器人话术测试系统 Download PDF

Info

Publication number
CN111696576A
CN111696576A CN202010434523.2A CN202010434523A CN111696576A CN 111696576 A CN111696576 A CN 111696576A CN 202010434523 A CN202010434523 A CN 202010434523A CN 111696576 A CN111696576 A CN 111696576A
Authority
CN
China
Prior art keywords
intelligent voice
test
module
call
voice robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010434523.2A
Other languages
English (en)
Inventor
张晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengzhi Information Technology Nanjing Co ltd
Original Assignee
Shengzhi Information Technology Nanjing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengzhi Information Technology Nanjing Co ltd filed Critical Shengzhi Information Technology Nanjing Co ltd
Priority to CN202010434523.2A priority Critical patent/CN111696576A/zh
Publication of CN111696576A publication Critical patent/CN111696576A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/10Architectures or entities
    • H04L65/1046Call controllers; Call servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种智能语音机器人话术测试系统,包括呼叫服务器和对话测试服务器,其中,呼叫服务器,用于根据对话测试服务器的指令来发起呼叫或者接收来自待测试智能语音机器人呼入的呼叫;对话测试服务器,用于负责与智能语音机器人做媒体上的交互,即对话或通话;通话从呼叫服务器建立以后,对话测试服务器与待测试的智能语音机器人就建立起了语音媒体连接;对话测试服务器包括测试语料加载模块、对话预期加载模块、语句识别模块、语音播放模块、通话记录分析模块、路径判定模块和结果输出模块;以下的系统均指智能语音机器人话术测试系统;本发明完成对智能语音机器人的测试过程,从而解放测试生产力,提高生产效率。

Description

一种智能语音机器人话术测试系统
技术领域
本发明涉及智能语音技术领域,特别是一种智能语音机器人话术测试系统。
背景技术
随着以深度学习为代表的人工智能技术的发展,ASR(语音识别)和TTS(文本转语音,亦语音合成)也得到进一步发展与提升。智能化的语音机器人也相继面世。
智能语音机器人,这里“语音”不仅仅指通过电话信道做呼叫的方式,同时也包含了IP层的VOIP语音方式。这里“智能”指的是包含根据业务场景设定的话术,机器人将在话术范畴内做出回应。
目前市面上各式各样的智能语音机器人被不断创造出来,智能语音机器人所依赖的话术随着业务复杂性的增长,也变得越来越难以被充分测试。
在智能语音机器人刚起步的阶段,业务一般比较简单,话术并不复杂,测试方法大多是人工完成。通过电话/VOIP等方式验证话术的正确性。
但是随着业务的发展,话术越来越复杂。人工测试便变得越来越低效了。而且,随着NLP(自然语言处理)技术的发展,对于意图的理解也从关键字理解升级为通过深度学习训练模型来匹配意图。这一种情况更难以用人工完成了。
综上现在主要存在的问题可以概括为,缺乏一个行之有效的智能语音机器人测试系统。具体问题有:
1.人工测试低效而且无法测试所有复杂的业务分支;
2.人工测试无法完成特殊场景测试,比如某种噪音下的语音,如办公室背景,或者大街上等测试场景。
发明内容
本发明所要解决的技术问题是克服现有技术的不足而提供一种智能语音机器人话术测试系统,本发明通过模拟人与智能语音机器人交互的过程,完成对智能语音机器人的测试过程,从而解放测试生产力,提高生产效率;具有普适性,可以完全代替真人去做呼叫测试。
本发明为解决上述技术问题采用以下技术方案:
根据本发明提出的一种智能语音机器人话术测试系统,包括呼叫服务器和对话测试服务器,其中,
呼叫服务器,用于根据对话测试服务器的指令来发起呼叫或者接收来自待测试智能语音机器人呼入的呼叫;
对话测试服务器,用于负责与智能语音机器人做媒体上的交互,即对话或通话;通话从呼叫服务器建立以后,对话测试服务器与待测试的智能语音机器人就建立起了语音媒体连接;
对话测试服务器包括测试语料加载模块、对话预期加载模块、语句识别模块、语音播放模块、通话记录分析模块、路径判定模块和结果输出模块;以下的系统均指智能语音机器人话术测试系统;其中,
测试语料加载模块,用于将测试语料加载入系统中;
对话预期加载模块,用于负责将对话预期输入系统;
语句识别模块,用于处理待测试智能语音机器人输入的音频、识别出完整的语句,并输出播放音频的路径至语音播放模块;输出播放音频的路径至语音播放模块作为对待测试智能语音机器人输入音频的回答;
语音播放模块,用于根据接收的播放音频的路径,播放其路径上的音频文件;
通话记录分析模块,用于在测试呼叫结束后,将智能语音机器人的通话记录导入,并将通话记录过程中的机器人意图分支记录下来形成话术路径;
路径判定模块,是对通话记录模块生成的话术路径与对话预期做对比,并判断是否测试通过;
结果输出模块,是对路径判定模块结果的汇总,并形成规范化的输出报表结果。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,如果待测试智能语音机器人是通过电话信道呼叫,则在系统中增加电话信道语音线路设备;如果待测试智能语音机器人是通过IP层VOIP呼叫,则在系统中增加IP层语音线路设备。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,所述测试语料是指模拟测试用的模拟用户说话的音频和时间线配置信息;测试用的模拟用户说话音频和时间线用于该系统在何时做出何种语音的应答。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,所述对话预期,是指智能语音机器人与测试系统对话结束后,生成的对话是否与预期一致;对话预期是以表格的形式记录对话过程中,每句话的意图分支是否与期望一致,并记录下每个分支的实际情况。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,语句识别模块采用VAD算法对智能语音机器人的音频做端点检测,检测出语音机器人说话的开始与结束,从而识别出完整的语句;
端点检测采用短时能量检测,
Figure BDA0002501719470000031
其中,En为xn(m)的短时能量,xn(m)为第n帧中第m毫秒语音信号,m为第n帧第m毫秒,N为帧长。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,所述媒体连接,是指两个终端或者服务器之间建立起实时传输协议RTP流,语音媒体通过udp/tcp协议传输的过程。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,还包括特殊音频合成模块,特殊音频合成模块,用于针对预设的测试场景,对测试用的音频做背景白噪添加处理,处理后的音频将由语音播放模块播放。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,所述通话记录,是指在智能语音机器人完成一通通话时,会产生一个文本记录;用于记录机器人和用户之间的对话。
作为本发明所述的一种智能语音机器人话术测试系统进一步优化方案,话术是树状结构,或是图状结构,无论是哪种结构都会从起始点经过一系列的节点,最终到达结束点;所述话术路径,即指从开始节点到结束节点过程中的一系列节点的集合。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明通过模拟人与智能语音机器人交互的过程,完成对智能语音机器人的测试过程,从而解放测试生产力,提高生产效率。
附图说明
图1是话术树状结构举例。
图2为一种智能语音机器人话术测试系统架构图。
图3为一种智能语音机器人话术测试系统工作流程图(Outbound call外呼)。
图4为使用无线语音网关对接待测试智能语音机器人图。
图5为使用IP语音网关对接智能语音机器人图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明的实施样例流程,如图3,这里阐述一下具体工作流程。
(S1)在测试开始时,准备好测试语料与测试预期,并导入系统。测试语料的形式可以如下,但不一定拘泥于如下形式,
例如,
第一句话结束后500毫秒,播放语音文件1.wav
第二句话结束后300毫秒,播放语音文件2.wav
......
第N句话结束后500毫秒,播放语音文件n.wav
测试预期的形式可以如下,但不一定拘泥于如下形式,
以图1话术为例,例如,
第二句话预期意图为接受,话术分支会走C1
......
系统中的测试语料加载模块和对话预期加载模块会分别处理测试语料和测试预期。为呼叫做好准备。图2为一种智能语音机器人话术测试系统架构图。
(S2)准备好后,使用待测试的智能语音机器人对测试系统发起呼叫。呼叫服务器接收到来自待测试的智能语音机器人的呼叫,建立通话。语句识别模块负责处理待测试语音机器人的说话,并判定说话结束。
(S3)待测试智能语音机器人的话术是否结束,如果结束,智能语音机器人会主动挂机。如果没有结束,智能语音机器人会按照话术的定义播放下一条语音。
(S4)智能语音机器人说话,说话语音被对话测试服务器接收。语句识别模块会识别出句子是否结束。
(S5)句子结束后,系统会从测试语料中选出回复的语音。根据实际需要,如增加背景噪声,可以通过特殊音频合成模块对回复语音。
(S6)播放语音模块负责将语音“回复”给智能语音机器人。
(S7)对话结束后,测试系统收取到待测试机器人的通话记录。通话记录处理模块根据通话记录做意图分支等记录,处理完后将结果发送给路径判定模块。
(S8)路径判定模块根据通话记录收集通话过程中的路径信息。
(S9)结果输出模块负责将按照指定格式打印出来。
有关本发明中测试系统与待测试语音机器人通信层对接举如下两个实施样例,但具体方式不限于此。
A.对接使用电话信道通信的智能语音机器人,请参考图4。具体对接实施过程如下,
电话信道的呼叫会从运营商网络路由过来,最终由无线语音网络接收。无线网关将信令信号传递给呼叫服务器,呼叫服务器接收到信令信号,进而通过信令交互建立呼叫。
B.对接使用IP层通信的智能语音机器人,请参考图5.具体对接实施过程如下,
IP层信道从IP网络路由过来,最终由IP语音网络接收。无线网关将信令信号传递给呼叫服务器,呼叫服务器接受到信令信息,进而通过信令交互建立呼叫。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。

Claims (9)

1.一种智能语音机器人话术测试系统,其特征在于,包括呼叫服务器和对话测试服务器,其中,
呼叫服务器,用于根据对话测试服务器的指令来发起呼叫或者接收来自待测试智能语音机器人呼入的呼叫;
对话测试服务器,用于负责与智能语音机器人做媒体上的交互,即对话或通话;通话从呼叫服务器建立以后,对话测试服务器与待测试的智能语音机器人就建立起了语音媒体连接;
对话测试服务器包括测试语料加载模块、对话预期加载模块、语句识别模块、语音播放模块、通话记录分析模块、路径判定模块和结果输出模块;以下的系统均指智能语音机器人话术测试系统;其中,
测试语料加载模块,用于将测试语料加载入系统中;
对话预期加载模块,用于负责将对话预期输入系统;
语句识别模块,用于处理待测试智能语音机器人输入的音频、识别出完整的语句,并输出播放音频的路径至语音播放模块;输出播放音频的路径至语音播放模块作为对待测试智能语音机器人输入音频的回答;
语音播放模块,用于根据接收的播放音频的路径,播放其路径上的音频文件;
通话记录分析模块,用于在测试呼叫结束后,将智能语音机器人的通话记录导入,并将通话记录过程中的机器人意图分支记录下来形成话术路径;
路径判定模块,是对通话记录模块生成的话术路径与对话预期做对比,并判断是否测试通过;
结果输出模块,是对路径判定模块结果的汇总,并形成规范化的输出报表结果。
2.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,如果待测试智能语音机器人是通过电话信道呼叫,则在系统中增加电话信道语音线路设备;如果待测试智能语音机器人是通过IP层VOIP呼叫,则在系统中增加IP层语音线路设备。
3.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,所述测试语料是指模拟测试用的模拟用户说话的音频和时间线配置信息;测试用的模拟用户说话音频和时间线用于该系统在何时做出何种语音的应答。
4.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,所述对话预期,是指智能语音机器人与测试系统对话结束后,生成的对话是否与预期一致;对话预期是以表格的形式记录对话过程中,每句话的意图分支是否与期望一致,并记录下每个分支的实际情况。
5.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,语句识别模块采用VAD算法对智能语音机器人的音频做端点检测,检测出语音机器人说话的开始与结束,从而识别出完整的语句;
端点检测采用短时能量检测,
Figure FDA0002501719460000021
其中,En为xn(m)的短时能量,xn(m)为第n帧中第m毫秒语音信号,m为第n帧第m毫秒,N为帧长。
6.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,所述媒体连接,是指两个终端或者服务器之间建立起实时传输协议RTP流,语音媒体通过udp/tcp协议传输的过程。
7.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,还包括特殊音频合成模块,特殊音频合成模块,用于针对预设的测试场景,对测试用的音频做背景白噪添加处理,处理后的音频将由语音播放模块播放。
8.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,所述通话记录,是指在智能语音机器人完成一通通话时,会产生一个文本记录;用于记录机器人和用户之间的对话。
9.根据权利要求1所述的一种智能语音机器人话术测试系统,其特征在于,话术是树状结构,或是图状结构,无论是哪种结构都会从起始点经过一系列的节点,最终到达结束点;所述话术路径,即指从开始节点到结束节点过程中的一系列节点的集合。
CN202010434523.2A 2020-05-21 2020-05-21 一种智能语音机器人话术测试系统 Pending CN111696576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010434523.2A CN111696576A (zh) 2020-05-21 2020-05-21 一种智能语音机器人话术测试系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010434523.2A CN111696576A (zh) 2020-05-21 2020-05-21 一种智能语音机器人话术测试系统

Publications (1)

Publication Number Publication Date
CN111696576A true CN111696576A (zh) 2020-09-22

Family

ID=72478122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010434523.2A Pending CN111696576A (zh) 2020-05-21 2020-05-21 一种智能语音机器人话术测试系统

Country Status (1)

Country Link
CN (1) CN111696576A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792819A (zh) * 2021-10-29 2021-12-14 百融至信(北京)征信有限公司 一种基于多任务模型的节点可复用智能外呼方法及系统
CN116030788A (zh) * 2023-02-23 2023-04-28 福建博士通信息股份有限公司 一种智能语音交互方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020077819A1 (en) * 2000-12-20 2002-06-20 Girardo Paul S. Voice prompt transcriber and test system
US20060224392A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation Test harness for a speech server
US20180122363A1 (en) * 2016-10-31 2018-05-03 International Business Machines Corporation System, method and computer program product for assessing the capabilities of a conversation agent via black box testing
CN108777141A (zh) * 2018-05-31 2018-11-09 康键信息技术(深圳)有限公司 测试装置、测试的方法及存储介质
CN109227558A (zh) * 2018-10-09 2019-01-18 北京智合大方科技有限公司 可实时调校的智能外呼机器人
CN109977202A (zh) * 2019-03-06 2019-07-05 北京西屋信维科技发展有限公司 一种智能客服系统及其控制方法
CN110675857A (zh) * 2019-09-23 2020-01-10 湖北亿咖通科技有限公司 一种语音识别自动化测试系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020077819A1 (en) * 2000-12-20 2002-06-20 Girardo Paul S. Voice prompt transcriber and test system
US20060224392A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation Test harness for a speech server
US20180122363A1 (en) * 2016-10-31 2018-05-03 International Business Machines Corporation System, method and computer program product for assessing the capabilities of a conversation agent via black box testing
CN108777141A (zh) * 2018-05-31 2018-11-09 康键信息技术(深圳)有限公司 测试装置、测试的方法及存储介质
CN109227558A (zh) * 2018-10-09 2019-01-18 北京智合大方科技有限公司 可实时调校的智能外呼机器人
CN109977202A (zh) * 2019-03-06 2019-07-05 北京西屋信维科技发展有限公司 一种智能客服系统及其控制方法
CN110675857A (zh) * 2019-09-23 2020-01-10 湖北亿咖通科技有限公司 一种语音识别自动化测试系统及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792819A (zh) * 2021-10-29 2021-12-14 百融至信(北京)征信有限公司 一种基于多任务模型的节点可复用智能外呼方法及系统
CN113792819B (zh) * 2021-10-29 2024-05-14 百融至信(北京)科技有限公司 一种基于多任务模型的节点可复用智能外呼方法及系统
CN116030788A (zh) * 2023-02-23 2023-04-28 福建博士通信息股份有限公司 一种智能语音交互方法及装置
CN116030788B (zh) * 2023-02-23 2023-06-09 福建博士通信息股份有限公司 一种智能语音交互方法及装置

Similar Documents

Publication Publication Date Title
CN111128126B (zh) 多语种智能语音对话的方法及系统
CN110049270B (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
US10810997B2 (en) Automated recognition system for natural language understanding
US10049676B2 (en) Automated speech recognition proxy system for natural language understanding
WO2021051506A1 (zh) 语音交互方法、装置、计算机设备及存储介质
US7392188B2 (en) System and method enabling acoustic barge-in
US8694324B2 (en) System and method of providing an automated data-collection in spoken dialog systems
CN102254556B (zh) 基于听者和说者的讲话风格比较估计听者理解说者的能力
US8560321B1 (en) Automated speech recognition system for natural language understanding
CN107818798A (zh) 客服服务质量评价方法、装置、设备及存储介质
CN108777751A (zh) 一种呼叫中心系统及其语音交互方法、装置和设备
US8515025B1 (en) Conference call voice-to-name matching
US10382624B2 (en) Bridge for non-voice communications user interface to voice-enabled interactive voice response system
CN105210355B (zh) 用于在电话呼叫的接收者判断不适合说话时应答电话呼叫的设备和相关方法
CN103903627A (zh) 一种语音数据的传输方法及装置
CN111294471B (zh) 一种智能电话应答方法和系统
WO2008084476A2 (en) Vowel recognition system and method in speech to text applications
US20070067172A1 (en) Method and apparatus for performing conversational opinion tests using an automated agent
CN111696576A (zh) 一种智能语音机器人话术测试系统
CN102196100A (zh) 通话即时翻译系统及方法
CN114143401B (zh) 一种电话客服应答适配方法和装置
CN110534084B (zh) 一种基于FreeSWITCH的智能语音控制方法及系统
RU2787530C1 (ru) Платформа автоматизации контакт-центров с использованием речевой аналитики
Murai et al. Dictation of multiparty conversation using statistical turn taking model and speaker model
JP2005123869A (ja) 通話内容書き起こしシステムおよび通話内容書き起こし方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination