CN114999494A - 语音交互功能的测试方法和装置、存储介质及电子装置 - Google Patents
语音交互功能的测试方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN114999494A CN114999494A CN202210552454.4A CN202210552454A CN114999494A CN 114999494 A CN114999494 A CN 114999494A CN 202210552454 A CN202210552454 A CN 202210552454A CN 114999494 A CN114999494 A CN 114999494A
- Authority
- CN
- China
- Prior art keywords
- test
- client
- text
- determining
- response information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 374
- 230000003993 interaction Effects 0.000 title claims abstract description 105
- 230000004044 response Effects 0.000 claims abstract description 124
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000002452 interceptive effect Effects 0.000 claims abstract description 33
- 230000006870 function Effects 0.000 claims description 105
- 238000013515 script Methods 0.000 claims description 31
- 230000002159 abnormal effect Effects 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000005316 response function Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004887 air purification Methods 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Abstract
本申请公开了一种语音交互功能的测试方法和装置、存储介质及电子装置,涉及智能家居领域,方法包括:获取用于对客户端进行语音交互功能测试的第一测试文本;在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
Description
技术领域
本发明涉及通信领域,具体而言,涉及一种语音交互功能的测试方法和装置、存储介质及电子装置。
背景技术
具有语音交互功能的客户端,即智能语音应用,在上线之前要通过一系列的测试确保客户端的语音交互功能正常后,才能合格通过,最终合格上线下载。客户端的语音交互功能作为新兴功能,上线测试没有自动化测试软件,仅依靠流水线工人的手动测试,按照测试指令做验证,不仅大大降低了客户端的上线效率,且因人工参与测试结果准确性难以保障。
目前客户端的上线测试没有自动化测试软件,在智能语音应用测试语音交互时,需要人工手动点击“唤醒”按钮,之后输入语音,得到回复之后,通过人工判断结果正确性,从而确定语音交互的成功率。该测试方案存在繁琐费时,易漏测等缺点。
针对相关技术中,对客户端的语音交互功能的测试方案繁琐费时,易漏测等问题,尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音交互功能的测试方法和装置、存储介质及电子装置,以至少解决相关技术中,对客户端的语音交互功能的测试方案繁琐费时,易漏测等问题。
根据本发明实施例的一个实施例,提供了一种语音交互功能的测试方法,包括:获取用于对客户端进行语音交互功能测试的第一测试文本;在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
在一个示例性实施例中,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息,包括:获取用于定位所述客户端对应的交互界面中的文本框的第一测试脚本;通过所述第一测试脚本分析所述客户端的交互界面中的第一界面元素,以获取所述第一界面元素中的第一文本框和第二文本框;提取所述第一文本框中的第一文本信息,根据第一文本信息确定所述客户端对所述测试音频进行转换得到的第二测试文本;以及提取所述第二文本框中的第二文本信息,根据所述第二文本信息确定所述客户端响应所述测试音频的第一响应信息。
在一个示例性实施例中,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息,包括:在获取到所述客户端根据所述测试音频进行转换得到的第二测试文本的情况下,确定所述第一测试文本和所述第二测试文本的第一相似值;在所述第一测试文本和所述第二测试文本的第一相似值小于所述第一预设阈值的情况下,控制所述上位机再次根据所述第一测试文本播放对应的测试音频,获取所述客户端根据所述测试音频进行转换得到的第三测试文本,以及所述第一测试文本和所述第三测试文本的第三相似值;在所述第三相似值大于或等于所述第一预设阈值的情况下,确定所述客户端响应所述测试音频的第一响应信息。
在一个示例性实施例中,确定所述客户端的语音交互功能正常之前,所述方法还包括:向搜索服务器发送请求获取所述测试音频对应的预设响应信息的获取请求;在接收到所述搜索服务器发送的响应所述获取请求的第二响应信息的情况下,提取所述预设响应信息的第一关键字,以及提取所述第一响应信息的第二关键字,其中,所述第二响应信息中包含所述预设响应信息;确定所述第一关键字和所述第二关键字的相似值,并将所述相似值作为所述第一响应信息与预设响应信息的第二相似值。
在一个示例性实施例中,获取用于对客户端进行语音交互功能测试的第一测试文本之前,所述方法还包括:获取用于模拟点击客户端对应的交互界面中的麦克风控件的第二测试脚本;通过所述第二测试脚本分析所述客户端对应的交互界面中的第二界面元素,并在所述第二界面元素中确定麦克风控件;通过所述第二测试脚本模拟点击所述麦克风控件,以开启所述客户端的语音交互功能。
在一个示例性实施例中,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息之后,所述方法还包括:在所述第一测试文本和所述第二测试文本的第一相似值小于第一预设阈值,和/或,所述第一响应信息与预设响应信息的第二相似值小于第二预设阈值的情况下,确定所述客户端的语音交互功能异常;根据所述第二测试文本和所述第一响应信息,确定所述客户端的语音交互功能异常的异常原因信息;将所述异常原因信息发送至客户端对应的服务器系统。
在一个示例性实施例中,获取用于对客户端进行语音交互功能测试的第一测试文本之后,所述方法还包括:在多个上位机中确定具备从文本到语音的转换功能的所述目标上位机;将所述第一测试文本发送至所述目标上位机,以使所述目标上位机通过从文本到语音的转换功能将所述第一测试文本转换为测试音频,并播放所述测试音频。
根据本发明实施例的另一个实施例,还提供了一种语音交互功能的测试装置,包括:获取模块,用于获取用于对客户端进行语音交互功能测试的第一测试文本;第一确定模块,用于在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;第二确定模块,用于在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音交互功能的测试方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的语音交互功能的测试方法。
在本发明实施例中,获取用于对客户端进行语音交互功能测试的第一测试文本;在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常;采用上述技术方案,解决了对客户端的语音交互功能的测试方案繁琐费时,易漏测等问题,进而可以解决提高了对客户端进行语音交互功能测试时,输入测试语料的效率;以及即使在语料较多的情况下,也不会发生遗漏某些语料的情况。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种语音交互功能的测试方法的硬件环境示意图;
图2是根据本发明实施例的语音交互功能的测试方法的流程图;
图3是根据本发明可选实施例的语音交互功能的测试方法的系统框图;
图4是根据本发明可选实施例的语音交互功能的测试方法的流程图;
图5是根据本发明可选实施例的语音交互功能的测试方法的示意图;
图6是根据本发明实施例的一种语音交互功能的测试装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种语音交互功能的测试方法。该语音交互功能的测试法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述语音交互功能的测试方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
在本实施例中提供了一种语音交互功能的测试方法,图2是根据本发明实施例的语音交互功能的测试方法的流程图,该流程包括如下步骤:
步骤S202,获取用于对客户端进行语音交互功能测试的第一测试文本;
步骤S204,在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;
步骤S206,在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
通过上述步骤,获取用于对客户端进行语音交互功能测试的第一测试文本;在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常,解决了相关技术中,对客户端的语音交互功能的测试方案繁琐费时,易漏测等问题,进而可以解决提高了对客户端进行语音交互功能测试时,输入测试语料的效率;以及即使在语料较多的情况下,也不会发生遗漏某些语料的情况。
在一个示例性实施例中,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息,包括:获取用于定位所述客户端对应的交互界面中的文本框的第一测试脚本;通过所述第一测试脚本分析所述客户端的交互界面中的第一界面元素,以获取所述第一界面元素中的第一文本框和第二文本框;提取所述第一文本框中的第一文本信息,根据第一文本信息确定所述客户端对所述测试音频进行转换得到的第二测试文本;以及提取所述第二文本框中的第二文本信息,根据所述第二文本信息确定所述客户端响应所述测试音频的第一响应信息。
也就是说,为了自动测试客户端的语音交互功能,需要构建用于定位所述客户端对应的交互界面中的文本框的第一测试脚本、获取用于模拟点击客户端对应的交互界面中的麦克风控件的第二测试脚本等多个测试脚本;在确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息时,获取预先构建的用于定位所述客户端对应的交互界面中的文本框的第一测试脚本,通过第一测试脚本在客户端的交互界面确定第一文本框和第二文本框的位置,以及提取所述第一文本框中的第一文本信息和第二文本框的第二文本信息,第一文本信息即为客户端根据测试音频进行转换得到的第二测试文本,第二文本信息即为客户端响应测试音频的第一响应信息。
在一个示例性实施例中,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息,包括以下步骤:
步骤S2041:在获取到所述客户端根据所述测试音频进行转换得到的第二测试文本的情况下,确定所述第一测试文本和所述第二测试文本的第一相似值;
步骤S2042:在所述第一测试文本和所述第二测试文本的第一相似值小于所述第一预设阈值的情况下,控制所述上位机再次根据所述第一测试文本播放对应的测试音频;
步骤S2043:获取所述客户端根据所述测试音频进行转换得到的第三测试文本,以及所述第一测试文本和所述第三测试文本的第三相似值;
步骤S2044:在所述第三相似值大于或等于所述第一预设阈值的情况下,确定所述客户端响应所述测试音频的第一响应信息;在所述第三相似值小于所述第一预设阈值的情况下,执行步骤S2042-S2043。
也就是说,首先,确定客户端对测试音频进行转换得到的第二测试文本与测试音频对应的第一测试文本的第一相似值;在第一相似值小于第一预设阈值的情况下,确定所述客户端的语音转换功能异常;在第一相似值大于或等于第一预设阈值的情况下,确定所述客户端的语音转换功能正常;其次,在客户端的语音转换功能正常的情况下,确定所述客户端响应所述测试音频的第一响应信息;在客户端的语音转换功能异常的情况下,客户端再次根据测试音频进行转换得到的第三测试文本,以及确定第一测试文本和所述第三测试文本的第三相似值。
需要说明的是,所述语音交互功能包括:语音转换功能和语音响应功能。客户端对测试音频进行转换得到的测试文本与测试音频对应的测试文本的相似值大于或等于第一预设阈值的情况下,确定所述客户端的语音转换功能正常;在客户端响应所述测试音频的响应信息与预设响应信息的相似度大于或等于第二预设阈值的情况下,确定所述客户端的语音响应功能正常。
在一个示例性实施例中,确定所述客户端的语音交互功能正常之前,向搜索服务器发送请求获取所述测试音频对应的预设响应信息的获取请求;在接收到所述搜索服务器发送的响应所述获取请求的第二响应信息的情况下,提取所述预设响应信息的第一关键字,以及提取所述第一响应信息的第二关键字,其中,所述第二响应信息中包含所述预设响应信息;确定所述第一关键字和所述第二关键字的相似值,并将所述相似值作为所述第一响应信息与预设响应信息的第二相似值。
本发明实施例给出了一种确定第一响应信息与预设响应信息的第二相似值的方法,具体如下:向搜索服务器发送获取所述测试音频对应的预设响应信息的获取请求;搜索服务器根据获取请求向服务器系统发送预设响应信息,在服务器接收到预设响应信息的情况下,提取预设响应信息的第一关键字以及提取第一响应信息的第二关键字;根据第一关键字和第二关键字的相似值确定所述第一响应信息与预设响应信息的第二相似值。
举例来讲,在测试音频为“今天天气如何”的情况下,确定客户端的第一响应信息为“今天天气晴朗,温度为10℃-15℃”,以及搜索服务器发送的预设响应信息为“温度为10℃-15℃,天气晴”,提取第一关键字为“温度:10℃-15℃,晴”,第二关键字为“晴,温度:10℃-15℃”,将第一关键字和第二关键字的相似值作为所述第一响应信息与预设响应信息的第二相似值,需要说明的是,上述实施例仅是为了更好的理解本发明,本发明对上述数值不做限定。
在一个示例性实施例中,获取用于对客户端进行语音交互功能测试的第一测试文本之前,获取用于模拟点击客户端对应的交互界面中的麦克风控件的第二测试脚本;通过所述第二测试脚本分析所述客户端对应的交互界面中的第二界面元素,并在所述第二界面元素中确定麦克风控件;通过所述第二测试脚本模拟点击所述麦克风控件,以开启所述客户端的语音交互功能。
也就是说,本发明实施例还可以实现自动点击客户端的麦克风控件,具体的,通过第二测试脚本在交互界面中确定麦克风控件,以及通过所述第二测试脚本模拟点击所述麦克风控件,以开启所述客户端的语音交互功能,实现了模拟唤醒设备的技术效果,使得功能测试更加智能化。
在一个示例性实施例中,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息之后,在所述第一测试文本和所述第二测试文本的第一相似值小于第一预设阈值,和/或,所述第一响应信息与预设响应信息的第二相似值小于第二预设阈值的情况下,确定所述客户端的语音交互功能异常;根据所述第二测试文本和所述第一响应信息,确定所述客户端的语音交互功能异常的异常原因信息;将所述异常原因信息发送至客户端对应的服务器系统。
也就是说,确定语音交互功能的异常原因信息,以使目标对象根据异常原因信息对客户端进行优化;例如,异常原因信息为:客户端转换的文本信息与测试音频对应的文本信息的相似度小于预设阈值,语音转换功能存在异常;客户端响应测试音频的响应信息与测试音频对应的预设响应信息的相似度小于预设阈值,语音响应功能存在异常等。
在一个示例性实施例中,获取用于对客户端进行语音交互功能测试的第一测试文本之后,在多个上位机中确定具备从文本到语音的转换功能的所述目标上位机;将所述第一测试文本发送至所述目标上位机,以使所述目标上位机通过从文本到语音的转换功能将所述第一测试文本转换为测试音频,并播放所述测试音频。
本发明实施例中,通过上位机自动播放测试音频,因此在确定目标上位机时,需要在多个上位机中确定具备从文本到语音的转换功能的所述目标上位机,以使服务器系统将测试文本发送至目标上位机时,目标上位机可以将所述第一测试文本转换为测试音频,并播放所述测试音频。
为了更好的理解上述语音交互功能的测试方法的过程,以下再结合可选实施例对上述语音交互功能的测试的实现方法流程进行说明,但不用于限定本发明实施例的技术方案。
在本实施例中提供了一种语音交互功能的测试方法,图3是根据本发明可选实施例的语音交互功能的测试方法的系统框图,具体包括:上位机、云端服务器(相当于上述服务器系统)、搭载智能语音应用(相当于上述实施例中的客户端)的安卓设备。
本申请所提供的语音交互功能的测试方法的具体流程如图4所示,图4是根据本发明可选实施例的语音交互功能的测试方法的流程图,具体如下步骤:
步骤S401:启动测试;
步骤S402:通过测试脚本启动语音应用,并且跳转到语音交互界面;
在本方案中,通过自动化测试框架,如APPIUM等,模拟人工操作,打开要测试的语音应用并且跳转到要测试的语音交互界面,如图5,图5是根据本发明可选实施例的语音交互功能的测试方法的示意图。
步骤S403:模拟点击唤醒按钮,如图5中的麦克风图标;
通过测试脚本(相当于上述实施例中的第二测试脚本)分析界面元素,定位到麦克风图标,并且模拟人手工点击,用于唤醒设备,进入拾音流程。
步骤S404:判断是否进入拾音流程;若进入拾音流程,执行步骤S405,否则,执行步骤S403;
步骤S405:通过测试脚本控制上位机播放测试音频;
具体的,将测试语料(相当于上述实施例中的测试文本)通过TTS(TextToSpeech)转换为测试音频并且播放至被测设备;
步骤S406:判断智能语音应用转换的文字是否和测试音频对应的文字一致;
在智能语音应用转换的文字和测试音频对应的文字一致的情况下,执行步骤S407;否则,执行步骤S405;
步骤S407:提取智能语音应用的回复(相当于上述实施例中的第一响应信息);
步骤S408:将收到的回复与预期回复(相当于上述实施例中的预设响应信息)进行对比,判断是否符合预期;在符合预期的情况下,执行步骤S409,否则执行步骤S410;
例如,用户输入语料为“天气”,收到的回复为“北京今天天气阴转晴”等文字信息,可以定位到该文本框并且提取出关键字,如“天气”,“度”,“风”等,并且与预期回复进行比较,如果与预期回复一致,则将本次交互标记为成功,否则标记为失败。
步骤S409:交互结果成功;
步骤S410:交互结果失败。
通过上述实施例,解决了相关技术中,对客户端的语音交互功能的测试方案繁琐费时,易漏测等问题,进而可以解决提高了对客户端进行语音交互功能测试时,输入测试语料的效率;以及即使在语料较多的情况下,也不会发生遗漏某些语料的情况。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
在本实施例中还提供了语音交互功能的测试装置,该语音交互功能的测试装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本发明实施例的一种语音交互功能的测试装置的结构框图;如图6所示,包括:
获取模块62,用于获取用于对客户端进行语音交互功能测试的第一测试文本;
第一确定模块64,用于在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;
第二确定模块66,用于在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
通过上述装置,获取用于对客户端进行语音交互功能测试的第一测试文本;在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常,解决了相关技术中,对客户端的语音交互功能的测试方案繁琐费时,易漏测等问题,进而可以解决提高了对客户端进行语音交互功能测试时,输入测试语料的效率;以及即使在语料较多的情况下,也不会发生遗漏某些语料的情况。
在一个示例性实施例中,第一确定模块,用于获取用于定位所述客户端对应的交互界面中的文本框的第一测试脚本;通过所述第一测试脚本分析所述客户端的交互界面中的第一界面元素,以获取所述第一界面元素中的第一文本框和第二文本框;提取所述第一文本框中的第一文本信息,根据第一文本信息确定所述客户端对所述测试音频进行转换得到的第二测试文本;以及提取所述第二文本框中的第二文本信息,根据所述第二文本信息确定所述客户端响应所述测试音频的第一响应信息。
在一个示例性实施例中,第一确定模块,用于在获取到所述客户端根据所述测试音频进行转换得到的第二测试文本的情况下,确定所述第一测试文本和所述第二测试文本的第一相似值;在所述第一测试文本和所述第二测试文本的第一相似值小于所述第一预设阈值的情况下,控制所述上位机再次根据所述第一测试文本播放对应的测试音频,获取所述客户端根据所述测试音频进行转换得到的第三测试文本,以及所述第一测试文本和所述第三测试文本的第三相似值;在所述第三相似值大于或等于所述第一预设阈值的情况下,确定所述客户端响应所述测试音频的第一响应信息。
在一个示例性实施例中,第二确定模块,用于向搜索服务器发送请求获取所述测试音频对应的预设响应信息的获取请求;在接收到所述搜索服务器发送的响应所述获取请求的第二响应信息的情况下,提取所述预设响应信息的第一关键字,以及提取所述第一响应信息的第二关键字,其中,所述第二响应信息中包含所述预设响应信息;确定所述第一关键字和所述第二关键字的相似值,并将所述相似值作为所述第一响应信息与预设响应信息的第二相似值。
在一个示例性实施例中,第一确定模块,用于获取用于模拟点击客户端对应的交互界面中的麦克风控件的第二测试脚本;通过所述第二测试脚本分析所述客户端对应的交互界面中的第二界面元素,并在所述第二界面元素中确定麦克风控件;通过所述第二测试脚本模拟点击所述麦克风控件,以开启所述客户端的语音交互功能。
在一个示例性实施例中,第二确定模块,用于在所述第一测试文本和所述第二测试文本的第一相似值小于第一预设阈值,和/或,所述第一响应信息与预设响应信息的第二相似值小于第二预设阈值的情况下,确定所述客户端的语音交互功能异常;根据所述第二测试文本和所述第一响应信息,确定所述客户端的语音交互功能异常的异常原因信息;将所述异常原因信息发送至客户端对应的服务器系统。
在一个示例性实施例中,第一确定模块,用于在多个上位机中确定具备从文本到语音的转换功能的所述目标上位机;将所述第一测试文本发送至所述目标上位机,以使所述目标上位机通过从文本到语音的转换功能将所述第一测试文本转换为测试音频,并播放所述测试音频。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,获取用于对客户端进行语音交互功能测试的第一测试文本;
S2,在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;
S3,在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取用于对客户端进行语音交互功能测试的第一测试文本;
S2,在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;
S3,在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种语音交互功能的测试方法,其特征在于,包括:
获取用于对客户端进行语音交互功能测试的第一测试文本;
在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;
在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
2.根据权利要求1所述的方法,其特征在于,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息,包括:
获取用于定位所述客户端对应的交互界面中的文本框的第一测试脚本;
通过所述第一测试脚本分析所述客户端的交互界面中的第一界面元素,以获取所述第一界面元素中的第一文本框和第二文本框;
提取所述第一文本框中的第一文本信息,根据第一文本信息确定所述客户端对所述测试音频进行转换得到的第二测试文本;以及提取所述第二文本框中的第二文本信息,根据所述第二文本信息确定所述客户端响应所述测试音频的第一响应信息。
3.根据权利要求1所述的方法,其特征在于,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息,包括:
在获取到所述客户端根据所述测试音频进行转换得到的第二测试文本的情况下,确定所述第一测试文本和所述第二测试文本的第一相似值;
在所述第一测试文本和所述第二测试文本的第一相似值小于所述第一预设阈值的情况下,控制所述上位机再次根据所述第一测试文本播放对应的测试音频,获取所述客户端根据所述测试音频进行转换得到的第三测试文本,以及所述第一测试文本和所述第三测试文本的第三相似值;
在所述第三相似值大于或等于所述第一预设阈值的情况下,确定所述客户端响应所述测试音频的第一响应信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,确定所述客户端的语音交互功能正常之前,所述方法还包括:
向搜索服务器发送请求获取所述测试音频对应的预设响应信息的获取请求;
在接收到所述搜索服务器发送的响应所述获取请求的第二响应信息的情况下,提取所述预设响应信息的第一关键字,以及提取所述第一响应信息的第二关键字,其中,所述第二响应信息中包含所述预设响应信息;
确定所述第一关键字和所述第二关键字的相似值,并将所述相似值作为所述第一响应信息与预设响应信息的第二相似值。
5.根据权利要求1-3任一项所述的方法,其特征在于,获取用于对客户端进行语音交互功能测试的第一测试文本之前,所述方法还包括:
获取用于模拟点击客户端对应的交互界面中的麦克风控件的第二测试脚本;
通过所述第二测试脚本分析所述客户端对应的交互界面中的第二界面元素,并在所述第二界面元素中确定麦克风控件;
通过所述第二测试脚本模拟点击所述麦克风控件,以开启所述客户端的语音交互功能。
6.根据权利要求1-5任一项所述的方法,其特征在于,确定所述客户端根据所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息之后,所述方法还包括:
在所述第一测试文本和所述第二测试文本的第一相似值小于第一预设阈值,和/或,所述第一响应信息与预设响应信息的第二相似值小于第二预设阈值的情况下,确定所述客户端的语音交互功能异常;
根据所述第二测试文本和所述第一响应信息,确定所述客户端的语音交互功能异常的异常原因信息;
将所述异常原因信息发送至客户端对应的服务器系统。
7.根据权利要求1-5任一项所述的方法,其特征在于,获取用于对客户端进行语音交互功能测试的第一测试文本之后,所述方法还包括:
在多个上位机中确定具备从文本到语音的转换功能的所述目标上位机;
将所述第一测试文本发送至所述目标上位机,以使所述目标上位机通过从文本到语音的转换功能将所述第一测试文本转换为测试音频,并播放所述测试音频。
8.一种语音交互功能的测试装置,其特征在于,包括:
获取模块,用于获取用于对客户端进行语音交互功能测试的第一测试文本;
第一确定模块,用于在所述客户端对应的目标上位机根据所述第一测试文本播放对应的测试音频的情况下,通过分析所述客户端的交互界面中的第一界面元素,确定所述客户端对所述测试音频进行转换得到的第二测试文本,以及确定所述客户端响应所述测试音频的第一响应信息;
第二确定模块,用于在所述第一测试文本和所述第二测试文本的第一相似值大于或等于第一预设阈值,且所述第一响应信息与预设响应信息的第二相似值大于或等于第二预设阈值的情况下,确定所述客户端的语音交互功能正常。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210552454.4A CN114999494A (zh) | 2022-05-20 | 2022-05-20 | 语音交互功能的测试方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210552454.4A CN114999494A (zh) | 2022-05-20 | 2022-05-20 | 语音交互功能的测试方法和装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114999494A true CN114999494A (zh) | 2022-09-02 |
Family
ID=83027179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210552454.4A Pending CN114999494A (zh) | 2022-05-20 | 2022-05-20 | 语音交互功能的测试方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114999494A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160050317A1 (en) * | 2014-08-15 | 2016-02-18 | Accenture Global Services Limited | Automated testing of interactive voice response systems |
US20160134752A1 (en) * | 2014-11-12 | 2016-05-12 | 24/7 Customer, Inc. | Method and apparatus for facilitating speech application testing |
CN109360550A (zh) * | 2018-12-07 | 2019-02-19 | 上海智臻智能网络科技股份有限公司 | 语音交互系统的测试方法、装置、设备和存储介质 |
US20200184978A1 (en) * | 2018-12-07 | 2020-06-11 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, and device for matching speech with text, and computer-readable storage medium |
CN112466302A (zh) * | 2020-11-23 | 2021-03-09 | 北京百度网讯科技有限公司 | 语音交互的方法、装置、电子设备和存储介质 |
CN113220590A (zh) * | 2021-06-04 | 2021-08-06 | 北京声智科技有限公司 | 语音交互应用的自动化测试方法、装置、设备及介质 |
CN113782004A (zh) * | 2021-09-17 | 2021-12-10 | 深圳追一科技有限公司 | 人机语音交互测试方法、装置、计算机设备和存储介质 |
-
2022
- 2022-05-20 CN CN202210552454.4A patent/CN114999494A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160050317A1 (en) * | 2014-08-15 | 2016-02-18 | Accenture Global Services Limited | Automated testing of interactive voice response systems |
US20160134752A1 (en) * | 2014-11-12 | 2016-05-12 | 24/7 Customer, Inc. | Method and apparatus for facilitating speech application testing |
CN109360550A (zh) * | 2018-12-07 | 2019-02-19 | 上海智臻智能网络科技股份有限公司 | 语音交互系统的测试方法、装置、设备和存储介质 |
US20200184978A1 (en) * | 2018-12-07 | 2020-06-11 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, and device for matching speech with text, and computer-readable storage medium |
CN112466302A (zh) * | 2020-11-23 | 2021-03-09 | 北京百度网讯科技有限公司 | 语音交互的方法、装置、电子设备和存储介质 |
CN113220590A (zh) * | 2021-06-04 | 2021-08-06 | 北京声智科技有限公司 | 语音交互应用的自动化测试方法、装置、设备及介质 |
CN113782004A (zh) * | 2021-09-17 | 2021-12-10 | 深圳追一科技有限公司 | 人机语音交互测试方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109448710B (zh) | 语音处理方法及装置、家电设备、存储介质电子装置 | |
CN115358395A (zh) | 知识图谱的更新方法和装置、存储介质及电子装置 | |
CN114755931A (zh) | 控制指令的预测方法和装置、存储介质及电子装置 | |
CN115269774A (zh) | 文本意图的识别方法和装置、存储介质和电子装置 | |
CN106713011A (zh) | 一种获取测试数据的方法与系统 | |
CN112735406A (zh) | 设备的控制方法及装置、存储介质及电子装置 | |
CN114999494A (zh) | 语音交互功能的测试方法和装置、存储介质及电子装置 | |
CN114915514B (zh) | 意图的处理方法和装置、存储介质及电子装置 | |
CN115499333A (zh) | 关联关系的确定方法、系统、存储介质及电子装置 | |
CN115934523A (zh) | 目标测试数据的生成方法、装置、存储介质及电子装置 | |
CN114861678A (zh) | 时间信息的确定方法和装置、存储介质及电子装置 | |
CN115345225A (zh) | 推荐场景的确定方法及装置、存储介质及电子装置 | |
CN114826899B (zh) | 设备控制服务的调试方法和装置、存储介质及电子装置 | |
CN115460117A (zh) | 设备测试方法和装置、存储介质及电子装置 | |
CN115357446A (zh) | 设备的测试方法和装置、存储介质及电子装置 | |
CN115497453A (zh) | 识别模型的评估方法及装置、存储介质及电子装置 | |
CN115629961A (zh) | 调试结果的确定方法、装置、存储介质及电子装置 | |
CN117953867A (zh) | 智能设备的测试方法、测试装置及电子装置 | |
CN115171657A (zh) | 语音设备的测试方法和装置、存储介质 | |
CN116153345A (zh) | 播放测试方法及装置、存储介质及电子装置 | |
CN116301511A (zh) | 设备交互方法、装置、存储介质及电子装置 | |
CN117687903A (zh) | 测试用例的生成方法及装置、存储介质、电子装置 | |
CN114743542A (zh) | 语音处理的方法、装置、存储介质及电子装置 | |
CN114360498A (zh) | 智能家电的测试系统、方法及装置、计算机可读存储介质 | |
CN116192548A (zh) | 消息推送方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |