CN108511000A - 一种测试智能音箱唤醒词识别率的方法及系统 - Google Patents
一种测试智能音箱唤醒词识别率的方法及系统 Download PDFInfo
- Publication number
- CN108511000A CN108511000A CN201810181704.1A CN201810181704A CN108511000A CN 108511000 A CN108511000 A CN 108511000A CN 201810181704 A CN201810181704 A CN 201810181704A CN 108511000 A CN108511000 A CN 108511000A
- Authority
- CN
- China
- Prior art keywords
- test
- sound box
- word
- intelligent sound
- wake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 151
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000001755 vocal effect Effects 0.000 claims abstract description 36
- 230000002618 waking effect Effects 0.000 claims abstract description 18
- 230000009466 transformation Effects 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 15
- 230000002452 interceptive effect Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 4
- 230000001276 controlling effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 241000208340 Araliaceae Species 0.000 claims description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 238000013102 re-test Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013095 identification testing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Stereophonic System (AREA)
Abstract
本发明提供一种测试智能音箱唤醒词识别率的方法和系统,测试端控制被测智能音箱播放调音音乐文件,通过分贝仪在唤醒词播放端抓取当前环境音量的分贝值,并根据该分贝值调节被测智能音箱的播放音量与测试要求相符;测试端让智能音箱播放有声内容,由所述分贝仪抓取当前环境音量的分贝值,记为参照值A,播放到特定时间点后控制所述唤醒语播放端播放唤醒词语音;由所述分贝仪在一测试周期内继续抓取当前环境音量的分贝值,记为测试值C,并将参照值A和测试值C发回测试端进行分析,并由测试端记录唤醒结果;测试端控制智能音箱变换播放的有声内容的类型及控制智能音箱变换所在位置的高度和水平方位角,重复测试。
Description
技术领域
本发明涉及一种智能设备,特别涉及一种测试智能音箱唤醒词识别率的方法及系统。
背景技术
智能语音交互是近几年的热点,亚马逊和谷歌等国际大公司先后都推出了智能音箱作为推进各自人工智能的入口。国内也有京东,百度,阿里等公司在智能领域有布局。语音识别技术发展也有二三十年的历史,只有近两三年如雨后春笋般在不同领域有应用,主要是由于硬件设备条件达到,在云端可以运行高复杂度的语音识别系统,并且识别率达到商用级别。因此,目前语音识别系统的自动化测试也有比较成熟的方法与装置,但对于设备端本地唤醒词的识别测试目前还没有公开成熟的方法,但是作为交互设备的唤醒功能,在整个交互过程中也是非常关键的一个环节,特别是作为音箱类产品,在正常播放歌曲或其他有声内容的时候唤醒设备进行交互是一个主要的场景,其识别率也是智能音箱的性能的一个重要指标。在开发或者认证阶段,都需要一个能够标准化的测试和可复现问题的测试系统来解决开发或者认证过程中遇到的一些问题。
发明内容
本发明要解决的技术问题,在于提供一种测试智能音箱唤醒词识别率的系统及系统,可以无人工的自动化长时间测试,还可以多方位、多维度进行测试,从而实现标准化的测试。
本发明方法是这样实现的:一种测试智能音箱唤醒词识别率的方法,包括:
步骤S1、测试端控制被测智能音箱播放调音音乐文件,通过分贝仪在唤醒词播放端抓取当前环境音量的分贝值,并根据该分贝值调节被测智能音箱的播放音量与测试要求相符;
步骤S2、测试端让智能音箱播放有声内容,由所述分贝仪抓取当前环境音量的分贝值,记为参照值A,播放到特定时间点后控制所述唤醒语播放端播放唤醒词语音;由所述分贝仪在一测试周期内继续抓取当前环境音量的分贝值,记为测试值C,并将参照值A和测试值C发回测试端进行分析,并由测试端记录唤醒结果。
进一步的,本发明还包括:
步骤S3、测试端控制智能音箱变换播放的有声内容的类型,重复步骤S1至S2;
步骤S4、测试端控制智能音箱变换所在位置的高度和水平方位角,重复步骤S1至S3。
进一步的,所述步骤S2的分析是:将测试值C与参照值A进行对比,若测试值C远远低于参照值A,则判断被测智能音箱已被唤醒,若测试值C接近参照值A,则判断智能音箱没有被唤醒。
进一步的,所述有声内容的类型包括流行乐,爵士乐,Radio和电子书;所述唤醒词语音由软件仿真得到,并保存在语音资源库中。
进一步的,所述唤醒词播放端为高保真喇叭;所述测试端为PC,且与被测智能音箱通过蓝牙连接;所述被测智能音箱所在位置的高度和水平方位角的变换是通过可调旋转台实现。
进一步的,所述特定时间点为10秒或20秒,所述测试周期为唤醒词语音播放完毕后的10秒。
本发明系统是这样实现的:一种测试智能音箱唤醒词识别率的系统,包括测试端、唤醒词播放端、分贝仪以及可调旋转台;被测智能音箱放置在可调旋转台上,所述分贝仪邻近所述唤醒词播放端放置;
所述测试端运行测试程序,该测试程序根据测试方案控制所述唤醒词播放端输出唤醒词语音,同时也控制可调旋转台的高度和水平方位角;所述分贝仪实时监测环境声音音量大小的分贝值;所述测试端根据分贝仪监测的分贝值来控制被测智能音箱播放有声内容的音量大小,同时在所述唤醒词播放端播放唤醒词语音后,在测试周期内根据分贝仪监测的分贝值分析被测智能音箱是否被唤醒。
进一步的,所述测试程序包括:核心控制模块、音频处理模块、转台控制模块、数据采集模块、结果输出模块以及音响交互模块;
所述核心控制模块,首先在确认好本次的测试项后,确认测试端与被测智能音箱以及与所述唤醒词播放端的音乐通路建立完成后,播放调音音乐文件,利用分贝仪进行被测智能音箱播放音量校准,使得分贝仪抓取的分贝值符合本次测试要求,向所述音频处理模块发送需要生成唤醒词语音和有声内容语音的指令,同时对所述转台控制模块发送转台控制指令,等到两个指令都得到执行后,通知所述音频处理模块按照测试要求播放本次测试有声内容文件,并通过音乐通路使被测智能音箱输出有声内容语音,播放到特定时间点,控制所述唤醒词播放端播放唤醒词语音,在播放有声内容语音和唤醒词语音完的过程中,发送指令给所述数据采集模块对当前的环境的分贝值进行数据采集,并将采集的数据进行比对分析,得到唤醒结果;
所述音频处理模块,首先从所述核心控制模块接收到需要生成唤醒词语音和有声内容语音的指令,从语音资源库中取出对应所述唤醒词语音的音频文件,并根据指令中的需要模拟距离的信息,经过空间传输模型处理后,输出符合指令要求的有声内容语音;将对应唤醒词语音和有声内容语音的两个音频文件进入本次测试的待播放环节,根据所述核心控制模块提供的播放控制指令,将两个音频文件配置对应的播放时序和传输的设备;
所述转台控制模块,根据被测智能音箱常用的几个位置和所述核心控制模块输出的转台控制指令,并根据转台当前的高度和方位角信息对比本次测试需要的位置信息,得到基于目前转台位置需要进行调控的信息传输给转台,等待转台反馈完成后,上报给所述核心控制模块;同时从数据采集模块获取的被测智能音箱麦克风输入数据和处理后数据至测试端,并存储在特定的位置;
所述数据采集模块,预设到被测智能音箱的系统软件中,主要处于音频系统端,用于打包麦克风输入的原始数据与经过麦克风阵列算法处理后的数据;
所述结果输出模块,从所述核心控制模块得到测试项和唤醒结果按照一定格式要求进行输出,如果遇到有唤醒失败则提供失败的采集数据的位置链接;
所述音响交互模块,用于测试端搜索播放设备并建立音乐通路。
进一步的,所述转台控制模块还模拟用户真实摆放被测智能音箱的位置高低和水平方位来产生了不同的交互效果。
进一步的,当智能音箱播放有声内容时,所述数据采集模块将采集的数据记为参照值A,当所述唤醒语播放端播放唤醒词语音后的测试周期内,所述数据采集模块将采集的数据记为测试值C,则将参照值A和测试值C进行对比,若测试值C远远低于参照值A,则判断被测智能音箱已被唤醒,若测试值C接近参照值A,则判断智能音箱没有被唤醒;并将唤醒结果同步输出给所述结果输出模块。
本发明具有如下优点:本发明可以实现无人工的自动化长时间测试智能音箱的唤醒性能,可以多方位、多维度进行测试,从而比较真实模拟智能音箱最终用户的使用场景,亦可提供比较量化的数字报告给开发者或生厂商,供开发者或生产商做对应的优化。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明测试方法及系统中各装置的连接示意图。
图2为本发明测试系统中测试程序的各模块组成架构图。
图3为本发明测试系统中核心控制模块功能执行流程图。
图4为本发明测试方法及系统中唤醒词语音和有声内容语音的产生过程流程图。
图5为本发明测试系统中转台控制模块功能执行流程图。
图6为本发明测试系统中音乐通路交互功能执行流程图。
具体实施方式
请参阅图1所示,本发明的测试智能音箱唤醒词识别率的系统,包括测试端、唤醒词播放端、分贝仪以及可调旋转台;被测智能音箱放置在可调旋转台上,所述唤醒词播放端和被测智能音箱可以分开放置,所述分贝仪邻近所述唤醒词播放端放置;在具体的实施例中,所述唤醒词播放端为高保真喇叭;所述测试端为PC,且与被测智能音箱通过蓝牙连接,保证连接方便可靠;所述被测智能音箱所在位置的高度和水平方位角的变换是通过可调旋转台实现,无需人工参与,以实现自动测试。
所述测试端运行测试程序,该测试程序根据测试方案控制所述唤醒词播放端输出唤醒词语音,同时也控制可调旋转台的高度和水平方位角;所述分贝仪实时监测环境声音音量大小的分贝值;所述测试端根据分贝仪监测的分贝值来控制被测智能音箱播放有声内容的音量大小,同时在所述唤醒词播放端播放唤醒词语音后,在测试周期内根据分贝仪监测的分贝值分析被测智能音箱是否被唤醒。
本发明的测试智能音箱唤醒词识别率的方法,包括:
步骤S1、测试端控制被测智能音箱播放调音音乐文件,通过分贝仪在唤醒词播放端抓取当前环境音量的分贝值,并根据该分贝值调节被测智能音箱的播放音量与测试要求相符。
步骤S2、测试端让智能音箱播放有声内容,有声内容的类型包括流行乐,爵士乐,Radio和电子书;由所述分贝仪抓取当前环境音量的分贝值(此时的分贝值接近播放调节好的调音音乐文件时的测试值),记为参照值A,播放到特定时间点后,如播放10秒或20秒后,控制所述唤醒语播放端播放唤醒词语音,唤醒词语音由软件仿真得到,并保存在语音资源库中;由所述分贝仪在一测试周期内,即唤醒词语音播放完毕后的10秒内(该测试周期可供配置)内,继续抓取当前环境音量的分贝值,记为测试值C,并将参照值A和测试值C发回测试端进行分析,并由测试端记录唤醒结果;其中,分析过程是:将测试值C与参照值A进行对比,若测试值C远远低于参照值A,则判断被测智能音箱已被唤醒,若测试值C接近参照值A,则判断智能音箱没有被唤醒;通常低于10DB以上可认为唤醒,具体的还得看当时环境分贝值,如果环境当时有很大的噪音,需要等待静音后测试,正常情况下会预测一下环境值然后做判断。其测试原理是:
被测智能音箱在播放有声内容的时候,分贝仪测得的参照值A和测试值C两个相近,比如A=65分贝,C=67分贝,二者很相近。在播放唤醒词语音后,因为被测智能音箱如果有检测到唤醒词则会停止播放当前音乐,等待进一步的语音交互,等待时间即为测试周期,这个测试周期的时间最长可可自己设置到10秒左右,这个时候分贝仪检测到的值为测试值C,若智能音箱被唤醒,测试值C肯定远远低于之前的A值,如30分贝,如果智能音箱没有被唤醒,那测试值C与参照值A应该是相近的,因此可以通过这个分贝值来判断智能音箱是否被唤醒。
步骤S3、测试端控制智能音箱变换播放的有声内容的类型,重复步骤S1至S2,以实现智能音箱在播放不同的有声内容时,对唤醒词识别率的影响的测试。
步骤S4、测试端控制智能音箱变换所在位置的高度和水平方位角,重复步骤S1至S3,以实现智能音箱在不同的方位,对唤醒词识别率的影响的测试。
请参阅图2所示,所述测试程序包括:核心控制模块、音频处理模块、转台控制模块、数据采集模块、结果输出模块以及音响交互模块。
请参阅图3所示,所述核心控制模块,首先在确认好本次的测试项后,确认测试端与被测智能音箱以及与所述唤醒词播放端的音乐通路建立完成后,播放调音音乐文件,利用分贝仪进行被测智能音箱播放音量校准,使得分贝仪抓取的分贝值符合本次测试要求,向所述音频处理模块发送需要生成唤醒词语音和有声内容语音的指令,同时对所述转台控制模块发送转台控制指令,等到两个指令都得到执行后,通知所述音频处理模块按照测试要求播放本次测试有声内容文件,并通过音乐通路使被测智能音箱输出有声内容语音,播放到特定时间点,控制所述唤醒词播放端播放唤醒词语音,在播放有声内容语音和唤醒词语音完的过程中,发送指令给所述数据采集模块对当前的环境的分贝值进行数据采集,并将采集的数据进行比对分析,得到唤醒结果,并将唤醒结果同步输出给结果输出模块,同时从数据采集模块中的音乐通路获取对应麦克风输入数据和处理后数据至测试端,并存储在特定的位置(如Failed文件夹)。
请参阅图4所示,所述音频处理模块,首先从所述核心控制模块接收到需要生成唤醒词语音和有声内容语音的指令,从语音资源库中取出对应所述唤醒词语音的音频文件,并根据指令中的需要模拟距离的信息,经过空间传输模型处理后,输出符合指令要求的有声内容语音;将对应唤醒词语音和有声内容语音的两个音频文件进入本次测试的待播放环节,根据所述核心控制模块提供的播放控制指令,将两个音频文件配置对应的播放时序和传输的设备。
其中,当智能音箱播放有声内容时,所述数据采集模块将采集的数据记为参照值A,当所述唤醒语播放端播放唤醒词语音后的测试周期内,所述数据采集模块将采集的数据记为测试值C,则将参照值A和测试值C进行对比,若测试值C远远低于参照值A,则判断被测智能音箱已被唤醒,若测试值C接近参照值A,则判断智能音箱没有被唤醒;并将唤醒结果同步输出给所述结果输出模块。
请参阅图5所示,所述转台控制模块,根据被测智能音箱常用的几个位置和所述核心控制模块输出的转台控制指令,并根据转台当前的高度和方位角信息对比本次测试需要的位置信息,得到基于目前转台位置需要进行调控的信息传输给转台,等待转台反馈完成后,上报给所述核心控制模块;同时从数据采集模块获取的被测智能音箱麦克风输入数据和处理后数据至测试端,并存储在特定的位置。所述转台控制模块还模拟用户真实摆放被测智能音箱的位置高低和水平方位来产生了不同的交互效果。
所述数据采集模块,预设到被测智能音箱的系统软件中,主要处于音频系统端,用于打包麦克风输入的原始数据与经过麦克风阵列算法处理后的数据。
所述结果输出模块,从所述核心控制模块得到测试项和唤醒结果按照一定格式要求进行输出,如果遇到有唤醒失败则提供失败的采集数据的位置链接。
请参阅图6所示,所述音响交互模块,主要是测试端搜索播放设备并建立音乐通路,即搜索蓝牙设备,选择被测智能音箱的蓝牙进行链接,然后建立蓝牙音乐播放通路A2DP,最后在建立蓝牙数据传输链路如Socket链接传输。
本发明可以实现无人工的自动化长时间测试智能音箱的唤醒性能,可以多方位、多维度进行测试,从而比较真实模拟智能音箱最终用户的使用场景,亦可提供比较量化的数字报告给开发者或生厂商,供开发者或生产商做对应的优化。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (10)
1.一种测试智能音箱唤醒词识别率的方法,其特征在于:包括:
步骤S1、测试端控制被测智能音箱播放调音音乐文件,通过分贝仪在唤醒词播放端抓取当前环境音量的分贝值,并根据该分贝值调节被测智能音箱的播放音量与测试要求相符;
步骤S2、测试端让智能音箱播放有声内容,由所述分贝仪抓取当前环境音量的分贝值,记为参照值A,播放到特定时间点后控制所述唤醒语播放端播放唤醒词语音;由所述分贝仪在一测试周期内继续抓取当前环境音量的分贝值,记为测试值C,并将参照值A和测试值C发回测试端进行分析,并由测试端记录唤醒结果。
2.根据权利要求1所述的一种测试智能音箱唤醒词识别率的方法,其特征在于:还包括
步骤S3、测试端控制智能音箱变换播放的有声内容的类型,重复步骤S1至S2;
步骤S4、测试端控制智能音箱变换所在位置的高度和水平方位角,重复步骤S1至S3。
3.根据权利要求1所述的一种测试智能音箱唤醒词识别率的方法,其特征在于:所述步骤S2的分析是:将测试值C与参照值A进行对比,若测试值C远远低于参照值A,则判断被测智能音箱已被唤醒,若测试值C接近参照值A,则判断智能音箱没有被唤醒。
4.根据权利要求1所述的一种测试智能音箱唤醒词识别率的方法,其特征在于:所述有声内容的类型包括流行乐,爵士乐,Radio和电子书;所述唤醒词语音由软件仿真得到,并保存在语音资源库中。
5.根据权利要求1或4所述的一种测试智能音箱唤醒词识别率的方法,其特征在于:所述唤醒词播放端为高保真喇叭;所述测试端为PC,且与被测智能音箱通过蓝牙连接;所述被测智能音箱所在位置的高度和水平方位角的变换是通过可调旋转台实现。
6.根据权利要求1所述的一种测试智能音箱唤醒词识别率的方法,其特征在于:所述特定时间点为10秒或20秒,所述测试周期为唤醒词语音播放完毕后的10秒。
7.一种测试智能音箱唤醒词识别率的系统,其特征在于:包括测试端、唤醒词播放端、分贝仪以及可调旋转台;被测智能音箱放置在可调旋转台上,所述分贝仪邻近所述唤醒词播放端放置;
所述测试端运行测试程序,该测试程序根据测试方案控制所述唤醒词播放端输出唤醒词语音,同时也控制可调旋转台的高度和水平方位角;所述分贝仪实时监测环境声音音量大小的分贝值;所述测试端根据分贝仪监测的分贝值来控制被测智能音箱播放有声内容的音量大小,同时在所述唤醒词播放端播放唤醒词语音后,在测试周期内根据分贝仪监测的分贝值分析被测智能音箱是否被唤醒。
8.根据权利要求7所述的一种测试智能音箱唤醒词识别率的系统,其特征在于:所述测试程序包括:核心控制模块、音频处理模块、转台控制模块、数据采集模块、结果输出模块以及音响交互模块;
所述核心控制模块,首先在确认好本次的测试项后,确认测试端与被测智能音箱以及与所述唤醒词播放端的音乐通路建立完成后,播放调音音乐文件,利用分贝仪进行被测智能音箱播放音量校准,使得分贝仪抓取的分贝值符合本次测试要求,向所述音频处理模块发送需要生成唤醒词语音和有声内容语音的指令,同时对所述转台控制模块发送转台控制指令,等到两个指令都得到执行后,通知所述音频处理模块按照测试要求播放本次测试有声内容文件,并通过音乐通路使被测智能音箱输出有声内容语音,播放到特定时间点,控制所述唤醒词播放端播放唤醒词语音,在播放有声内容语音和唤醒词语音完的过程中,发送指令给所述数据采集模块对当前的环境的分贝值进行数据采集,并将采集的数据进行比对分析,得到唤醒结果;
所述音频处理模块,首先从所述核心控制模块接收到需要生成唤醒词语音和有声内容语音的指令,从语音资源库中取出对应所述唤醒词语音的音频文件,并根据指令中的需要模拟距离的信息,经过空间传输模型处理后,输出符合指令要求的有声内容语音;将对应唤醒词语音和有声内容语音的两个音频文件进入本次测试的待播放环节,根据所述核心控制模块提供的播放控制指令,将两个音频文件配置对应的播放时序和传输的设备;
所述转台控制模块,根据被测智能音箱常用的几个位置和所述核心控制模块输出的转台控制指令,并根据转台当前的高度和方位角信息对比本次测试需要的位置信息,得到基于目前转台位置需要进行调控的信息传输给转台,等待转台反馈完成后,上报给所述核心控制模块;同时从数据采集模块获取的被测智能音箱麦克风输入数据和处理后数据至测试端,并存储在特定的位置;
所述数据采集模块,预设到被测智能音箱的系统软件中,用于打包麦克风输入的原始数据与经过麦克风阵列算法处理后的数据;
所述结果输出模块,从所述核心控制模块得到测试项和唤醒结果按照一定格式要求进行输出,如果遇到有唤醒失败则提供失败的采集数据的位置链接;
所述音响交互模块,用于测试端搜索播放设备并建立音乐通路。
9.根据权利要求8所述的一种测试智能音箱唤醒词识别率的系统,其特征在于:所述转台控制模块还模拟用户真实摆放被测智能音箱的位置高低和水平方位来产生了不同的交互效果。
10.根据权利要求8所述的一种测试智能音箱唤醒词识别率的系统,其特征在于:当智能音箱播放有声内容时,所述数据采集模块将采集的数据记为参照值A,当所述唤醒语播放端播放唤醒词语音后的测试周期内,所述数据采集模块将采集的数据记为测试值C,则将参照值A和测试值C进行对比,若测试值C远远低于参照值A,则判断被测智能音箱已被唤醒,若测试值C接近参照值A,则判断智能音箱没有被唤醒;并将唤醒结果同步输出给所述结果输出模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810181704.1A CN108511000B (zh) | 2018-03-06 | 2018-03-06 | 一种测试智能音箱唤醒词识别率的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810181704.1A CN108511000B (zh) | 2018-03-06 | 2018-03-06 | 一种测试智能音箱唤醒词识别率的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108511000A true CN108511000A (zh) | 2018-09-07 |
CN108511000B CN108511000B (zh) | 2020-11-03 |
Family
ID=63377212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810181704.1A Active CN108511000B (zh) | 2018-03-06 | 2018-03-06 | 一种测试智能音箱唤醒词识别率的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108511000B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243426A (zh) * | 2018-09-19 | 2019-01-18 | 易诚博睿(南京)科技有限公司 | 一种自动化判断语音误唤醒系统及其判断方法 |
CN109712608A (zh) * | 2019-02-28 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 多音区唤醒测试方法、装置及存储介质 |
CN110047485A (zh) * | 2019-05-16 | 2019-07-23 | 北京地平线机器人技术研发有限公司 | 识别唤醒词的方法和装置、介质以及设备 |
CN110139204A (zh) * | 2019-05-29 | 2019-08-16 | 北京百度网讯科技有限公司 | 智能语音设备声学性能测试方法及系统 |
CN110278205A (zh) * | 2019-06-19 | 2019-09-24 | 百度在线网络技术(北京)有限公司 | 蓝牙音箱底座及其控制方法和系统 |
CN110602624A (zh) * | 2019-08-30 | 2019-12-20 | Oppo广东移动通信有限公司 | 音频测试方法、装置、存储介质及电子设备 |
CN110728975A (zh) * | 2019-10-10 | 2020-01-24 | 南京创维信息技术研究院有限公司 | 一种asr识别率自动化测试的系统及方法 |
CN111462730A (zh) * | 2020-03-26 | 2020-07-28 | 深圳市微测检测有限公司 | 语音识别测试方法、装置及计算机可读存储介质 |
CN111611169A (zh) * | 2020-05-22 | 2020-09-01 | 深圳市亿道数码技术有限公司 | 一种语音助手唤醒率自动化测试方法及测试工具 |
CN111739512A (zh) * | 2020-06-18 | 2020-10-02 | 中汽院智能网联科技有限公司 | 一种基于实车的语音唤醒率测试方法、系统、设备及介质 |
CN111798852A (zh) * | 2019-06-27 | 2020-10-20 | 深圳市豪恩声学股份有限公司 | 语音唤醒识别性能测试方法、装置、系统及终端设备 |
CN111816177A (zh) * | 2020-07-03 | 2020-10-23 | 北京声智科技有限公司 | 电梯的语音打断控制方法、装置及电梯 |
CN112685083A (zh) * | 2019-10-17 | 2021-04-20 | 北京沃东天骏信息技术有限公司 | 用于测量唤醒率的方法和系统 |
CN113093691A (zh) * | 2021-03-16 | 2021-07-09 | 通山星火原实业有限公司 | 一种智能家居蓝牙语音遥控器的测试设备及其测试方法 |
CN113225662A (zh) * | 2021-05-28 | 2021-08-06 | 杭州国芯科技股份有限公司 | 一种带G-sensor的TWS耳机唤醒测试方法 |
CN113543006A (zh) * | 2021-06-30 | 2021-10-22 | 深圳市豪恩声学股份有限公司 | 耳机测试方法、装置、电子设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745731A (zh) * | 2013-12-31 | 2014-04-23 | 安徽科大讯飞信息科技股份有限公司 | 一种语音识别效果自动化测试系统及测试方法 |
CN103901782A (zh) * | 2012-12-25 | 2014-07-02 | 联想(北京)有限公司 | 一种声控方法、电子设备及声控装置 |
JP2015087617A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社第一興商 | カラオケのガイドボーカル生成装置及びガイドボーカル生成方法 |
CN106448672A (zh) * | 2016-10-27 | 2017-02-22 | Tcl通力电子(惠州)有限公司 | 一种音响系统及控制方法 |
CN106571142A (zh) * | 2016-10-11 | 2017-04-19 | 惠州市德赛西威汽车电子股份有限公司 | 一种汽车导航语音识别率自动测试系统 |
CN106898348A (zh) * | 2016-12-29 | 2017-06-27 | 北京第九实验室科技有限公司 | 一种出声设备的去混响控制方法和装置 |
CN107613447A (zh) * | 2017-10-27 | 2018-01-19 | 深圳市传测科技有限公司 | 一种智能终端音频测试装置、系统及测试方法 |
-
2018
- 2018-03-06 CN CN201810181704.1A patent/CN108511000B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103901782A (zh) * | 2012-12-25 | 2014-07-02 | 联想(北京)有限公司 | 一种声控方法、电子设备及声控装置 |
JP2015087617A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社第一興商 | カラオケのガイドボーカル生成装置及びガイドボーカル生成方法 |
CN103745731A (zh) * | 2013-12-31 | 2014-04-23 | 安徽科大讯飞信息科技股份有限公司 | 一种语音识别效果自动化测试系统及测试方法 |
CN106571142A (zh) * | 2016-10-11 | 2017-04-19 | 惠州市德赛西威汽车电子股份有限公司 | 一种汽车导航语音识别率自动测试系统 |
CN106448672A (zh) * | 2016-10-27 | 2017-02-22 | Tcl通力电子(惠州)有限公司 | 一种音响系统及控制方法 |
CN106898348A (zh) * | 2016-12-29 | 2017-06-27 | 北京第九实验室科技有限公司 | 一种出声设备的去混响控制方法和装置 |
CN107613447A (zh) * | 2017-10-27 | 2018-01-19 | 深圳市传测科技有限公司 | 一种智能终端音频测试装置、系统及测试方法 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243426A (zh) * | 2018-09-19 | 2019-01-18 | 易诚博睿(南京)科技有限公司 | 一种自动化判断语音误唤醒系统及其判断方法 |
CN109712608A (zh) * | 2019-02-28 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 多音区唤醒测试方法、装置及存储介质 |
CN109712608B (zh) * | 2019-02-28 | 2021-10-08 | 百度在线网络技术(北京)有限公司 | 多音区唤醒测试方法、装置及存储介质 |
CN110047485A (zh) * | 2019-05-16 | 2019-07-23 | 北京地平线机器人技术研发有限公司 | 识别唤醒词的方法和装置、介质以及设备 |
CN110047485B (zh) * | 2019-05-16 | 2021-09-28 | 北京地平线机器人技术研发有限公司 | 识别唤醒词的方法和装置、介质以及设备 |
CN110139204A (zh) * | 2019-05-29 | 2019-08-16 | 北京百度网讯科技有限公司 | 智能语音设备声学性能测试方法及系统 |
US10950238B2 (en) | 2019-06-19 | 2021-03-16 | Baidu Online Network Technology (Beijing) Co., Ltd. | Bluetooth speaker base, method and system for controlling thereof |
CN110278205A (zh) * | 2019-06-19 | 2019-09-24 | 百度在线网络技术(北京)有限公司 | 蓝牙音箱底座及其控制方法和系统 |
CN111798852A (zh) * | 2019-06-27 | 2020-10-20 | 深圳市豪恩声学股份有限公司 | 语音唤醒识别性能测试方法、装置、系统及终端设备 |
CN111798852B (zh) * | 2019-06-27 | 2024-03-29 | 深圳市豪恩声学股份有限公司 | 语音唤醒识别性能测试方法、装置、系统及终端设备 |
CN110602624B (zh) * | 2019-08-30 | 2021-05-25 | Oppo广东移动通信有限公司 | 音频测试方法、装置、存储介质及电子设备 |
CN110602624A (zh) * | 2019-08-30 | 2019-12-20 | Oppo广东移动通信有限公司 | 音频测试方法、装置、存储介质及电子设备 |
CN110728975A (zh) * | 2019-10-10 | 2020-01-24 | 南京创维信息技术研究院有限公司 | 一种asr识别率自动化测试的系统及方法 |
CN112685083A (zh) * | 2019-10-17 | 2021-04-20 | 北京沃东天骏信息技术有限公司 | 用于测量唤醒率的方法和系统 |
CN111462730A (zh) * | 2020-03-26 | 2020-07-28 | 深圳市微测检测有限公司 | 语音识别测试方法、装置及计算机可读存储介质 |
CN111611169A (zh) * | 2020-05-22 | 2020-09-01 | 深圳市亿道数码技术有限公司 | 一种语音助手唤醒率自动化测试方法及测试工具 |
CN111739512A (zh) * | 2020-06-18 | 2020-10-02 | 中汽院智能网联科技有限公司 | 一种基于实车的语音唤醒率测试方法、系统、设备及介质 |
CN111816177A (zh) * | 2020-07-03 | 2020-10-23 | 北京声智科技有限公司 | 电梯的语音打断控制方法、装置及电梯 |
CN113093691A (zh) * | 2021-03-16 | 2021-07-09 | 通山星火原实业有限公司 | 一种智能家居蓝牙语音遥控器的测试设备及其测试方法 |
CN113093691B (zh) * | 2021-03-16 | 2024-02-02 | 通山星火原实业有限公司 | 一种智能家居蓝牙语音遥控器的测试设备及其测试方法 |
CN113225662B (zh) * | 2021-05-28 | 2022-04-29 | 杭州国芯科技股份有限公司 | 一种带G-sensor的TWS耳机唤醒测试方法 |
CN113225662A (zh) * | 2021-05-28 | 2021-08-06 | 杭州国芯科技股份有限公司 | 一种带G-sensor的TWS耳机唤醒测试方法 |
CN113543006A (zh) * | 2021-06-30 | 2021-10-22 | 深圳市豪恩声学股份有限公司 | 耳机测试方法、装置、电子设备及介质 |
CN113543006B (zh) * | 2021-06-30 | 2024-01-12 | 深圳市豪恩声学股份有限公司 | 耳机测试方法、装置、电子设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108511000B (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108511000A (zh) | 一种测试智能音箱唤醒词识别率的方法及系统 | |
CN110288997A (zh) | 用于声学组网的设备唤醒方法及系统 | |
CN103456301B (zh) | 一种基于环境声音的场景识别方法及装置及移动终端 | |
CN108462895A (zh) | 音效处理方法、装置和机器可读介质 | |
CN108346433A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
US20190355354A1 (en) | Method, apparatus and system for speech interaction | |
CN109166593A (zh) | 音频数据处理方法、装置及存储介质 | |
CN109817219A (zh) | 语音唤醒测试方法及系统 | |
GB2563953A (en) | Detection of replay attack | |
CN105850154A (zh) | 基于检测到的环境声音来调整音频 | |
CN111462741B (zh) | 语音数据处理方法、装置及存储介质 | |
CN109509472A (zh) | 基于语音平台识别背景音乐的方法、装置及系统 | |
JP2021167977A (ja) | 音声信号処理方法、音声信号処理装置、電子機器及び記憶媒体 | |
CN110232909A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
KR101995443B1 (ko) | 화자 검증 방법 및 음성인식 시스템 | |
CN106713011A (zh) | 一种获取测试数据的方法与系统 | |
CN105704609A (zh) | 音响设备模式调节方法和装置 | |
CN115208507A (zh) | 基于白盒语音对抗样本的隐私保护方法与装置 | |
CN112992170B (zh) | 模型训练方法及装置、存储介质及电子装置 | |
KR20200028852A (ko) | 암묵 신호 분리를 위한 방법, 장치 및 전자 장치 | |
CN110008698A (zh) | 病毒检测方法及装置 | |
CN108377414A (zh) | 一种调节音量的方法、装置、存储介质及电子设备 | |
CN105828135B (zh) | 音视频播放系统中的播放控制方法、装置及播放设备 | |
CN112420063A (zh) | 一种语音增强方法和装置 | |
Li et al. | Overview and Analysis of Speech Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 350000 building, No. 89, software Avenue, Gulou District, Fujian, Fuzhou 18, China Patentee after: Ruixin Microelectronics Co., Ltd Address before: 350000 building, No. 89, software Avenue, Gulou District, Fujian, Fuzhou 18, China Patentee before: Fuzhou Rockchips Electronics Co.,Ltd. |