CN108564966B - 语音测试的方法及其设备、具有存储功能的装置 - Google Patents

语音测试的方法及其设备、具有存储功能的装置 Download PDF

Info

Publication number
CN108564966B
CN108564966B CN201810109423.5A CN201810109423A CN108564966B CN 108564966 B CN108564966 B CN 108564966B CN 201810109423 A CN201810109423 A CN 201810109423A CN 108564966 B CN108564966 B CN 108564966B
Authority
CN
China
Prior art keywords
text information
audio signal
tested
original text
playing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810109423.5A
Other languages
English (en)
Other versions
CN108564966A (zh
Inventor
杨帆
高斯金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anker Innovations Co Ltd
Original Assignee
Anker Innovations Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anker Innovations Co Ltd filed Critical Anker Innovations Co Ltd
Priority to CN201810109423.5A priority Critical patent/CN108564966B/zh
Publication of CN108564966A publication Critical patent/CN108564966A/zh
Application granted granted Critical
Publication of CN108564966B publication Critical patent/CN108564966B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10305Improvement or modification of read or write signals signal quality assessment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements

Abstract

本发明公开了一种语音测试的方法及其设备、具有存储功能的装置,该方法包括:检测设备将原始待测文本信息转为第一音频信号;将通过第一播放设备播放的第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号发送至被测设备,以通过被测设备将第一音频信号从混合音频信号分离出来后转换成文本信息;将转换后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能。本发明通过多个播放设备播放多个音频信号的混合信号对被测设备进行语音测试,替代高昂的高端声卡,在降低成本的前提下实现复合音频测试的效果。

Description

语音测试的方法及其设备、具有存储功能的装置
技术领域
本发明涉及语音测试领域,特别是涉及一种语音测试的方法及其设备、具有存储功能的装置。
背景技术
越来越多的设备开始使用语音技术,但目前行业内并没有一种很有效的语音测试方法,大多都是人工在手动执行测试,测试效率低,测试结果统计也会花费较多时间,造成整个测试体系效率低下,不能很好地响应研发的测试需求。而已有的自动化测试技术,使用了一些高端声卡来进行测试,高端声卡通过多个声道形成混合音效,便于测试被测设备在不同音效下的工作状态。但是由于高端声卡成本高昂,大大增加了测试设备的成本。
因此提供一种新的语音测试的方法显得尤为必要。
发明内容
本发明主要解决的技术问题是提供一种语音测试的方法及其设备、具有存储功能的装置,能够实现复合音频测试的效果且降低生产成本。
为解决上述技术问题,本发明采用的第一个技术方案是:提供一种语音测试的方法,包括:检测设备将原始待测文本信息转为第一音频信号;对所述第一音频信号的播放参数进行配置,其中,所述播放参数包括所述第一音频信号播放的速度、音色、音量以及播放方式中的至少一种;将通过第一播放设备播放的所述第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号发送至被测设备,以通过所述被测设备将所述第一音频信号从所述混合音频信号分离出来后转换成文本信息,其中,所述至少一个第二音频信号为模拟环境的音频信息;将转换后的文本信息与所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能。
为解决上述技术问题,本发明采用的第二个技术方案是:提供一种语音测试的方法,包括:被测设备接收第一播放设备播放的第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号,其中,所述至少一个第二音频信号为模拟环境的音频信息;其中,所述第一音频信号是通过检测设备将原始待测文本信息转换得到的,所述第一音频信号是检测设备将原始待测文本信息转换且对播放参数进行配置后得到的,其中,所述播放参数包括所述第一音频信号播放的速度、音色、音量以及播放方式中的至少一种;将所述第一音频信号从所述混合音频信号分离出来,并转换成文本信息;将所述转换后的文本信息发送至所述检测设备,以通过所述检测设备将转换后的文本信息与所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能。
为解决上述技术问题,本发明采用的第三个技术方案是:提供一种语音测试的检测设备,所述检测设备包括:通信电路、存储器及处理器;所述通信电路用于传输指令;所述存储器用于存储所述处理器执行的计算机程序以及在执行所述计算机程序时所产生的中间数据;所述处理器执行所述计算机程序时,实现上述的语音测试的方法。
为解决上述技术问题,本发明采用的第四个技术方案是:提供一种语音测试的被测设备,所述被测设备包括:通信电路、存储器及处理器;所述通信电路用于传输指令;所述存储器用于存储所述处理器执行的计算机程序以及在执行所述计算机程序时所产生的中间数据;所述处理器执行所述计算机程序时,实现上述的语音测试的方法。
为解决上述技术问题,本发明采用的第五个技术方案是:提供一种具有存储功能的装置,所述具有存储功能的装置存储有程序数据,所述程序数据能够被执行以实现上述语音测试的方法。
本发明的有益效果是:区别于现有技术,本发明通过多个播放设备播放多个音频信号的混合信号对被测设备进行语音测试,替代高昂的高端声卡,在降低成本的前提下实现复合音频测试的效果。
附图说明
图1是本发明测试系统一实施方式的结构示意图;
图2是本发明语音测试的方法一实施方式的流程示意图;
图3是本发明语音测试的方法另一实施方式的流程示意图;
图4是本发明检测设备一实施方式的结构示意图;
图5是本发明被测设备一实施方式的结构示意图;
图6是本发明具有存储功能的装置一实施方式的结构示意图。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,均属于本发明保护的范围。
参阅图1,图1是本发明测试系统一实施方式的结构示意图。
如图1,本实施方式的测试系统包括测试设备10、被测设备11、第一播放设备12以及第二播放设备13。
第一播放设备12将原始待测文本信息转为第一音频信号,第一播放设备12播放第一音频信号,第二播放设备13播放第二音频信号,第一被测设备11接收第一音频信号和第二音频信号的混合音频信号。将第一音频信号从混合音频信号分离出来后转换成文本信息。测试设备10将转换后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能。需要说明的是,本实施方式中,播放设备的数量可以是2个,还可以是3个或3个以上,本发明对此不作限定。
为了清楚说明上述检测系统的工作方式,进一步请参阅图2和图3对应的实施方式。
请参阅图2,图2是本发明语音测试的方法一实施方式的流程示意图。
如图2所示,本实施方式的语音测试的方法包括如下步骤:
S201:检测设备将原始待测文本信息转为第一音频信号。
其中,检测设备包括智能手机、PC、ipad等,本发明对此不作限定。检测设备与播放设备连接,播放设备主要包括文字转语音TTS播放和音频文件播放2个功能,并能接收外部指令即可,例如只具备少量功能的安卓手机。多个播放设备用来模拟嘈杂的音频信息,可以替代高端声卡,在实现复合音频的测试效果同时降低生产成本。
在一个具体的实施方式中,第一播放设备获取原始待测文本信息,通过第一播放设备将原始待测文本信息转为第一音频信号。第一播放设备可以通过TTS功能将原始待测文本信息转为第一音频信号,也可以通过获取原始待测文本信息对应的录音文件来将原始待测文本信息转为第一音频信号,本发明对此不作限定。
S202:将通过第一播放设备播放的第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号发送至被测设备,以通过被测设备将第一音频信号从混合音频信号分离出来后转换成文本信息。
其中,被测设备包括包括智能手机、PC、ipad等,本发明对此不作限定。被测设备具有STT(语音转文本)功能,本发明检测设备即为检测被测设备的STT性能。STT性能包括安静环境下的性能和嘈杂环境中的性能,为了检测被测设备在各种嘈杂环境下的的STT性能,除了要向被测设备输入原始待测文本信息对应的音频信号外,还需要向被测设备输入混合有外部环境音频信息的音频信号,以便于测试被测设备在嘈杂环境下的STT性能。
在一个具体的实施方式中,通过第一播放设备将原始待测文本信息转为第一音频信号后,对第一音频信号的播放参数进行配置,其中,播放参数包括第一音频信号播放的速度、音色、音量以及播放方式中的至少一种。由于可以调整第一音频信号的播放参数,可以测试在原始待测文本信息对应第一音频信号播放参数变化时被测设备的STT性能,满足不同的测试需求。
在另一个具体的实施方式中,通过第一播放设备将原始待测文本信息转为第一音频信号后,通过第一播放设备播放第一音频信号。同时通过第二播放设备播放第二音频信号,第二音频信号包括含有语音的音频信号或者不含语音的音频信号,例如说话声、哭声、笑声以及音乐声等等,第一音频信号和第二音频信号混合形成混合音频信号。被测设备接收第一音频信号和第二音频信号混合形成的混合音频信号,将第一音频信号从混合音频信号中分离出来转换成文本信息。
在其他实施方式中,检测设备还可以包括第三播放设备、第四播放设备以及第五播放设备等,第三播放设备、第四播放设备以及第五播放设备分别播放第三音频信号、第四音频信号以及第五音频信号,多个音频信号即可模拟各种环境的音频信息,例如模拟火车站、机场以及商场等环境。由于多个播放设备可以模拟各种环境的音频信息,可以有效测试在不同音频信息下被测设备的STT性能。多个播放设备可以替代高端声卡,在测试完毕后多个播放设备还可以用作其他用途,提高了测试设备利用率的同时,大大降低了测试成本。
S203:将转换后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能。
在被测设备将第一音频信号从混合音频信号中分离出来转换成文本信息后,检测设备通过设定接口获取被测设备输出的转换后的文本信息,其中,设定接口包括被测设备的本地接口和云端接口。将转换后的文本信息与原始待测文本信息进行比对,根据比对结果对转换后的文本信息进行差异删除。将进行差异删除后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能在根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能之后,根据比对结果生成检测报告。由于检测设备可自动生成检测报告,替代了传统的人工测试方法,提高了效率。
在一个具体的实施方式中,按照以下规则消除对比差异:(1)去掉转换后的文本信息与原始待测文本信息中包含的标点符号;(2)去掉转换后的文本信息与原始待测文本信息中的所有空格;(3)对特殊符号进行转义,比如原始待测文本信息中的文本为%,转换后的文本信息为percent,则认为识别正确。通过删除差异信息可以提高文本对比的效率,可以更快的获得测试结果,提高测试效率。
在另一个具体的实施方式中,按照以下规则消除对比差异:(1)删除转换后的文本信息与原始待测文本信息中不同的标点符号、空格;(2)对特殊符号进行转义,比如原始待测文本信息中的文本为%,转换后的文本信息为percent,则认为识别正确。通过优化删除差异信息的步骤,可以提高消除对比差异步骤的时间,进而提高测试效率。
区别于现有技术,本发明通过多个播放设备播放多个音频信号的混合信号对被测设备进行语音测试,替代高昂的高端声卡,在降低成本的前提下实现复合音频测试的效果。
参阅图3,图3是本发明语音测试的方法另一实施方式的流程示意图。
如图3所示,本实施方式的语音测试的方法包括如下步骤:
S301:被测设备接收第一播放设备播放的第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号;其中,第一音频信号是通过检测设备将原始待测文本信息转换得到的。
其中,被测设备包括包括智能手机、PC、ipad等,被测设备具有STT(语音转文本)功能和收发信号的功能,本发明对此不作限定。
S302:将第一音频信号从混合音频信号分离出来,并转换成文本信息。
具体的,被测设备通过STT功能将从混合音频信号分离出来的第一音频信号转换为文本信息。
S303:将转换后的文本信息发送至检测设备,以通过检测设备将转换后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能。
具体的,被测设备包括本地接口和云端接口的至少一种,被测设备通过本地接口和云端接口的至少一种将转换后的文本信息发送至检测设备。
区别于现有技术,本发明通过多个播放设备播放多个音频信号的混合信号对进行被测设备进行语音测试,替代高昂的高端声卡,可以实现复合音频测试的效果且降低生产成本。
参阅图4,图4是本发明检测设备一实施方式的结构示意图。检测设备40包括:通信电路43、存储器41及处理器42;通信电路43用于传输指令;存储器41用于存储处理器42执行的计算机程序以及在执行计算机程序时所产生的中间数据;处理器42执行计算机程序时,实现下述任一的语音测试的方法。
其中,检测设备40包括智能手机、PC、ipad等,本发明对此不作限定。播放设备包括TTS(文字转语音)播放和音频文件播放2个功能,并能接收外部指令即可,例如只具备少量功能的安卓手机。被测设备包括包括智能手机、PC、ipad等,本发明对此不作限定。被测设备具有STT(语音转文本)功能,检测设备40即为检测被测设备的STT性能。STT性能包括安静环境下的性能和嘈杂环境中的性能,为了检测被测设备在各种嘈杂环境下的的STT性能,除了要向被测设备输入原始待测文本信息对应的音频信号外,还需要向被测设备输入混合有外部环境音频信息的音频信号,以便于测试被测设备在嘈杂环境下的STT性能。多个播放设备用来模拟嘈杂的音频信息,可以替代高端声卡,在实现复合音频的测试效果同时降低生产成本。
在一个具体的实施方式中,处理器42获取原始待测文本信息,通过处理器42将原始待测文本信息转为第一音频信号。处理器42可以通过TTS功能将原始待测文本信息转为第一音频信号,也可以通过获取原始待测文本信息对应的录音文件来将原始待测文本信息转为第一音频信号,本发明对此不作限定。
在一个具体的实施方式中,通过处理器42将原始待测文本信息转为第一音频信号后,对第一音频信号的播放参数进行配置,其中,播放参数包括第一音频信号播放的速度、音色、音量以及播放方式中的至少一种。由于可以调整第一音频信号的播放参数,可以测试在原始待测文本信息对应第一音频信号播放参数变化时被测设备的STT性能,满足不同的测试需求。
在一个具体的实施方式中,通过处理器42将原始待测文本信息转为第一音频信号后,处理器42通过第一播放设备播放第一音频信号。同时通过第二播放设备播放第二音频信号,第二音频信号包括含有语音的音频信号或者不含语音的音频信号,例如说话声、哭声、笑声以及音乐声等等,第一音频信号和第二音频信号混合形成混合音频信号。处理器42通过通信电路43将第一音频信号和第二音频信号混合形成的混合音频信号发送给被测设备,被测设备将第一音频信号从混合音频信号中分离出来转换成文本信息。在其他实施方式中,检测设备还可以包括第三播放设备、第四播放设备以及第五播放设备等,第三播放设备、第四播放设备以及第五播放设备分别播放第三音频信号、第四音频信号以及第五音频信号,多个音频信号即可模拟各种环境的音频信息,例如模拟火车站、机场以及商场等环境。由于多个播放设备可以模拟各种环境的音频信息,可以有效测试在不同音频信息下被测设备的STT性能。多个播放设备可以替代高端声卡,在测试完毕后多个播放设备还可以用作其他用途,提高了测试设备利用率的同时,大大降低了测试成本。
在被测设备将第一音频信号从混合音频信号中分离出来转换成文本信息后,处理器42通过通信电路43通过设定接口获取被测设备输出的转换后的文本信息,其中,设定接口包括被测设备的本地接口和云端接口。处理器42将转换后的文本信息与原始待测文本信息进行比对,根据比对结果对转换后的文本信息进行差异删除。处理器42将进行差异删除后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能。在根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能之后,处理器42根据比对结果生成检测报告。由于检测设备20可自动生成检测报告,替代了传统的人工测试方法,提高了效率。
在一个具体的实施方式中,按照以下规则消除对比差异:(1)去掉转换后的文本信息与原始待测文本信息中包含的标点符号;(2)去掉转换后的文本信息与原始待测文本信息中的所有空格;(3)对特殊符号进行转义,比如原始待测文本信息中的文本为%,转换后的文本信息为percent,则认为识别正确。通过删除差异信息可以提高文本对比的效率,减小对比误差,提高测试准确度。
在另一个具体的实施方式中,按照以下规则消除对比差异:(1)删除转换后的文本信息与原始待测文本信息中不同的标点符号、空格;(2)对特殊符号进行转义,比如原始待测文本信息中的文本为%,转换后的文本信息为percent,则认为识别正确。通过优化删除差异信息的步骤,可以提高消除对比差异步骤的时间,进而提高测试效率。
区别于现有技术,本发明通过多个播放设备播放多个音频信号的混合信号对被测设备进行语音测试,替代高昂的高端声卡,在降低成本的前提下实现复合音频测试的效果。
参阅图5,图5是本发明被测设备一实施方式的结构示意图。
被测设备50包括:通信电路53、存储器51及处理器52;通信电路53用于传输指令;存储器51用于存储处理器52执行的计算机程序以及在执行计算机程序时所产生的中间数据;处理器52执行计算机程序时,实现下述任一的语音测试的方法。
处理器52通过通信电路53接收第一播放设备播放的第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号;其中,第一音频信号是通过检测设备将原始待测文本信息转换得到的。
其中,被测设备50包括包括智能手机、PC、ipad等,被测设备具有STT(语音转文本)功能和收发信号的功能,本发明对此不作限定。
处理器52将第一音频信号从混合音频信号分离出来,并转换成文本信息。
具体的,被测设备50通过STT功能将从混合音频信号分离出来的第一音频信号转换为文本信息。
处理器52将转换后的文本信息通过通信电路53发送至检测设备,以通过检测设备将转换后的文本信息与原始待测文本信息进行比对,根据转换后的文本信息与原始待测文本信息的相似度确定被测设备的性能。
具体的,被测设备50包括本地接口和云端接口的至少一种,被测设备50通过本地接口和云端接口的至少一种将转换后的文本信息发送至检测设备。
区别于现有技术,本发明通过多个播放设备播放多个音频信号的混合信号对被测设备进行语音测试,替代高昂的高端声卡,在降低成本的前提下实现复合音频测试的效果。
请参阅图6,图6是本发明具有存储功能的装置一实施方式的结构示意图。具有存储功能的装置60中存储有至少一个程序或指令51,程序或指令61用于实现上述任一机器人的控制方法。在一个实施方式中,具有存储功能的装置包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
区别于现有技术,本发明通过多个播放设备播放多个音频信号的混合信号对被测设备进行语音测试,替代高昂的高端声卡,在降低成本的前提下实现复合音频测试的效果。
在本申请所提供的几个实施方式中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种语音测试的方法,其特征在于,包括:
检测设备将原始待测文本信息转为第一音频信号;
对所述第一音频信号的播放参数进行配置,其中,所述播放参数包括所述第一音频信号播放的速度、音色、音量以及播放方式中的至少一种;
将通过第一播放设备播放的所述第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号发送至被测设备,以通过所述被测设备将所述第一音频信号从所述混合音频信号分离出来后转换成文本信息,其中,所述至少一个第二音频信号为模拟环境的音频信息;
将转换后的文本信息与所述原始待测文本信息进行比对,通过设定接口获取所述被测设备输出的转换后的文本信息;将所述转换后的文本信息与所述原始待测文本信息进行比对,删除所述转换后的文本信息与所述原始待测文本信息中不同的标点符号、空格,并对特殊符号进行转义,根据比对结果对所述转换后的文本信息进行差异删除;将进行差异删除后的文本信息与所述所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能根据比对结果对所述转换后的文本信息进行差异删除;将进行差异删除后的文本信息与所述所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能。
2.根据权利要求1所述的语音测试的方法,其特征在于,所述测设备将原始待测文本信息转为第一音频信号的步骤具体包括:
获取所述原始待测文本信息;
通过所述第一播放设备将所述原始待测文本信息转为所述第一音频信号。
3.根据权利要求1所述的语音测试的方法,其特征在于,所述将转换后的文本信息与所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能的步骤之后还包括:
根据比对结果生成检测报告。
4.一种语音测试的方法,其特征在于,包括:
被测设备接收第一播放设备播放的第一音频信号与通过其他播放设备播放的至少一个第二音频信号的混合音频信号,其中,所述至少一个第二音频信号为模拟环境的音频信息;其中,所述第一音频信号是通过检测设备将原始待测文本信息转换得到的,所述第一音频信号是检测设备将原始待测文本信息转换且对播放参数进行配置后得到的,其中,所述播放参数包括所述第一音频信号播放的速度、音色、音量以及播放方式中的至少一种;
将所述第一音频信号从所述混合音频信号分离出来,并转换成文本信息;
将所述转换后的文本信息发送至所述检测设备,以通过所述检测设备将转换后的文本信息与所述原始待测文本信息进行比对,通过设定接口获取所述被测设备输出的转换后的文本信息;将所述转换后的文本信息与所述原始待测文本信息进行比对,删除所述转换后的文本信息与所述原始待测文本信息中不同的标点符号、空格,并对特殊符号进行转义,根据比对结果对所述转换后的文本信息进行差异删除;将进行差异删除后的文本信息与所述所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能根据比对结果对所述转换后的文本信息进行差异删除;将进行差异删除后的文本信息与所述所述原始待测文本信息进行比对,根据所述转换后的文本信息与所述原始待测文本信息的相似度确定所述被测设备的性能。
5.一种语音测试的检测设备,其特征在于,所述检测设备包括:通信电路、存储器及处理器;
所述通信电路用于传输指令;
所述存储器用于存储所述处理器执行的计算机程序以及在执行所述计算机程序时所产生的中间数据;
所述处理器执行所述计算机程序时,实现如权利要求1-3任一所述的语音测试的方法。
6.一种语音测试的被测设备,其特征在于,所述被测设备包括:通信电路、存储器及处理器;
所述通信电路用于传输指令;
所述存储器用于存储所述处理器执行的计算机程序以及在执行所述计算机程序时所产生的中间数据;
所述处理器执行所述计算机程序时,实现如权利要求4所述的语音测试的方法。
7.一种具有存储功能的装置,其特征在于,所述具有存储功能的
装置存储有程序数据,所述程序数据能够被执行以实现如权利要求1-3任一所述的语音测试的方法或实现如权利要求4所述的语音测试的方法。
CN201810109423.5A 2018-02-02 2018-02-02 语音测试的方法及其设备、具有存储功能的装置 Active CN108564966B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810109423.5A CN108564966B (zh) 2018-02-02 2018-02-02 语音测试的方法及其设备、具有存储功能的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810109423.5A CN108564966B (zh) 2018-02-02 2018-02-02 语音测试的方法及其设备、具有存储功能的装置

Publications (2)

Publication Number Publication Date
CN108564966A CN108564966A (zh) 2018-09-21
CN108564966B true CN108564966B (zh) 2021-02-09

Family

ID=63531249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810109423.5A Active CN108564966B (zh) 2018-02-02 2018-02-02 语音测试的方法及其设备、具有存储功能的装置

Country Status (1)

Country Link
CN (1) CN108564966B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109600184B (zh) * 2018-11-24 2020-11-06 六安富华智能信息科技有限公司 一种有文本广播自检功能的应急广播终端
CN109379155A (zh) * 2018-11-24 2019-02-22 合肥龙泊信息科技有限公司 一种有文本广播自检功能的应急广播系统
CN109660681A (zh) * 2018-12-05 2019-04-19 福建星网智慧软件有限公司 一种ip-pbx语音播报的自动化测试方法及系统
CN109523990B (zh) * 2019-01-21 2021-11-05 未来电视有限公司 语音检测方法和装置
CN111629396A (zh) * 2019-02-27 2020-09-04 北京小米移动软件有限公司 通话质量的测试系统和测试方法
CN110310664A (zh) * 2019-06-21 2019-10-08 深圳壹账通智能科技有限公司 设备降噪功能的测试方法及相关设备
CN111798852B (zh) * 2019-06-27 2024-03-29 深圳市豪恩声学股份有限公司 语音唤醒识别性能测试方法、装置、系统及终端设备
CN113362806A (zh) * 2020-03-02 2021-09-07 北京奇虎科技有限公司 智能音响的评测方法、系统、存储介质及其计算机设备
CN112261214A (zh) * 2020-10-21 2021-01-22 广东商路信息科技有限公司 网络语音通信自动化测试方法及系统
CN112969135B (zh) * 2021-02-20 2023-04-25 山东英信计算机技术有限公司 一种pc机声卡测试方法、装置及系统
CN114171065A (zh) * 2021-11-29 2022-03-11 重庆长安汽车股份有限公司 音频采集和对比方法、系统及车辆

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040114771A1 (en) * 2002-12-12 2004-06-17 Mitchell Vaughan Multimedia system with pre-stored equalization sets for multiple vehicle environments
JP2004297368A (ja) * 2003-03-26 2004-10-21 Yamaha Corp アレイスピーカ検査装置、アレイスピーカ装置、及びこの装置の配線判定方法
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
US20080027726A1 (en) * 2006-07-28 2008-01-31 Eric Louis Hansen Text to audio mapping, and animation of the text
CN103226950A (zh) * 2012-01-29 2013-07-31 特克特朗尼克公司 电信网络中的语音处理
CN103745731B (zh) * 2013-12-31 2016-10-19 科大讯飞股份有限公司 一种语音识别效果自动化测试系统及测试方法
CN104538042A (zh) * 2014-12-22 2015-04-22 南京声准科技有限公司 终端智能语音测试系统和方法
CN106162429A (zh) * 2015-03-25 2016-11-23 美律电子(深圳)有限公司 移动装置与其操作方法
CN106874294A (zh) * 2015-12-14 2017-06-20 阿里巴巴集团控股有限公司 一种信息匹配方法及装置
CN205789102U (zh) * 2016-04-08 2016-12-07 王泰来 使用高保真混放器的高保真双音频播放装置

Also Published As

Publication number Publication date
CN108564966A (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
CN108564966B (zh) 语音测试的方法及其设备、具有存储功能的装置
JP2021086154A (ja) 音声認識方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
CN108595431B (zh) 语音交互文本纠错方法、装置、终端及存储介质
JP2019185062A (ja) 音声インタラクション方法、端末機器及びコンピュータ読み取り可能な記憶媒体
CN109243425A (zh) 语音识别测试方法、装置、系统、计算机设备及存储介质
WO2020253128A1 (zh) 基于语音识别的通信服务方法、装置、计算机设备及存储介质
CN110503944B (zh) 语音唤醒模型的训练和使用方法及装置
CN110379410A (zh) 语音响应速度自动分析方法及系统
CN109119067B (zh) 语音合成方法及装置
US20220301546A1 (en) Method for testing vehicle-mounted voice device, electronic device and storage medium
WO2021227308A1 (zh) 一种视频资源的生成方法和装置
CN113470618A (zh) 唤醒测试的方法、装置、电子设备和可读存储介质
US10997966B2 (en) Voice recognition method, device and computer storage medium
CN108595412A (zh) 纠错处理方法及装置、计算机设备及可读介质
CN111768759A (zh) 用于生成信息的方法和装置
CN112843681B (zh) 虚拟场景控制方法、装置、电子设备及存储介质
CN110312161B (zh) 一种视频配音方法、装置及终端设备
JP7375089B2 (ja) 音声応答速度確定方法、装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
US11302308B2 (en) Synthetic narrowband data generation for narrowband automatic speech recognition systems
CN111933118A (zh) 进行语音识别优化的方法、装置及应用其的智能语音对话系统
CN109213466B (zh) 庭审信息的显示方法及装置
JP2022095689A5 (zh)
KR20220056833A (ko) 소리 데이터 노이즈 캔슬링 방법, 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램
CN108766448B (zh) 混音测试系统、方法、装置及存储介质
CN110516043A (zh) 用于问答系统的答案生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant