CN114121038A - 音响语音测试方法、装置、设备及存储介质 - Google Patents

音响语音测试方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114121038A
CN114121038A CN202111372869.5A CN202111372869A CN114121038A CN 114121038 A CN114121038 A CN 114121038A CN 202111372869 A CN202111372869 A CN 202111372869A CN 114121038 A CN114121038 A CN 114121038A
Authority
CN
China
Prior art keywords
audio
result
response
sound
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111372869.5A
Other languages
English (en)
Inventor
李昕洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202111372869.5A priority Critical patent/CN114121038A/zh
Publication of CN114121038A publication Critical patent/CN114121038A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种音响语音测试方法、装置、设备及存储介质,属于音响测试技术领域。本发明通过在播放测试音频时,采集待测音响对测试音频的响应音频,将响应音频转换为音频响应结果,并对音频响应结果进行语音识别,获得语音识别结果,对语音识别结果进行关键词匹配,根据关键词匹配结果生成待测音响的音响测试日志。通过播放测试音频并采集待测音响对测试音频响应的响应音频,再对响应音频进行语音识别,然后进行关键词匹配,有效提升了音响测试的准确性,根据匹配结果生成测试日志避免了人工测试造成的记录误差和人力资源浪费缺陷,提升了音响测试的效率。

Description

音响语音测试方法、装置、设备及存储介质
技术领域
本发明涉及音响测试技术领域,尤其涉及一种音响语音测试方法、装置、设备及存储介质。
背景技术
随着时代的发展科技的进步,越来越多的智能音响成功问世,给人们的生活带来了许多的便利,智能音响已经成了人们生活中不可缺少的一部分,人们对于智能音响的需求也将会不断地增加,因此智能音响在现在亦或是将来都将是一个庞大的市场。为了使智能音响对语音进行准确识别和答复,需要对智能音响进行严格的语音测试,目前在对智能音响的测试工作中,需要投入大量的人工成本进行长时间的语音测试,不仅浪费大量的人力资源,而且人工测试统计的测试方式准确率低导致极易出现误差。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种音响语音测试方法、装置、设备及存储介质,旨在解决现有技术进行音响语音测试时准确率低以及浪费人力资源的技术问题。
为实现上述目的,本发明提供了一种音响语音测试方法,所述方法包括以下步骤:
在播放测试音频时,采集待测音响对所述测试音频的响应音频;
将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果;
对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。
可选地,所述将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果包括:
将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息;
根据预设文本格式将所述文本信息转换为对应格式的文本文件;
根据所述文本文件获得对应的语音识别结果。
可选地,所述对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志包括:
对所述语音识别结果进行关键词提取,获得关键词提取结果;
根据预设正则表达式对所述关键词提取结果进行关键词匹配,获得关键词匹配结果;
根据所述关键词匹配结果生成所述待测音响的音响测试日志。
可选地,所述根据所述关键词匹配结果生成所述待测音响的音响测试日志包括:
根据匹配规则和所述匹配结果判断所述待测音响的响应音频是否为正确响应音频,并生成判断结果;
根据所述判断结果生成所述待测音响的音响测试日志。
可选地,所述将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息包括:
根据预设音频格式将所述响应音频转换为音频响应结果;
将所述音频响应结果转化为对应的文字序列;
根据预设声学模型对所述文字序列进行语音识别,获得对应的文本信息。
可选地,所述将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果,还包括:
将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果。
可选地,所述将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果之前,所述方法还包括:
获取所述响应音频的音频时长,并判断所述音频时长是否超过预设时长;
若否,则检测所述响应音频的音频格式和音频编码信息是否满足预设上传条件;
若满足所述预设上传条件,则执行所述将所述响应音频上传至云端服务器的步骤。
此外,为实现上述目的,本发明还提出一种音响语音测试装置,所述音响语音测试装置包括:
音频播放模块,用于在播放测试音频时,采集待测音响对所述测试音频的响应音频;
音频识别模块,用于将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果;
音频匹配模块,用于对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。
此外,为实现上述目的,本发明还提出一种音响语音测试设备,所述音响语音测试设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音响语音测试程序,所述音响语音测试程序配置为实现如上文所述的音响语音测试方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有音响语音测试程序,所述音响语音测试程序被处理器执行时实现如上文所述的音响语音测试方法的步骤。
本发明通过在播放测试音频时,采集待测音响对所述测试音频的响应音频,将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果,对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。本发明通过采集待测音响对测试音频的响应音频,再将响应音频转换为音频响应结果,并对其进行语音识别,获得对应的语音识别结果,再对识别结果进行关键词匹配,根据匹配结果生成音响测试日志。对响应音频进行语音识别,再进行关键词匹配,有效提升了音响测试的准确性,根据匹配结果生成测试日志避免了人工测试造成的记录误差和人力资源浪费缺陷,提升了音响测试的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的音响语音测试设备的结构示意图;
图2为本发明音响语音测试方法第一实施例的流程示意图;
图3为本发明音响语音测试方法第二实施例的流程示意图;
图4为本发明音响语音测试方法第二实施例中语音识别的基本架构公式示意图;
图5为本发明音响语音测试方法第三实施例的流程示意图;
图6为本发明音响语音测试装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的音响语音测试设备结构示意图。
如图1所示,该音响语音测试设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对音响语音测试设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及音响语音测试程序。
在图1所示的音响语音测试设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明音响语音测试设备中的处理器1001、存储器1005可以设置在音响语音测试设备中,所述音响语音测试设备通过处理器1001调用存储器1005中存储的音响语音测试程序,并执行本发明实施例提供的音响语音测试方法。
本发明实施例提供了一种音响语音测试方法,参照图2,图2为本发明一种音响语音测试方法第一实施例的流程示意图。
本实施例中,所述音响语音测试方法包括以下步骤:
步骤S10:在播放测试音频时,采集待测音响对所述测试音频的响应音频。
应当理解的是,本实施例方法的执行主体可以是具有数据处理、网络通信以及程序运行功能的计算服务设备,例如服务器以及电脑等,或者是其他能够实现相同或相似功能的音响语音测试设备,本实施例对此不加以限制。
需要说明的是,测试音频可以是需要测试的语音问题音频,也可以是用户向音响提出的待响应语音音频,例如,今天天气如何、帮我查询一下菜谱、订一个明天早上的闹钟或帮我呼叫联系人等语音音频。待测音响可以是智能音响,例如,Alexa音响或HomePod音响等音响,也可以是其他可以进行语音交互响应的音响,本实施例不加以限定。响应音频指的是待测音响对测试音频进行响应反馈播放的音频。
在具体实现中,音响语音测试设备播放预设的测试音频,然后采集待测音响对测试音频进行响应反馈播放的响应音频。例如,音响语音测试设备播放:“明天天气怎么样”,此时采集待测音响根据测试音频进行响应播放的响应音频:“明天天气小雨转阴”,再根据响应音频进行格式转换。
步骤S20:将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果。
需要说明的是,音频响应结果可以是预设音频格式的音频文件,采集到的响应音频的初始格式需要进行转换,将其转换为可以进行语音识别的对应格式,语音识别所支持的格式可以是PCM、WAV、AMR或M4A,也可以是其他音频格式,本实施例不加以限定,语音识别结果可以是音频响应结果进行语音识别后转换生成的文本信息。
在具体实现中,将采集到的待测音响的响应音频转换为对应音频格式的音频响应结果,对音频响应结果进行语音识别,提取音频响应结果中对应的文本信息,获得语音识别结果。
步骤S30:对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。
需要说明的是,关键词可以是根据响应音频进行语音识别得到的关键信息,例如,天气、雨、晴、阴、音乐或联系人等关键词,本实施例不加以限定。关键词匹配结果可以是语音识别结果中匹配到的关键词结果,根据关键词匹配结果判断待测音响的响应音频是否为正确响应音频。音响测试日志可以是根据关键词匹配结果判断待测音响的响应音频是否为正确响应音频,并生成的判断结果,将判断结果进行记录而得到的日志。
可以理解的是,关键词匹配是根据预设正则表达式和预设关键词库对语音识别结果进行匹配,若语音识别结果的关键词匹配结果为预设关键词占比以上的结果,则判定待测音响的该响应音频为正确响应,若语音识别结果的关键词匹配结果为预设关键词数量以下的结果,则判定待测音响的该响应音频为错误响应,例如,预设关键词占比为75%,对语音识别结果进行关键词匹配,获得关键词匹配结果为85%,则判定待测音响的该响应音频为正确响应。
在具体实现中,根据预设关键词库对语音识别结果进行关键词匹配,获得关键词匹配结果,根据关键词匹配结果对照预设关键词占比,判断关键词匹配结果是否满足预设关键词占比要求,若关键词匹配结果满足预设关键词占比要求,则判定待测音响的响应音频为正确响应,若关键词匹配结果未满足预设关键词占比要求,则判定待测音响的响应音频为错误响应,根据关键词匹配结果的判定结果生成待测音响的音响测试日志。
本实施例通过在播放测试音频时,采集待测音响对所述测试音频的响应音频,将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果,对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。本发明通过采集待测音响对测试音频的响应音频,再将响应音频转换为音频响应结果,并对其进行语音识别,获得对应的语音识别结果,再对识别结果进行关键词匹配,根据匹配结果生成音响测试日志。对响应音频进行语音识别,再进行关键词匹配,有效提升了音响测试的准确性,根据匹配结果生成测试日志避免了人工测试造成的记录误差和人力资源浪费缺陷,提升了音响测试的效率。
进一步地,为了快速精准地对响应音频进行语音识别,上述步骤S20还包括:
将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果。
需要说明的是,云端服务器可以是百度、阿里或腾讯的语音识别云端服务器,音响语音测试设备通过调用语音识别的应用程序编程接口(Application ProgrammingInterface,API),将响应音频的数据上传至云端服务器,以使云端服务器将上传的音频数据转换为可识别的文本信息,并将文本信息转换为预设文本格式的文件,再反馈至音响语音测试设备。
在具体实现中,音响语音测试设备在需要对大量的响应音频进行处理时,通过调用语音识别的应用程序编程接口将响应音频上传至云端服务器,以使云端服务器将上传的音频数据转换为可识别的文本信息,并将文本信息转换为预设文本格式的文件,再反馈至音响语音测试设备。
进一步地,为了快速精准地对响应音频进行语音识别,所述将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果之前,还包括:
获取所述响应音频的音频时长,并判断所述音频时长是否超过预设时长;
若否,则检测所述响应音频的音频格式和音频编码信息是否满足预设上传条件;
若满足所述预设上传条件,则执行所述将所述响应音频上传至云端服务器的步骤。
需要说明的是,待测音响根据不同测试音频所播放的响应音频时长不同,根据云端服务器所规定的音频时长阈值设定预设时长,预设时长可以是60s、90s或120s等,也可以是其他时长,本实施例不加以限定。
应当理解的是,各云端服务器所支持的音频格式和音频编码信息不同,根据上传的云端服务器检测响应音频的音频格式和音频编码信息是否满足上传条件。
在具体实现中,获取响应音频的音频时长,并判断音频时长是否超过预设时长,若否,则检测响应音频的音频格式和音频编码信息是否满足预设上传条件,若音频时长超过预设时长,则对响应音频进行剪辑,剪辑掉多余的时长,并检测响应音频的音频格式和音频编码信息是否满足预设上传条件,若响应音频的音频格式和音频编码信息不满足预设上传条件,则根据上传条件对响应音频进行格式转换或编码转换,将转换后的响应音频上传至云端服务器。
参考图3,图3为本发明一种音响语音测试方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S20包括:
步骤S201:将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息。
需要说明的是,文本信息可以是根据音频响应结果建立对应的声学模型而得到的文字信息,参考图4,图4为本发明中语音识别的基本架构公式示意图,其中W表示文字序列,Y表示语音输入,公式1表示语音识别的目标是在给定语音输入的情况下,找到可能性最大的文字序列。根据贝叶斯公式,可以得到公式2,其中分母表示出现这条语音的概率,它相比于求解的文字序列没有参数关系,可以在求解时忽略,进而得到公式3。公式3中第一部分表示给定一个文字序列出现这条音频的概率,它就是语音识别中的声学模型;第二部分表示出现这个文字序列的概率,它就是语音识别中的语言模型,在完成声学模型建模后,就可以基于声学模型对未知语音帧序列进行语音识别。
应当理解的是,将响应音频转换为对应的音频响应结果,再对音频响应结果进行文本识别,提取音频响应结果中包含的语音文字,对提取的语音文字进行记录,获得对应的文本信息。
步骤S202:根据预设文本格式将所述文本信息转换为对应格式的文本文件。
需要说明的是,预设文本格式可以是Json或TXT等格式,也可以是其他文本格式,本实施例不加以限定文本文件可以是提取文本信息中的文字信息并根据预设文本格式生成的文件。
应当理解的是,提取文本信息中的文字信息,然后根据预设文本格式创建空本的文本文件,再将提取的文字信息导入至空白的文本文件中。
步骤S203:根据所述文本文件获得对应的语音识别结果。
在具体实现中,根据预设关键词库对语音识别结果进行关键词匹配,获得关键词匹配结果,根据关键词匹配结果对照预设关键词占比,判断关键词匹配结果是否满足预设关键词占比要求,若关键词匹配结果满足预设关键词占比要求,则判定待测音响的响应音频为正确响应,若关键词匹配结果未满足预设关键词占比要求,则判定待测音响的响应音频为错误响应,根据关键词匹配结果的判定结果生成待测音响的音响测试日志。
本实施例通过将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息,根据预设文本格式将所述文本信息转换为对应格式的文本文件,根据所述文本文件获得对应的语音识别结果。由于本发明是通过对音频响应结果进行文本识别,获得对应的文本信息,再根据预设文本格式将文本信息转换为对应的文本文件,根据文本文件获得对应的语音识别结果,有效提升了音响测试的准确性,实现了对响应音频语音识别的效率,有效避免了因语音识别错误导致音响测试出现误差的问题。
进一步地,为了准确获得响应音频对应的文本信息,上述步骤S201还包括:
根据预设音频格式将所述响应音频转换为音频响应结果;
将所述音频响应结果转化为对应的文字序列;
根据预设声学模型对所述文字序列进行语音识别,获得对应的文本信息。
需要说明的是,预设音频格式可以是PCM、WAV、AMR或M4A等格式,也可以是其他音频格式,本实施例不加以限定。文字序列可以是音频响应结果中语音帧序列,声学模型可以是基于语音帧序列和文字序列的概率建立的模型。
在具体实现中,音响语音测试设备根据预设音频格式、预设采样率、预设声道以及预设位深将响应音频转换为音频响应结果,预设采样率可以是8000Hz、16000Hz或441000Hz,预设声道可以为左声道、右声道或双声道,预设位深可以是16bit或8bit,本实施例不加以限定。
参考图5,图5为本发明一种音响语音测试方法第三实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S30包括:
步骤S301:对所述语音识别结果进行关键词提取,获得关键词提取结果。
需要说明的是,关键词提取可以是根据预设关键词库对语音识别结果中的文字信息进行遍历,若语音识别结果中的文字信息含有关键词库中的关键词,则将该关键词进行提取并标记,获得关键词提取结果,根据关键词提取结果确定该语音识别结果中的关键词占比。
在具体实现中,根据预设关键词库对语音识别结果中的文字信息进行遍历,获得遍历结果,根据遍历结果对语音识别结果中的关键词进行提取,获得关键词提取结果。
步骤S302:根据预设正则表达式对所述关键词提取结果进行关键词匹配,获得关键词匹配结果。
需要说明的是,预设正则表达式可以是描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。构造正则表达式的方法和创建数学表达式的方法一样。就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合,正则表达式可以是是由普通字符以及特殊字符组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
在具体实现中,根据预设正则表达式对关键词提取结果进行关键词匹配,检查提取的关键词是否含有预设关键词库中的关键词,将符合要求的关键词进行匹配统计,获得关键词的匹配结果。
步骤S303:根据所述关键词匹配结果生成所述待测音响的音响测试日志。
需要说明的是,音响测试日志可以是根据关键词匹配结果生成的判断结果,判断结果可以是正确响应,也可以是错误响应,需根据关键词匹配结果来进行判定。
应当理解的是,根据不同的测试音频对待测音响进行多次测试,根据多次测试对应的测试日志对待测音响进行测试统计,根据统计结果判定待测音响是否符合音响语音响应要求。
在具体实现中,根据预设关键词库对语音识别结果进行关键词匹配,获得关键词匹配结果,根据关键词匹配结果对照预设关键词占比,判断关键词匹配结果是否满足预设关键词占比要求,若关键词匹配结果满足预设关键词占比要求,则判定待测音响的响应音频为正确响应,若关键词匹配结果未满足预设关键词占比要求,则判定待测音响的响应音频为错误响应,根据关键词匹配结果的判定结果生成待测音响的音响测试日志。
本实施例通过对所述语音识别结果进行关键词提取,获得关键词提取结果,根据预设正则表达式对所述关键词提取结果进行关键词匹配,获得关键词匹配结果,根据所述关键词匹配结果生成所述待测音响的音响测试日志。通过对语音识别结果进行关键词提取,然后根据预设正则表达式对关键词的提取结果进行关键匹配,根据关键词匹配结果生成待测音响的音响测试日志,有效提升了音响测试的准确性,避免了人工测试造成的记录误差和人力资源浪费缺陷,提升了音响测试的效率。
进一步地,为了准确判断响应音频是否正确,上述步骤S303包括:
根据匹配规则和所述匹配结果判断所述待测音响的响应音频是否为正确响应音频,并生成判断结果;
根据所述判断结果生成所述待测音响的音响测试日志。
需要说明的是,匹配规则可以是预先根据关键词库设定的规则,根据匹配规则可以对语音识别结果进行关键词匹配,获得关键词匹配结果。
在具体实现中,根据匹配规则和匹配结果判断待测音响的响应音频是否为正确响应音频,若匹配结果符合匹配规则,则判定待测音响的响应音频为正确响应音频,并生成判断结果;若匹配结果不符合匹配规则,则判定待测音响的响应音频为非正确响应音频,并生成判断结果,根据判断结果生成待测音响的音响测试日志。通过对音响测试进行多次测试,获得对应的测试日志集合,通过对测试日志集合进行统计,判定待测音响是否符合语音测试标准,若测试日志集合中正确响应次数超过非正确响应次数,则判定待测音响符合语音测试标准;若测试日志集合中正确响应次数未超过非正确响应次数,则判定待测音响不符合语音测试标准。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有音响语音测试程序,所述音响语音测试程序被处理器执行时实现如上文所述的音响语音测试方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少县有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
参照图6,图6为本发明音响语音测试装置第一实施例的结构框图。
如图6所示,本发明实施例提出的音响语音测试装置包括:
音频播放模块10,用于在播放测试音频时,采集待测音响对所述测试音频的响应音频;
音频识别模块20,用于将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果;
音频匹配模块30,用于对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。
本实施例通过在播放测试音频时,采集待测音响对所述测试音频的响应音频,将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果,对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。本发明通过采集待测音响对测试音频的响应音频,再将响应音频转换为音频响应结果,并对其进行语音识别,获得对应的语音识别结果,再对识别结果进行关键词匹配,根据匹配结果生成音响测试日志。对响应音频进行语音识别,再进行关键词匹配,有效提升了音响测试的准确性,根据匹配结果生成测试日志避免了人工测试造成的记录误差和人力资源浪费缺陷,提升了音响测试的效率。
进一步地,所述音频识别模块20,还用于将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息,根据预设文本格式将所述文本信息转换为对应格式的文本文件,根据所述文本文件获得对应的语音识别结果。
进一步地,所述音频匹配模块30,还用于对所述语音识别结果进行关键词提取,获得关键词提取结果,根据预设正则表达式对所述关键词提取结果进行关键词匹配,获得关键词匹配结果,根据所述关键词匹配结果生成所述待测音响的音响测试日志。
进一步地,所述音频匹配模块30,还用于根据匹配规则和所述匹配结果判断所述待测音响的响应音频是否为正确响应音频,并生成判断结果,根据所述判断结果生成所述待测音响的音响测试日志。
进一步地,所述音频识别模块20,还用于根据预设音频格式将所述响应音频转换为音频响应结果,将所述音频响应结果转化为对应的文字序列,根据预设声学模型对所述文字序列进行语音识别,获得对应的文本信息。
进一步地,所述音频识别模块20,还用于将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果。
进一步地,所述音频识别模块20,还用于获取所述响应音频的音频时长,并判断所述音频时长是否超过预设时长;若否,则检测所述响应音频的音频格式和音频编码信息是否满足预设上传条件;若满足所述预设上传条件,则执行所述将所述响应音频上传至云端服务器的步骤。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的音响语音测试方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种音响语音测试方法,其特征在于,所述音响语音测试方法包括:
在播放测试音频时,采集待测音响对所述测试音频的响应音频;
将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果;
对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。
2.如权利要求1所述的音响语音测试方法,其特征在于,所述将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果的步骤,包括:
将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息;
根据预设文本格式将所述文本信息转换为对应格式的文本文件;
根据所述文本文件获得对应的语音识别结果。
3.如权利要求1所述的音响语音测试方法,其特征在于,所述对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志的步骤,包括:
对所述语音识别结果进行关键词提取,获得关键词提取结果;
根据预设正则表达式对所述关键词提取结果进行关键词匹配,获得关键词匹配结果;
根据所述关键词匹配结果生成所述待测音响的音响测试日志。
4.如权利要求3所述的音响语音测试方法,其特征在于,所述根据所述关键词匹配结果生成所述待测音响的音响测试日志的步骤,包括:
根据匹配规则和所述匹配结果判断所述待测音响的响应音频是否为正确响应音频,并生成判断结果;
根据所述判断结果生成所述待测音响的音响测试日志。
5.如权利要求2所述的音响语音测试方法,其特征在于,所述将所述响应音频转换为音频响应结果,并对所述音频响应结果进行文本识别,获得对应的文本信息的步骤,包括:
根据预设音频格式将所述响应音频转换为音频响应结果;
将所述音频响应结果转化为对应的文字序列;
根据预设声学模型对所述文字序列进行语音识别,获得对应的文本信息。
6.如权利要求1所述的音响语音测试方法,其特征在于,所述将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果的步骤,还包括:
将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果。
7.如权利要求6所述的音响语音测试方法,其特征在于,所述将所述响应音频上传至云端服务器,以使所述云端服务器将所述响应音频转换为音频响应结果后,对所述音频响应结果进行语音识别并反馈对应的语音识别结果的步骤之前,所述方法还包括:
获取所述响应音频的音频时长,并判断所述音频时长是否超过预设时长;
若否,则检测所述响应音频的音频格式和音频编码信息是否满足预设上传条件;
若满足所述预设上传条件,则执行所述将所述响应音频上传至云端服务器的步骤。
8.一种音响语音测试装置,其特征在于,所述音响语音测试装置包括:
音频播放模块,用于在播放测试音频时,采集待测音响对所述测试音频的响应音频;
音频识别模块,用于将所述响应音频转换为音频响应结果,并对所述音频响应结果进行语音识别,获得语音识别结果;
音频匹配模块,用于对所述语音识别结果进行关键词匹配,根据关键词匹配结果生成所述待测音响的音响测试日志。
9.一种音响语音测试设备,其特征在于,所述音响语音测试设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音响语音测试程序,所述音响语音测试程序配置为实现如权利要求1至7中任一项所述的音响语音测试方法。
10.一种存储介质,其特征在于,所述存储介质上存储有音响语音测试程序,所述音响语音测试程序被处理器执行时实现如权利要求1至7任一项所述的音响语音测试方法。
CN202111372869.5A 2021-11-18 2021-11-18 音响语音测试方法、装置、设备及存储介质 Pending CN114121038A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111372869.5A CN114121038A (zh) 2021-11-18 2021-11-18 音响语音测试方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111372869.5A CN114121038A (zh) 2021-11-18 2021-11-18 音响语音测试方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114121038A true CN114121038A (zh) 2022-03-01

Family

ID=80396429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111372869.5A Pending CN114121038A (zh) 2021-11-18 2021-11-18 音响语音测试方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114121038A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116013365A (zh) * 2023-03-21 2023-04-25 深圳联友科技有限公司 一种语音全自动化测试的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116013365A (zh) * 2023-03-21 2023-04-25 深圳联友科技有限公司 一种语音全自动化测试的方法
CN116013365B (zh) * 2023-03-21 2023-06-02 深圳联友科技有限公司 一种语音全自动化测试的方法

Similar Documents

Publication Publication Date Title
CN108932945B (zh) 一种语音指令的处理方法及装置
CN109599093B (zh) 智能质检的关键词检测方法、装置、设备及可读存储介质
CN111128223B (zh) 一种基于文本信息的辅助说话人分离方法及相关装置
CN111145737B (zh) 语音测试方法、装置和电子设备
CN108920513B (zh) 一种多媒体数据处理方法、装置和电子设备
CN111341305B (zh) 一种音频数据标注方法、装置及系统
CN109326305B (zh) 一种批量测试语音识别和文本合成的方法和测试系统
CN112053692B (zh) 语音识别处理方法、装置及存储介质
CN108877779B (zh) 用于检测语音尾点的方法和装置
CN110111778B (zh) 一种语音处理方法、装置、存储介质及电子设备
CN111798833A (zh) 一种语音测试方法、装置、设备和存储介质
CN110503960B (zh) 语音识别结果的实时上载方法、装置、设备及存储介质
CN112509568A (zh) 一种语音唤醒方法及装置
CN113782026A (zh) 一种信息处理方法、装置、介质和设备
CN114121038A (zh) 音响语音测试方法、装置、设备及存储介质
CN113709313B (zh) 客服通话数据智能质检方法、装置、设备及介质
CN110889008B (zh) 一种音乐推荐方法、装置、计算装置和存储介质
CN114666618A (zh) 音频审核方法、装置、设备及可读存储介质
CN113223487B (zh) 一种信息识别方法及装置、电子设备和存储介质
CN112735394B (zh) 一种语音的语义解析方法及装置
CN115331703A (zh) 一种歌曲人声检测方法及装置
CN111986657B (zh) 音频识别方法和装置、录音终端及服务器、存储介质
CN111782868B (zh) 一种音频处理方法、装置、设备及介质
CN111105813B (zh) 朗读评分方法、装置、设备及可读存储介质
CN104978403B (zh) 一种视频专辑名称的生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination