CN111402875A - 用于车机的语音测试用音频的合成方法、装置及电子设备 - Google Patents

用于车机的语音测试用音频的合成方法、装置及电子设备 Download PDF

Info

Publication number
CN111402875A
CN111402875A CN202010154820.1A CN202010154820A CN111402875A CN 111402875 A CN111402875 A CN 111402875A CN 202010154820 A CN202010154820 A CN 202010154820A CN 111402875 A CN111402875 A CN 111402875A
Authority
CN
China
Prior art keywords
audio
voice
test
noise
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010154820.1A
Other languages
English (en)
Inventor
赵韡
黄一飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zebra Network Technology Co Ltd
Original Assignee
Zebra Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zebra Network Technology Co Ltd filed Critical Zebra Network Technology Co Ltd
Priority to CN202010154820.1A priority Critical patent/CN111402875A/zh
Publication of CN111402875A publication Critical patent/CN111402875A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明提供一种用于车机的语音测试用音频的合成方法、语音测试用音频、语音测试方法、合成装置、电子设备及计算机可读存储介质,其中,用于车机的语音测试用音频的合成方法包括:步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。根据本发明的用于车机的语音测试用音频的合成方法,能够模拟出实车的音频,便于进行语音测试,提高语音测试效率。

Description

用于车机的语音测试用音频的合成方法、装置及电子设备
技术领域
本发明涉及车辆领域,具体涉及一种用于车机的语音测试用音频的合成方法、语音测试用音频、语音测试方法、合成装置、电子设备及计算机可读存储介质。
背景技术
在语音唤醒测试过程中,经常遇到的问题是:实车语音唤醒测试中效率和测试覆盖的矛盾。
在语音唤醒测试中,我们需要在多个维度构建测试场景通过这些维度正交成千上万种的测试场景。然而,通过实车覆盖是基本不现实的,或者说人力拖入很大,时间成本很高,不能适应快速迭代开发模式。
但是作为测试团队,又需要尽可能多的覆盖测试场景,避免测试遗漏。
并且在一些特定的场景比如告诉场景,还是具备一定危险性,测试覆盖风险较大。
发明内容
有鉴于此,本发明提供一种用于车机的语音测试用音频的合成方法、语音测试用音频、语音测试方法、合成装置、电子设备及计算机可读存储介质,能够提高测试效率和降低测试难度,使得测试覆盖和测试时效性达到平衡。
为解决上述技术问题,一方面,本发明提供一种用于车机的语音测试用音频的合成方法,包括如下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
进一步地,所述步骤S1中,
多种所述人声语料的维度包括样本类别、坐姿、及关键词中的一种或多种;
多种所述噪音语料的维度包括车速、地点、开窗状态、及干扰音源中的一种或多种。
进一步地,
所述样本类别的维度包括性别、年龄、及口音中的一种或多种;
所述坐姿包括主驾坐姿、副驾坐姿中的任一种;
所述关键词包括主关键词、定制关键词、及快捷关键词中的任一种;
所述地点包括地库、普路、高架、及高速中的任一种;
所述开窗状态包括主驾半开、主驾全开、副驾半开、及副驾全开中的任一种;
所述干扰音源包括本机音源、手机音源、及其他音源中的任一种。
进一步地,所述步骤S3包括:
步骤S31,获取所述语音音频的音频长度;
步骤S32,根据所述语音音频的音频长度对所述噪音音频进行截取;
步骤S33,对于所述语音音频和截取后的所述噪音音频进行混合。
进一步地,所述步骤S3还包括:
步骤S34,获取所述噪音音频的音频强度;
步骤S35,根据所述噪音音频的音频强度强化所述语音音频,
其中,所述步骤S33中,基于强化后的所述语音音频和截取后的所述噪音音频进行混合。
进一步地,所述强化具体为:
当所述噪音音频的音频强度小于50dB,则所述语音音频的强度不变;
当所述噪音音频的音频强度大于等于50dB且小于77dB,则所述语音音频的强度增强0.3*(所述噪音音频的音频强度-50)dB;
当所述噪音音频的音频强度大于等于77dB,则所述语音音频的强度增强8dB。
第二方面,本发明提供一种语音测试用音频,根据上述任一项所述的用于车机的语音测试用音频的合成方法合成得到的语音测试用音频。
进一步地,在语音测试中的应用所述语音测试用音频。
进一步地,所述语音测试包括语音唤醒测试、或语音识别测试。
第三方面,本发明提供一种语音测试方法,包括:
根据测试场景,通过上述任一所述的用于车机的语音测试用音频的合成方法合成语音测试用音频;
车机基于所述语音测试用音频进行语音测试。
进一步地,所述车机基于所述语音测试用音频进行语音测试包括:
将所述语音测试用音频推送至车机;
通过所述车机对于所述语音测试用音频进行测试。
进一步地,所述语音测试为语音唤醒测试,所述语音测试用音频包括多个音频文件。
进一步地,通过所述车机对于所述音频测试用音频进行测试包括:
将多个所述音频文件进行排列,并依次推送至所述车机,
由所述车机播放所述音频文件,并基于所述播放进行语音唤醒测试,
当其中一个音频文件的语音唤醒测试结束,按照排列顺序推送下一个音频文件至所述车机,直至所有音频文件全部测试结束。
进一步地,基于所述播放进行语音唤醒测试包括:
监听所述车机语音日志,获取测试结果;
标记失败的测试结果以及其对应的音频文件。
进一步地,通过音频输出设备直连所述车机的麦克风以播放所述音频文件,并基此进行语音唤醒测试。
第四方面,本发明提供语音测试用音频的合成装置,包括:
获取模块,用于针对不同车型分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
组合模块,用于根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
音频混合模块,用于基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音唤醒测试用音频。
第五方面,本发明提供用于合成语音测试用音频的电子设备,包括:
一个或多个处理器;
一个或多个存储器,其中存储了计算机可读代码,所述计算机可读代码当由所述一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
第六方面,本发明提供一种计算机可读存储介质,其中存储了计算机可读代码,所述计算机可读代码当由一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
本发明的上述技术方案至少具有如下有益效果之一:
根据本发明的用于车机的语音测试用音频的合成方法,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频,能够模拟出实车的音频,便于进行语音测试,提高语音测试效率;
进一步地,根据语音音频的音频长度对噪音音频进行截取,能够获得音频长度一致的语音音频和噪音音频,使得音频更接近现实;
进一步地,根据噪音音频的音频强度强化语音音频,能够解决伦巴效应,便于更好和准确地进行语音测试;
根据本发明的语音测试方法,车机基于所述语音测试用音频进行语音测试,能够提高测试效率和降低测试难度,使得测试覆盖和测试时效性达到平衡;
进一步地,当其中一个音频文件的语音唤醒测试结束,按照排列顺序推送下一个音频文件至所述车机,能够实现自动化测试,使得测试效率更高,能够批量持续的进行验证,替代繁琐的实车验证,提升测试安全性,减少人力和车辆投入,能够并发执行,自动统计结果。
附图说明
图1为根据本发明一实施例的用于车机的语音测试用音频的合成方法的流程图;
图2为根据本发明实施例的音频混合方法的流程示意图;
图3为根据本发明一实施例的语音测试方法的流程图;
图4为根据本发明实施例的语音测试方法的流程示意图;
图5为根据本发明实施例的语音测试用音频的合成装置的示意图;
图6为根据本发明实施例的用于合成语音测试用音频的电子设备的示意图。
具体实施方式
下面将结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
首先,结合图1说明根据本发明实施例的用于车机的语音测试用音频的合成方法。
如图1所示,本发明实施例的用于车机的语音测试用音频的合成方法包括:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频。
其中,语音测试可以包括唤醒测试、或语音识别测试等。
可选地,针对不同车型,分别录制语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频。
可选地,多种人声语料的维度可以包括以下一种或多种:样本类别、坐姿、及关键词。
具体地,样本类别的维度以包括以下一种或多种:性别、年龄、及口音;
坐姿可以包括以下任一种:主驾坐姿、副驾坐姿;
关键词可以包括以下任一种:主关键词、定制关键词、及快捷关键词。
例如,人声语料通过在指定实体车型中,地库安静环境,在实体车内进行语音测试(唤醒操作),由实体车车机进行音频收录,以获取多种语音音频,并对不同人,不同坐姿等进行编号,以形成表1所示的多种人声语料。
表1人声语料表
人声语料编号 人员编号 性别 年龄 口音 坐姿 语料
IDxxx1 Pxxx1 30 粤语 主驾1 主唤醒词
IDxxx2 Pxxx1 30 粤语 主驾2 主唤醒词
……
IDx999 P7511 18 东北话 副驾4 快捷唤醒
可选地,多种噪音语料的维度可以包括以下一种或多种:车速、地点、开窗状态、及干扰音源。
具体地,地点包括以下任一种:地库、普路、高架、及高速;
开窗状态可以包括以下任一种:主驾半开、主驾全开、副驾半开、及副驾全开;
干扰音源可以包括以下任一种:本机音源、手机音源、及其他音源。
例如,噪音语料通过在指定实体车型中,按照场景要求,行驶时录制,有实体车进行音频收录,以获取多种噪音音频,并对不同时速,开关窗状态等进行编号,以形成表2所示的多种噪音语料。
表2噪音语料表
噪音语料编号 车型 地点 开窗状态 干扰音源 车速
IDXXXA22_XX1 XXXXA22 地库 主驾半开 0kph
IDXXXA22_XX2 XXXXA22 地库 主驾半开 收音机 0kph
IDXXXA22_999 XXXXA22 高架 副驾全开开 手机外放音乐 60kph
……
IDXXXA28_999 XXXXA28 高速 主驾半开 80kph
需要注意的是,以上只是可选地示例,任何可以影响到语音测试的人声语料和噪音语料的维度均应理解在本发明内。
步骤S2,根据测试场景,对于各车型,将语音音频和噪音音频进行组合。
也就是说,根据测试场景,对于各个车型,组合语音音频和噪音音频。由此,能够获得场景所需要的语音音频和噪音音频,便于后续的音频混合。
步骤S3,基于组合后的语音音频和噪音进行音频混合,从而获取测试场景下的各车型的语音测试用音频。
也就是说,通过音频混合测试场景下的语音音频和噪音音频,从而获得该测试场景下的各车型的语音测试用音频。
由此,能够模拟出实车的音频,便于后续进行语音测试,提高语音测试效率。
根据本发明一些实施例,步骤S3包括:
步骤S31,获取语音音频的音频长度;
首先,获取语音音频的音频长度;
步骤S32,根据语音音频的音频长度对噪音音频进行截取;
接着,截取与语音音频的音频长度一致的噪音音频。由此,能够使得音频更接近现实。
通常情况下,语音音频的音频长度低于噪音音频的音频长度,因此可以采用基于语音音频的音频长度来截取相应长度的噪音音频。需要注意的是,如果语音音频的音频长度高于噪音音频长度,可以对噪音音频进行延长(重复播放)再进行截取或截取部分语音音频的长度,以保证语音音频的音频长度与噪音音频的音频长度保持一致,这些均应该理解在本发明内。
步骤S33,对于语音音频和截取后的噪音音频进行混合。
此后,将音频长度一致的语音音频和噪音音频进行混合,从而形成测试用音频。
为了解决伦巴效应(伦巴效应是指我们配合周围噪音提高自己声音的自然倾向),对音频进行了优化,优化步骤包括:
步骤S34,获取噪音音频的音频强度;
步骤S35,根据噪音音频的音频强度强化语音音频,
其中,步骤S33中,基于强化后的语音音频和截取后的噪音音频进行混合。
由此,能够解决伦巴效应,使得音频更加接近现实,便于更好和准确地进行语音测试。
进一步地,强化具体为:
当噪音音频的音频强度小于50dB,则语音音频的强度不变;
当噪音音频的音频强度大于等于50dB且小于77dB,则语音音频的强度增强0.3*(噪音音频的音频强度-50)dB;
当噪音音频的音频强度大于等于77dB,则语音音频的强度增强8dB。
需要注意的是,以上只是可选的示例,语音音频的强度增强可以根据情况进行调整,以更接近实际测试场景中的音频,这些均应该理解在本发明内。
作为示例,如图2所示,音频混合步骤包括:
1)发起音频混合;
2)选取语音音频;
3)获取语音音频的音频长度;
4)选取噪音音频;
5)根据语音音频长度截取噪音音频;
6)获取噪音音频的音频强度;
7)根据噪音音频的音频强度强化语音音频;
8)混合噪音音频和语音音频;
9)根据分类(例如场景的分类等)进行编号保存。
下面,结合图3,说明本发明实施例的语音测试方法。
如图3所示,本发明的语音测试方法包括:
步骤S10,根据测试场景,通过上述用于车机的语音测试用音频的合成方法合成语音测试用音频。
也就是说,根据测试场景,合成语音测试用音频。
因为音频可以以文件形式保存,由此,一次合成在此车型生命周期内都可以重复使用,节省测试成本。
步骤S20,车机基于所述语音测试用音频进行语音测试。
由此,能够提高测试效率和降低测试难度,使得测试覆盖和测试时效性达到平衡。
可选地,步骤S20具体包括:
首先,将所述语音测试用音频推送至车机;
接着,通过所述车机对于所述语音测试用音频进行测试。
例如,通过车机播放音频,将声音输入车机语音测试模块,从而进行测试。
需要注意的是,以上只是可选地示例,还可以通过音频输出设备直连所述车机的麦克风以播放所述音频文件(例如,音频输出设备为电脑,通过音频线连接电脑音频输出接口和车机的麦克风的连接线,以播放所述音频文件,使电脑中的音频数据能够模拟麦克风的数据接入),并基此进行语音测试,也可以通过人工嘴播放语音音频,环绕音响设备播放噪音音频这样的模式来达到模拟实车噪音场景效果,并基此进行语音测试,这些均应该理解在本发明范围内。
根据本发明一些实施例,基于台架进行语音测试。
例如,在台架上放置一台车机,可以远程控制车机播放音频,并进行语音测试(语音唤醒测试),监听车机,并记录测试数据。
台架测试的测试效率高,且不存在安全风险,且数据标准统一,使得数据具备可对比性。由此,能够使得语音测试更加便捷。
根据本发明一些实施例,语音测试为语音唤醒测试,所述语音测试用音频包括多个音频文件。
进一步地,语音唤醒测试过程包括:
首先,将多个所述音频文件进行排列,并依次推送至所述车机。
接着,由所述车机播放所述音频文件,并基于所述播放进行语音唤醒测试。
可选地,基于所述播放进行语音唤醒测试包括:
监听所述车机语音日志,获取测试结果;
标记失败的测试结果以及其对应的音频文件。
最后,当其中一个音频文件的语音唤醒测试结束,按照排列顺序推送下一个音频文件至所述车机,直至所有音频文件全部测试结束。
由此,能够实现自动化测试,使得测试效率更高,能够批量持续的进行验证,替代繁琐的实车验证,提升测试安全性,减少人力和车辆投入,能够并发执行,自动统计结果。
作为示例,如图4所示,语音测试(语音唤醒测试)过程包括:
1)发起语音自动化唤醒测试;
2)将多个所述音频文件进行编号,根据测试集获取音频编号并进行排列;
3)根据编号推送指定音频至车机;
4)调用车机接口,出发指定音频播放;
5)监听车机语音日志,获取唤醒结果;
6)当唤醒结果为失败,则标记失败结果及音频编号;当唤醒结果为成功,进行阶段语音流程(停止车机的语音流程),直接进行下一个测试,由此,能够避免车机的语音流程占用测试时间,从而缩短测试时间,提高效率。
7)轮询执行(依次执行),直至所有测试用例完成;
8)根据测试结果生成重跑用例集;
9)生成最终测试报告。
下面,结合图5,说明根据本发明实施例的语音测试用音频的合成装置1000。
如图5所示,本发明实施例的语音测试用音频的合成装置1000包括:
获取模块1001,用于针对不同车型分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
组合模块1002,用于根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
音频混合模块1003,用于基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音唤醒测试用音频。
进一步地,语音测试用音频的合成装置1000包括还可以分别用于语音测试用音频的合成方法中的相应步骤,在此省略其详细说明。
此外,结合图6,说明根据本发明实施例的用于合成语音测试用音频的电子设备1400。
如图6所示,本发明实施例的用于合成语音测试用音频的电子设备1400包括:
处理器1401和存储器1402,在存储器1402中存储有计算机程序指令,其中,在计算机程序指令被处理器运行时,使得处理器1401执行以下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
进一步地,处理器1401还可以执行语音测试用音频的合成方法中的相应步骤,在此省略其详细说明。
上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器1401代表的一个或者多个中央处理器(CPU),以及由存储器1402代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
所述网络接口1403,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,并可以保存在硬盘1405中。
所述输入设备1404,可以接收操作人员输入的各种指令,并发送给处理器1401以供执行。所述输入设备1404可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
所述显示设备1406,可以将处理器1401执行指令获得的结果进行显示。
所述存储器1402,用于存储操作系统运行所必须的程序和数据,以及处理器1401计算过程中的中间结果等数据。
可以理解,本发明实施例中的存储器1402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM),其用作外部高速缓存。本文描述的装置和方法的存储器1402旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器1402存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统14021和应用程序14014。
其中,操作系统14021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序14014,包含各种应用程序,例如浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序14014中。
上述处理器1401,当调用并执行所述存储器1402中所存储的应用程序和数据,具体的,可以是应用程序14014中存储的程序或指令时,首先,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;接着,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;最后,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
本发明上述实施例揭示的方法可以应用于处理器1401中,或者由处理器1401实现。处理器1401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1401可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1402,处理器1401读取存储器1402中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ASIC)、数字信号处理器DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
另外,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器运行时,使得所述处理器执行以下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
进一步地,所述处理器还可以执行用于车机的语音测试用音频的合成方法中的相应步骤,在此省略其详细说明。
更进一步地,本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。电子设备(例如可以是服务器、云服务器、或者服务器的一部分等)的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得用于车机的语音测试用音频的合成装置1000实施上述各种实施方式提供的用于车机的语音测试用音频的合成方法。
在本申请所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁盘或者光盘等各种可以存储程序代码的介质。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种用于车机的语音测试用音频的合成方法,其特征在于,包括如下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
2.根据权利要求1所述的用于车机的语音测试用音频的合成方法,其特征在于,所述步骤S1中,
多种所述人声语料的维度包括样本类别、坐姿、及关键词中的一种或多种;
多种所述噪音语料的维度包括车速、地点、开窗状态、及干扰音源中的一种或多种。
3.根据权利要求2所述的用于车机的语音测试用音频的合成方法,其特征在于,
所述样本类别的维度包括性别、年龄、及口音中的一种或多种;
所述坐姿包括主驾坐姿、副驾坐姿中的任一种;
所述关键词包括主关键词、定制关键词、及快捷关键词中的任一种;
所述地点包括地库、普路、高架、及高速中的任一种;
所述开窗状态包括主驾半开、主驾全开、副驾半开、及副驾全开中的任一种;
所述干扰音源包括本机音源、手机音源、及其他音源中的任一种。
4.根据权利要求1所述的用于车机的语音测试用音频的合成方法,其特征在于,所述步骤S3包括:
步骤S31,获取所述语音音频的音频长度;
步骤S32,根据所述语音音频的音频长度对所述噪音音频进行截取;
步骤S33,对于所述语音音频和截取后的所述噪音音频进行混合。
5.根据权利要求4所述的用于车机的语音测试用音频的合成方法,其特征在于,所述步骤S3还包括:
步骤S34,获取所述噪音音频的音频强度;
步骤S35,根据所述噪音音频的音频强度强化所述语音音频,
其中,所述步骤S33中,基于强化后的所述语音音频和截取后的所述噪音音频进行混合。
6.根据权利要求5所述的用于车机的语音测试用音频的合成方法,其特征在于,所述强化具体为:
当所述噪音音频的音频强度小于50dB,则所述语音音频的强度不变;
当所述噪音音频的音频强度大于等于50dB且小于77dB,则所述语音音频的强度增强0.3*(所述噪音音频的音频强度-50)dB;
当所述噪音音频的音频强度大于等于77dB,则所述语音音频的强度增强8dB。
7.一种语音测试用音频,其特征在于,根据权利要求1至6任一项所述的用于车机的语音测试用音频的合成方法合成得到的语音测试用音频。
8.根据权利要求7所述的语音测试用音频,其特征在于,在语音测试中的应用所述语音测试用音频。
9.根据权利要求7所述的语音测试用音频,其特征在于,所述语音测试包括语音唤醒测试、或语音识别测试。
10.一种语音测试方法,其特征在于,包括:
根据测试场景,通过权利要求1至6项任一所述的用于车机的语音测试用音频的合成方法合成语音测试用音频;
车机基于所述语音测试用音频进行语音测试。
11.根据权利要求10所述的语音测试方法,其特征在于,所述车机基于所述语音测试用音频进行语音测试包括:
将所述语音测试用音频推送至车机;
通过所述车机对于所述语音测试用音频进行测试。
12.根据权利要求11所述的语音测试方法,其特征在于,所述语音测试为语音唤醒测试,所述语音测试用音频包括多个音频文件。
13.根据权利要求12所述的语音测试方法,其特征在于,通过所述车机对于所述音频测试用音频进行测试包括:
将多个所述音频文件进行排列,并依次推送至所述车机,
由所述车机播放所述音频文件,并基于所述播放进行语音唤醒测试,
当其中一个音频文件的语音唤醒测试结束,按照排列顺序推送下一个音频文件至所述车机,直至所有音频文件全部测试结束。
14.根据权利要求13所述的语音测试方法,其特征在于,基于所述播放进行语音唤醒测试包括:
监听所述车机语音日志,获取测试结果;
标记失败的测试结果以及其对应的音频文件。
15.根据权利要求12所述的语音测试方法,其特征在于,通过音频输出设备直连所述车机的麦克风以播放所述音频文件,并基此进行语音唤醒测试。
16.一种语音测试用音频的合成装置,包括:
获取模块,用于针对不同车型分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
组合模块,用于根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
音频混合模块,用于基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音唤醒测试用音频。
17.一种用于合成语音测试用音频的电子设备,其特征在于,包括:
一个或多个处理器;
一个或多个存储器,其中存储了计算机可读代码,所述计算机可读代码当由所述一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
18.一种计算机可读存储介质,其特征在于,其中存储了计算机可读代码,所述计算机可读代码当由一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,针对不同车型,分别获取语音测试所需的多种人声语料和多种噪音语料,以形成多种语音音频和噪音音频;
步骤S2,根据测试场景,对于各车型,将所述语音音频和所述噪音音频进行组合;
步骤S3,基于组合后的所述语音音频和所述噪音进行音频混合,从而获取所述测试场景下的各车型的语音测试用音频。
CN202010154820.1A 2020-03-06 2020-03-06 用于车机的语音测试用音频的合成方法、装置及电子设备 Pending CN111402875A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010154820.1A CN111402875A (zh) 2020-03-06 2020-03-06 用于车机的语音测试用音频的合成方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010154820.1A CN111402875A (zh) 2020-03-06 2020-03-06 用于车机的语音测试用音频的合成方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN111402875A true CN111402875A (zh) 2020-07-10

Family

ID=71428578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010154820.1A Pending CN111402875A (zh) 2020-03-06 2020-03-06 用于车机的语音测试用音频的合成方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111402875A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111326174A (zh) * 2019-12-31 2020-06-23 四川长虹电器股份有限公司 一种远场语音干扰场景测试语料自动化合成的方法
CN112614484A (zh) * 2020-11-23 2021-04-06 北京百度网讯科技有限公司 特征信息挖掘方法、装置及电子设备
CN113409798A (zh) * 2021-06-22 2021-09-17 科大讯飞股份有限公司 车内含噪语音数据生成方法、装置以及设备
JP2022116320A (ja) * 2021-06-11 2022-08-09 阿波▲羅▼智▲聯▼(北京)科技有限公司 車載音声機器のテスト方法、装置、電子機器及び記憶媒体
EP4102499A1 (en) * 2021-06-08 2022-12-14 Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd. Wakeup testing method and apparatus, electronic device and readable storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190066671A1 (en) * 2017-08-22 2019-02-28 Baidu Online Network Technology (Beijing) Co., Ltd. Far-field speech awaking method, device and terminal device
CN109473094A (zh) * 2018-11-12 2019-03-15 东风汽车有限公司 车载控制屏语音识别率测试方法、电子设备、系统
CN109712608A (zh) * 2019-02-28 2019-05-03 百度在线网络技术(北京)有限公司 多音区唤醒测试方法、装置及存储介质
CN110808029A (zh) * 2019-11-20 2020-02-18 斑马网络技术有限公司 车机语音测试系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190066671A1 (en) * 2017-08-22 2019-02-28 Baidu Online Network Technology (Beijing) Co., Ltd. Far-field speech awaking method, device and terminal device
CN109473094A (zh) * 2018-11-12 2019-03-15 东风汽车有限公司 车载控制屏语音识别率测试方法、电子设备、系统
CN109712608A (zh) * 2019-02-28 2019-05-03 百度在线网络技术(北京)有限公司 多音区唤醒测试方法、装置及存储介质
CN110808029A (zh) * 2019-11-20 2020-02-18 斑马网络技术有限公司 车机语音测试系统及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111326174A (zh) * 2019-12-31 2020-06-23 四川长虹电器股份有限公司 一种远场语音干扰场景测试语料自动化合成的方法
CN112614484A (zh) * 2020-11-23 2021-04-06 北京百度网讯科技有限公司 特征信息挖掘方法、装置及电子设备
CN112614484B (zh) * 2020-11-23 2022-05-20 北京百度网讯科技有限公司 特征信息挖掘方法、装置及电子设备
EP4102499A1 (en) * 2021-06-08 2022-12-14 Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd. Wakeup testing method and apparatus, electronic device and readable storage medium
JP2022187977A (ja) * 2021-06-08 2022-12-20 アポロ インテリジェント コネクティヴィティ (ベイジン) テクノロジー カンパニー リミテッド ウェイクアップテスト方法、装置、電子機器、及び読み取り可能な記憶媒体
JP2022116320A (ja) * 2021-06-11 2022-08-09 阿波▲羅▼智▲聯▼(北京)科技有限公司 車載音声機器のテスト方法、装置、電子機器及び記憶媒体
JP7308335B2 (ja) 2021-06-11 2023-07-13 阿波▲羅▼智▲聯▼(北京)科技有限公司 車載音声機器のテスト方法、装置、電子機器及び記憶媒体
CN113409798A (zh) * 2021-06-22 2021-09-17 科大讯飞股份有限公司 车内含噪语音数据生成方法、装置以及设备

Similar Documents

Publication Publication Date Title
CN111402875A (zh) 用于车机的语音测试用音频的合成方法、装置及电子设备
CN113032195B (zh) 芯片仿真验证方法、系统、设备及存储介质
CN107516510B (zh) 一种智能设备自动化语音测试方法及装置
US8402403B2 (en) Verifying a register-transfer level design of an execution unit
US8234102B2 (en) Development of assertions for integrated circuit design simulation
US8527921B2 (en) Constrained random simulation coverage closure guided by a cover property
CN103176894B (zh) 一种面向数据库的测试数据自动衍生方法和装置
CN113470618A (zh) 唤醒测试的方法、装置、电子设备和可读存储介质
CN114021440B (zh) 一种基于matlab的fpga时序仿真验证方法及装置
CN110322587B (zh) 驾驶过程中的评价记录方法、装置、设备及存储介质
US7657851B2 (en) Device, system, and method for correction of integrated circuit design
US7010774B1 (en) Bottom-up approach for synthesis of register transfer level (RTL) based design
CN113139359B (zh) 基于fpga内嵌处理器的虚拟仿真测试方法
CN115617673A (zh) 基于Cosim平台的测试用例配置的方法及应用
US8020126B2 (en) Links and chains verification and validation methodology for digital devices
CN114969115A (zh) 基于标准化元数据体系的数据管理方法和系统
US20040015792A1 (en) Method for creating standard VHDL test environments
CN113535581A (zh) 测试脚本生成方法、装置、设备及计算机可读存储介质
EP3734491A1 (en) Method, apparatus, device, and medium for implementing simulator
CN111782670A (zh) 数据资源操作自动处理的方法及装置
Tomasena et al. A transaction level assertion verification framework in systemc: An application study
CN112580282B (zh) 用于集成电路设计验证的方法、装置、设备以及存储介质
CN112346957B (zh) 车载语音系统自动测试设备和方法
JP2003058597A (ja) 論理等価性検証装置及び論理等価性検証方法
CN117421211A (zh) 一种语音智能座舱测试方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination