CN111951833A - 语音测试方法、装置、电子设备和存储介质 - Google Patents
语音测试方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111951833A CN111951833A CN202010772715.4A CN202010772715A CN111951833A CN 111951833 A CN111951833 A CN 111951833A CN 202010772715 A CN202010772715 A CN 202010772715A CN 111951833 A CN111951833 A CN 111951833A
- Authority
- CN
- China
- Prior art keywords
- microphone
- sound source
- audio
- detected
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010998 test method Methods 0.000 title claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 115
- 230000007613 environmental effect Effects 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000005070 sampling Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000004088 simulation Methods 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 abstract description 9
- 238000009434 installation Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 6
- 230000002411 adverse Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 description 4
- 101710180672 Regulator of MON1-CCZ1 complex Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000013102 re-test Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Abstract
本发明实施例提供一种语音测试方法、装置、电子设备和存储介质,其中方法包括:基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;基于所述模拟麦克风输出信号进行语音测试。本发明实施例提供的语音测试方法、装置、电子设备和存储介质,基于可调整的待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号,并基于模拟麦克风输出信号进行语音测试,提高了语音测试的全面性,同时屏蔽了麦克风安装位置、实际接线状态、测试人员操作差异、生产车间环境噪声等诸多因素的不利影响,提高了语音测试的准确性,并降低了复测次数。
Description
技术领域
本发明涉及信号处理技术领域,尤其涉及一种语音测试方法、装置、电子设备和存储介质。
背景技术
随着智能化控制领域的发展,主要用于语音识别以及声源定位的语音设备,例如车载信息娱乐导航系统,在实现智能化控制、提高人机交互体验方面具有重要作用。为了保证语音设备正常运行,生产厂家在生产集成麦克风输入的语音设备时,需要基于麦克风采集并输出的语音信号对其进行语音测试。
目前的语音测试方法,通常是通过测试人员或外部功放系统输出测试音频,由语音设备的外接麦克风采集该测试音频信号并输出对应的模拟信号,最后对模拟信号进行模数转换,以供语音设备对其进行语音测试。然而,整个测试环节中,语音测试的准确性受到诸如麦克风安装位置、实际接线状态、测试人员站位、生产环境噪声等因素影响,造成语音测试的准确性欠佳。
发明内容
本发明实施例提供一种语音测试方法、装置、电子设备和存储介质,用以解决现有技术中语音测试准确性不足的缺陷。
本发明实施例提供一种语音测试方法,包括:
基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;
基于所述模拟麦克风输出信号进行语音测试。
根据本发明一个实施例的语音测试方法,所述基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号,具体包括:
基于所述待测声源位置信息,确定待测声源与若干个麦克风的相对位置;
基于所述待测声源与任一麦克风的相对位置对应的音频衰减系数,对所述待测声源设置信息对应的标准音频进行衰减,得到所述任一麦克风的待测音频;
对所述任一麦克风的待测音频进行信号处理,得到所述任一麦克风的模拟麦克风输出信号。
根据本发明一个实施例的语音测试方法,所述待测声源与任一麦克风之间相对位置对应的音频衰减系数,是基于如下步骤确定的:
从预先确定的对应不同音频强度与不同相对位置的音频衰减系数中,选取所述待测声源设置信息中的音频强度以及所述待测声源与任一麦克风的相对位置对应的音频衰减系数。
根据本发明一个实施例的语音测试方法,所述对应不同音频强度与不同相对位置的音频衰减系数,是基于如下步骤确定的:
控制样本声源在任一采样相对位置播放对应任一音频强度的标准音频,通过采样麦克风采集所述标准音频,得到所述采样麦克风输出的实测麦克风输出信号;所述采样相对位置是所述采样麦克风与所述样本声源的相对位置;
基于所述任一音频强度,以及所述实测麦克风输出信号的强度,确定对应所述任一音频强度与所述任一采样相对位置的音频衰减系数。
根据本发明一个实施例的语音测试方法,所述基于所述待测声源位置信息,确定待测声源与若干个麦克风的相对位置,具体包括:
基于所述待测声源位置信息中所述待测声源与基准麦克风的相对位置,以及所述基准麦克风与其余每一麦克风的相对位置,确定所述待测声源与每一麦克风的相对位置;所述基准麦克风为所述若干个麦克风中的任意一个。
根据本发明一个实施例的语音测试方法,所述待测声源设置信息包括语音命令设置信息和环境噪声设置信息,所述待测声源位置信息包括语音命令位置信息和环境噪声位置信息。
根据本发明一个实施例的语音测试方法,所述对所述任一麦克风的待测音频进行信号处理,得到所述任一麦克风的模拟麦克风输出信号,具体包括:
对所述任一麦克风的待测音频进行数模转换,得到所述待测音频的模拟信号;
对所述待测音频的模拟信号进行信号放大,得到所述任一麦克风的模拟麦克风输出信号。
本发明实施例还提供一种语音测试装置,包括:
麦克风输出信号模拟单元,用于基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;
语音测试单元,用于基于所述模拟麦克风输出信号进行语音测试。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音测试方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音测试方法的步骤。
本发明实施例提供的语音测试方法、装置、电子设备和存储介质,基于可调整的待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号,并基于模拟麦克风输出信号进行语音测试,提高了语音测试的全面性,同时屏蔽了麦克风安装位置、实际接线状态、测试人员操作差异、生产车间环境噪声等诸多因素的不利影响,提高了语音测试的准确性,并降低了复测次数。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音测试方法的流程示意图;
图2为本发明实施例提供的麦克风输出信号模拟方法的流程示意图;
图3为本发明实施例提供的音频衰减系数确定方法的流程示意图;
图4为本发明实施例提供的待测声源与多个麦克风的相对位置的示意图;
图5为本发明又一实施例提供的语音测试方法的流程示意图;
图6为本发明实施例提供的语音测试装置的结构示意图;
图7是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着智能化控制领域的发展,用于智能语音控制的语音设备的功能和性能,影响着智能化控制的效果以及人机交互的体验。为了保证语音设备正常运行,生产厂家在生产语音设备时,需要基于麦克风采集并输出的语音信号对其进行语音测试。
目前的语音测试方法,通常是通过测试人员或外部功放系统输出测试音频,以模拟终端用户,从而对语音设备的语音识别、声源定位等功能进行系统测试。整个测试过程中,测试人员或外部功放系统播放测试音频后,由语音设备的外接麦克风采集该测试音频信号并输出对应的模拟信号,最后对模拟信号进行模数转换,进而对其进行语音测试。然而,整个测试环节中,实际测试对象除了语音设备之外,还包括测试人员/功放系统、麦克风、连接的线束以及生产环境,上述任一对象出现问题,均会导致语音设备的测试结果出错。即,语音测试的准确性受到如麦克风安装位置、实际接线状态、测试人员站位、生产车间环境噪声等诸多因素影响,造成语音设备的语音测试准确性欠佳。
对此,本发明实施例提供了一种语音测试方法。图1为本发明实施例提供的语音测试方法的流程示意图,如图1所示,该方法包括:
步骤110,基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;
步骤120,基于模拟麦克风输出信号进行语音测试。
具体地,接收测试人员发出的测试命令。其中,测试命令中可以包括待测声源设置信息和待测声源位置信息。此处,待测声源设置信息为需要进行测试的声源对应的音频设置信息,可以包括待测声源输出音频对应的语音命令文本,该音频的音频强度等。待测声源位置信息为需要测试的声源与语音设备外接麦克风的相对位置。为了在测试时尽可能模拟语音设备实际运行时的多种应用场景,测试人员可以随时调整待测声源设置信息以及待测声源位置信息,使得不同的待测声源设置信息能够体现各种语音命令和各种音频强度,不同的待测声源位置信息能够体现各种声源与麦克风的相对位置,两者相结合可以保证语音测试的全面性,从而保证测试通过的语音设备在投入实际应用时也可以正常运行。
获取得到测试人员设置的待测声源设置信息以及待测声源位置信息后,可以基于待测声源设置信息和待测声源位置信息合成音频,并模拟声源实际发声时,音频的传播过程以及麦克风采集信号的过程,生成对应的模拟麦克风输出信号。此处,模拟麦克风输出信号近似于对应相同待测声源设置信息以及待测声源位置信息的声源播放音频时,语音设备外接麦克风所实际采集并输出的信号。
然后,基于模拟麦克风输出信号,对语音设备进行语音测试。在进行语音识别测试或者声源定位测试时,由于测试人员可以随时调整待测声源设置信息和待测声源位置信息,模拟出用户在不同位置发出不同音频强度的不同语音命令等各种应用场景,全面测试待测语音设备的语音识别准确率或是声源定位准确率。另外,测试人员还可以调整输入测试命令的时间间隔,以提高语音测试的效率、节约测试时间。
由于语音测试的基础是模拟得到的模拟麦克风输出信号,在整个测试过程中无需测试人员或外部功放系统播放测试音频,也无需麦克风进行信号采集和转换,使得可以屏蔽麦克风安装位置、实际接线状态、测试人员操作差异、生产车间环境噪声等诸多因素的不利影响,提高了语音测试的准确性,并降低了复测次数。
本发明实施例提供的方法,基于可调整的待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号,并基于模拟麦克风输出信号进行语音测试,提高了语音测试的全面性,同时屏蔽了麦克风安装位置、实际接线状态、测试人员操作差异、生产车间环境噪声等诸多因素的不利影响,提高了语音测试的准确性,并降低了复测次数。
基于上述实施例,图2为本发明实施例提供的麦克风输出信号模拟方法的流程示意图,如图2所示,步骤110具体包括:
步骤111,基于待测声源位置信息,确定待测声源与若干个麦克风的相对位置;
步骤112,基于待测声源与任一麦克风的相对位置对应的音频衰减系数,对待测声源设置信息对应的标准音频进行衰减,得到该麦克风的待测音频;
步骤113,对该麦克风的待测音频进行信号处理,得到该麦克风的模拟麦克风输出信号。
具体地,由于声音从声源传播到麦克风的过程中,会逐渐衰减,即麦克风采集到的音频是声源播放的音频经过衰减后的结果。因此,为了正确模拟麦克风处采集并输出的音频,需要确定音频从待测声源位置处,经由空气传播到达麦克风位置时的音频衰减系数。其中,音频衰减系数是指音频从待测声源传播到麦克风时,音频强度的衰减程度,其大小受到待测声源与麦克风之间的相对位置影响。
当语音设备外接一个或多个麦克风时,每个麦克风均会采集到待测声源播放的音频,故需要针对每个麦克风,分别生成其对应的模拟麦克风输出信号。然而,由于各个麦克风与待测声源的相对位置不同,故对于不同麦克风而言,其对应的音频衰减系数不同,所采集得到的音频也不同。因此,可以基于测试人员给定的待测声源位置信息,确定待测声源分别与每个麦克风的相对位置。其中,待测声源与任一麦克风的相对位置可以包括待测声源在以该麦克风为原点的直角坐标系中的横纵坐标,还可以包括待测声源与该麦克风的距离,以及待测声源和该麦克风之间的连线与水平方向或垂直方向的夹角,本发明实施例对此不作具体限定。
得到待测声源与每一麦克风的相对位置之后,针对任一麦克风,基于待测声源与该麦克风的相对位置,确定对应的音频衰减系数。然后,基于音频衰减系数,对待测声源设置信息对应的标准音频进行衰减,得到该麦克风的待测音频。其中,标准音频是预先利用采样麦克风采集的对应不同声源设置信息的音频。具体而言,可以使用样本声源分别播放不同声源设置信息对应的音频,然后由设置于样本声源位置处的采样麦克风进行采集。由于音频从样本声源传播到采样麦克风的衰减较小,可忽略不计,因此可以将采集得到的音频作为不同声源设置信息对应的标准音频,以模拟待测声源播放的音频。最后,将该麦克风的待测音频进行信号处理,将音频转换为待测语音设备的麦克风接口能够接收的信号形式,作为该麦克风的模拟麦克风输出信号。
本发明实施例提供的方法,基于待测声源位置信息,确定待测声源与若干个麦克风的相对位置,从而基于待测声源与任一麦克风的相对位置对应的音频衰减系数,对待测声源设置信息对应的标准音频进行衰减和信号处理,得到该麦克风的模拟麦克风输出信号,提高了模拟麦克风输出信号的准确性。
基于上述任一实施例,待测声源与任一麦克风之间相对位置对应的音频衰减系数,是基于如下步骤确定的:
从预先确定的对应不同音频强度与不同相对位置的音频衰减系数中,选取待测声源设置信息中的音频强度以及待测声源与任一麦克风的相对位置对应的音频衰减系数。
具体地,由于音频衰减系数不仅与待测声源和麦克风之间的相对位置有关,还与待测声源播放音频的音频强度有关,因此可以预先将样本声源部署在不同的相对位置处,再播放不同音频强度的音频,然后计算此时的音频衰减系数,从而得到对应不同音频强度与不同相对位置的音频衰减系数。此处,可以将对应不同音频强度和不同相对位置的音频衰减系数存储于音频衰减系数矩阵,方便检索。例如,可以以麦克风为原点,将麦克风的拾音空间分割为m*n的二维空间,其中,该二维空间中的每一坐标点代表待测声源与该麦克风的相对位置,针对任一音频强度,计算该二维空间中的每一坐标点对应的音频衰减系数,从而构建得到如下所示的音频衰减系数矩阵:
其中,ε[k]为音频强度为k时的音频衰减系数矩阵,ε(i,j,k),i∈[1,m],j∈[1,n]为音频强度为k时,二维空间中坐标(i,j)对应的音频衰减系数。
确定得到待测声源与任一麦克风之间的相对位置后,结合待测声源设置信息中包含的音频强度,对音频衰减系数库进行检索,选取得到该音频强度和该相对位置对应的音频衰减系数。
基于上述任一实施例,图3为本发明实施例提供的音频衰减系数确定方法的流程示意图,如图3所示,对应不同音频强度与不同相对位置的音频衰减系数,是基于如下步骤确定的:
步骤310,控制样本声源在任一采样相对位置播放对应任一音频强度的标准音频,通过采样麦克风采集标准音频,得到采样麦克风输出的实测麦克风输出信号;采样相对位置是采样麦克风与样本声源的相对位置。
步骤320,基于该音频强度,以及实测麦克风输出信号的强度,确定对应该音频强度与该采样相对位置的音频衰减系数。
具体地,将样本声源部署于任意采样相对位置(i,j)处,然后依次播放对应k个等级的音频强度的标准音频。此处,采样相对位置是采样麦克风与样本声源的相对位置。然后,通过采样麦克风采集样本声源播放的标准音频,得到采样麦克风输出的实测麦克风输出信号的强度V(i,j,1),V(i,j,2),…,V(i,j,k)。
其中,采样麦克风采集并输出的实测麦克风输出信号的强度为标准音频的音频强度与该音频强度和该采样相对位置对应的音频衰减系数的乘积。即,该音频强度,实测麦克风输出信号的强度,以及对应该音频强度与该采样相对位置的音频衰减系数之间的关系,满足以下条件:
其中,V(i,j,k)是样本声源在采样相对位置(i,j)处播放音频强度等级为k的标准音频时,实测麦克风输出信号的强度,Uk为该标准音频的音频强度,ε(i,j,k)则是对应该音频强度与该采样相对位置的音频衰减系数。
因此,基于该音频强度,以及实测麦克风输出信号的强度,可以计算得到对应该音频强度与该采样相对位置的音频衰减系数。
基于上述任一实施例,步骤111具体包括:
基于待测声源位置信息中待测声源与基准麦克风的相对位置,以及基准麦克风与其余每一麦克风的相对位置,确定待测声源与每一麦克风的相对位置;基准麦克风为若干个麦克风中的任意一个。
具体地,当待测语音设备外接多个麦克风时,多个麦克风的基本参数相同,区别仅在于待测声源与各个麦克风之间的相对位置不同,即各个麦克风所采集并输出的信号的差异仅和待测声源与各个麦克风之间的相对位置相关,故需要分别确定待测声源与各个麦克风之间的相对位置。通常情况下,与待测语音设备连接的各个麦克风之间的相对位置是固定的。以车载语音设备为例,通常与其连接的麦克风为双麦克风阵列,包括离主驾较近的主驾麦克风和离副驾较近的副驾麦克风,且对于同一车型的车载语音设备,主驾麦克风和副驾麦克风之间的相对位置是固定不变的。
因此,选中多个麦克风中的任意一个作为基准麦克风,并在待测声源位置信息中设定待测声源与基准麦克风的相对位置后,即可基于基准麦克风与其余每一麦克风的相对位置,确定得到待测声源与每一麦克风的相对位置。图4为本发明实施例提供的待测声源与多个麦克风的相对位置的示意图,如图4所示,以车载语音设备对应的双麦克风阵列为例,选择主驾麦克风mic1作为基准麦克风,待测声源s与主驾麦克风mic1间的相对位置为(x1,y1),主驾麦克风mic1与副驾麦克风mic2之间的距离为L。以主驾麦克风mic1作为坐标系原点,若x1<0,且L>|x1|,即待测声源处于图4中的阴影部分时,根据三角形勾股定理可以计算得到待测声源s与副驾麦克风mic2之间的距离:
同时可以根据正切函数的定义,计算待测声源s与副驾麦克风mic2之间连线与水平方向的夹角:
δ2=argtan(y1/(L-|x1|))
若x1≥0,或者,|x1|>L且x1<0,即待测声源处于图4的阴影部分以外的位置时,根据三角形勾股定理可以计算得到待测声源s与副驾麦克风mic2之间的距离:
再根据正切函数的定义,计算待测声源s与副驾麦克风mic2之间连线与水平方向的夹角:
δ2=argtan(y1/|L+x1|)
需要说明的是,可以直接将待测声源s与副驾麦克风mic2之间的距离,以及待测声源s与副驾麦克风mic2之间连线与水平方向的夹角作为待测声源s与副驾麦克风mic2的相对位置,也可以将待测声源s与副驾麦克风mic2之间的距离,以及待测声源s与副驾麦克风mic2之间连线与水平方向的夹角转换成横纵坐标形式,作为待测声源s与副驾麦克风的相对位置,本发明实施例对此不作具体限定。
以此类推,当麦克风的数量大于2个时,可以采用相同方式计算其余每个麦克风与待测声源的相对位置。
确定得到待测声源与每一麦克风的相对位置后,对于任一麦克风,可以基于待测声源与该麦克风的相对位置,以及待测声源播放的标准音频的音频强度,确定对应该音频强度与该相对位置的音频衰减系数,并基于确定得到的音频衰减系数对标准音频进行衰减,经过信号处理后,得到该麦克风对应的模拟麦克风输出信号。
基于上述任一实施例,待测声源设置信息包括语音命令设置信息和环境噪声设置信息,待测声源位置信息包括语音命令位置信息和环境噪声位置信息。
具体地,语音设备在实际投入使用时,使用环境并非绝对安静,除了用户的语音命令外,还掺杂着各种环境噪声。例如车载语音设备在使用时,麦克风采集并输出的信号中会包含发动机噪声、风噪、胎噪等噪声。为了在测试时尽可能模拟语音设备实际运行时的真实应用场景,以保证测试通过的语音设备在投入实际应用时也可以正常运行,需要在测试时也将环境噪声考虑在内。
因此,测试人员在设定待测声源设置信息时,需要同时设置语音命令设置信息和环境噪声设置信息。其中,语音命令设置信息中可以包括语音命令文本和语音命令音频的音频强度,环境噪声设置信息可以包括环境噪声类型,例如发动机噪声、风噪或胎噪,以及噪声音频的音频强度。此外,环境噪声声源与语音命令声源不同,因此在设置待测声源位置信息时,需要分别设置语音命令位置信息和环境噪声位置信息,分别代表语音命令声源的位置信息和环境噪声声源的位置信息。
由于待测声源包括语音命令声源和环境噪声声源,因此针对任一麦克风生成其对应的模拟麦克风输出信号时,需要叠加语音命令对应的待测音频和环境噪声对应的待测音频,再进行信号处理,从而得到模拟麦克风输出信号。其中,可以基于语音命令设置信息中的语音命令文本和音频强度,选取对应的标准音频,并基于对应该音频强度以及语音命令位置信息的音频衰减系数对标准音频进行衰减,得到语音命令对应的待测音频。
对于环境噪声,需要预先构建对应不同类型环境噪声和不同等级音频强度的标准音频。针对任一类型的环境噪声,还需要预先测定对应不同音频强度与不同环境噪声相对位置的音频衰减系数,从而按照与语音命令对应的待测音频相同的生成方式,生成环境噪声对应的待测音频。需要说明的是,对于部分环境噪声,例如发动机噪声,由于该环境噪声声源的位置是固定的,因此在确定音频衰减系数时,可以仅测定对应不同音频强度的音频衰减系数。
以发动机噪声为例,由于发动机距离麦克风的距离是固定的,因此,麦克风接收到的信号强度仅与发动机本身发出的噪声音频强度有关,而发动机发出的噪声音频强度通常与转速有关,因此可以测量不同转速下发动机发出的噪声音频强度,以及采样麦克风输出的实测麦克风输出信号强度。根据发动机发出的噪声音频强度、采样麦克风输出的实测麦克风输出信号强度,以及对应该噪声音频强度的音频衰减系数间存在的下列关系,计算得到对应不同噪声音频强度的音频衰减系数:
V[p,q,kpq]=[V(p,q,1),V(p,q,2),…,V(p,q,kpq)]
=[ε(p,q,1),ε(p,q,2),…,ε(p,q,kpq)]*Wkpq
=ε[p,q,kpq]*Wkpq
其中,V[p,q,kpq]包括发动机发出从第1至第kpq等级音频强度的噪声时,采样麦克风输出的实测麦克风输出信号强度V(p,q,1),V(p,q,2),...,V(p,q,kpq);Wkpq为发动机发出的第1、2或第kpq等级的噪声强度,ε[p,q,kpq]包括对应第1至第kpq等级噪声音频强度的音频衰减系数ε(p,q,1),ε(p,q,2),...,ε(p,q,kpq)。
本发明实施例提供的方法,通过在待测声源设置信息中设置语音命令设置信息和环境噪声设置信息,在待测声源位置信息中设置语音命令位置信息和环境噪声位置信息,能够更准确地模仿真实应用场景,提高了语音测试的准确性。
基于上述任一实施例,步骤113具体包括:
对任一麦克风的待测音频进行数模转换,得到待测音频的模拟信号;
对待测音频的模拟信号进行信号放大,得到该麦克风的模拟麦克风输出信号。
具体地,为了将音频转换为待测语音设备的麦克风接口能够接收的信号形式,考虑到麦克风输出给语音设备的信号为模拟信号,因此需要利用数模转换器D/A对任一麦克风的待测音频进行数模转换,得到该待测音频的模拟信号。另外,待测语音设备能够接收的麦克风输出信号的电压幅值需要处于一定电压范围,而数模转换后得到的模拟信号电压幅值可能较小,达不到该电压范围。因此,还可以利用信号放大控制电路对待测音频的模拟信号进行信号放大,使得获得的模拟麦克风输出信号的电压幅值能够满足待测语音设备的接收要求。其中,信号放大时,可以基于待测音频的音频幅值以及采样麦克风的输出信号的电压幅值,确定增益值,并基于增益值对待测音频的模拟信号进行放大。
基于上述任一实施例,图5为本发明又一实施例提供的语音测试方法的流程示意图,如图5所示,该方法包括:
步骤510,接收测试人员下发的测试命令。此处,测试命令中包括语音命令设置信息、环境噪声设置信息、语音命令位置信息和环境噪声位置信息。其中,语音命令设置信息还包括语音命令文本和语音命令音频的音频强度,环境噪声设置信息还包括环境噪声类型和噪声音频的音频强度。测试人员还可以控制输入测试命令的时间间隔,以提高语音测试的效率、节约测试时间。
步骤520,基于语音命令位置信息和环境噪声位置信息,确定语音命令声源和环境噪声声源分别与若干个麦克风的相对位置。具体而言,可以基于语音命令声源与基准麦克风的相对位置、环境噪声声源与基准麦克风的相对位置,以及基准麦克风与其余每一麦克风的相对位置,确定语音命令声源和环境噪声声源与每一麦克风的相对位置。
步骤530,基于语音命令音频的音频强度和语音命令声源与任一麦克风的相对位置,确定语音命令音频的音频衰减系数;基于噪声音频的音频强度和噪声声源与该麦克风的相对位置,确定噪声音频的音频衰减系数。
步骤540,分别利用语音命令音频的音频衰减系数和噪声音频的音频衰减系数,对语音命令标准音频和噪声标准音频进行衰减,得到语音命令对应的待测音频,以及环境噪声对应的待测音频。其中,语音命令标准音频是根据语音命令文本和语音命令音频的音频强度确定的,噪声标准音频是根据环境噪声类型和噪声音频的音频强度确定的。具体可采用如下公式计算语音命令对应的待测音频,以及环境噪声对应的待测音频:
V[xi,yj,kij]=ε(xi,yj,kij)*U(n)
V[xp,yq,kpq]=ε(xp,yq,kpq)*W(n)
其中,U(n)和W(n)分别为语音命令标准音频和噪声标准音频的离散形式,ε(xi,yj,kij)为对应相对位置(xi,yj)和音频强度kij的语音命令音频的音频衰减系数,ε(xp,yq,kpq)为对应相对位置(xp,yq)和音频强度kpq的噪声音频的音频衰减系数,V[xi,yj,kij]和V[xp,yq,kpq]分别为语音命令对应的待测音频和环境噪声对应的待测音频。
步骤550,将语音命令对应的待测音频和环境噪声对应的待测音频叠加,得到该麦克风的待测音频:
Z1(n)=V[xi,yj,kij]+V[xp,yq,kpq]
步骤560,对该麦克风的待测音频进行数模转换和信号放大,得到该麦克风的模拟麦克风输出信号。
步骤570,将每一麦克风的模拟麦克风输出信号传送给待测语音设备进行语音测试。具体而言,可以利用通道控制方法打开待测语音设备对应各麦克风的输入通道,并将每一麦克风的模拟麦克风输出信号输入至待测语音设备。
下面对本发明实施例提供的语音测试装置进行描述,下文描述的语音测试装置与上文描述的语音测试方法可相互对应参照。
基于上述任一实施例,图6为本发明实施例提供的语音测试装置的结构示意图,如图6所示,该装置包括:麦克风输出信号模拟单元610和语音测试单元620。
其中,麦克风输出信号模拟单元610用于基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;
语音测试单元620用于基于模拟麦克风输出信号进行语音测试。
本发明实施例提供的装置,基于可调整的待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号,并基于模拟麦克风输出信号进行语音测试,提高了语音测试的全面性,同时屏蔽了麦克风安装位置、实际接线状态、测试人员操作差异、生产车间环境噪声等诸多因素的不利影响,提高了语音测试的准确性,并降低了复测次数。
基于上述任一实施例,麦克风输出信号模拟单元610具体包括:
相对位置确定单元,用于基于待测声源位置信息,确定待测声源与若干个麦克风的相对位置;
待测音频生成单元,用于基于待测声源与任一麦克风的相对位置对应的音频衰减系数,对待测声源设置信息对应的标准音频进行衰减,得到该麦克风的待测音频;
信号处理单元,用于对该麦克风的待测音频进行信号处理,得到该麦克风的模拟麦克风输出信号。
本发明实施例提供的装置,基于待测声源位置信息,确定待测声源与若干个麦克风的相对位置,从而基于待测声源与任一麦克风的相对位置对应的音频衰减系数,对待测声源设置信息对应的标准音频进行衰减和信号处理,得到该麦克风的模拟麦克风输出信号,提高了模拟麦克风输出信号的准确性。
基于上述任一实施例,该装置还包括音频衰减系数确定单元,音频衰减系数确定单元具体用于:
从预先确定的对应不同音频强度与不同相对位置的音频衰减系数中,选取待测声源设置信息中的音频强度以及待测声源与任一麦克风的相对位置对应的音频衰减系数。
基于上述任一实施例,该装置还包括音频衰减系数测量单元,音频衰减系数测量单元具体用于:
控制样本声源在任一采样相对位置播放对应任一音频强度的标准音频,通过采样麦克风采集标准音频,得到采样麦克风输出的实测麦克风输出信号;采样相对位置是采样麦克风与样本声源的相对位置。
基于该音频强度,以及实测麦克风输出信号的强度,确定对应该音频强度与该采样相对位置的音频衰减系数。
基于上述任一实施例,相对位置确定单元具体用于:
基于待测声源位置信息中待测声源与基准麦克风的相对位置,以及基准麦克风与其余每一麦克风的相对位置,确定待测声源与每一麦克风的相对位置;基准麦克风为若干个麦克风中的任意一个。
基于上述任一实施例,待测声源设置信息包括语音命令设置信息和环境噪声设置信息,待测声源位置信息包括语音命令位置信息和环境噪声位置信息。
本发明实施例提供的装置,通过在待测声源设置信息中设置语音命令设置信息和环境噪声设置信息,在待测声源位置信息中设置语音命令位置信息和环境噪声位置信息,能够更准确地模仿真实应用场景,提高了语音测试的准确性。
基于上述任一实施例,信号处理单元具体用于:
对任一麦克风的待测音频进行数模转换,得到待测音频的模拟信号;
对待测音频的模拟信号进行信号放大,得到该麦克风的模拟麦克风输出信号。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行语音测试方法,该方法包括:基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;基于所述模拟麦克风输出信号进行语音测试。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的语音测试方法,该方法包括:基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;基于所述模拟麦克风输出信号进行语音测试。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的语音测试方法,该方法包括:基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;基于所述模拟麦克风输出信号进行语音测试。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音测试方法,其特征在于,包括:
基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;
基于所述模拟麦克风输出信号进行语音测试。
2.根据权利要求1所述的语音测试方法,其特征在于,所述基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号,具体包括:
基于所述待测声源位置信息,确定待测声源与若干个麦克风的相对位置;
基于所述待测声源与任一麦克风的相对位置对应的音频衰减系数,对所述待测声源设置信息对应的标准音频进行衰减,得到所述任一麦克风的待测音频;
对所述任一麦克风的待测音频进行信号处理,得到所述任一麦克风的模拟麦克风输出信号。
3.根据权利要求2所述的语音测试方法,其特征在于,所述待测声源与任一麦克风的相对位置对应的音频衰减系数,是基于如下步骤确定的:
从预先确定的对应不同音频强度与不同相对位置的音频衰减系数中,选取所述待测声源设置信息中的音频强度以及所述待测声源与任一麦克风的相对位置对应的音频衰减系数。
4.根据权利要求3所述的语音测试方法,其特征在于,所述对应不同音频强度与不同相对位置的音频衰减系数,是基于如下步骤确定的:
控制样本声源在任一采样相对位置播放对应任一音频强度的标准音频,通过采样麦克风采集所述标准音频,得到所述采样麦克风输出的实测麦克风输出信号;所述采样相对位置是所述采样麦克风与所述样本声源的相对位置;
基于所述任一音频强度,以及所述实测麦克风输出信号的强度,确定对应所述任一音频强度与所述任一采样相对位置的音频衰减系数。
5.根据权利要求2所述的语音测试方法,其特征在于,所述基于所述待测声源位置信息,确定待测声源与若干个麦克风的相对位置,具体包括:
基于所述待测声源位置信息中所述待测声源与基准麦克风的相对位置,以及所述基准麦克风与其余每一麦克风的相对位置,确定所述待测声源与每一麦克风的相对位置;所述基准麦克风为所述若干个麦克风中的任意一个。
6.根据权利要求1至5中任一项所述的语音测试方法,其特征在于,所述待测声源设置信息包括语音命令设置信息和环境噪声设置信息,所述待测声源位置信息包括语音命令位置信息和环境噪声位置信息。
7.根据权利要求2至5任一项所述的语音测试方法,其特征在于,所述对所述任一麦克风的待测音频进行信号处理,得到所述任一麦克风的模拟麦克风输出信号,具体包括:
对所述任一麦克风的待测音频进行数模转换,得到所述待测音频的模拟信号;
对所述待测音频的模拟信号进行信号放大,得到所述任一麦克风的模拟麦克风输出信号。
8.一种语音测试装置,其特征在于,包括:
麦克风输出信号模拟单元,用于基于待测声源设置信息以及待测声源位置信息,生成模拟麦克风输出信号;
语音测试单元,用于基于所述模拟麦克风输出信号进行语音测试。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述语音测试方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述语音测试方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010772715.4A CN111951833A (zh) | 2020-08-04 | 2020-08-04 | 语音测试方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010772715.4A CN111951833A (zh) | 2020-08-04 | 2020-08-04 | 语音测试方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111951833A true CN111951833A (zh) | 2020-11-17 |
Family
ID=73339386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010772715.4A Pending CN111951833A (zh) | 2020-08-04 | 2020-08-04 | 语音测试方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111951833A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744765A (zh) * | 2021-08-19 | 2021-12-03 | 深圳市新国都股份有限公司 | Pos机语音播报检测方法、装置及存储介质 |
CN115294990A (zh) * | 2022-10-08 | 2022-11-04 | 杭州艾力特数字科技有限公司 | 扩声系统检测方法、系统、终端及存储介质 |
WO2023061126A1 (zh) * | 2021-10-15 | 2023-04-20 | 青岛海尔电冰箱有限公司 | 冰箱语音模块的测试系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080298599A1 (en) * | 2007-05-28 | 2008-12-04 | Hyun-Soo Kim | System and method for evaluating performance of microphone for long-distance speech recognition in robot |
CN103327427A (zh) * | 2012-03-19 | 2013-09-25 | 环旭电子股份有限公司 | 用于收音系统的等化前处理方法及其系统 |
CN103583054A (zh) * | 2010-12-03 | 2014-02-12 | 弗兰霍菲尔运输应用研究公司 | 经由根据抵达方向估算提取几何信息的声音获取 |
CN105044676A (zh) * | 2015-09-15 | 2015-11-11 | 北京理工大学 | 一种基于能量的声源定位方法 |
CN106354472A (zh) * | 2016-11-02 | 2017-01-25 | 广州幻境科技有限公司 | 一种用于虚拟现实环境中声音的控制方法及其系统 |
CN109633552A (zh) * | 2018-12-11 | 2019-04-16 | 黑龙江大学 | 一种基于神经网络的复合型空间分布麦克风声源定位方法 |
CN110049408A (zh) * | 2019-05-10 | 2019-07-23 | 苏州静声泰科技有限公司 | 一种麦克风传声器阵列阵型优化方法 |
CN110557711A (zh) * | 2019-08-30 | 2019-12-10 | 歌尔科技有限公司 | 一种耳机测试方法和耳机 |
CN111161757A (zh) * | 2019-12-27 | 2020-05-15 | 镁佳(北京)科技有限公司 | 声源定位方法、装置、可读存储介质及电子设备 |
-
2020
- 2020-08-04 CN CN202010772715.4A patent/CN111951833A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080298599A1 (en) * | 2007-05-28 | 2008-12-04 | Hyun-Soo Kim | System and method for evaluating performance of microphone for long-distance speech recognition in robot |
CN103583054A (zh) * | 2010-12-03 | 2014-02-12 | 弗兰霍菲尔运输应用研究公司 | 经由根据抵达方向估算提取几何信息的声音获取 |
CN103327427A (zh) * | 2012-03-19 | 2013-09-25 | 环旭电子股份有限公司 | 用于收音系统的等化前处理方法及其系统 |
CN105044676A (zh) * | 2015-09-15 | 2015-11-11 | 北京理工大学 | 一种基于能量的声源定位方法 |
CN106354472A (zh) * | 2016-11-02 | 2017-01-25 | 广州幻境科技有限公司 | 一种用于虚拟现实环境中声音的控制方法及其系统 |
CN109633552A (zh) * | 2018-12-11 | 2019-04-16 | 黑龙江大学 | 一种基于神经网络的复合型空间分布麦克风声源定位方法 |
CN110049408A (zh) * | 2019-05-10 | 2019-07-23 | 苏州静声泰科技有限公司 | 一种麦克风传声器阵列阵型优化方法 |
CN110557711A (zh) * | 2019-08-30 | 2019-12-10 | 歌尔科技有限公司 | 一种耳机测试方法和耳机 |
CN111161757A (zh) * | 2019-12-27 | 2020-05-15 | 镁佳(北京)科技有限公司 | 声源定位方法、装置、可读存储介质及电子设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744765A (zh) * | 2021-08-19 | 2021-12-03 | 深圳市新国都股份有限公司 | Pos机语音播报检测方法、装置及存储介质 |
CN113744765B (zh) * | 2021-08-19 | 2023-12-29 | 深圳市新国都股份有限公司 | Pos机语音播报检测方法、装置及存储介质 |
WO2023061126A1 (zh) * | 2021-10-15 | 2023-04-20 | 青岛海尔电冰箱有限公司 | 冰箱语音模块的测试系统 |
CN115294990A (zh) * | 2022-10-08 | 2022-11-04 | 杭州艾力特数字科技有限公司 | 扩声系统检测方法、系统、终端及存储介质 |
CN115294990B (zh) * | 2022-10-08 | 2023-01-03 | 杭州艾力特数字科技有限公司 | 扩声系统检测方法、系统、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111951833A (zh) | 语音测试方法、装置、电子设备和存储介质 | |
US10861480B2 (en) | Method and device for generating far-field speech data, computer device and computer readable storage medium | |
CN101411213B (zh) | 音频系统中的校准方法和装置 | |
CN107221319A (zh) | 一种语音识别测试系统和方法 | |
CN109313909B (zh) | 评估麦克风阵列一致性的方法、设备、装置和系统 | |
US10741195B2 (en) | Sound signal enhancement device | |
CN111161752A (zh) | 回声消除方法和装置 | |
CN109831733A (zh) | 音频播放性能的测试方法、装置、设备和存储介质 | |
CN110248016B (zh) | 用于自动调节免提系统的系统 | |
CN111031463B (zh) | 麦克风阵列性能评测方法、装置、设备和介质 | |
CN105979462A (zh) | 一种基于麦克风的测试处理方法和装置 | |
JP2009271359A (ja) | 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム | |
A Al-Karawi et al. | Automatic speaker recognition system in adverse conditions—implication of noise and reverberation on system performance | |
US20210306782A1 (en) | Method and system of audio device performance testing | |
CN113259832B (zh) | 麦克风阵列的检测方法、装置、电子设备及存储介质 | |
CN113470618A (zh) | 唤醒测试的方法、装置、电子设备和可读存储介质 | |
CN111613248A (zh) | 拾音测试方法、设备及系统 | |
CN110475181A (zh) | 设备配置方法、装置、设备和存储介质 | |
CN107403629B (zh) | 远场拾音性能评价方法和系统、电子设备 | |
CN109741761B (zh) | 声音处理方法和装置 | |
CN112951263A (zh) | 语音增强方法、装置、设备和存储介质 | |
CN112017636A (zh) | 基于车辆的用户发音模拟方法、系统、设备及存储介质 | |
CN113257247B (zh) | 一种测试方法及系统 | |
CN112995882B (zh) | 一种智能设备音频开环测试方法 | |
CN109121068A (zh) | 音效控制方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |