CN111031463B - 麦克风阵列性能评测方法、装置、设备和介质 - Google Patents

麦克风阵列性能评测方法、装置、设备和介质 Download PDF

Info

Publication number
CN111031463B
CN111031463B CN201911142503.1A CN201911142503A CN111031463B CN 111031463 B CN111031463 B CN 111031463B CN 201911142503 A CN201911142503 A CN 201911142503A CN 111031463 B CN111031463 B CN 111031463B
Authority
CN
China
Prior art keywords
noise
voice
recording
microphone array
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911142503.1A
Other languages
English (en)
Other versions
CN111031463A (zh
Inventor
黄伟凯
郑淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Centerm Information Co Ltd
Original Assignee
Fujian Centerm Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Centerm Information Co Ltd filed Critical Fujian Centerm Information Co Ltd
Priority to CN201911142503.1A priority Critical patent/CN111031463B/zh
Publication of CN111031463A publication Critical patent/CN111031463A/zh
Application granted granted Critical
Publication of CN111031463B publication Critical patent/CN111031463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种麦克风阵列性能评测方法、装置、设备和介质,方法包括:S1、测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,在白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,在白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;S2、汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表。本发明弥补了目前麦克风阵列性能的优劣评估技术领域的空白,为麦克风阵列产品选型提供可靠的依据,也提高了集成麦克风阵列的产品性能的不确定性。

Description

麦克风阵列性能评测方法、装置、设备和介质
技术领域
本发明涉及计算机技术领域,特别涉及一种麦克风阵列性能评测方法、装置、设备和介质。
背景技术
麦克风阵列是由多个麦克风组成的拾音系统,具有回声消除、定向拾音、声源定向,VAD等功能。与传统的麦克风相比,在应用体验上有如下优点:
1.能够在设备扬声器工作的同时录制声音,并且能够排除扬声器声音的干扰;
2.能够在嘈杂环境下准确地录制说话人的语音;
3.能够输出声源与麦克风阵列的相对方向;
4.能够识别到含有实时语音的时间段。
由于具有以上优点,麦克风阵列技术已经被广泛地用于智能音箱、智能家电等设备中。
然而,在麦克风阵列广泛应用的背景之下,却缺乏一套对麦克风阵列性能的评估方法,导致各个麦克风阵列产品出现在性能上参差不齐却又无法具体衡量性能指标的窘境。这样大大提高了麦克风阵列产品选型的难度,也提高了集成麦克风阵列的产品性能的不确定性。
于20190125公开的,申请号为CN201811063803.6的中国发明公开了一种麦克风阵列的测试方法、装置、系统、设备和存储介质,其揭示了一种麦克风阵列的测试方法,通过分别估算麦克风阵列每个通道的麦克风性能参数从而估算整体麦克风的性能指标,但该方法没有考虑到麦克风阵列的整体性,而是使用部分来衡量整体,不能用于评估麦克风阵列的整体性能。
于20180420,公开的,申请号为CN201711474399的中国发明所公开的一种智能音箱和麦克风阵列测试系统,与20190820公开的,申请号为CN201920207496的中国发明所公开的一种麦克风阵列自动化测试系统,分别提出一套麦克风阵列的测试方法,但是也只是提出麦克风阵列测试过程中相关的硬件架构,并未提及测试参数与评估指标。
发明内容
本发明要解决的技术问题,在于提供一种麦克风阵列性能评测方法、装置、设备和介质,弥补目前麦克风阵列性能的优劣评估技术领域的空白,为麦克风阵列产品选型提供可靠的依据,也提高了集成麦克风阵列的产品性能的不确定性。
第一方面,本发明提供了一种麦克风阵列性能评测方法,包括
S1、测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;
S2、汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表。
第二方面,本发明提供了一种麦克风阵列性能评测装置,包括:
测试模块,用于测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;
汇总模块,用于汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表。
第三方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供的方法、装置、设备和介质,对麦克风阵列的多个性能指标进行测试,得到多个指标参数;然后汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表,对比不同麦克风阵列的性能指标参数列表,即可得到麦克风阵列性能的优劣评估结果。从而弥补目前麦克风阵列性能的优劣评估技术领域的空白。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
下面参照附图结合实施例对本发明做进一步的说明。
图1为本发明实施例一中方法中的流程图;
图2为本发明测试环境示意图;
图3为本发明录音测试过程示意图,其中包括了叠加合成测试音频的过程;
图4为本发明计算录音与噪声的平均能量比的过程示意图,;
图5为本发明实施例二中装置的结构示意图;
图6为本发明实施例三中电子设备的结构示意图;
图7为本发明实施例四中介质的结构示意图。
具体实施方式
本申请实施例通过提供一种麦克风阵列性能评测方法、装置、设备及介质,弥补目前麦克风阵列性能的优劣评估技术领域的空白,为麦克风阵列产品选型提供可靠的依据,也提高了集成麦克风阵列的产品性能的不确定性。
本申请实施例中的技术方案,总体思路如下:对麦克风阵列中多个性能项目(包括麦克风阵列响应时间、声源定向误差、在有色噪声背景下的同向降噪性能、在白噪声背景下的同向降噪性能、在有色噪声背景下的异向降噪性能、在白噪声背景下的异向降噪性能、回声消除性能、远场拾音性能、人声识别性能、语音识别性能)进行测试和计算,最后汇总各个项目的指标参数,组成该阵列的性能参数列表,对比不同阵列的参数列表即可评估麦克风阵列性能的优劣。
实施例一
本实施例提供一种麦克风阵列性能评测方法,如图1所示,包括下述步骤:
S1、测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,在白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,在白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;
S2、汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表。
如此,通过对比不同麦克风阵列的性能指标参数列表,麦克风阵列性能的优劣评估。
其中,上述各个性能指标参数的测试方法详述如下:
(1)所述麦克风阵列的响应时间的测试方法是:使用专业的音频处理软件,在播放音频的同时进行录音;在录制的波形上对比具有相同特征的两个点的横向时间差异;多次测量得出平均值,记录平均值为该麦克风阵列的响应时间;
(2)所述声源定向误差的测试方法是:如图2所示,将声源放在距离麦克风阵列中心点一定距离(取1m时较佳)的圆上;变换声源在圆上的位置;记录声源实际位置与麦克风阵列识别到的相对位置;多次测量,统计记录识别角度误差、阵列识别的角度范围与最小角度分辨率;
(3)所述在有色噪声背景下的同向降噪性能的测试方法是:如图3所示,将有色噪声与语音叠加合成测试音频;将测试音频并从麦克风阵列拾音方向的声源中播放出来,同时使用该麦克风阵列进行录音并保存成无损格式;计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(4)所述在白噪声背景下的同向降噪性能的测试方法是:如图3所示,将白噪声与语音叠加合成测试音频;将测试音频并从麦克风阵列拾音方向的声源中播放出来,同时使用该麦克风阵列进行录音并保存成无损格式;计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(5)所述在有色噪声背景下的异向降噪性能的测试方法是:如图3所示,将有色噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(6)所述在白噪声背景下的异向降噪性能的测试方法是:如图3所示,将白噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(7)所述在有色噪声背景下的异向降噪性能的测试方法是:如图3所示,将白噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(8)所述回声消除性能的测试方法是:如图3所示,将噪声与语音叠加合成测试音频;播放时使用麦克风阵列拾音方向上的声源播放测试音频;在播放测试音频时,将噪音通道接入麦克风阵列的回声消除输入端,同时将麦克风阵列的输出录制成无损的音频格式;计算录音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(9)所述远场拾音性能的测试方法是:单独使用语音通道进行测试;调整声源位置,使声源位于麦克风阵列的拾音范围内,如图2所示,并与麦克风阵列中心距离一定距离(取1m时较佳);调整声源音量,使在阵列中心位置测得的声强60-80dB;播放语音,并同时使用阵列进行录音,保存无损格式的录音数据;保持声源音量不变,调整阵列与声源的距离,多次测试并记录测试参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(10)所述测试语音识别性能的测试方法是:对多个包含语音的音频片段进行语音识别,记录语音识别供应商、音频片段、音频中的噪声和语音的平均能量比和识别率,并统计结果。
如图3所示,所述(3)至(8)中的叠加合成测试音频的过程是:
取一个只包含语音且不包含任何噪声的音频作为语音样本;取多个只包含噪声不包含语音的音频作为噪声样本,噪声样本囊括均匀噪声样本、有色噪声样本和实际噪声样本;
使用专业的音频处理软件将语音样本和噪声样本分别放在左右声道中,即可通过音频处理软件自动叠加合成测试音频,分别调整噪声和语音的增益,从而形成多组语音和噪声比例不同的的测试音频,使用该音频作为测试样本进行测试。
如图4所示,所述(3)至(8)中的计算录音与噪声的平均能量比的过程是:
计算录音中包含语音段的平均能量与不包含语音段的录音的平均能量,即:将录音数据中每个采样点的能量值A的平方累加后除以采样点个数最后取平方根,计算公式为:
Figure BDA0002281334630000071
计算评估指标,计算公式为:
Figure BDA0002281334630000072
其中,利用公式(2)计算评估指标前,先将音频按时间进行分割,分割为只含噪声的音频与同时包含人声和噪声的音频,之后才能进行计算平均能量,进而计算比值,得到录音质量度量值。
评估指标的大小表示语音的清晰程度,该评估指标越趋近于0则表示语音(人声)越清晰,噪声越小;比值越趋近于1则表示噪声越大,语音越小。例如不含噪音的音频段的比值应为0;不含语音的均匀噪声的比值应为1。且该值在0~1之间呈线性关系,可以直接用于衡量音频中语音的清晰程度。当该值大于等于1时,表示背景噪声幅度的起伏变化比语音大,此时无法从波形上判断出音频中哪里含有语音。
基于同一发明构思,本申请还提供了与实施例一中的方法对应的装置,详见实施例二。
实施例二
在本实施例中提供了一种麦克风阵列性能评测装置,如图5所示,包括测试模块,用于测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,在白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,在白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;
汇总模块,用于汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表。
其中,所述测试模块进一步包括:
(1)响应时间测试模块,用于测试麦克风阵列的响应时间,测试的过程是:使用专业的音频处理软件,在播放音频的同时进行录音;在录制的波形上对比具有相同特征的两个点的横向时间差异;多次测量得出平均值,记录平均值为该麦克风阵列的响应时间;
(2)声源定向误差测试模块,用于测试麦克风阵列的声源定向误差,测试的过程是:将声源放在距离麦克风阵列中心点一定距离的圆上;变换声源在圆上的位置;记录声源实际位置与麦克风阵列识别到的相对位置;多次测量,统计记录识别角度误差、阵列识别的角度范围与最小角度分辨率;
(3)同向降噪性能测试模块,用于测试麦克风阵列在有色噪声背景下的同向降噪性能和白噪声背景下的同向降噪性能,测试的过程是:分别将有色噪声、白噪声与语音叠加合成测试音频;将测试音频并从麦克风阵列拾音方向的声源中播放出来,同时使用该麦克风阵列进行录音并保存成无损格式;计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(4)异向降噪性能测试模块,用于测试麦克风阵列在白噪声背景下的异向降噪性能和白噪声背景下的异向降噪性能,测试的过程是:分别将有色噪声、白噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(5)回声消除性能测试模块,用于测试麦克风阵列的回声消除性能,测试的过程是:将噪声与语音叠加合成测试音频;播放时使用麦克风阵列拾音方向上的声源播放测试音频;在播放测试音频时,将噪音通道接入麦克风阵列的回声消除输入端,同时将麦克风阵列的输出录制成无损的音频格式;计算录音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(6)远场拾音性能测试模块,用于测试麦克风阵列的远场拾音性能,测试的过程是:单独使用语音通道进行测试;调整声源位置,使声源位于麦克风阵列的拾音范围内,并与麦克风阵列中心距离一定距离;调整声源音量,使在阵列中心位置测得的声强60-80dB;播放语音,并同时使用阵列进行录音,保存无损格式的录音数据;保持声源音量不变,调整阵列与声源的距离,多次测试并记录测试参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(7)语音识别性能测试模块,用于测试麦克风阵列的语音识别性能,测试的过程是:对多个包含语音的音频片段进行语音识别,记录语音识别供应商、音频片段、音频中的噪声和语音的平均能量比和识别率,并统计结果。
且所述同向降噪性能测试模块、异向降噪性能测试模块以及回声消除性能测试模块中的叠加合成测试音频的过程是:
取一个只包含语音且不包含任何噪声的音频作为语音样本;取多个只包含噪声不包含语音的音频作为噪声样本,噪声样本囊括均匀噪声样本、有色噪声样本和实际噪声样本;
使用专业的音频处理软件将语音样本和噪声样本分别放在左右声道中,分别调整噪声和语音的增益,从而形成多组语音和噪声比例不同的的测试音频,使用该音频作为测试样本进行测试。
所述同向降噪性能测试模块、异向降噪性能测试模块以及回声消除性能测试模块中的计算录音与噪声的平均能量比的过程是:
计算录音中包含语音段的平均能量与不包含语音段的录音的平均能量,即:将录音数据中每个采样点的能量值A的平方累加后除以采样点个数最后取平方根,计算公式为:
Figure BDA0002281334630000101
计算评估指标,计算公式为:
Figure BDA0002281334630000102
其中,利用公式(2)计算评估指标前,先将音频按时间进行分割,分割为只含噪声的音频与同时包含人声和噪声的音频,之后才能进行计算。
由于本发明实施例二所介绍的装置,为实施本发明实施例一的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。
基于同一发明构思,本申请提供了实施例一对应的电子设备实施例,详见实施例三。
实施例三
本实施例提供了一种电子设备,如图6所示,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,可以实现实施例一中任一实施方式。
由于本实施例所介绍的电子设备为实施本申请实施例一中方法所采用的设备,故而基于本申请实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中的方法所采用的设备,都属于本申请所欲保护的范围。
基于同一发明构思,本申请提供了实施例一对应的存储介质,详见实施例四。
实施例四
本实施例提供一种计算机可读存储介质,如图7所示,其上存储有计算机程序,该计算机程序被处理器执行时,可以实现实施例一中任一实施方式。
本申请实施例中提供的技术方案,至少具有如下技术效果或优点:本申请实施例提供的方法、装置、系统、设备及介质,对麦克风阵列的多个性能指标进行测试,得到多个指标参数;然后汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表,对比不同麦克风阵列的性能指标参数列表,即可得到麦克风阵列性能的优劣评估结果。从而弥补目前麦克风阵列性能的优劣评估技术领域的空白。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims (8)

1.一种麦克风阵列性能评测方法,其特征在于:包括
S1、测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;
S2、汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表;
(A)所述麦克风阵列的响应时间的测试方法是:使用专业的音频处理软件,在播放音频的同时进行录音;在录制的波形上对比具有相同特征的两个点的横向时间差异;多次测量得出平均值,记录平均值为该麦克风阵列的响应时间;
(B)所述声源定向误差的测试方法是:将声源放在距离麦克风阵列中心点一定距离的圆上;变换声源在圆上的位置;记录声源实际位置与麦克风阵列识别到的相对位置;多次测量,统计记录识别角度误差、阵列识别的角度范围与最小角度分辨率;
(C)所述在有色噪声背景下的同向降噪性能的测试方法是:将有色噪声与语音叠加合成测试音频;将测试音频从麦克风阵列拾音方向的声源中播放出来,同时使用该麦克风阵列进行录音并保存成无损格式;计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(D)所述白噪声背景下的同向降噪性能的测试方法是:将白噪声与语音叠加合成测试音频;将测试音频从麦克风阵列拾音方向的声源中播放出来,同时使用该麦克风阵列进行录音并保存成无损格式;计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(E)所述在有色噪声背景下的异向降噪性能的测试方法是:将有色噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(F)所述白噪声背景下的异向降噪性能的测试方法是:将有白噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(G)所述回声消除性能的测试方法是:将噪声与语音叠加合成测试音频;播放时使用麦克风阵列拾音方向上的声源播放测试音频;在播放测试音频时,将噪音通道接入麦克风阵列的回声消除输入端,同时将麦克风阵列的输出录制成无损的音频格式;计算录音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(H)所述远场拾音性能的测试方法是:单独使用语音通道进行测试;调整声源位置,使声源位于麦克风阵列的拾音范围内,并与麦克风阵列中心距离一定距离;调整声源音量,使在阵列中心位置测得的声强60-80dB;播放语音,并同时使用阵列进行录音,保存无损格式的录音数据;保持声源音量不变,调整阵列与声源的距离,多次测试并记录测试参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
(I)所述测试语音识别性能的测试方法是:对多个包含语音的音频片段进行语音识别,记录语音识别供应商、音频片段、音频中的噪声和语音的平均能量比和识别率,并统计结果。
2.根据权利要求1所述的麦克风阵列性能评测方法,其特征在于:所述(C)至(G)中的叠加合成测试音频的过程是:
取一个只包含语音且不包含任何噪声的音频作为语音样本;取多个只包含噪声不包含语音的音频作为噪声样本,噪声样本囊括均匀噪声样本、有色噪声样本和实际噪声样本;
使用专业的音频处理软件将语音样本和噪声样本分别放在左右声道中,分别调整噪声和语音的增益,从而形成多组语音和噪声比例不同的测试音频,使用该音频作为测试样本进行测试。
3.根据权利要求1所述的麦克风阵列性能评测方法,其特征在于:所述(C)至(G)中的计算录音与噪声的平均能量比的过程是:
计算录音中包含语音段的平均能量与不包含语音段的录音的平均能量,即:将录音数据中每个采样点的能量值A的平方累加后除以采样点个数最后取平方根,计算公式为:
Figure FDA0002970714910000031
其中,
Figure FDA0002970714910000032
为录音中包含语音段的平均能量或不包含语音段的录音的平均能量,当
Figure FDA0002970714910000033
为不包含语音段的录音的平均能量时记为
Figure FDA0002970714910000034
Figure FDA0002970714910000035
为录音中包含语音段的平均能量时记为
Figure FDA0002970714910000036
n为采样点个数;
计算评估指标X,计算公式为:
Figure FDA0002970714910000037
其中,利用公式2计算评估指标前,先将音频按时间进行分割,分割为只含噪声的音频与同时包含人声和噪声的音频,之后才能进行计算。
4.一种麦克风阵列性能评测装置,其特征在于:包括:
测试模块,用于测试麦克风阵列的以下性能指标参数:麦克风阵列的响应时间,声源定向误差,在有色噪声背景下的同向降噪性能,白噪声背景下的同向降噪性能,在有色噪声背景下的异向降噪性能,白噪声背景下的异向降噪性能,回声消除性能,远场拾音性能,测试语音识别性能;
汇总模块,用于汇总测试所得的各个性能指标参数,组成该麦克风阵列的性能指标参数列表;
所述测试模块进一步包括:
响应时间测试模块,用于测试麦克风阵列的响应时间,测试的过程是:使用专业的音频处理软件,在播放音频的同时进行录音;在录制的波形上对比具有相同特征的两个点的横向时间差异;多次测量得出平均值,记录平均值为该麦克风阵列的响应时间;
声源定向误差测试模块,用于测试麦克风阵列的声源定向误差,测试的过程是:将声源放在距离麦克风阵列中心点一定距离的圆上;变换声源在圆上的位置;记录声源实际位置与麦克风阵列识别到的相对位置;多次测量,统计记录识别角度误差、阵列识别的角度范围与最小角度分辨率;
同向降噪性能测试模块,用于测试麦克风阵列在有色噪声背景下的同向降噪性能和白噪声背景下的同向降噪性能,测试的过程是:分别将有色噪声、白噪声与语音叠加合成测试音频;将测试音频从麦克风阵列拾音方向的声源中播放出来,同时使用该麦克风阵列进行录音并保存成无损格式;计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
异向降噪性能测试模块,用于测试麦克风阵列在有色噪声背景下的异向降噪性能和白噪声背景下的异向降噪性能,测试的过程是:分别将有色噪声、白噪声与语音叠加合成测试音频;在播放测试音频时,使语音通道从麦克风阵列拾音方向上的声源播放出来,同时使噪声通道从非拾音方向的声源播放出来;在测试过程中同步地进行录音并保存成无损格式,计算录音中语音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
回声消除性能测试模块,用于测试麦克风阵列的回声消除性能,测试的过程是:将噪声与语音叠加合成测试音频;播放时使用麦克风阵列拾音方向上的声源播放测试音频;在播放测试音频时,将噪音通道接入麦克风阵列的回声消除输入端,同时将麦克风阵列的输出录制成无损的音频格式;计算录音与噪声的平均能量比,记录测试过程中的参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
远场拾音性能测试模块,用于测试麦克风阵列的远场拾音性能,测试的过程是:单独使用语音通道进行测试;调整声源位置,使声源位于麦克风阵列的拾音范围内,并与麦克风阵列中心距离一定距离;调整声源音量,使在阵列中心位置测得的声强60-80dB;播放语音,并同时使用阵列进行录音,保存无损格式的录音数据;保持声源音量不变,调整阵列与声源的距离,多次测试并记录测试参数,包括录音中语音与噪声的平均能量比、无压缩的录音数据和噪声与语音分量的增益;
语音识别性能测试模块,用于测试麦克风阵列的语音识别性能,测试的过程是:对多个包含语音的音频片段进行语音识别,记录语音识别供应商、音频片段、音频中的噪声和语音的平均能量比和识别率,并统计结果。
5.根据权利要求4所述的麦克风阵列性能评测装置,其特征在于:所述同向降噪性能测试模块、异向降噪性能测试模块以及回声消除性能测试模块中的叠加合成测试音频的过程是:
取一个只包含语音且不包含任何噪声的音频作为语音样本;取多个只包含噪声不包含语音的音频作为噪声样本,噪声样本囊括均匀噪声样本、有色噪声样本和实际噪声样本;
使用专业的音频处理软件将语音样本和噪声样本分别放在左右声道中,分别调整噪声和语音的增益,从而形成多组语音和噪声比例不同的测试音频,使用该音频作为测试样本进行测试。
6.根据权利要求4所述的麦克风阵列性能评测装置,其特征在于:所述同向降噪性能测试模块、异向降噪性能测试模块以及回声消除性能测试模块中的计算录音与噪声的平均能量比的过程是:
计算录音中包含语音段的平均能量与不包含语音段的录音的平均能量,即:将录音数据中每个采样点的能量值A的平方累加后除以采样点个数最后取平方根,计算公式为:
Figure FDA0002970714910000061
其中,
Figure FDA0002970714910000062
为录音中包含语音段的平均能量或不包含语音段的录音的平均能量,当
Figure FDA0002970714910000063
为不包含语音段的录音的平均能量时记为
Figure FDA0002970714910000064
Figure FDA0002970714910000065
为录音中包含语音段的平均能量时记为
Figure FDA0002970714910000066
n为采样点个数;
计算评估指标X,计算公式为:
Figure FDA0002970714910000067
其中,利用公式2计算评估指标前,先将音频按时间进行分割,分割为只含噪声的音频与同时包含人声和噪声的音频,之后才能进行计算。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现如权利要求1至3任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现如权利要求1至3任一项所述的方法。
CN201911142503.1A 2019-11-20 2019-11-20 麦克风阵列性能评测方法、装置、设备和介质 Active CN111031463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911142503.1A CN111031463B (zh) 2019-11-20 2019-11-20 麦克风阵列性能评测方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911142503.1A CN111031463B (zh) 2019-11-20 2019-11-20 麦克风阵列性能评测方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN111031463A CN111031463A (zh) 2020-04-17
CN111031463B true CN111031463B (zh) 2021-08-17

Family

ID=70206261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911142503.1A Active CN111031463B (zh) 2019-11-20 2019-11-20 麦克风阵列性能评测方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN111031463B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111586547B (zh) * 2020-04-28 2022-05-06 北京小米松果电子有限公司 音频输入模组的检测方法及装置、存储介质
CN111683329B (zh) * 2020-05-30 2022-02-08 北京声智科技有限公司 麦克风检测方法、装置、终端及存储介质
CN111986706A (zh) * 2020-07-31 2020-11-24 广州市凯泽利科技有限公司 一种基于音频分析的语音响应时间测试方法
TWI763207B (zh) 2020-12-25 2022-05-01 宏碁股份有限公司 聲音訊號處理評估方法及裝置
CN113453137B (zh) * 2021-06-29 2023-03-14 四川长虹电器股份有限公司 麦克风阵列中单麦异常检测方法及其检测装置
CN118592041A (zh) * 2022-12-16 2024-09-03 北京小米移动软件有限公司 音频采集的分析方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007125449A1 (en) * 2006-04-28 2007-11-08 Koninklijke Philips Electronics N.V. Device for and method of estimating directivity of a microphone arrangement
CN104244159A (zh) * 2013-06-06 2014-12-24 美商富迪科技股份有限公司 校正小阵列麦克风性能的方法
CN108206981A (zh) * 2017-12-29 2018-06-26 歌尔科技有限公司 拾音测试方法及设备
CN109275084A (zh) * 2018-09-12 2019-01-25 北京小米智能科技有限公司 麦克风阵列的测试方法、装置、系统、设备和存储介质
CN109348392A (zh) * 2018-10-11 2019-02-15 四川长虹电器股份有限公司 一种实现麦克风阵列硬件状态检测的方法
CN109521394A (zh) * 2018-10-25 2019-03-26 北京云知声信息技术有限公司 一种声源方向定位的准确率测试方法
CN110415681A (zh) * 2019-09-11 2019-11-05 北京声智科技有限公司 一种语音识别效果测试方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7450474B2 (en) * 2004-02-25 2008-11-11 Lockheed Martin Corporation Diagnostic system and method for transducers
CN103674223B (zh) * 2013-12-13 2017-02-01 中联重科股份有限公司渭南分公司 噪声源测试装置、系统及方法
ES2883874T3 (es) * 2015-10-26 2021-12-09 Fraunhofer Ges Forschung Aparato y método para generar una señal de audio filtrada realizando renderización de elevación
CN105784104A (zh) * 2016-03-03 2016-07-20 海信集团有限公司 噪声测试装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007125449A1 (en) * 2006-04-28 2007-11-08 Koninklijke Philips Electronics N.V. Device for and method of estimating directivity of a microphone arrangement
CN104244159A (zh) * 2013-06-06 2014-12-24 美商富迪科技股份有限公司 校正小阵列麦克风性能的方法
CN108206981A (zh) * 2017-12-29 2018-06-26 歌尔科技有限公司 拾音测试方法及设备
CN109275084A (zh) * 2018-09-12 2019-01-25 北京小米智能科技有限公司 麦克风阵列的测试方法、装置、系统、设备和存储介质
CN109348392A (zh) * 2018-10-11 2019-02-15 四川长虹电器股份有限公司 一种实现麦克风阵列硬件状态检测的方法
CN109521394A (zh) * 2018-10-25 2019-03-26 北京云知声信息技术有限公司 一种声源方向定位的准确率测试方法
CN110415681A (zh) * 2019-09-11 2019-11-05 北京声智科技有限公司 一种语音识别效果测试方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
智能音响中MEMS_Microphone性能测试的实现过程;周晨龙;《科技创新与应用》;20180530;第61-62页 *
讯飞麦克风阵列声学测试方法;Share2604;《https://wenku.baidu.com/view/9d2fd64d86c24028915f804d2b160b4e777f8173.html》;20180703;第1-3页 *

Also Published As

Publication number Publication date
CN111031463A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN111031463B (zh) 麦克风阵列性能评测方法、装置、设备和介质
US9947338B1 (en) Echo latency estimation
CN109597022A (zh) 声源方位角运算、定位目标音频的方法、装置和设备
US11138989B2 (en) Sound quality prediction and interface to facilitate high-quality voice recordings
US10477309B2 (en) Sound field reproduction device, sound field reproduction method, and program
US20210306782A1 (en) Method and system of audio device performance testing
CN110390947B (zh) 声源位置的确定方法、系统、设备和存储介质
CN107527626A (zh) 一种音频识别系统
CN104937659A (zh) 车辆引擎声音提取以及再现
CN112837670B (zh) 语音合成方法、装置及电子设备
CN110650426A (zh) 麦克风阵列的非线性谐波失真检测方法、装置和存储介质
TW202109508A (zh) 聲音分離方法、電子設備和電腦可讀儲存媒體
CN104937955A (zh) 自动的扬声器极性检测
CN110475181B (zh) 设备配置方法、装置、设备和存储介质
CN112055284B (zh) 回声消除方法及神经网络的训练方法、装置、介质、设备
CN111951833A (zh) 语音测试方法、装置、电子设备和存储介质
CN112951263B (zh) 语音增强方法、装置、设备和存储介质
CN109741761B (zh) 声音处理方法和装置
CN105869656A (zh) 一种语音信号清晰度的确定方法及装置
CN113257247B (zh) 一种测试方法及系统
CN113945265B (zh) 一种多声音区域的音频隔离度检测方法、装置及系统
US11978441B2 (en) Speech recognition apparatus, method and non-transitory computer-readable storage medium
CN111596261B (zh) 一种声源定位方法及装置
US11716586B2 (en) Information processing device, method, and program
US20240196160A1 (en) Audio signal processing device generating room impulse response filter using machine learning model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant