CN105210386A - 用于多个麦克风的自动化增益匹配 - Google Patents
用于多个麦克风的自动化增益匹配 Download PDFInfo
- Publication number
- CN105210386A CN105210386A CN201480026424.3A CN201480026424A CN105210386A CN 105210386 A CN105210386 A CN 105210386A CN 201480026424 A CN201480026424 A CN 201480026424A CN 105210386 A CN105210386 A CN 105210386A
- Authority
- CN
- China
- Prior art keywords
- frame
- data frame
- microphone
- power ratio
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000007774 longterm Effects 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 7
- 238000012423 maintenance Methods 0.000 description 44
- 230000015572 biosynthetic process Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 11
- 230000004913 activation Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 6
- 238000005314 correlation function Methods 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
- H04R29/006—Microphone matching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
一种方法包含在第一时间在处理器处从第一麦克风接收第一数据帧。所述方法还包含在所述第一时间从第二麦克风接收第二数据帧。所述方法进一步包含响应于确定所述第一数据帧和所述第二数据帧为噪声数据帧,基于所述第一数据帧和所述第二数据帧计算所述第一麦克风与所述第二麦克风的功率比。
Description
优先权申明
本申请主张2013年5月16日提交的美国临时专利申请No.61/824,222和2013年12月23日提交的美国非临时申请No.14/139,370的优先权,以上申请的内容通过引用以其全文并入本文中。
技术领域
本发明总体上涉及用于多个麦克风的自动化增益匹配。
背景技术
技术的进步已经产生了更小且功能更强大的运算装置。例如,当前存在多种便携式个人运算装置,包含无线运算装置,例如便携式无线电话、个人数字助理(PDA)和寻呼装置,这些装置小巧、轻便且易于用户携带。更具体来说,便携式无线电话(例如,蜂窝电话和因特网协议(IP)电话)可经由无线网络传送话音和数据包。进一步,许多此些无线电话包含并入其中的其它类型的装置。例如,无线电话还可以包含数码静物相机、数码摄像机、数字记录器和音频文件播放器。而且,此些无线电话可处理可执行指令,包含软件应用,例如可以用于访问因特网的网络浏览器应用。这样,这些无线电话可以包含显著的运算能力。
无线电话中的音频处理系统可以使用多麦克风系统,所述多麦克风系统基于多信道数字处理算法提高音频质量。例如,相比于单麦克风系统,多麦克风系统可以提供增强的噪声抑制(例如,平稳噪声抑制及非平稳噪声抑制)且可允许所述音频处理系统实现空间有关的音频特征,例如位置相关的噪声。
然而,当存在多麦克风系统的麦克风之间的增益(例如,灵敏度)失配,音频处理系统的性能可能会降低。用于校正此些增益失配的增益校准计算可能不准确且可能是处理资源上的很大负担。
发明内容
公开了用于相对于多个麦克风的自动化增益匹配的一种方法和一种设备。来自多个麦克风的音频信号可以在特定时间实例中进行数字取样以生成数字数据帧。例如,来自参照麦克风的音频信号可在第一时间进行数字取样以生成参照数据帧,且来自目标麦克风的音频信号也可以在第一时间进行数字取样以生成目标数据帧。单源识别符(SSI)可以确定一个源存在于参照数据帧中,且可以确定一个源存在于目标数据帧中。单信道信号检测器(SC-SD)可以确定一个源是否对应于两种数据帧的语音或背景噪声。如果一个源对应于两种数据帧的背景噪声,则可以确定与参照数据帧的功率和目标数据帧的功率相关联的功率比。功率比可以添加到功率比的直方图以确定用于调整目标麦克风的增益的增益校准值。例如,增益校准值可以基于直方图中具有最高计数的特定功率比。
在特定实施例中,方法包含:在第一时间在处理器处从第一麦克风接收第一数据帧。所述方法还包含在第一时间从第二麦克风接收第二数据帧。所述方法还包含:响应于确定第一数据帧和第二数据帧为噪声数据帧,基于第一数据帧和第二数据帧计算第一麦克风与第二麦克风的功率比。
在另一特定实施例中,设备包含处理器和可由处理器访问的存储器。存储器存储指令,所述指令可由处理器执行以使处理器在第一时间从第一麦克风接收第一数据帧。指令还使处理器在第一时间从第二麦克风接收第二数据帧。指令还使处理器:响应于确定第一数据帧和第二数据帧为噪声数据帧,基于第一数据帧和第二数据帧计算第一麦克风与第二麦克风的功率比。
在另一特定实施例中,设备包含用于在第一时间从第一麦克风接收第一数据帧的装置。所述设备还包含用于在第一时间从第二麦克风接收第二数据帧的装置。所述设备还包含用于响应于确定第一数据帧和第二数据帧为噪声数据帧,基于第一数据帧和第二数据帧计算第一麦克风与第二麦克风的功率比的装置。
在另一特定实施例中,计算机可读存储媒体包含指令,所述指令在由处理器执行时,使处理器在第一时间从第一麦克风接收第一数据帧。指令还可以使处理器在第一时间从第二麦克风接收第二数据帧。指令还可使处理器响应于确定第一数据帧和第二数据帧为噪声数据帧,基于第一数据帧和第二数据帧计算第一麦克风与第二麦克风的功率比。
所公开的实施例中的至少一个所提供的一个具体优点是生成麦克风增益失配的快速和准确估计值的能力。所公开的实施例中的至少一个所提供的另一具体优点是:相比于最小统计算法,提高的麦克风增益失配计算的稳定性,以及使麦克风增益失配的估计值适应不同类型的背景噪声或噪声频谱形状的能力。经审查整个申请,包含以下部分:附图说明、具体实施方式和权利要求书,本发明的其它方面、优点和特征将变得显而易见。
附图说明
图1是可操作以确定目标麦克风的增益校准值的系统的一个具体的说明性实施例的框图;
图2是噪声检测器的一个具体的说明性实施例的框图;
图3说明了来自具体的帧的人类语音的频谱、循环移位版本的频谱,以及自循环相关函数;
图4是噪声检测器的另一个具体的说明性实施例的框图;
图5是可操作以确定数据帧是否为噪声数据帧的系统的一个具体的说明性实施例的框图;
图6是功率比计算器的一个具体的说明性实施例的框图;
图7是基于直方图的估计器的一个具体的说明性实施例的框图;
图8是基于直方图的估计器的另一个具体的说明性实施例的框图;
图9说明了功率值比的直方图;
图10是确定目标麦克风的增益校准值的方法的一个具体实施例的流程图;以及
图11是无线装置的框图,所述无线装置包含可操作以确定目标麦克风的增益校准值的组件。
具体实施方式
参照图1,示出了可操作以确定目标麦克风的增益校准值的系统100的特定说明性实施例。系统100包含噪声检测器102、功率比计算器104,以及基于直方图的估计器106。噪声检测器102耦合到功率比计算器104,且功率比计算器104耦合到基于直方图的估计器106。在特定实施例中,噪声检测器102、功率比计算器104,以及基于直方图的估计器106可以包含在处理器中或者可以包含可由处理器执行的指令。
噪声检测器102和功率比计算器104经配置以接收和处理多个数据帧。例如,可将第一数据帧112、第二数据帧114,以及第N数据帧116提供给噪声检测器102和功率比计算器104,其中N为大于1的任意整数。例如,如果N等于4,则将四个数据帧提供给噪声检测器102和功率比计算器104。每个数据帧112到116可以对应于从来自对应的麦克风的模拟音频生成的数字化音频样本。来自对应的麦克风的模拟音频可以同时(例如,第一时间)取样以生成数据帧112到116。例如,第一数据帧112可以对应于来自第一麦克风(未示出)的第一模拟音频的第一数字化音频样本,第二数据帧114可以对应于来自第二麦克风(未示出)的第二模拟音频的第二数字化音频样本,且第N数据帧116可对应于来自第N麦克风(未示出)的第N模拟音频的第N数字化音频样本。第一模拟音频、第二模拟音频,以及第N模拟音频可以在第一时间取样以分别生成第一数据帧112、第二数据帧114,以及第N数据帧。第一时间可对应于特定时间段。例如,在特定实施例中,第一时间可对应于特定时钟周期。在特定实施例中,第一麦克风可以是参照麦克风,且每个附加麦克风可以是目标麦克风。
每个数据帧112到116可以是语音数据帧、噪声数据帧,或者多源数据帧(例如,包含大量语音和大量噪声的数据帧)。在特定实施例中,语音数据帧可以包含对应于语音的大量数据和对应于背景噪声的最少(或零)数据。噪声数据帧可以包含对应于背景噪声的大量数据和对应于语音的最少(或零)数据。响应于接收到数据帧112到116,噪声检测器102可以经配置以确定是否每个数据帧112到116都为噪声数据帧。例如,噪声检测器102可确定每个数据帧112到116是单源数据帧(例如,对应于单一类型的音频数据)还是多源数据帧。为了说明,单源数据帧可以是语音数据帧或者噪声数据帧。多源数据帧可以是包含大量噪声和语音的数据帧。此些数据帧包含对应于两种类型的音频数据(例如,噪声类型和语音类型)的数据。作为一个说明性实例,噪声检测器102可以确定第一数据帧112是语音数据帧、噪声数据帧,还是多源数据帧。同样,噪声检测器102可以确定第二数据帧114和第N数据帧116中的每一者是语音数据帧、噪声数据帧,还是多源数据帧。噪声检测器102经配置以响应于确定与特定取样时间(或时间指数)相关联的任何一个数据帧112到116是多源数据帧,删除(或者停止用于增益匹配目的的处理)与特定取样时间(或时间指数)相关联的每个数据帧112到116。为了说明,如果第一数据帧112确定为包含对应于噪声和语音的数据,则第一数据帧112、第二数据帧114,以及第N数据帧116都可以丢弃(例如,可以停止用于增益匹配目的的数据帧112到116中的每一个的处理)。
当每个数据帧112到116是单源数据帧(例如,对应于单一类型的音频数据)时,噪声检测器102可以识别每个数据帧112到116是否为噪声数据帧或语音数据帧。为了说明,噪声检测器102可以确定第一数据帧112是否为语音数据帧,噪声检测器102可以确定第二数据帧114是否为语音数据帧等。响应于确定每个数据帧112到116不是语音数据帧,噪声检测器102可以生成激活信号122以实现(例如,激活)功率比计算器104。例如,确定每个数据帧112到116不是语音数据帧可以指示每个数据帧112到116为噪声数据帧。
功率比计算器104经配置以响应于从噪声检测器102接收到激活信号122,接收数据帧112到116中的每一个以及计算第一麦克风(例如,参照麦克风)与每个目标麦克风的功率比。例如,功率比计算器104可以基于第一数据帧112和第二数据帧114计算第一麦克风与第二麦克风的第一功率比。另外,功率比计算器104可以基于第一数据帧112和第N数据帧116来计算第一麦克风与第N麦克风的第(N-1)功率比。在特定实施例中,当确定功率比时,功率比计算器102可以利用时域平均(例如,平滑)。功率比计算器104可以生成指示第一功率比和第二功率比的强度信号132。可以将强度信号132提供给基于直方图的估计器106。在特定实施例中,第一功率比可以对应于特定麦克风的增益校准值。例如,第一功率比(对应于第一麦克风与第二麦克风之间的功率比)可以对应于第二麦克风的增益校准值142。
基于直方图的估计器106经配置以从功率比计算器104接收强度信号132且维护每个功率比的直方图。在特定实施例中,使用直方图来确定每个目标麦克风的增益校准值142。例如,通过找到对应的直方图中的峰值,可以生成每个目标麦克风的估计的增益校准值142。峰值可以对应于直方图中出现最频繁的功率比。例如,第一功率比(对应于第一麦克风与第二麦克风之间的功率比)可以对应于-1分贝(dB)。可以经由强度信号132将第一功率比提供给基于直方图的估计器106。基于直方图的估计器106可以将第一功率比添加到与第一麦克风与第二麦克风之间的其它功率比相关联的直方图,且确定哪个功率比在直方图中出现最频繁。出现最频繁的功率比(例如,具有最高计数的特定功率比)可以对应于第二麦克风的增益校准值142。
当数据帧是噪声数据帧时基于数据帧112到116确定校准值可以准许系统100在实时音频应用中快速和准确地收敛。例如,系统100可以生成麦克风增益失配的快速和准确的估计值。与最小统计算法相比,使用功率比的直方图可提供提高的麦克风增益失配计算的稳定性,以及使麦克风增益失配的估计值适应不同类型的背景噪声或噪声频谱形状的能力。
参照图2,示出了噪声检测器102的特定说明性实施例。噪声检测器102包含单源识别符(SSI)模块202、单信道信号检测器(SC-SD)模块204,以及逻辑“与”门206。SSI模块202可以耦合到逻辑“与”门206的第一输入,且SC-SD模块204可以耦合到第二逻辑“与”门206的第二输入。
对应于第一麦克风(例如,参照麦克风)的第一数据帧112可以表示为x1(t)=s(t)+n(t),其中s(t)对应于定向源信号,且其中n(t)是分布的背景噪声。在特定实施例中,s(t)可以对应于语音。对应于第二麦克风(例如,目标麦克风)的第二数据帧114可表示为x2(t)=γ*s(t)+β*n(t),其中(γ)对应于第一数据帧112和第二数据帧114的定向源之间的强度差,且其中(β)表征第一麦克风与第二麦克风之间的增益失配。在实时应用中,当第一数据帧112和第二数据帧112由噪声检测器102接收时,定向源s(t)、背景噪声n(t)、强度差(γ),以及增益失配(β)可以是未知的。在特定实施例中,第N数据帧116可以表示为xN(t)=γN*s(t)+βN*n(t),其中(γN)对应于第一数据帧112和第N数据帧116的定向源之间的强度差,且其中(βN)表征第一麦克风与第N麦克风之间的增益失配。
SSI模块202可以经配置以确定每个数据帧112到116为单源数据帧或多源数据帧。例如,可以将每个数据帧112到116提供给SSI模块202。SSI模块202可以检测噪声数据帧和语音数据帧(例如,单源数据帧)。例如,单源数据帧可以包含噪声n(t)或信号s(t)(例如,语音)。在特定实施例中,SSI模块202可以基于与数据帧112到116相关联的声组件的方向来确定每个数据帧112到116是否为单源数据帧。例如,单源数据帧可以对应于具有来自单一方向的声组件(例如,单向声组件)的数据帧。
在另一特定实施例中,SSI模块202可确定每个数据帧112到116是否为多源数据帧。响应于确定特定数据帧112到116不是多源数据帧,SSI模块202可以确定特定数据帧112到116是单源数据帧。多源数据帧可以对应于具有来自多个方向的声组件的数据帧。可替换地,或另外,多源数据帧可以对应于数据帧,在所述数据帧中,两个或两个以上声组件检测为具有超过特定阈值的量值(例如,基于测量的分贝水平),且检测为来自不同的源方向。
在另一特定实施例中,矩阵(例如,如下所描述的协方差矩阵)可以用于确定每个数据帧112到116是否为单源数据帧。为了便于说明,下面的说明书对应于确定第一数据帧112和第二数据帧114是否为单源数据帧。然而,本文所使用的技术可扩展以确定其它数据帧(例如,第N数据帧116)是否为单源数据帧。而且,为了便于说明,本文中信号s(t)描述为语音;然而,在其它实施例中,可以存在其它信号类型。
通过使用第一数据帧112(例如,x1(t)=s(t)+n(t))和第二数据帧114(例如,x2(t)=γ*s(t)+β*n(t)),从第一时间(例如,t=k+1)到第T时间(例如,t=k+T)的数据可以用于获得
P1(k)可以对应于第一麦克风所对应的信道的功率级,Px(k)可以对应于第一麦克风和第二麦克风之间的相关性,且P2(k)可以对应于第二麦克风所对应的信道的功率级。Ps(k)可以对应于第k帧处的语音s(t)的功率级,且Pn(k)可以对应于第k帧处的噪声n(t)的功率级。在特定实施例中,s(t)和n(t)是不相关的。所述三个方程的矢量符号可以表示为
因此,对应于从第一时间到第L时间的连续时间指数的矢量可以表示为矩阵(H),其中
当数据帧为单源数据帧(例如,语音数据帧或噪声数据帧),矩阵(H)的秩可以等于1。然而,如果数据帧是多源数据帧(例如,存在大量语音s(t)和噪声n(t)),则矩阵(H)的秩可以等于2。因此,SSI模块202可以检测帧,在所述帧中,通过检测矩阵(H)的秩,存在一个源(例如,一种类型的音频数据)。然而,当存在一个源(即,当矩阵(H)的秩为1),对矩阵(H)的分析并不指示存在哪种类型的音频数据。
在特定实施例中,由SSI模块202进行的计算可以通过以下方式简化:利用协方差矩阵(R)的特征值分解来确定每个数据帧112到116是否对应于单一类型的音频数据。协方差矩阵可以表示为
其中V是协方差矩阵(R)的特征矩阵,且λi是相应的特征值,λ1>λ2>λ3>0。然后确定每个数据帧112到116是否对应于单一类型的音频数据可以通过如下比较完成
如果比较为真(例如,如果上式的左手侧大于或等于阈值tλ),则所比较的数据帧(即,以上实例中的第一数据帧112和第二数据帧114)中的每一个是单源数据帧。例如,如果比较为真,则所比较的数据帧中的每一个对应于噪声n(t)或对应于语音s(t)(例如,对应于单一类型的音频数据)。SSI模块202可以生成信号212,该信号212指示所比较的数据帧中的每一个是否为单源数据帧。例如,当所比较的数据帧中的每一个为单源数据帧,SSI模块202可以生成逻辑高电压信号(例如,逻辑“1”值),且将逻辑高电压信号提供给逻辑与门206的第一输入。相反,当所比较的数据帧中的一或多个对应于多个类型的音频数据(例如,噪声和语音),SSI模块202可以生成逻辑低电压信号(例如,逻辑“0”值),且将逻辑低电压信号提供给逻辑与门206的第一输入。
SC-SD模块204可以经配置以检测每个数据帧112到116是否为语音数据帧。例如,对于第一数据帧112(例如,x1(t)=s(t)+n(t)),SC-SD模块204可以确定是否存在对应于语音s(t)的音频数据或是否不存在对应于语音s(t)的音频数据。SC-SD模块204可以对于其它数据帧114、116做出类似确定。在特定实施例中,SC-SD模块204是单信道话音激活检测器(SC-VAD)。例如,SC-SD模块204可以经配置以检测具有强语音s(t)组件的帧。在特定实施例中,SC-SD模块204使用语音检测过程,该过程基于人类语音中的谐波结构,通常集中在低频。参照图3,示出特定数据帧112到116的人类语音频谱的第一曲线图302。
由SC-SD模块204使用的语音检测过程可以基于单帧,使得在评估期间从帧到帧没有误差传播。另外,语音检测过程可以是高效且易于调谐的存储器。进一步地,语音检测过程与输入电平无关。
对于特定数据帧112到116,SC-SD模块204可以确定特定数据帧112到116傅立叶系数Sf(k)的量值,其中k(例如,1、……、Nf)是频率指数,并且Nf为若干频率区间。语音检测过程还可以确定循环移位版本的傅立叶系数(Sf(k)),其可以表示为Cf(k,τ),其中τ是移位的量。例如,循环移位版本的傅立叶系数可以表示为Cf(k,τ)=Sf((k+τ)*%*Nf),其中%表示调制操作。参照图3,示出了特定数据帧112到116的循环移位版本的人类语音频谱的第二曲线图304。语音检测过程还可以确定自循环相关函数,其可运算为:
参照图3,示出了自循环相关函数的第三曲线图306。自循环相关函数的最小值可以通过评估使用不同的移位量的上述方程识别(例如,对于τ的不同值)。如果最小值308小于阈值310,则特定数据帧112到116可以分类为语音数据帧;否则,特定数据帧112到116可以分类为噪声数据帧。阈值310的值可以选择和/或修正以调谐语音检测过程。
再次参照图2,SC-SD模块204可以生成信号214,所述信号214指示特定数据帧112到116是否为语音数据帧。例如,如果特定数据帧112到116分类为噪声数据帧,则SC-SD模块204可以生成逻辑高电压信号(例如,逻辑“1”值),且将逻辑高电压信号提供给逻辑与门206的第二输入。如果特定数据帧112到116分类为语音数据帧,则SC-SD模块204可以生成逻辑低电压信号(例如,逻辑“0”值),且将逻辑低电压信号提供给逻辑与门206的第二输入。
逻辑与门206经配置以在第一输入处从SSI模块202接收信号212,且在第二输入处从SC-SD模块204接收信号214。逻辑与门206经配置以基于分别从SSI模块202和SC-SD模块接收的信号212-214来输出激活信号122。例如,响应于SSI模块202生成逻辑高电压信号且SC-SD模块204生成逻辑高电压信号,逻辑与门206可以生成逻辑高电压激活信号(例如,实现图1的功率比计算器104)。响应于SSI模块202或SC-SD模块204生成逻辑低电压信号,逻辑与门206可以生成逻辑低电压激活信号(例如,禁用图1的功率比计算器104),且数据帧112到116可以丢弃(例如,未用于后续的增益匹配计算)。
参照图4,示出了噪声检测器102的另一特定说明性实施例。噪声检测器102包含SSI模块402和SC-SD模块404。
SSI模块402可以对应于图2的SSI模块202,且可以实质上类似的方式操作。然而,响应于确定数据帧112到116中的每一个为单源数据帧,图4的SSI模块402可以将数据帧112到116提供给SC-SD模块404。响应于确定数据帧112到116中的一或多个为多源数据帧,SSI模块402可以经配置以丢弃数据帧112到116(例如,停止处理用于增益匹配计算的数据帧112到116)。
SC-SD模块404可以对应于图2的SC-SD模块204,并可以实质上类似的方式操作。然而,如果SSI模块402确定数据帧112到116中的每一个为单源数据帧,则SC-SD模块404可以从SSI模块402接收数据帧112到116。而且,响应于确定数据帧112到116中的每一个分类为噪声数据帧,SC-SD模块404可以生成逻辑高电压激活信号(例如,实现图1的功率比计算器104)。响应于确定数据帧112到116中的一或多个分类为语音数据帧,SC-SD模块404可以生成逻辑低电压激活信号(例如,禁用图1的功率比计算器104)。在特定实施例中,响应于确定数据帧112到116中的一或多个分类为包含语音s(t),数据帧112到116可以丢弃(例如,从后续的增益匹配计算中省略)。
参照图5,可操作以确定数据帧是否为噪声数据帧的系统500的具体的说明性实施例。系统500可以包含第一麦克风502、第二麦克风504、第N麦克风506、编解码器(CODEC)508,以及噪声检测器102。在特定实施例中,第一麦克风502可以是参照麦克风,第二麦克风504可以是目标麦克风,并且第N麦克风可以是目标麦克风。
第一麦克风502可生成第一模拟音频信号,且将第一模拟音频信号提供给CODEC508。CODEC508可以在第一时间数字取样第一模拟音频信号以生成第一数据帧112。第二麦克风504可生成第二模拟音频信号,且将第二模拟音频信号提供给CODEC508。CODEC508可以在第一时间数字取样第二模拟音频信号以生成第二数据帧114。第N麦克风506可以生成第N模拟音频信号,且将第N模拟音频信号提供给CODEC508。CODEC508可以在第一时间数字取样第N模拟音频信号以生成第N数据帧116。
将数据帧112到116提供给噪声检测器102的另一个具体的说明性实施例。例如,噪声检测器102包含前两个麦克风SSI模块520和第(N-1)两个麦克风SSI模块522。每两个麦克风SSI模块520、522可以对应于图2的SSI模块202,且可以相对于各个输入数据帧112到116以实质上类似的方式操作。例如,前两个麦克风SSI模块520可以确定第一数据帧112和第二数据帧114是否为单源数据帧。噪声检测器102还可以包含用于每个麦克风的SC-SD模块。例如,噪声检测器102可以包含用于处理第一数据帧112的第一SC-SD模块524、用于处理第二数据帧114的第二SC-SD模块524以及用于处理第N数据帧116的第NSC-SD模块528。SC-SD模块524-528中的每一个可以对应于图2的SSI模块204,且可以相对于各个输入数据帧112到116以实质上类似的方式操作。
噪声检测器102还可以包含组合电路530。在特定实施例中,组合电路530可以是逻辑门或一系列逻辑门,所述逻辑门经配置以从每两个麦克风SSI模块520、522和从每个SC-SD模块524-528接收输入信号。响应于输入信号,组合电路530可以生成激活信号122。例如,当输入信号指示数据帧112到116中的每一个为单源数据帧,且数据帧中的每一个分类为噪声数据帧时,组合电路530可以生成逻辑高值(例如,实现图1的功率比计算器104)。响应于指示数据帧112到116中的一或多个为多源数据帧或指示数据帧中的至少一个分类为语音数据帧的输入信号,组合电路530可以生成逻辑低值(例如,禁用图1的功率比计算器104),且丢弃数据帧112到116(例如,从后续的增益匹配计算中省略)。
尽管对噪声检测器102的几个实施例进行了说明,其它实施例也是可能的。例如,在另一特定实施例中,噪声检测器102可以包含三个麦克风SSI模块,其经配置以从三个麦克风接收模拟音频生成的三个数据帧。在另一特定实施例中,基于每两个麦克风SSI模块520、522的输出,组合电路可以选择性地激活每个SC-SD模块524-528。例如,响应于前两个麦克风SSI模块520确定第一数据帧112和第二数据帧114为单源数据帧,组合电路可以激活第一SC-SD模块524和第二SC-SD模块526。此外,响应于第(N-1)两个麦克风SSI模块522确定第N数据帧116为多源数据帧,组合电路可以去活第NSC-SD模块528。因此,第N数据帧116可以从后续的增益匹配计算中省略,而相对于第一数据帧112和第二数据帧114的增益匹配计算继续进行。
参照图6,示出了功率比计算器104的特定说明性实施例。功率比计算器104包含第一帧功率计算器模块602、第二帧功率计算器模块604、第N帧功率计算器模块606、第一比值计算器模块612,以及第(N-1)比值计算器模块614。在特定实施例中,功率比计算器104还可以包含第一时域平滑模块622和第(N-1)时域平滑模块624。
第一帧功率计算器模块602经配置以接收第一数据帧112以及计算第一数据帧112的第一帧功率。将代表第一帧功率的第一功率信号提供给第一比值计算器模块612和第(N-1)比值计算器模块614。第二帧功率计算器模块604经配置以接收第二数据帧114以及计算第二数据帧114的第二帧功率。将代表第二帧功率的第二功率信号提供给第一比值计算器模块312。第N帧功率计算器模块606经配置以接收第N数据帧116以及计算第N数据帧116的第N帧功率。将代表第N帧功率的第N功率信号提供给第(N-1)比值计算器模块614。在特定实施例中,可响应于第一激活信号和第二激活选择性地激活比值计算器模块612、614。
第一比值计算器模块612可计算第一帧功率和第二帧功率的第一比值632(例如,基于第一麦克风502(例如,参照麦克风)计算用于第二麦克风504的功率比。如参照图7所述,可将第一比值632提供给基于直方图的估计器106。在特定实施例中,第一时域平滑模块622可在时域内平均或平滑第一比值632以移除第一比值632中的杂质(例如,非稳态噪声的影响)且生成第一修正比值632'。当发生时域平滑时,与第一比值632不同,第一修正比值632'可被提供给基于直方图的估计器106。第(N-1)比值计算器模块614可计算第一帧功率与第(N-1)帧功率的第(N-1)比值634(例如,基于第一麦克风502计算用于第N麦克风506的功率比。如参照图7所述,可将第(N-1)比值634提供给基于直方图的估计器106。在特定实施例中,第(N-1)时域平滑模块624可在时域内平均或平滑第一比值632以移除第(N-1)比值634中的杂质且生成第(N-1)修正比值634'。当发生时域平滑时,与第(N-1)比值634不同,第(N-1)修正比值634'可被提供给基于直方图的估计器106。
参照图7,示出了基于直方图的估计器106的特定说明性实施例。基于直方图的估计器106包含第一直方图维护模块702和第(N-1)直方图维护模块704。在特定实施例中,直方图估计器106可包含第一时域平滑模块712和第(N-1)时域平滑模块714。
第一直方图维护模块702经配置以接收第一比值632(或第一修正比值632')。第一直方图维护模块702经配置以维护与在其它特定时间从第一麦克风502和第二麦克风504接收的其它数据帧相关联的功率比的直方图。响应于接收到第一比值632,第一直方图维护模块702将第一比值添加到所维护的直方图中的功率比。
例如,参照图9,示出了功率比的直方图。水平轴可对应于不同的功率比并且垂直轴可对应于每个功率比已被检测到的次数。例如,如果第一比值632对应于-1dB,则功率比-1dB已被检测到的次数的计数可增加(例如,从200增加到201)。
再次参照图7,第一直方图维护模块702经配置以基于对应于第一比值632的直方图中出现最频繁的功率比确定第一增益校准值742。第一增益校准值742可对应于图1的增益校准值142。例如,参照图9,第一直方图维护模块702可确定功率比-1dB出现最频繁。作为响应,第一直方图维护模块702可生成第一增益校准值742,其中第一增益校准值742与功率比-1dB相关联。可将第一增益校准值742提供给第二麦克风504。
第(N-1)直方图维护模块704经配置以接收第(N-1)比值634(或第(N-1)修正比值634')。第(N-1)直方图维护模块704经配置以维护与在其它特定时间从第一麦克风502和第N麦克风506接收的其它数据帧相关联的功率比的直方图。响应于接收到第(N-1)比值634,第(N-1)直方图维护模块704将第(N-1)比值添加到所维护的直方图中的功率比。第(N-1)直方图维护模块704经配置以基于对应于第(N-1)比值634的直方图中出现最频繁的功率比确定第(N-1)增益校准值744。第(N-1)增益校准值744可对应于图1的增益校准值142。
每个直方图维护模块702、704可以是短期直方图维护模块或长期直方图维护模块。长期直方图维护模块可在第一特定时间段内存储功率比,并且短期直方图模块可在第二特定时间段内存储功率比。在特定实施例中,第二特定时间段包含在第一特定时间段内;然而,第二特定时间段短于第一特定时间段。
例如,长期直方图维护模块可存储由对应的比值计算器模块计算的每个功率比,并且短期直方图只可存储在最近时间段内计算的功率比(例如,存储在最近三秒内计算的功率比)。在特定实施例中,长期直方图维护模块可存储由处理器计算的每个功率比。参照图1,短期直方图维护模块可存储从特定时间(例如,第一时间之前的三秒)到第一时间的功率比。在特定实施例中,特定时间可由处理器选择。因此,短期直方图维护模块可存储更多的最近功率比,从而在改变环境期间实现更快的校准。长期直方图维护模块可存储在延长的时间段内计算的功率比,这可减少在功率比计算期间由于偶尔的杂质导致的不适当增益校准的影响。
在特定实施例中,可将第一增益校准值742和第(N-1)增益校准值744分别提供给第一时域平滑模块712和第(N-1)时域平滑模块714。时域平滑模块712、714可平滑增益校准值742、744以生成修正校准值742'、744'。可将修正校准值742'、744'分别提供给与第二和第N麦克风504、506相关联的增益调整电路。
参照图8,示出了基于直方图的估计器106的另一特定说明性实施例。图8的基于直方图的估计器106包含第一长期直方图维护模块802、第(N-1)长期直方图维护模块804、第一短期直方图维护模块806、第(N-1)短期直方图维护模块808、定时器810、第一组合电路852以及第二组合电路854。
直方图维护模块802到808可以与图7的直方图维护模块702、704实质上类似的方式操作。然而,短期直方图维护模块804、808可维护对应的短期直方图,并且长期直方图维护模块802、806可维护对应的长期直方图。
例如,短期直方图维护模块804、808可以此方式响应于定时器810,即仅在特定时间段内维护功率比直方图。例如,定时器810可生成指示较短时间段(例如,三秒)的定时信号812。短期直方图维护模块804、808可在较短时间(例如,长至当前时间之前三秒)内维护对应的短期直方图中的功率比信息。短期直方图维护模块802、804可基于对应的短期直方图内出现最频繁的功率比分别生成增益校准值842、844。
长期直方图维护模块802、806可在较长时间段内维护对应的长期直方图。例如,可永久地或从装置(为其实施增益匹配)的启动到停机维护长期直方图。
与长期直方图维护模块802、806相关联的增益校准值841、843(例如,校准估计值)可表示为gL。与短期直方图维护模块804、808相关联的增益校准值842、844(例如,校准估计值)可表示为gS。第一组合电路852可确定是否使用第一短期直方图维护模块804的第一短期校准估计值gS或第一长期校准估计值gL进行增益匹配。在特定实施例中,如果认为第一短期校准估计值gS是可靠的,则可使用第一短期校准估计值gS。例如,第一组合电路852可将第一短期校准估计值gS和第一长期校准估计值gL之差的绝对值(例如,│gL-gS│)与阈值β进行比较。如果绝对值小于阈值β,则可认为第一短期校准估计值gS是可靠的,并且第一组合电路852可将第一短期校准估计值842(gS)提供给与第二麦克风502相关联的增益校准电路。否则,第一组合电路852可将第一长期校准估计值841(gL)提供给与第二麦克风502相关联的增益校准电路。用于第一组合电路852的伪代码可表示为:
如果(│gL-gS│<β)
ct=α*ct-1+(1–α)*gS,
否则
ct=α*ct-1+(1–α)*gL。
其中α是小于1的平滑参数,ct是在当前时间(t)用于第二麦克风504(例如,目标麦克风)的输出校准,ct-1是在前一时间点(t-1)用于第二麦克风504的输出校准。
第二组合电路854可相对于从第N长期直方图维护模块806和第N短期直方图维护模块808接收到的信号以与第一组合电路852实质上类似的方式操作。例如,第二组合电路854可将来自第N短期直方图维护模块808的第二短期校准估计值gS和来自第N长期直方图维护模块806的第二长期校准估计值gL之差的绝对值(例如,│gL-gS│)与阈值β进行比较。如果绝对值小于阈值β,则第二组合电路854可将第二短期校准估计值844(gS)提供给与第N麦克风504相关联的增益校准电路。否则,第二组合电路854可将第二长期校准估计值843(gL)提供给与第N麦克风502相关联的增益校准电路。
参照图10,示出了确定用于目标麦克风的增益校准值的方法1000的特定实施例的流程图。在一个说明性实施例中,可使用图1的系统100、图2中的噪声检测器102的实施例、图4中的噪声检测器102的实施例、图5到7的系统5、图6中的功率比计算器104的实施例、图7中的基于直方图的估计器106的实施例、图8中的基于直方图的估计器106的实施例或它们的任意组合实施方法1000。
方法1000包含在第一时间在1002处从第一麦克风接收第一数据帧。例如,在图1中,噪声检测器102和功率比计算器104可从第一麦克风(例如,图5的第一麦克风502)接收第一数据帧112。在所述第一时间可在1004处从第二麦克风接收第二数据帧。例如,在图1中,噪声检测器102和功率比计算器104还可从第二麦克风(例如,图5的第二麦克风504)接收第二数据帧114。
方法1000还可包含在1006处确定第一数据帧和第二数据帧是否为单源数据帧。例如,在图2中,SSI模块202可确定第一数据帧112和第二数据帧114是否为单源数据帧。可将第一数据帧112和第二数据帧114提供给SSI模块202。SSI模块202可检测其中存在一个源(例如,一种类型的音频数据)的数据帧。音频数据的类型可以是噪声n(t)或语音s(t)。
方法1000还可包含在1008处确定第一数据帧和第二数据帧是否为语音数据帧。例如,在图2中,SC-SD模块204可检测第一数据帧112是否为语音数据帧,并且可检测第二数据帧114是否为语音数据帧。为了说明,对于第一数据帧112(例如,x1(t)=s(t)+n(t))而言,SC-SD模块204可确定是否存在对应于语音s(t)的实质量的音频数据或者是否不存在对应于语音s(t)的实质量的音频数据。SC-SD模块204可作出用于第二数据帧114的类似确定。
在1010处,可响应于确定第一数据帧和第二数据帧为噪声数据帧,基于第一数据帧和第二数据帧计算第一麦克风与第二麦克风的功率比。例如,在图6中,第一帧功率计算器模块602可接收第一数据帧112,并且计算第一数据帧112的第一帧功率。第二帧功率计算器模块604可接收第二数据帧114,并且计算第二数据帧114的第二帧功率。第一比值计算器模块612可计算第一帧功率与第二帧功率的第一比值632(例如,基于第一麦克风502(例如,参照麦克风)计算用于第二麦克风504的功率比)。当确定数据帧112、114均为单源数据帧并且当确定数据帧112、114均不是语音数据帧时,可将第一数据帧112和第二数据帧114分类为噪声数据帧。
在特定实施例中,方法1000可包含基于功率比确定增益校准值。例如,可将由第一比值计算器模块812生成的第一比值832提供给与第二麦克风(例如,图5的第二麦克风504)相关联的增益校准电路,以基于参照麦克风调整第二麦克风的功率级。作为另一实例,在图7中,第一直方图维护模块702可基于对应于第一比值632的直方图中出现最频繁的功率比确定第一增益校准值742。作为响应,第一直方图维护模块702可生成第一增益校准值942,并且可将第一增益校准值742提供给与第二麦克风504相关联的增益校准电路。作为另一实例,在图8中,第一组合电路852可确定第一短期直方图维护模块804的第一短期校准估计值gs是否可靠。如果第一短期校准估计值gs可靠,则第一组合电路852可将第一短期校准估计值842(gs)提供给与第二麦克风502相关联的增益校准电路。否则,第一组合电路852可将第一长期校准估计值841(gl)提供给与第二麦克风502相关联的增益校准电路。
参照图11,其示出了无线装置1100的框图,无线装置1100包含可操作以确定用于目标麦克风的增益校准值的组件。装置1100包含耦合到存储器1132的处理器1110,例如数字信号处理器(DSP)。
图11还示出了耦合到处理器1110和显示器1128的显示器控制器1126。相机控制器1190可耦合到处理器1110和相机1192。扬声器1136、第一麦克风502、第二麦克风504以及第N麦克风508可耦合到CODEC508。CODEC508可响应于从各个麦克风502到506接收到音频信号将数据帧112到116提供给处理器1110。例如,处理器1110可包含噪声检测器102、功率比计算器104以及基于直方图的估计器106。在另一实例中,噪声检测器102、功率比计算器104以及基于直方图的估计器106可作为指令1158存储在存储器1132中,指令1158可由处理器1110执行以实施噪声检测器102、功率比计算器104以及基于直方图的估计器106的功能。如参照图1所述,CODEC508可将数据帧112到116提供给噪声检测器102和功率比计算器104。
存储器1132可包含直方图数据1154和增益匹配数据1152。在特定实施例中,直方图数据1154可对应于图11中所示的功率比的直方图。基于直方图的估计器106可响应于从功率比计算器接收到功率比从存储器1122访问直方图数据1154。直方图数据1154可用于以参照图9到10所述的方式确定在直方图数据1154中已出现最频繁的功率比。响应于确定已出现最频繁的功率比,基于直方图的估计器106可从存储器1122访问增益匹配数据1152,以确定对应的校准值。基于直方图的估计器106可将校准值提供给与对应的目标麦克风(例如,第二麦克风504和/或第N麦克风506)相关联的增益校准电路1178,以基于参照麦克风(例如,第一麦克风502)调整增益。
存储器1132可以是包含指令1158的有形非暂时性处理器可读存储媒体。指令1156可由处理器(例如,处理器1110或其组件)执行以实施图10的方法1000。图11还指示出,无线控制器1140可以经由射频(RF)接口1180耦合到处理器1110和无线天线1142。在特定实施例中,处理器1110、显示器控制器1126、存储器1132、CODEC508以及无线控制器1140被包含在系统级封装或系统级芯片装置1122中。在特定实施例中,输入装置1130及电源1144耦合到系统级芯片装置1122中。此外,在特定实施例中,如图11中所示,显示器1128、输入装置1130、扬声器1136、麦克风502到506、无线天线1142以及电源1144位于系统级芯片装置1122外部。然而,显示器1128、输入装置1130、扬声器1136、麦克风502到506、无线天线1142以及电源1144中的每一者可以耦合到系统级芯片装置1122的组件,例如接口或控制器。
结合所描述的实施例,公开了一种设备,其包含用于在第一时间从第一麦克风接收第一数据帧的装置。例如,用于接收第一数据帧的装置可包含图1的噪声检测器102、图1的功率比计算器104、图2的SSI模块202、图2的SC-SD模块204、图4的SSI模块402、图4的SC-SD模块404、图5的前两个麦克风SSI模块520、图5的第(N-1)两个麦克风SSI模块522、图5的第一SC-SD模块524、图6的第一帧功率计算器602、图11的经编程以执行指令1158的处理器1110、接收第一数据帧的一或多个其它装置、电路、模块或指令,或其任意组合。
所述设备还可包含用于在第一时间从第二麦克风接收第二数据帧的装置。例如,用于接收第二数据帧的装置可包含图1的噪声检测器102、图1的功率比计算器104、图2的SSI模块202、图2的SC-SD模块204、图4的SSI模块402、图4的SC-SD模块404、图5的前两个麦克风SSI模块520、图5的第二SC-SD模块526、图6的第二帧功率计算器604、图11的经编程以执行指令1158的处理器1110、接收第二数据帧的一或多个其它装置、电路、模块或指令,或其任意组合。
所述设备还可包含用于基于第一数据帧和第二数据帧计算第一麦克风与第二麦克风的功率比的装置。例如,用于计算功率比的装置可包含图1的系统100、图2中的噪声检测器102的实施例、图4中的噪声检测器102的实施例、图5的系统5、图6中的功率比计算器104的实施例、图7中的基于直方图的估计器106的实施例、图8中的基于直方图的估计器106的实施例、图11的经编程以执行指令1158的处理器1110、图11的增益匹配数据1152、图11的直方图数据1154、计算功率比的一或多个其它装置、电路、模块或指令,或其任意组合。
技术人员将进一步认识到,可将结合本文所公开的实施例所描述的各种说明性逻辑块、配置、模块、电路以及算法步骤实现为电子硬件、由处理器执行的计算机软件或两者的组合。上文已就其功能性方面对各种说明性组件、块、配置、模块、电路和步骤予以总体地描述。至于此功能是否实现为硬件或处理器可执行指令,取决于施加于整个系统上的具体应用和设计约束。针对每一具体应用,熟练的技术人员可以变化的方式实现所描述的功能,但是此实现决策不应被解释为导致偏离本发明的范围。
可将结合本文所公开的实施例描述的方法或算法的步骤直接在硬件、由处理器执行的软件模块或两者的组合中来体现。软件模块可存在于随机存取存储器(RAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动磁盘、压缩光盘只读存储器(CD-ROM)或本领域中已知的任何其它形式的非瞬态存储媒体中。示范性存储媒体耦合到处理器,使得处理器可以从存储媒体读取信息并且将信息写入到存储媒体。在替代方案中,存储媒体可集成到处理器中。处理器和存储媒体可存在于专用集成电路(ASIC)中。ASIC可存在于运算装置或用户终端中。在替代方案中,处理器和存储媒体可作为分立组件存在于运算装置或用户终端中。
提供对所公开的实施例的先前描述是为了实现本领域技术人员能够制造或使用所公开的实施例。对这些实施例的各种修改对于本领域的技术人员而言将是显而易见的,并且可将本文界定的原理应用到其它实施例而不偏离本发明的范围。因此,本发明并非旨在局限于本文所示出的实施例,而是应被赋予可能与由下面的权利要求所界定的原理和新颖特征一致的最宽范围。
Claims (30)
1.一种方法,其包括:
在第一时间在处理器处从第一麦克风接收第一数据帧;
在所述第一时间从第二麦克风接收第二数据帧;
确定所述第一数据帧和所述第二数据帧是否为单源数据帧;
响应于确定所述第一数据帧和所述第二数据帧为单源数据帧,确定所述第一数据帧和所述第二数据帧是否为噪声数据帧;以及
响应于确定所述第一数据帧和所述第二数据帧为噪声数据帧,基于所述第一数据帧和所述第二数据帧计算所述第一麦克风与所述第二麦克风的功率比。
2.根据权利要求1所述的方法,其进一步包括:响应于确定所述第一数据帧或第二数据帧中的至少一者不是单源数据帧,中止关于所述第一数据帧和所述第二数据帧的增益校准处理。
3.根据权利要求1所述的方法,其中单源数据帧为噪声数据帧或语音数据帧中的一者。
4.根据权利要求1所述的方法,其进一步包括:
响应于确定所述第一数据帧为单源数据帧,确定所述第一数据帧是否为语音数据帧;以及
响应于确定所述第二数据帧为单源数据帧,确定所述第二数据帧是否为语音数据帧。
5.根据权利要求4所述的方法,其中响应于确定所述第一数据帧不是语音数据帧,所述第一数据帧为噪声数据帧,且其中响应于确定所述第二数据帧不是语音数据帧,所述第二数据帧为噪声数据帧。
6.根据权利要求1所述的方法,其进一步包括基于所述功率比确定增益校准值。
7.根据权利要求1所述的方法,其进一步包括:
确定功率比的长期直方图,其中所述长期直方图与由所述处理器计算的多个功率比相关联;以及
基于所述功率比的长期直方图确定增益校准值。
8.根据权利要求7所述的方法,其中所述增益校准值对应于在所述功率比的长期直方图中具有最高计数的特定功率比。
9.根据权利要求1所述的方法,其进一步包括:
确定功率比的短期直方图,其中所述短期直方图与由所述处理器从特定时间到所述第一时间计算的功率比相关联;以及
基于所述功率比的短期直方图确定增益校准值。
10.根据权利要求9所述的方法,其中所述特定时间可经由所述处理器选择。
11.根据权利要求1所述的方法,其进一步包括:
确定功率比的长期直方图,其中所述长期直方图与由所述处理器在第一时间段期间计算的功率比相关联;
确定功率比的短期直方图,其中所述短期直方图与由所述处理器在第二时间段期间计算的功率比相关联,其中所述第一时间段大于所述第二时间段;以及
基于所述功率比的长期直方图或所述功率比的短期直方图确定增益校准。
12.根据权利要求1所述的方法,其进一步包括:响应于确定所述第一数据帧不是噪声数据帧或所述第二数据帧不是噪声数据帧,中止关于所述第一数据帧和所述第二数据帧的增益校准处理。
13.根据权利要求1所述的方法,其进一步包括:
在所述第一时间从第三麦克风接收第三数据帧;以及
响应于确定所述第一数据帧和所述第三数据帧为噪声数据帧,基于所述第一数据帧和所述第三数据帧计算所述第一麦克风与所述第三麦克风的功率比。
14.一种设备,其包括:
处理器;以及
可由所述处理器访问的存储器,所述存储器存储指令,所述指令可由所述处理器执行以使所述处理器:
在第一时间从第一麦克风接收第一数据帧;
在所述第一时间从第二麦克风接收第二数据帧;
确定所述第一数据帧和所述第二数据帧是否为单源数据帧;
响应于确定所述第一数据帧和所述第二数据帧为单源数据帧,确定所述第一数据帧和所述第二数据帧是否为噪声数据帧;以及
响应于确定所述第一数据帧和所述第二数据帧为噪声数据帧,基于所述第一数据帧和所述第二数据帧计算所述第一麦克风与所述第二麦克风的功率比。
15.根据权利要求14所述的设备,其中所述指令可进一步由所述处理器执行以使所述处理器:响应于确定所述第一数据帧或第二数据帧中的至少一者不是单源数据帧,中止关于所述第一数据帧和所述第二数据帧的增益校准处理。
16.根据权利要求14所述的设备,其中单源数据帧为噪声数据帧或语音数据帧中的一者。
17.根据权利要求14所述的设备,其中所述指令可进一步由所述处理器执行以:
响应于确定所述第一数据帧为单源数据帧,确定所述第一数据帧是否为语音数据帧;以及
响应于确定所述第二数据帧为单源数据帧,确定所述第二数据帧是否为语音数据帧。
18.根据权利要求17所述的设备,其中响应于确定所述第一数据帧不是语音数据帧,所述第一数据帧为噪声数据帧,且其中响应于确定所述第二数据帧不是语音数据帧,所述第二数据帧为噪声数据帧。
19.根据权利要求14所述的设备,其中所述指令可进一步由所述处理器执行以基于所述功率比确定增益校准值。
20.一种设备,其包括:
用于在第一时间从第一麦克风接收第一数据帧的装置;
用于在所述第一时间从第二麦克风接收第二数据帧的装置;
用于确定所述第一数据帧和所述第二数据帧是否为单源数据帧的装置;
用于响应于确定所述第一数据帧和所述第二数据帧为单源数据帧,确定所述第一数据帧和所述第二数据帧是否为噪声数据帧的装置;以及
用于响应于确定所述第一数据帧和所述第二数据帧为噪声数据帧,基于所述第一数据帧和所述第二数据帧计算所述第一麦克风与所述第二麦克风的功率比的装置。
21.根据权利要求20所述的设备,其中所述用于确定所述第一数据帧和所述第二数据帧是否为单源数据帧的装置包含可由处理器执行的单源识别符模块。
22.根据权利要求20所述的设备,其中所述用于确定所述第一数据帧和所述第二数据帧是否为噪声数据帧的装置包含可由处理器执行的单信道信号检测器模块。
23.根据权利要求20所述的设备,其中所述用于计算的装置包含可由处理器执行的功率比计算器。
24.根据权利要求20所述的设备,其中单源数据帧为噪声数据帧或语音数据帧中的一者。
25.根据权利要求20所述的设备,其进一步包括用于基于所述功率比确定增益校准值的装置。
26.一种计算机可读存储媒体,其包括指令,所述指令在由处理器执行时,使所述处理器:
在第一时间从第一麦克风接收第一数据帧;
在所述第一时间从第二麦克风接收第二数据帧;
确定所述第一数据帧和所述第二数据帧是否为单源数据帧;
响应于确定所述第一数据帧和所述第二数据帧为单源数据帧,确定所述第一数据帧和所述第二数据帧是否为噪声数据帧;以及
响应于确定所述第一数据帧和所述第二数据帧为噪声数据帧,基于所述第一数据帧和所述第二数据帧计算所述第一麦克风与所述第二麦克风的功率比。
27.根据权利要求26所述的计算机可读存储媒体,其进一步包括指令,所述指令在由所述处理器执行时,使所述处理器:响应于确定所述第一数据帧或第二数据帧中的至少一者不是单源数据帧,中止关于所述第一数据帧和所述第二数据帧的增益校准处理。
28.根据权利要求26所述的计算机可读存储媒体,其进一步包括指令,所述指令在由所述处理器执行时,使所述处理器:
响应于确定所述第一数据帧为单源数据帧,确定所述第一数据帧是否为语音数据帧;以及
响应于确定所述第二数据帧为单源数据帧,确定所述第二数据帧是否为语音数据帧。
29.根据权利要求28所述的计算机可读存储媒体,其中响应于确定所述第一数据帧不是语音数据帧,所述第一数据帧为噪声数据帧,且其中响应于确定所述第二数据帧不是语音数据帧,所述第二数据帧为噪声数据帧。
30.根据权利要求26所述的计算机可读存储媒体,其进一步包括指令,所述指令在由所述处理器执行时,使所述处理器基于所述功率比确定增益校准值。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361824222P | 2013-05-16 | 2013-05-16 | |
US61/824,222 | 2013-05-16 | ||
US14/139,370 | 2013-12-23 | ||
US14/139,370 US9258661B2 (en) | 2013-05-16 | 2013-12-23 | Automated gain matching for multiple microphones |
PCT/US2014/036634 WO2014186156A1 (en) | 2013-05-16 | 2014-05-02 | Automated gain matching for multiple microphones |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105210386A true CN105210386A (zh) | 2015-12-30 |
CN105210386B CN105210386B (zh) | 2017-09-22 |
Family
ID=51895791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480026424.3A Expired - Fee Related CN105210386B (zh) | 2013-05-16 | 2014-05-02 | 用于增益校准的方法和设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9258661B2 (zh) |
EP (1) | EP2997741B1 (zh) |
JP (1) | JP6067930B2 (zh) |
KR (1) | KR101687131B1 (zh) |
CN (1) | CN105210386B (zh) |
WO (1) | WO2014186156A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107820188A (zh) * | 2017-11-15 | 2018-03-20 | 深圳市路畅科技股份有限公司 | 一种校准麦克风的方法、系统及相关装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9363598B1 (en) * | 2014-02-10 | 2016-06-07 | Amazon Technologies, Inc. | Adaptive microphone array compensation |
US10163453B2 (en) | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
US10057642B2 (en) | 2015-10-06 | 2018-08-21 | Comcast Cable Communications, Llc | Controlling the provision of power to one or more devices |
US11956503B2 (en) * | 2015-10-06 | 2024-04-09 | Comcast Cable Communications, Llc | Controlling a device based on an audio input |
US11303994B2 (en) | 2019-07-14 | 2022-04-12 | Peiker Acustic Gmbh | Reduction of sensitivity to non-acoustic stimuli in a microphone array |
US11567530B2 (en) * | 2020-06-18 | 2023-01-31 | Honeywell International Inc. | Enhanced time resolution for real-time clocks |
CN112135233A (zh) * | 2020-08-27 | 2020-12-25 | 荣成歌尔微电子有限公司 | 麦克风灵敏度测试方法、系统及计算机存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101203063A (zh) * | 2007-12-19 | 2008-06-18 | 北京中星微电子有限公司 | 麦克风阵列的噪声消除方法及装置 |
CN101668243A (zh) * | 2008-09-01 | 2010-03-10 | 深圳华为通信技术有限公司 | 一种麦克风阵列及麦克风阵列校准的方法和模块 |
US8391507B2 (en) * | 2008-08-22 | 2013-03-05 | Qualcomm Incorporated | Systems, methods, and apparatus for detection of uncorrelated component |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60139144D1 (de) * | 2000-11-30 | 2009-08-13 | Nippon Telegraph & Telephone | Audio-dekodierer und audio-dekodierungsverfahren |
JP3806344B2 (ja) * | 2000-11-30 | 2006-08-09 | 松下電器産業株式会社 | 定常雑音区間検出装置及び定常雑音区間検出方法 |
JP2002287782A (ja) * | 2001-03-28 | 2002-10-04 | Ntt Docomo Inc | イコライザ装置 |
US7171008B2 (en) | 2002-02-05 | 2007-01-30 | Mh Acoustics, Llc | Reducing noise in audio systems |
US8098844B2 (en) | 2002-02-05 | 2012-01-17 | Mh Acoustics, Llc | Dual-microphone spatial noise suppression |
US7716044B2 (en) | 2003-02-07 | 2010-05-11 | Nippon Telegraph And Telephone Corporation | Sound collecting method and sound collecting device |
DE60325699D1 (de) * | 2003-05-13 | 2009-02-26 | Harman Becker Automotive Sys | Verfahren und System zur adaptiven Kompensation von Mikrofonungleichheiten |
US7587056B2 (en) * | 2006-09-14 | 2009-09-08 | Fortemedia, Inc. | Small array microphone apparatus and noise suppression methods thereof |
US8855330B2 (en) * | 2007-08-22 | 2014-10-07 | Dolby Laboratories Licensing Corporation | Automated sensor signal matching |
US8411880B2 (en) * | 2008-01-29 | 2013-04-02 | Qualcomm Incorporated | Sound quality by intelligently selecting between signals from a plurality of microphones |
US8611556B2 (en) * | 2008-04-25 | 2013-12-17 | Nokia Corporation | Calibrating multiple microphones |
US8411603B2 (en) * | 2008-06-19 | 2013-04-02 | Broadcom Corporation | Method and system for dual digital microphone processing in an audio CODEC |
US8495797B2 (en) * | 2008-07-02 | 2013-07-30 | Jack C. La See | Casement window hinge with reduced sash-sag |
US8229126B2 (en) | 2009-03-13 | 2012-07-24 | Harris Corporation | Noise error amplitude reduction |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
KR101601197B1 (ko) * | 2009-09-28 | 2016-03-09 | 삼성전자주식회사 | 마이크로폰 어레이의 이득 조정 장치 및 방법 |
JP5857403B2 (ja) | 2010-12-17 | 2016-02-10 | 富士通株式会社 | 音声処理装置および音声処理プログラム |
WO2012091643A1 (en) | 2010-12-29 | 2012-07-05 | Telefonaktiebolaget L M Ericsson (Publ) | A noise suppressing method and a noise suppressor for applying the noise suppressing method |
-
2013
- 2013-12-23 US US14/139,370 patent/US9258661B2/en not_active Expired - Fee Related
-
2014
- 2014-05-02 KR KR1020157035320A patent/KR101687131B1/ko active IP Right Grant
- 2014-05-02 EP EP14729788.1A patent/EP2997741B1/en not_active Not-in-force
- 2014-05-02 JP JP2016513976A patent/JP6067930B2/ja not_active Expired - Fee Related
- 2014-05-02 CN CN201480026424.3A patent/CN105210386B/zh not_active Expired - Fee Related
- 2014-05-02 WO PCT/US2014/036634 patent/WO2014186156A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101203063A (zh) * | 2007-12-19 | 2008-06-18 | 北京中星微电子有限公司 | 麦克风阵列的噪声消除方法及装置 |
US8391507B2 (en) * | 2008-08-22 | 2013-03-05 | Qualcomm Incorporated | Systems, methods, and apparatus for detection of uncorrelated component |
CN101668243A (zh) * | 2008-09-01 | 2010-03-10 | 深圳华为通信技术有限公司 | 一种麦克风阵列及麦克风阵列校准的方法和模块 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107820188A (zh) * | 2017-11-15 | 2018-03-20 | 深圳市路畅科技股份有限公司 | 一种校准麦克风的方法、系统及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
US20140341380A1 (en) | 2014-11-20 |
EP2997741A1 (en) | 2016-03-23 |
WO2014186156A1 (en) | 2014-11-20 |
KR101687131B1 (ko) | 2016-12-15 |
JP2016526324A (ja) | 2016-09-01 |
US9258661B2 (en) | 2016-02-09 |
KR20160009638A (ko) | 2016-01-26 |
CN105210386B (zh) | 2017-09-22 |
JP6067930B2 (ja) | 2017-01-25 |
EP2997741B1 (en) | 2019-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105210386A (zh) | 用于多个麦克风的自动化增益匹配 | |
US9953661B2 (en) | Neural network voice activity detection employing running range normalization | |
US10602267B2 (en) | Sound signal processing apparatus and method for enhancing a sound signal | |
KR100883712B1 (ko) | 음원 방향 추정 방법, 및 음원 방향 추정 장치 | |
RU2596592C2 (ru) | Пространственный аудио процессор и способ обеспечения пространственных параметров на основе акустического входного сигнала | |
US9318125B2 (en) | Noise reduction devices and noise reduction methods | |
US9449594B2 (en) | Adaptive phase difference based noise reduction for automatic speech recognition (ASR) | |
US10127919B2 (en) | Determining noise and sound power level differences between primary and reference channels | |
EP3726530B1 (en) | Method and apparatus for adaptively detecting a voice activity in an input audio signal | |
RU2759716C2 (ru) | Устройство и способ оценки задержки | |
EP1973104B1 (en) | Method and apparatus for estimating noise by using harmonics of a voice signal | |
US9183846B2 (en) | Method and device for adaptively adjusting sound effect | |
BR112013026333B1 (pt) | método de classificação de sinal de áudio baseada em quadro, classificador de áudio, dispositivo de comunicação de áudio, e, disposição de codec de áudio | |
KR101373594B1 (ko) | 신호 지연 검출 방법, 검출 장치 및 코더 | |
US10636438B2 (en) | Method, information processing apparatus for processing speech, and non-transitory computer-readable storage medium | |
US11769517B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
CN112530450A (zh) | 频域中的样本精度延迟识别 | |
US9779762B2 (en) | Object sound period detection apparatus, noise estimating apparatus and SNR estimation apparatus | |
JP6759927B2 (ja) | 発話評価装置、発話評価方法、および発話評価プログラム | |
KR101817421B1 (ko) | 두 채널 구조에 기초하는 사전 음성 부재 확률의 추정 방법 | |
Yaodu et al. | A real-time noise energy estimation method | |
WO2023172609A1 (en) | Method and audio processing system for wind noise suppression | |
Wang et al. | A statistical analysis of power-level-difference-based dual-channel post-filter estimator | |
JP6213324B2 (ja) | 音声信号処理装置及びプログラム | |
JP2015119260A (ja) | マルチパス判定装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170922 Termination date: 20190502 |
|
CF01 | Termination of patent right due to non-payment of annual fee |