CN107409255A - 子带信号的自适应混合 - Google Patents

子带信号的自适应混合 Download PDF

Info

Publication number
CN107409255A
CN107409255A CN201680019380.0A CN201680019380A CN107409255A CN 107409255 A CN107409255 A CN 107409255A CN 201680019380 A CN201680019380 A CN 201680019380A CN 107409255 A CN107409255 A CN 107409255A
Authority
CN
China
Prior art keywords
subband
output
microphone
microphone array
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680019380.0A
Other languages
English (en)
Other versions
CN107409255B (zh
Inventor
M·奥瑞斯卡宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bose Corp
Original Assignee
Bose Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bose Corp filed Critical Bose Corp
Publication of CN107409255A publication Critical patent/CN107409255A/zh
Application granted granted Critical
Publication of CN107409255B publication Critical patent/CN107409255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Abstract

一种方法包括接收(与包括多个子带的频带相关联的)第一麦克风阵列处理信号,并接收与频带相关联的第二麦克风阵列处理信号。该方法包括基于第一麦克风阵列处理信号生成对应于第一子带的第一输出,并且基于第二麦克风阵列处理信号生成对应于第一子带的第二输出。该方法包括基于第一麦克风阵列处理信号生成对应于第二子带的第三输出,并且基于第二麦克风阵列处理信号生成对应于第二子带的第四输出。该方法包括执行第一组麦克风混合操作以生成第一子带的自适应混合器输出,并且执行不同的一组麦克风混合操作以生成第二子带的另一自适应混合器输出。

Description

子带信号的自适应混合
技术领域
本公开一般涉及子带信号的自适应混合。
背景技术
用于通过电信系统进行通信的耳机可以包括用于检测佩戴者的语音的一个或多个麦克风(例如,以提供给电子设备进行传输和/或存储语音信号)。这样的麦克风可能暴露于各种类型的噪声,包括环境噪声和/或风噪声以及其他类型的噪声。在一些情况下,特定的噪声减轻策略可能更适于一种类型的噪声(例如环境噪声,如附近在说话的其他人、交通、机械等)。在其他情况下,另一噪声减轻策略可能更适于另一种类型的噪声(例如,风噪声,由移动经过耳机的空气引起的噪声)。为了说明,“定向”噪声减轻策略可能更适于环境噪声减轻,而“全向”噪声减轻策略可能更适于风噪声减轻。
发明内容
在一个实现方式中,一种方法包括接收与包括多个子带的频带相关联的第一麦克风阵列处理信号。该方法包括接收与包括多个子带的频带相关联的第二麦克风阵列处理信号。该方法包括基于第一麦克风阵列处理信号生成第一输出。该第一输出对应于多个子带中的第一子带。该方法包括基于第二麦克风阵列处理信号生成第二输出。该第二输出对应于第一子带。该方法包括基于第一麦克风阵列处理信号生成第三输出。该第三输出对应于第二子带。该方法包括基于第二麦克风阵列处理信号生成第四输出。该第四输出对应于第二子带。该方法还包括执行第一组麦克风混合操作以生成与第一子带相关联的第一自适应混合器输出,并且执行第二组麦克风混合操作以生成与第二子带相关联的第二自适应混合器输出。第二组麦克风混合操作与第一组麦克风混合操作不同。
在另一实现方式中,一种装置包括第一麦克风阵列处理部件、第二麦克风阵列处理部件、第一带分析滤波器部件、第二带分析滤波器部件以及与第一子带相关联的第一自适应混合部件。第一麦克风阵列处理部件被配置为从多个麦克风接收多个麦克风信号,并且生成第一麦克风阵列处理信号。第一麦克风阵列处理信号与包括多个子带的频带相关联。第二麦克风阵列处理部件被配置为从多个麦克风接收多个麦克风信号,并生成第二麦克风阵列处理信号。第二麦克风阵列处理信号与包括多个子带的频带相关联。第一带分析滤波器是被配置为基于第一麦克风阵列处理信号生成第一输出的部件。第一输出对应于多个子带中的第一子带。第二带分析滤波器部件被配置为基于第二麦克风阵列处理信号生成第二输出。第二输出对应于第一子带。第一自适应混合部件被配置为基于第一输出与第二输出的比较来生成与第一子带相关联的第一自适应混合器输出。
在又一实现方式中,一种系统包括多个麦克风、第一麦克风阵列处理部件、第二麦克风阵列处理部件、第一带分析滤波器部件、第二带分析滤波器部件、第一自适应混合部件以及第一合成部件。第一麦克风阵列处理部件被配置为基于从多个麦克风接收到的多个麦克风信号来生成第一麦克风阵列处理信号。第一麦克风阵列处理信号与包括多个子带的频带相关联。第二麦克风阵列处理部件被配置为基于从多个麦克风接收到的多个麦克风信号生成第二麦克风阵列处理信号。第二麦克风阵列处理信号与包括多个子带的频带相关联。第一带分析滤波器部件被配置为基于第一麦克风阵列处理信号生成第一输出。第一输出对应于多个子带中的第一子带。第二带分析滤波器部件被配置为基于第二麦克风阵列处理信号生成第二输出。第二输出对应于第一子带。第一自适应混合部件与第一子带相关联,并且第一自适应混合部件被配置为基于第一输出与第二输出的比较来生成与第一子带相关联的第一自适应混合器输出。第一合成部件与第一自适应混合部件相关联,并且第一合成部件被配置为基于第一自适应混合器输出生成第一合成子带输出信号。
附图说明
图1是用于子带信号的自适应混合的系统的说明性实现方式的图;
图2是用于子带信号的子集的自适应混合的系统的说明性实现方式的图;以及
图3是子带信号的自适应混合方法的说明性实现方式的流程图。
具体实施方式
在一些情况下,用于语音通信的耳机(例如,有线耳机或无线耳机)使用各种噪声减轻策略来减少由耳机的麦克风捕获的噪声量。例如,噪声可以包括环境噪声和/或风噪声。噪声的减轻可以减少远端通信伙伴所听到的噪声量。作为另一例子,噪声的减轻可以改善远程语音识别引擎的语音识别。在一些情况下,一个噪声减轻策略(例如,第一“波束成形”策略)表示“更定向的”策略,其在环境噪声减轻方面更有效,但在风噪声减轻方面效果较差。另一噪声减轻策略(例如,第二“波束成形”策略)表示“不太定向的”策略,其在风噪声减轻方面更有效,但在环境噪声减轻方面效果较差。
本公开描述了带(例如,频域信号表示的多个子带,例如频带)的多个分析部分的自适应混合的系统和方法。在本公开中,使用多个麦克风混合算法,基于各个子带信号中的能量,来修改多个不同子带的子带信号,以便在各个子带中提高语音相对于周围噪声的信噪比(SNR)。作为例子,风噪声是频带受限制的(例如,在频域中小于大约1KHz)。在风噪声的情况下,在一些情况中,“不太定向的”噪声减轻策略用于与风噪声相关联的子带,而不是在整个带(包括带的与风噪声不相关联的部分)上应用“宽带增益”。在与风噪声不相关联的子带(例如,高于约1KHz的子带)中,在一些情况下,使用“更定向的”噪声减轻策略(其在环境噪声减轻方面更有效)。
在一些情况下,与在整个频带上应用宽带增益的主动风噪声减轻方案相比,本公开的子带自适应混合方法提供了改善的性能(例如,对于用于电信的噪声消除耳机,以减少发送到远端方的信号中的噪声量)。例如,在一些情况下,本公开的子带自适应混合方法在频带的较大部分中(例如,对应于8KHz频带的窄带信号或对应于16KHz频带的宽带信号)产生更高的SNR以及相对于在整个频带上操作的混合方法减少了混响。
作为风噪声减轻的说明性例子,超定向麦克风阵列(例如,速度麦克风)和全向麦克风(例如,压力麦克风)可以与耳机相关联。通常,与全向麦克风相比,超定向麦克风阵列对环境噪声的灵敏度较低;且与全向麦克风相比,超定向麦克风阵列对风噪声的灵敏度较高。通过将频带分成多个子带(例如,8个子带),将“不太定向的”解决方案应用于第一组子带(例如,前3个子带),而将“更定向的”解决方案应用于第二组子带(例如,接下来的5个子带)。然后组合不同混合操作的输出以生成输出信号。在风噪声存在的情况下,选择性地将不同的混合解决方案应用于不同的子带可以由于输出信号中更高的定向性而导致减少混响。其他优点可能包括由于通过子带混合耦合的部分邻近效应而增加输出信号(将被发送到远端方)的SNR和语音深度。
在实践中,在存在风噪声的情况下,本公开的自适应子带混合算法可以有利于“不太定向的”解决方案的输出(如应用于例如前3个子带)。在一些情况下,这导致了几乎是“二元”的决策,并且单独地解析“不太定向的”的输出信号的输出,其中与“更定向的”解决方案(如应用于例如接下来的5个子带)的输出的混合少于10%。由于调谐和被动风噪声保护,该结果针对不同耳机可能会有所不同。对与风噪声相关联的所选子带应用“不太定向的”解决方案可以减少输出信号中的风噪声量,同时允许将“更定向的”解决方案应用于频带的其余部分以改善环境噪声减轻。
参考图1,示出了用于子带信号的自适应混合的系统的示例,并且一般被指定为100。图1示出了来自多个麦克风阵列处理块(例如,波束成形器)的输出可以被划分成多个子带(或“分析部分”)。与不同子带相关联的信号可以发送到不同的混合部件进行处理。为了改善第一子带的信噪比,可以对第一子带执行第一组麦克风混合操作;并且为了改善第二子带的信噪比,可以对第二子带执行第二组麦克风混合操作。在一些情况下,“不太定向的”解决方案可以改善第一组子带信号的SNR(例如,在频带受限的频率范围内,例如对于风噪声小于约1KHz)。在其他情况下,可以使用“更定向的”解决方案来改善第二组子带信号的信噪比(例如,在与风噪声相关联的频带受限频率范围之外)。
在图1的例子中,系统100包括麦克风阵列102中的多个麦克风,麦克风阵列102包括两个或更多麦克风。例如,在图1所示的特定实现方式中,麦克风阵列102包括第一麦克风104、第二麦克风106和第N麦克风108。在替代实现方式中,麦克风阵列102可以包括两个麦克风(例如,第一麦克风104和第二麦克风106)。梯度麦克风可以具有双向麦克风模式,其可用于在无线耳机中提供良好的语音响应,其中麦克风可以指向用户嘴的大体方向。这种麦克风可以在环境噪声中提供良好的响应,但是容易受到风噪声影响。压力麦克风倾向于具有全向麦克风模式。
系统100还包括两个或更多个麦克风阵列处理部件(例如,“波束成形器”)。在图1所示的特定实现方式中,系统100包括第一麦克风阵列处理部件110(例如,在图1中标识为“B1”的第一波束成形器,例如被设计用于漫射环境中的“高度定向”波束成形器或VMIC)。系统100还包括第二麦克风阵列处理部件112(例如,在图1中标识为“B2”的第二波束成形器,例如被设计用于风噪声环境中的“不太定向”波束成形器或PMIC)。在替代实现方式中,可以使用多于两个的麦克风阵列处理部件(例如,多于两个波束成形器)。此外,在一些情况下,其他频带受限传感器可以通信地耦合到第三波束成形器(例如,在图1中未示出的“B3”),以提供用于改善噪声减轻的附加频带受限信号。频带受限传感器的其他例子可以包括骨传导麦克风,ANR中的反馈麦克风,压电元件,远程监视皮肤振动的光学多普勒测速仪,或通过接触直接监视皮肤振动的压力元件等替代方案。通过骨骼和皮肤传导的语音被频带限制在低频。
图1示出了第一麦克风104通信地耦合到第一麦克风阵列处理部件110和第二麦克风阵列处理部件112。第一麦克风阵列处理部件110和第二麦克风阵列处理部件112被配置为从第一麦克风104接收第一麦克风信号。图1还示出了第二麦克风106通信地耦合到第一麦克风阵列处理部件110和第二麦克风阵列处理部件112。第一麦克风阵列处理部件110和第二麦克风阵列处理部件112被配置为从第二麦克风106接收第二麦克风信号。在图1所示的特定实现方式中,麦克风阵列102包括两个以上的麦克风。在该示例中,第N麦克风108通信地耦合到第一麦克风阵列处理部件110和第二麦克风阵列处理部件112。第一麦克风阵列处理部件110和第二麦克风阵列处理部件112被配置为从第N麦克风108接收第N麦克风信号。在替代实现方式中,系统100包括从麦克风阵列102的多个麦克风接收麦克风信号的两个以上的麦克风阵列处理部件(例如,“波束成形器”)。
第一麦克风阵列处理部件110被配置为生成第一麦克风阵列处理信号,其与包括多个子带的频带相关联。作为例子,频带可以对应于窄带,例如8KHz频带等其他替代方案。作为另一例子,频带可以对应于宽带,例如16KHz频带等其他替代方案。在特定实现方式中,第一麦克风阵列处理部件110包括第一波束成形部件,其被配置为基于从麦克风阵列102的麦克风接收到的多个麦克风信号来执行第一组波束成形操作。在特定情况下,第一组波束成形操作包括一个或多个定向麦克风波束成形操作。
第二麦克风阵列处理部件112被配置为生成与频带相关联的第二麦克风阵列处理信号。在特定实现方式中,第二麦克风阵列处理部件112包括第二波束成形部件,其被配置为基于从麦克风阵列102的麦克风接收到的麦克风信号来执行第二组波束成形操作。在特定情况下,第二组波束成形操作包括一个或多个全向麦克风波束成形操作。
系统100还包括多个带分析滤波器。在图1的例子中,带分析滤波器包括与第一麦克风阵列处理部件110相关联的第一组带分析滤波器114以及与第二麦克风阵列处理部件112相关联的第二组带分析滤波器116。带分析滤波器被配置为确定特定带的多个分析部分。在一些情况下,分析部分可以对应于特定频带的不同频率子带(例如,诸如8KHz频带的“窄”频带或诸如16KHz频带的“宽”频带)。当带分析滤波器用作滤波器组时,可以使用分析部分的其它例子,这取决于滤波器组的特定类型。例如,可以使余弦调制滤波器组变得复杂,称为频域的“VFE”滤波器组。在一些情况下,分析部分可能对应于时域样本。在其他情况下,分析部分可以对应于频域样本。另外,虽然图1示出了滤波器组的一个例子,但是可以构想出其他实现方式。为了说明,滤波器组可以被实现为均匀滤波器组或者非均匀滤波器组。子带滤波器也可以被实现为余弦调制滤波器组(CMFB)、小波滤波器组、DFT滤波器组、基于BARK标度的滤波器组或倍频程滤波器组等其他替代方案。
为了说明,可以在音频编码的MPEG标准中使用余弦调制滤波器组(CFMB)。在这种情况下,在滤波器组的分析部分之后,信号仅包括“实数”分量。可以使用离散余弦变换(例如,DCT和MDCT)来有效地实现这种类型的滤波器组。滤波器组的其他例子包括DFT调制滤波器组、广义DFT滤波器组或复指数调制滤波器组。在这种情况下,在滤波器组的分析部分之后,信号包括对应于频率槽的复值分量。可以经由加权叠加(WOLA)DFT滤波器组来有效地实现DFT滤波器组,其中可以使用快速傅里叶变换(FFT)来有效计算DFT变换。WOLA DFT滤波器组可以在数字上有效地在嵌入式硬件上实现。
在图1所示的具体实现方式中,与第一麦克风阵列处理部件110相关联的第一组带分析滤波器114包括第一带分析滤波器118(在图1中标识为“H1”)、第二带分析滤波器120(在图1中标识为“H2”)和第N带分析滤波器122(在图1中标识为“HN”)。与第二麦克风阵列处理部件112相关联的第二组带分析滤波器116包括第一带分析滤波器124(在图1中标识为“H1”)、第二带分析滤波器126(在图1中标识为“H2”)和第N带分析滤波器128(在图1中标识为“HN”)。作为例子,第一带分析滤波器118(H1)可以是低通滤波器(在偶数堆叠滤波器组的情况下)或带通滤波器(在奇数堆叠滤波器组的情况下)。作为另一例子,第N带分析滤波器(HN)可以是高通滤波器(在偶数堆叠的情况下)或带分析滤波器(在奇数堆叠的情况下)。其他滤波器(例如,H2)可以是带通滤波器。另外,可以对滤波器组进行抽取(N=M)或过采样(M<N)。一些滤波器组可能在子带处理中对信号修改更健壮,并且可以用在一些音频和语音应用中。
第一组带分析滤波器114中的第一带分析滤波器118被配置为基于从第一麦克风阵列处理部件110接收到的麦克风阵列处理信号生成第一输出130。第一输出130对应于多个子带中的第一子带(在图1中标识为“子带(1)信号”)。第一组带分析滤波器114中的第二带分析滤波器120被配置为基于从第一麦克风阵列处理部件110接收到的麦克风阵列处理信号生成第二输出132。第二输出132对应于多个子带中的第二子带(在图1中标识为“子带(2)信号”)。第一组带分析滤波器114中的第N带分析滤波器122被配置为基于从第一麦克风阵列处理部件110接收到的麦克风阵列处理信号生成第N输出134。第N输出134对应于多个子带中的第N子带(在图1中标识为“子带(n)信号”)。
第二组带分析滤波器116中的第一带分析滤波器124被配置为基于从第二麦克风阵列处理部件112接收到的麦克风阵列处理信号生成第一输出136。第一输出136对应于第一子带(在图1中标识为“子带(1)信号”)。第二组带分析滤波器116中的第二带分析滤波器126被配置为基于从第二麦克风阵列处理部件112接收到的麦克风阵列处理信号生成第二输出138。第二输出136对应于第二子带(在图1中标识为“子带(2)信号”)。第二组带分析滤波器116中的第N带分析滤波器128被配置为基于从第二麦克风阵列处理部件112接收到的麦克风阵列处理信号生成第N输出140。第N输出140对应于第N子带(在图1中标识为“子带(N)信号”)。在图1所示的特定实现方式中,系统100还包括多个抽取部件(在图1中由字母“M”连同向下箭头一起标识),其被配置为对带分析滤波器的一个或多个输出执行一个或多个抽取操作。在一些情况下,M的值可以是一(没有抽取);而在其他情况下,M的值可能小于一。
系统100还包括多个(自适应)混合部件。在图1所示的特定实现方式中,混合部件包括第一混合部件150(在图1中标识为“α1”)、第二混合部件152(在图1中标识为“α2”)以及第N混合部件154(在图1中标识为“αN”)。第一混合部件150被配置为从第一组带分析滤波器114的第一带分析滤波器118接收对应于第一子带的第一输出130。第一混合部件150还被配置为从第二组带分析滤波器116的第一带分析滤波器124接收对应于第一子带的第一输出136。第一混合部件150被配置为基于输出130和136生成与第一子带相关联的第一自适应混合器输出。
如本文进一步描述的,第一混合部件150使用第一缩放因子(也称为“第一混合系数”或α1)来生成与第一子带相关联的第一自适应混合器输出。在一些实例中,选择或计算第一混合系数(α1),使得第一输出130和136中具有较小噪声的那个输出为与第一子带相关联的第一自适应混合器输出提供更大的贡献。在一些情况下,第一混合系数(α1)可以在0和1之间变化。还可以使用其他值,包括更窄的范围(例如,使用输出130、136中的每一个的至少一部分)或更宽的范围(例如,允许输出130、136中的一个过驱动第一自适应混合器输出)等其他替代方案。
在一些实现方式中,归一化最小均方(NLMS)算法可用于麦克风混合操作。可以将NLMS算法推广到在分析后具有实值输出的滤波器组中(例如,CMFB滤波器组或小波滤波器组),或者用于在分析后具有复值输出的滤波器组。NLMS算法依赖于归一化的LMS类型系统来检测多个信号中的功率并相应地减小信号的权重。可以根据下面的等式(1)确定加权输出:
y(n)=α(n)W(n)+(1-α(n)D(n)) (1)
在上述等式(1)中,α(n)是要估计的系统标识权重,W(n)和D(n)是波束成形元件或单个元件的输出。例如,参考图1,W(n)和D(n)可以分别对应于第一波束成形器(B1)110和第二波束成形器(B2)112的输出。作为说明性例子,这些输出可以对应于速度和压力麦克风信号、MVDR输出、延迟求和波束成形器输出、或可以在各种噪声环境中接收在频带上相对于彼此具有不同性能的语音信号的其他传感器组合。例如,可以从骨传导麦克风、ANR中的反馈麦克风、压电元件、监视脸部的振动的光学多普勒测速仪等其他替代方案接收这些信号。
在上述等式(1)中,索引n是从1到L的样本索引。在帧处理方案的情况下,L表示帧大小。在样本处理方案的情况下,L表示样本中的功率归一化的帧大小。可以做出广义的假设,即所有样本都是每个滤波器组(例如,图1的带分析滤波器)的输出,并且可以是实数或复数(例如,如果y(n)是复数,那么W(n)和D(n)也是复数)。可以根据下面的等式(2)确定要降低(例如,最小化)的成本函数:
J(n)=E{|y(n)|2}=E{y(n)yH(n)} (2)
在上述等式(2)中,在矢量的情况下,H是Hermitian算子。在单值的情况下,H是*共轭。为了找到权重α(n)以降低成本函数,可以根据下面的等式(3)使用J(n)相对于α(n)的偏导数:
在上述等式(3)中,
因此,
由于均方误差更新等式或随机梯度递归具有的形式,所以可以计算以下内容:
可以使用无偏差的误差估计器来近似期望函数,如下所示:
对于L=1的简单情况,这简化为:
权重等式可以定义为如下:
α(n+1)=α(n)-μ(W(n)-D(n))yH(n)
在这种情况下,μ是步长或学习速率。实际的实现方式可以包括正则化的牛顿递归形式,其中通过利用信号功率和正则化常数对输入信号进行归一化或缩放来控制学习速率,如下所示:
在这种情况下,ε(i)是小的正常数,ε(i)>0,加上它以确保数值稳定性(防止除以零),并且L大于0。关于图1,最后的结果可以被表示为滤波器组分解的函数,如下面的等式(4)所示:
在上述等式(4)中,引入索引k,其中k=1:N,其中N是滤波器组或麦克风混合带的数目。对于每个带,可以使用麦克风混合程序来混合信号。
在具有复值样本的滤波器组(例如,WOLA DFT滤波器组)的情况下,可以使用等式(4)。在具有实值样本的滤波器组(例如,CFMB)的情况下,等式(4)可以被简化为更简单的形式,如下面的等式(5)所示:
通常,对于相同的数据块方案,实值数据方法在数值上比复值方法更有效率。
第二混合部件152被配置为从第一组带分析滤波器114中的第二带分析滤波器120接收对应于第二子带的第二输出132。第二混合部件152还被配置为从第二组带分析滤波器116中的第二带分析滤波器126接收对应于第二子带的第二输出138。第二混合部件152被配置为基于输出132和138生成与第二子带相关联的第二自适应混合器输出。
如本文进一步描述的,第二混合部件152使用第二缩放因子(也称为“第二混合系数”或α2)来生成与第二子带相关联的第二自适应混合器输出。可以选择或计算第二混合系数(α2),使得第二输出132和138中具有较小噪声的那个输出为与第二子带相关联的第二自适应混合器输出提供较大的贡献。在一些情况下,第二混合系数(α2)可以在0和1之间变化。还可以使用其他值,包括更窄的范围(例如,使用输出132、138中的每一个的至少一部分)、更宽的范围(例如,允许输出132、138中的一个过驱动第二自适应混合器输出)。在一些情况下,第二混合系数(α2)可以是动态值。在其他情况下,第二混合系数(α2)可以是常数值。
第N混合部件154被配置为从第一组带分析滤波器114中的第N带分析滤波器122接收对应于第N子带的第N输出134。第N混合部件154还被配置为从第二组带分析滤波器116中的第N带分析滤波器128接收对应于第N子带的第N输出140。第N混合部件154被配置为基于输出134和140生成与第N子带相关联的第N自适应混合器输出。
如本文进一步描述的,第N混合部件154可以使用第N缩放因子(也称为“第N混合系数”或αN)来生成与第N子带相关联的第N自适应混合器输出。可以选择或计算第N混合系数(αN),使得第N输出134和140中具有较小噪声的那个输出为与第N子带相关联的第N自适应混合器输出提供更大的贡献。在一些情况下,第N混合系数(αN)可以在0和1之间变化。还可以使用其他值,包括更窄的范围(例如,使用输出134、140中的每一个的至少一部分)、更宽的范围(例如,允许输出134、140中的一个过驱动第N自适应混合器输出)。在一些情况下,第N混合系数(αN)可以是动态值。在其他情况下,第N混合系数(αN)可以是常数值。
在图1所示的特定实现方式中,系统100还包括多个插值部件(在图1中由字母“M”与向上箭头一起标识),其被配置为对自适应混合器输出中的一个或多个输出执行一个或多个插值操作。图1还示出了系统100可以包括多个合成部件(或合成“滤波器”)。例如,在图1所示的特定实现方式中,多个合成部件包括第一合成部件160(在图1中标识为“F1”)、第二合成部件162(在图2中标识为“F2”)以及第N合成部件164(在图1中标识为“FN”)。
第一合成部件160与第一混合部件150相关联,并且被配置为基于从第一混合部件150接收到的第一自适应混合器输出来生成第一合成子带输出信号。第二合成部件160与第二自适应混合部件152相关联,并且被配置为基于从第二混合部件152接收到的第二自适应混合器输出来生成第二合成子带输出信号。第N合成部件164与第N自适应混合部件154相关联,并且被配置为基于从第N混合部件154接收到的第N自适应混合器输出来生成第N合成子带输出信号。
合成部件160-164被配置为向组合器170提供合成的子带输出信号。组合器170被配置为基于从合成部件160-164接收到的合成子带输出信号的组合来生成音频输出信号172。在图1所示的特定实现方式中,组合器170被配置为基于从第一合成部件160接收到的第一合成子带输出信号、从第二合成部件162接收到的第二合成子带输出信号以及从第N合成部件164接收到的第N合成子带输出信号的组合,来生成音频输出信号172。
在操作中,第一麦克风阵列处理部件110(例如,第一波束成形器)从麦克风阵列102的麦克风(例如,从第一麦克风104,从第二麦克风106,以及从第N麦克风108)接收多个麦克风信号。在一些情况下,麦克风阵列102的各个麦克风与耳机相关联,并且各个麦克风被定位于耳机上的各种位置处(或以其他方式连接到耳机,例如悬挂式麦克风)。为了说明,麦克风阵列102的一个或多个麦克风可以被定位于耳机的一侧(例如,面向耳腔,在耳腔内或其组合),而麦克风阵列102的一个或多个麦克风可以被定位于耳机的另一侧(例如,在一个或多个方向上以捕获语音输入)。
第一麦克风阵列处理部件110在处理来自麦克风阵列102的多个麦克风信号时,采用第一波束成形策略。第二麦克风阵列处理部件112在处理来自麦克风阵列102的多个麦克风信号时,采用第二波束成形策略。在一些情况下,第一波束成形策略对应于比第二波束成形策略“更定向的”波束成形策略。例如,在一些情况下,第一波束成形策略更适合于一个应用(例如,环境噪声消除),而第二波束成形策略更适合于另一个应用(例如,风噪声消除)。当采用不同的波束成形策略时,不同的麦克风阵列处理部件110、112生成不同的波束成形器输出。
将不同的麦克风阵列处理部件110、112的输出提供给带分析滤波器。例如,第一麦克风阵列处理部件110的输出被提供给第一组带分析滤波器114,并且第二麦克风阵列处理部件112的输出被提供给第二组带分析滤波器116。第一组带分析滤波器114包括N个带分析滤波器118-122,用以分析波束成形第一麦克风阵列处理部件110的输出的不同部分(由第一波束成形操作产生的)。第二组带分析滤波器116包括N个频带分析滤波器124-128,用以分析波束成形第二麦克风阵列处理部件112的输出的不同部分(由第二波束成形操作产生的)。为了说明,基于第一波束成形操作的结果,第一带分析滤波器118生成第一子带信号130,第二带分析滤波器120生成第二子带信号132,并且第N带分析滤波器122生成第N子带信号134。基于第二波束成形操作的结果,第一带分析滤波器124生成第一子带信号136,第二带分析滤波器126生成第二子带信号138,以及第N带分析滤波器128生成第N子带信号140。
图1示出了第一输出130、136(与第一子带相关联)被传送到第一自适应混合部件150。第二输出132、138(与第二子带相关联)被传送到第二自适应混合部件152。输出134、140(与第N子带相关联)被传送到第N自适应混合部件154。在图1的例子中,在子带信号被自适应混合部件150-154处理之前,对子带信号执行抽取操作。第一自适应混合部件150基于输出130和136生成与第一子带相关联的第一自适应混合器输出。第二自适应混合部件152基于输出132和138生成与第二子带相关联的第二自适应混合器输出。第N自适应混合部件154基于输出134和140生成与第N子带相关联的第N自适应混合器输出。
如上所解释的,选择或计算用于“混合”特定子带的输出信号的特定混合系数,使得具有较高SNR的输出表示特定自适应混合器输出的更大部分(或全部)。在一些情况下,第一子带对应于风噪声(例如,小于约1KHz)。在一些情况下,第一麦克风阵列处理部件110采用定向噪声减轻策略,而第二麦克风阵列处理部件112采用全向噪声减轻策略。在存在风噪声的情况下,与由第一带分析滤波器124生成的第一子带信号136相比,由第一带分析滤波器118生成的第一子带信号130受风噪声影响更多。在这种情况下,第一自适应混合部件150选择第一子带信号136(“不太定向的”输出),以便为第一子带提供较高的SNR。作为另一例子,第二子带在与风噪声相关联的频带外部(例如,大于约1KHz)。在存在风噪声的情况下,与第一子带信号130、136相比,第二子带信号132、138可能受风噪声的影响更小。在这种情况下,第二自适应混合部件152选择由第二带分析滤波器120生成的第二子带信号138(“更定向的”输出),以便为第二子带提供较高的SNR。
图1还示出了第一自适应混合部件150将与第一子带相关联的第一自适应混合器输出发送到第一合成滤波器160(具有介入插值)。第二自适应混合部件152将与第二子带相关联的第二自适应混合器输出发送到第二合成滤波器162(具有介入插值)。第N自适应混合部件154将与第N子带相关联的第N自适应混合器输出发送到第N合成滤波器164(具有介入插值)。组合器170将来自合成部件160-164的自适应混合输出信号进行组合,以生成输出信号172(将被传送到远端方或语音识别引擎)。
因此,图1示出了子带信号的自适应混合系统的例子。图1示出了在一些情况下,“不太定向的”解决方案可以改善第一组子带信号的信噪比(例如,在频带受限频率范围内,例如对于风噪声小于约1KHz)。在其他情况下,可以使用“更定向的”解决方案来改善第二组子带信号的信噪比(例如,在与风噪声相关的频带受限频率范围之外)。
参考图2,示出了子带信号的自适应混合系统的例子,并且通常被描绘为200。在图2的例子中,仅为了说明的目的省略了选择部件(例如,麦克风阵列、插值部件等)。在图2示出的示例性实现方式中,多个带分析滤波器可以生成多个子带信号(例如,N个子带信号,如8个子带信号)。子带信号的第一子集(例如,8个子带信号中的3个)可以被提供给一组自适应混合部件(例如,具有自适应α值的混合部件)。子带信号的第二子集(例如,8个子带信号中的5个)可以被提供给另一组混合部件(例如,具有静态α值的混合部件)。为了说明,子带信号的第一子集可以处于频带受限的频率范围内(例如,小于约1KHz,其中环境噪声可能与风噪声重叠),并且子带信号的第二子集可以在频带受限的频率范围之外。
在图2所示的例子中,系统200包括第一麦克风阵列处理部件202(例如,在图2中标识为“B1”的第一波束成形器)和第二麦克风阵列处理部件204(例如,在图2中标识为“B2”的第二波束成形器)。在一些情况下,图2的第一麦克风阵列处理部件202可以对应于图1的第一麦克风阵列处理部件110。第二麦克风阵列处理部件204可对应于图1的第二麦克风阵列处理部件112。虽然图2中未示出,但第一麦克风阵列处理部件202和第二麦克风阵列处理部件204可以被配置为从麦克风阵列的多个麦克风(例如,图1的麦克风阵列102的麦克风104-108)接收麦克风信号。
在图2的例子中,多个带分析滤波器与第一麦克风阵列处理部件202相关联,并且多个带分析滤波器与第二麦克风阵列处理部件204相关联。与第一麦克风阵列处理部件202相关联的带分析滤波器包括第一带分析滤波器子集206和第二带分析滤波器子集208。与第二麦克风阵列处理部件204相关联的带分析滤波器包括第一带分析滤波器子集210和第二带分析滤波器子集212。
图2示出了与第一麦克风阵列处理部件202相关联的第一带分析滤波器子集206通信地耦合到第一组(自适应)混合部件214。与第一麦克风阵列处理部件202相关联的第二带分析滤波器子集208通信地耦合到第二组混合部件216。图2还示出了与第二麦克风阵列处理部件204相关联的第一带分析滤波器子集210通信地耦合到第一组(自适应)混合部件214。与第二麦克风阵列处理部件204相关联的第二带分析滤波器子集212通信地耦合到第二组混合部件216。
在图2中,N个带分析滤波器与第一麦克风阵列处理部件202相关联,并且N个带分析滤波器与第二麦克风阵列处理部件204相关联。在图2的说明性非限制例子中,N大于4(例如8个子带)。为了说明,与第一麦克风阵列处理部件202相关联的第一带分析滤波器子集206包括三个带分析滤波器,并且与第二麦克风阵列处理部件204相关联的第一带分析滤波器子集210包括三个带分析滤波器。与第一麦克风阵列处理部件202相关联的第二带分析滤波器子集208包括至少两个带分析滤波器,并且与第二麦克风阵列处理部件204相关联的第二带分析滤波器子集212包括至少两个带分析滤波器。应当理解,特定子集中的带分析滤波器的数目可以变化。例如,第一子集206、210可以包括少于三个的带分析滤波器或多于三个的带分析滤波器,并且第二子集208、212可以包括单个带分析滤波器或多于两个的带分析滤波器。
在图2所示的例子中,与第一麦克风阵列处理部件202相关联的第一带分析滤波器子集206包括第一带分析滤波器218(在图2中标识为“H1”)、第二带分析滤波器220(在图2中标识为“H2”)以及第三带分析滤波器222(在图2中标识为“H3”)。与第一麦克风阵列处理部件202相关联的第二带分析滤波器子集208包括第四带分析滤波器224(在图2中标识为“H4”)和第N带分析滤波器226(在图2中标识为“HN”)。
与第二麦克风阵列处理部件204相关联的第二带分析滤波器子集210包括第一带分析滤波器228(在图2中标识为“H1”)、第二带分析滤波器230(在图2中标识为“H2”)以及第三带分析滤波器232(在图2中标识为“H3”)。与第二麦克风阵列处理部件204相关联的第二带分析滤波器子集212包括第四带分析滤波器234(在图2中标识为“H4”)和第N带分析滤波器236(在图2中标识为“HN”)。
参考带第一分析滤波器子集206,第一带分析滤波器218被配置为生成对应于第一子带的第一输出240(在图2中标识为“子带(1)信号”)。第二带分析滤波器220被配置为生成对应于第二子带的第二输出242(在图2中标识为“子带(2)信号”)。第三带分析滤波器222被配置为生成对应于第三子带的第三输出244(在图2中标识为“子带(3)信号”)。参考第二带分析滤波器子集208,第四带分析滤波器224被配置为生成对应于第四子带的第四输出246(在图2中标识为“子带(4)信号”)。第N带分析滤波器226被配置为生成对应于第N子带的第N输出248(在图2中标识为“子带(N)信号”)。
参考第一带分析滤波器子集210,第一带分析滤波器228被配置为生成对应于第一子带的第一输出250(在图2中标识为“子带(1)信号”)。第二带分析滤波器230被配置为生成对应于第二子带的第二输出252(在图2中标识为“子带(2)信号”)。第三带分析滤波器232被配置为生成对应于第三子带的第三输出254(在图2中标识为“子带(3)信号”)。参考第二带分析滤波器子集212,第四带分析滤波器234被配置为生成对应于第四子带的第四输出256(在图2中标识为“子带(4)信号”)。第N带分析滤波器236被配置为生成对应于第N子带的第N输出258(在图2中标识为“子带(N)信号”)。
在图2的例子中(其中第一子集206和210包括三个带分析滤波器以生成三个子带信号),第一组(自适应)混合部件214包括第一混合部件260(在图2中标识为“α1”)、第二混合部件262(在图2中标识为“α2”)以及第三混合部件264(在图2中标识为“α3”)。第二组混合部件216包括第四混合部件266(在图2中标识为“α4”)和第N混合部件268(在图2中标识为“αN”)。
第一混合部件260被配置为从(与第一麦克风阵列处理部件202相关联的)第一带分析滤波器218接收对应于第一子带的第一输出240。第一混合部件260还被配置为从(与第二麦克风阵列处理部件204相关联的)第一带分析滤波器228接收对应于第一子带的第一输出250。第一混合部件260被配置为基于输出240和250生成与第一子带相关联的第一自适应混合器输出。
第一混合部件260可以使用第一缩放因子(也称为“第一混合系数”或α1)来生成与第一子带相关联的第一自适应混合器输出。可以选择或计算第一混合系数(α1),使得第一输出240和250中具有较小噪声的那个输出为与第一子带相关联的第一自适应混合器输出提供更大的贡献。在一些情况下,第一混合系数(α1)可以在0和1之间变化。还可以使用其他值,包括更窄的范围(例如,使用输出240、250中每一个的至少一部分)或更宽的范围(例如,以允许输出240、250中的一个过驱动第一自适应混合器输出)以及其他替代方案。
第二混合部件262被配置为从(与第一麦克风阵列处理部件202相关联的)第二带分析滤波器220接收对应于第二子带的第二输出242。第二混合部件262还被配置为从(与第二麦克风阵列处理部件204相关联的)第二带分析滤波器230接收对应于第二子带的第二输出252。第二混合部件262被配置为基于输出242和252生成与第二子带相关联的第二自适应混合器输出。
第二混合部件262可以使用第二缩放因子(也称为“第二混合系数”或α2)来生成与第二子带相关联的第二自适应混合器输出。可以选择或计算第二混合系数(α2),使得第一输出242和252中具有较小噪声的那个输出为与第二子带相关联的第二自适应混合器输出提供更大的贡献。在一些情况下,第二混合系数(α2)可以在0和1之间变化。还可以使用其他值,包括更窄的范围(例如,使用输出242、252中每一个的至少一部分)或更宽的范围(例如,允许输出242、252中的一个过驱动第二自适应混合器输出)以及其他替代方案。
第三混合部件264被配置为从(与第一麦克风阵列处理部件202相关联的)第三带分析滤波器222接收对应于第三子带的第三输出244。第三混合部件264还被配置为从(与第二麦克风阵列处理部件204相关联的)第三带分析滤波器232接收对应于第三子带的第三输出254。第三混合部件264被配置为基于输出244和254生成与第三子带相关联的第三自适应混合器输出。
第三混合部件264可以使用第三缩放因子(也称为“第三混合系数”或α3)来生成与第三子带相关联的第三自适应混合器输出。可以选择或计算第三混合系数(α3),使得第三输出244和254中噪声较小的那个输出为与第三子带相关联的第三自适应混合器输出提供更大的贡献。在一些情况下,第三混合系数(α3)可以在0和1之间变化。还可以使用其他值,包括更窄的范围(例如,使用输出244、254中的每一个的至少一部分)或更宽的范围(例如,允许输出244、254中的一个过驱动第三自适应混合器输出)以及其他替代方案。
第四混合部件266被配置为从(与第一麦克风阵列处理部件202相关联的)第四带分析滤波器224接收对应于第四子带的第四输出246。第四混合部件266还被配置为从(与第二麦克风阵列处理部件204相关联的)第四带分析滤波器234接收对应于第四子带的第四输出256。第四混合部件266被配置为基于输出246和256生成与第四子带相关联的第四混合器输出。在一些情况下,第四混合部件266可以使用第四缩放因子(α4)来生成与第四子带相关联的第四混合器输出。例如,第四缩放因子(α4)可以表示“非自适应”静态缩放因子,以选择与第一麦克风阵列处理部件202相关联的第四输出246或与第二麦克风阵列处理部件204相关联的第四输出256。作为例子,当第四输出246比第四输出256具有更少的噪声时,第四混合部件266可以通过向第四输出246应用缩放因子1(以及向第四输出256应用缩放因子0)来“选择”第四输出246。作为另一例子,当第四输出246比第四输出256具有更多的噪声时,第四混合部件266可以通过向第四输出246应用缩放因子0(以及向第四输出256应用缩放因子1)来“选择”第四输出256。
第N混合部件268被配置为从(与第一麦克风阵列处理部件202相关联的)第N带分析滤波器226接收对应于第N子带的第N输出248。第N混合部件268还被配置为从(与第二麦克风阵列处理部件204相关联的)第N带分析滤波器236接收对应于第N子带的第N输出258。第N混合部件268被配置为基于输出248和258生成与第N子带相关联的第N混合器输出。在一些情况下,第N混合部件268可以使用“非自适应”缩放因子(αN)来选择与第一麦克风阵列处理部件202相关联的第N输出248或与第二麦克风阵列处理部件204相关联的第N输出258。作为例子,当第N输出248比第N输出258具有更少的噪声时,第N混合部件268可以通过向第N输出248应用缩放因子1(以及向第N输出258应用缩放因子0)来“选择”第N输出248。作为另一例子,当第N输出248比第N输出258具有更多的噪声时,第N混合部件268可以通过向第N输出248应用缩放因子0(以及向第N输出258应用缩放因子1)来“选择”第N输出258。
在一些情况下,多个插值部件(图2中未示出)可以被配置为对自适应混合器输出中的一个或多个输出执行一个或多个插值运算。图2还示出了系统200可以包括多个合成部件(或合成“滤波器”)。例如,在图2所示的例子中,多个合成部件包括第一合成部件270(在图2中标识为“F1”)、第二合成部件272(在图2中标识为“F2”)以及第三合成部件274(在图2中标识为“F3”)。第一合成部件270、第二合成部件272和第三合成部件274与第一组(自适应)混合部件214相关联。图2进一步示出了第四合成部件276(在图2中标识为“F4”)和第N合成部件278(在图2中标识为“FN”)。第四合成部件276和第N合成部件278与第二组混合部件216相关联。
第一合成部件270与第一混合部件260相关联,并且被配置为基于从第一混合部件260接收到的第一自适应混合器输出来生成第一合成子带输出信号。第二合成部件272与第二自适应混合部件262相关联,并且被配置为基于从第二混合部件262接收到的第二自适应混合器输出来生成第二合成子带输出信号。第三合成部件274与第三自适应混合部件264相关联,并且被配置为基于从第三混合部件264接收到的第三自适应混合器输出来生成第三合成子带输出信号。与第一组(自适应)混合部件214相关联的合成部件270-274被配置为将合成子带输出信号提供给组合器280。组合器280被配置为对从合成部件270-274接收到的合成子带输出信号进行组合(以被提供给第二组合器284)。
第四合成部件276与第四混合部件266相关联,并且被配置为基于从第四混合部件266接收到的第四混合器输出来生成第四合成子带输出信号。第N合成部件278与第N自适应混合部件268相关联,并且被配置为基于从第N混合部件268接收到的第N混合器输出来生成第N合成子带输出信号。与第二组混合部件216相关联的合成部件276、278被配置为向组合器282提供合成子带输出信号。组合器282被配置为对从合成部件276、278接收到的合成子带输出信号进行组合(以被提供给第二组合器284)。在图2的例子中,第二组合器284被配置为基于从合成部件270-278接收到的合成子带输出信号的组合来生成音频输出信号286。
在操作中,第一麦克风阵列处理部件202(例如,第一波束成形器)可以(从图2中未示出的麦克风阵列的麦克风)接收多个麦克风信号。第一麦克风阵列处理部件202在处理多个麦克风信号时,采用第一波束成形策略。第二麦克风阵列处理部件204在处理多个麦克风信号时,采用第二波束成形策略。在一些情况下,第一波束成形策略对应于比第二波束成形策略“更定向的”波束成形策略。例如,在一些情况下,第一波束成形策略更适合于一个应用(例如,环境噪声消除),而第二波束成形策略更适合于另一应用(例如,风噪声消除)。由于采用不同的波束成形策略,所以不同的麦克风阵列处理部件202、204生成不同的波束成形器输出。
将不同麦克风阵列处理部件202、204的输出提供给带分析滤波器。例如,第一麦克风阵列处理部件202的输出被提供给第一组带分析滤波器206以及提第二组带分析滤波器208。第一组带分析滤波器206包括三个带分析滤波器218-222,用以分析(由第一波束成形操作产生的)第一麦克风阵列处理部件202的输出的不同部分。第二组带分析滤波器208包括至少两个带分析滤波器224、226,用以分析(由第一波束成形操作产生的)第一麦克风阵列处理部件202的输出的不同部分。为了说明,基于第一波束成形操作的结果,第一带分析滤波器218生成第一子带信号240,第二带分析滤波器220生成第二子带信号242,并且第三带分析滤波器222生成第三子带信号244。基于第一波束成形操作的结果,第四带分析滤波器224生成第四子带信号246,第N带分析滤波器226生成第N子带信号248。
第二麦克风阵列处理部件204的输出被提供给第一组带分析滤波器210和第二组带分析滤波器212。第一组带分析滤波器210包括三个带分析滤波器228-232,用以分析(由第二波束成形操作产生的)第二麦克风阵列处理部件204的输出的不同部分。第二组带分析滤波器212包括至少两个带分析滤波器234、236,用以分析(由第二波束成形操作产生的)第二麦克风阵列处理部件204的输出的不同部分。为了说明,基于第二波束成形操作的结果,第一带分析滤波器228生成第一子带信号250,第二带分析滤波器230生成第二子带信号252,以及第三带分析滤波器232生成第三子带信号254。基于第二波束成形操作的结果,第四带分析滤波器234生成第四子带信号256,并且第N带分析滤波器236生成第N子带信号258。
图2示出了第一子带信号240、250被传送到第一(自适应)混合部件260。第二子带信号242、252被传送到第二(自适应)混合部件262。第三子带信号244、254被传送到第三(自适应)混合部件264。在图2的例子中,在子带信号被自适应混合部件260-264处理之前,对子带信号执行抽取操作。第一自适应混合部件260基于输出240和250生成与第一子带相关联的第一自适应混合器输出。第二自适应混合部件262基于输出242和252生成与第二子带相关联的第二自适应混合器输出。第三自适应混合部件264基于输出244和254生成与第三子带相关联的第三自适应混合器输出。
如上所述,选择或计算用于“混合”特定子带的输出信号的特定混合系数,使得具有较高SNR的输出表示特定自适应混合器输出的更大部分(或全部)。在一些情况下,前三个子带可以对应于环境噪声和风噪声重叠的子带。在一些情况下,第一麦克风阵列处理部件202采用定向噪声减轻策略,而第二麦克风阵列处理部件204采用全向噪声减轻策略。
第四子带信号246、256被传送到第四混合部件266。第N子带信号248、258被传送到第N混合部件268。在图2的例子中,在子带信号被混合部件266、268处理之前,对子带信号执行抽取操作。第四混合部件266基于输出246和256生成与第四子带相关联的第四混合器输出。第N混合部件268基于输出248和258生成与第N子带相关联的第N混合器输出。
图2还示出了第一自适应混合部件260将与第一子带相关联的第一自适应混合器输出发送到第一合成滤波器270(在图2中省略了介入插值)。第二自适应混合部件262将与第二子带相关联的第二自适应混合器输出发送到第二合成滤波器272(在图2中省略了介入插值)。第三自适应混合部件264将与第三子带相关联的第三自适应混合器输出发送到第三合成滤波器274(在图2中省略了介入插值)。组合器280对来自自适应混合部件260-264的自适应混合输出信号进行组合。第四混合部件266将与第四子带相关联的第四混合器输出发送到第四合成滤波器276(在图2中省略了介入插值)。第N混合部件268向第N合成滤波器278发送与第N子带相关联的第N混合器输出(在图2中省略了介入插值)。组合器282对来自混合部件266、268的混合输出信号进行组合。第二组合器284基于组合器280、282的输出生成输出信号286(将被传送到远端方或语音识别引擎)。
因此,图2示出了多个带分析滤波器生成多个子带信号(例如,N个子带信号,如8个子带信号)的示例性实现方式。子带信号的第一子集(例如,8个子带信号中的3个)可以被提供给一组自适应混合部件(例如,具有自适应α值的混合部件)。子带信号的第二子集(例如,8个子带信号中的5个)可以被提供给另一组混合部件(例如,具有“非自适应”静态α值的混合部件)。为了说明,子带信号的第一子集可以处于频带受限的频率范围(例如,小于约1KHz,其中环境噪声可能与风噪声重叠),并且子带信号的第二子集可以在频带受限的频率范围之外。
图3是子带信号的自适应混合的方法300的说明性实现方式的流程图。图3示出了来自不同麦克风阵列处理部件(例如,采用不同波束成形策略的不同波束成形器)的麦克风阵列处理信号可被划分成多个分析部分(例如,子带)。针对特定子带的不同麦克风阵列处理信号用于生成被传送到与特定子带相关联的自适应混合部件的输出。不是在整个带上应用“宽带增益”,而是将带分成多个分析部分进行处理,这可以允许在不同分析部分中进行自适应混合。在不同分析部分中进行自适应混合允许减轻与风噪声相关联的子带(例如,小于约1KHz)中的风噪声,以及减轻剩余子带中的环境噪声。
方法300包括:在302处从与多个麦克风相关联的第一麦克风阵列处理部件接收第一麦克风阵列处理信号。第一麦克风阵列处理信号与包括多个子带的频带相关联。作为例子,参考图1,第一组带分析滤波器114中的第一带分析滤波器118从第一麦克风阵列处理部件110(例如,第一波束成形器)接收麦克风阵列处理信号。第一麦克风阵列处理部件110与麦克风阵列102的麦克风104-108相关联。
方法300包括:在304处从与多个麦克风相关联的第二麦克风阵列处理部件接收第二麦克风阵列处理信号。第二麦克风阵列处理信号与包括多个子带的频带相关联。作为例子,参考图1,第一组带分析滤波器116中的第一带分析滤波器124从第二麦克风阵列处理部件112(例如,第二波束成形器)接收麦克风阵列处理信号。第二麦克风阵列处理部件112与麦克风阵列102的麦克风104-108相关联。
方法300包括:在306处基于第一麦克风阵列处理信号生成对应于多个子带中的第一子带的第一输出。作为例子,参考图1,第一组带分析滤波器114中的第一带分析滤波器118基于从第一带分析滤波器118接收到的麦克风阵列处理信号生成与第一子带相关联的第一输出130。
方法300包括:在308处基于第二麦克风阵列处理信号生成对应于第一子带的第二输出。作为例子,参考图1,第二组带分析滤波器116中的第一带分析滤波器124基于从第一带分析滤波器124接收到的麦克风阵列处理信号生成与第一子带相关联的第一输出136。
方法300还包括:在310处将第一输出和第二输出传送到多个自适应混合部件中的第一自适应混合部件。每个自适应混合部件与多个子带中的特定子带相关联,并且第一自适应混合部件与第一子带相关联。作为例子,参考图1,将与第一子带相关联的第一输出130从第一带分析滤波器118(具有可选的介入抽取)传送到第一自适应混合部件150(其与第一子带相关联)。此外,将与第一子带相关联的第一输出136从第一带分析滤波器124(具有可选的介入抽取)传送到第一自适应混合部件150(其与第一子带相关联)。
在一些例子中,上述装置和技术的实现方式包括对本领域技术人员显而易见的计算机部件和计算机实现步骤。本领域技术人员应当理解,计算机实现步骤可以作为计算机可执行指令存储在计算机可读介质上,例如软盘、硬盘、光盘、闪存、非易失性存储器以及RAM。在一些例子中,计算机可读介质计算机存储器设备,其不是信号。此外,本领域技术人员应当理解,计算机可执行指令可以在多种处理器上执行,例如微处理器、数字信号处理器、门阵列等。为了便于描述,在本文中并没有将上文所述的系统和方法的每个步骤或元件都描述为计算机系统的一部分,但是本领域技术人员将认识到,每个步骤或元件可以具有对应的计算机系统或软件部件。因此,这样的计算机系统和/或软件部件可以通过描述其对应的步骤或元件(即它们的功能)来实现,并且在本公开的范围内。
本领域技术人员可以在不背离本发明构思的情况下对本文所公开的装置和技术进行多种使用和修改并进行偏离。例如,在本公开中示出或描述的部件或特征不限于所示或所描述的位置。作为另一例子,与参考前述一个或多个图所描述的相比,根据本公开的装置的例子可以包括全部、更少或不同的部件。所公开的例子应被解释为涵盖本文公开的装置和技术中存在或拥有的每个新颖性特征和特征的新颖组合,并且仅由随附权利要求及其等同物的范围限定。

Claims (20)

1.一种方法,包括:
接收第一麦克风阵列处理信号,其中所述第一麦克风阵列处理信号与包括多个子带的频带相关联;
接收第二麦克风阵列处理信号,其中所述第二麦克风阵列处理信号与包括所述多个子带的所述频带相关联;
基于所述第一麦克风阵列处理信号生成第一输出,其中所述第一输出对应于所述多个子带中的第一子带;
基于所述第二麦克风阵列处理信号生成第二输出,其中所述第二输出对应于所述多个子带中的所述第一子带;
基于所述第一麦克风阵列处理信号生成第三输出,其中所述第三输出对应于所述多个子带中的第二子带;
基于所述第二麦克风阵列处理信号生成第四输出,其中所述第四输出对应于所述第二子带;
执行第一组麦克风混合操作以生成与所述第一子带相关联的第一自适应混合器输出;以及
执行第二组麦克风混合操作以生成与所述第二子带相关联的第二自适应混合器输出,其中所述第二组麦克风操作与所述第一组麦克风混合操作不同。
2.根据权利要求1所述的方法,还包括:
向多个自适应混合部件中的第一自适应混合部件传送所述第一输出和所述第二输出,其中每个自适应混合部件与所述多个子带中的特定子带相关联,并且其中所述第一自适应混合部件与所述第一子带相关联;以及
向所述多个自适应混合部件中的第二自适应混合部件传送所述第三输出和所述第四输出,其中所述第二自适应混合部件与所述第二子带相关联。
3.根据权利要求2所述的方法,其中:
所述第一自适应混合部件执行所述第一组麦克风混合操作以生成与所述第一子带相关联的所述第一自适应混合器输出;并且
所述第二自适应混合部件执行所述第二组麦克风混合操作以生成与所述第二子带相关联的所述第二自适应混合器输出。
4.根据权利要求3所述的方法,其中:
所述第一组麦克风混合操作响应于所述第一输出具有比所述第二输出的第二信噪比高的第一信噪比而被选择,以生成与所述第一子带相关联的所述第一自适应混合器输出;以及
所述第二组麦克风混合操作响应于所述第三输出具有比与所述第四输出相关联的第四信噪比低的第三信噪比而被选择,以生成与所述第二子带相关联的所述第二自适应混合器输出。
5.根据权利要求2所述的方法,其中所述第一子带对应于与风噪声相关联的第一频率值范围。
6.根据权利要求5所述的方法,其中所述第二子带对应于与风噪声相关联的第二频率值范围。
7.根据权利要求1所述的方法,其中所述第一麦克风阵列处理信号是对从多个麦克风接收到的多个麦克风信号执行的第一组波束成形操作的结果。
8.根据权利要求7所述的方法,其中所述第二麦克风阵列处理信号是对从所述多个麦克风接收到的所述多个麦克风信号执行的第二组波束成形操作的第二结果。
9.根据权利要求8所述的方法,其中所述第一组波束成形操作包括一个或多个全向麦克风波束成形操作,并且其中所述第二组波束成形操作包括一个或多个定向麦克风波束成形操作。
10.根据权利要求1所述的方法,还包括:
对所述第一输出执行一个或多个抽取操作;以及
对所述第二输出执行一个或多个抽取操作。
11.根据权利要求1所述的方法,还包括:
将所述第一输出与所述第二输出进行比较;
响应于所述第一输出具有比所述第二输出高的信噪比,执行所述第一组麦克风混合操作以生成与所述第一子带相关联的所述第一自适应混合器输出;以及
响应于所述第一输出具有比所述第二输出低的信噪比,执行所述第二组麦克风混合操作。
12.一种装置,包括:
第一麦克风阵列处理部件,其被配置为:
从多个麦克风接收多个麦克风信号;
生成第一麦克风阵列处理信号,其中所述第一麦克风阵列处理信号与包括多个子带的频带相关联;
第二麦克风阵列处理部件,其被配置为:
从所述多个麦克风接收所述多个麦克风信号;
生成第二麦克风阵列处理信号,其中所述第二麦克风阵列处理信号与包括所述多个子带的所述频带相关联;
第一带分析滤波器部件,其被配置为基于所述第一麦克风阵列处理信号生成第一输出,其中所述第一输出对应于所述多个子带中的第一子带;
第二带分析滤波器部件,其被配置为基于所述第二麦克风阵列处理信号生成第二输出,其中所述第二输出对应于所述第一子带;以及
第一自适应混合部件,其与所述第一子带相关联,其中所述第一自适应混合部件被配置为基于所述第一输出与所述第二输出的比较来生成与所述第一子带相关联的第一自适应混合器输出。
13.根据权利要求12所述的装置,其中所述第一自适应混合部件被配置为:
当所述第一输出具有比所述第二输出高的信噪比时,执行第一组麦克风混合操作以生成所述第一自适应混合器输出,其中所述第一组麦克风混合操作与风噪声减轻相关联;以及
当所述第一输出具有比所述第二输出低的信噪比时,执行第二组麦克风混合操作以生成所述第一自适应混合器输出,其中所述第二组麦克风混合操作与环境噪声减轻相关联。
14.根据权利要求12所述的装置,其中所述第一麦克风阵列处理部件被配置为对所述多个麦克风信号执行第一组波束成形操作,并且其中所述第二麦克风阵列处理部件被配置为对所述多个麦克风信号执行第二组波束成形操作。
15.根据权利要求12所述的装置,还包括:
第三带分析滤波器部件,其被配置为基于所述第一麦克风阵列处理信号生成第三输出,其中所述第三输出对应于所述多个子带中的第二子带;
第四带分析滤波器部件,其被配置为基于所述第二麦克风阵列处理信号生成第四输出,其中所述第四输出对应于所述第二子带;以及
第二自适应混合部件,其与所述第二子带相关联,其中所述第二自适应混合部件被配置为基于所述第三输出与所述第四输出的比较来生成与所述第二子带相关联的第二混合器输出。
16.根据权利要求12所述的装置,还包括:
第三带分析滤波器部件,其被配置为基于所述第一麦克风阵列处理信号生成第三输出,其中所述第三输出对应于所述多个子带中的第二子带;
第四带分析滤波器部件,其被配置为基于所述第二麦克风阵列处理信号生成第四输出,其中所述第四输出对应于所述第二子带;以及
混合部件,其与所述第二子带相关联,其中所述混合部件被配置为基于所述第三输出和所述第四输出执行与环境噪声减轻相关联的一组麦克风混合操作。
17.根据权利要求14所述的装置,其中:
所述第一子带对应于第一频率值范围,其中所述第一频率值范围中的每个频率值不大于约1KHz;以及
所述第二子带对应于第二频率值范围,其中所述第二频率值范围中的每个频率值不小于约1KHz。
18.一种系统,包括:
多个麦克风;
第一麦克风阵列处理部件,其被配置为基于从所述多个麦克风接收到的多个麦克风信号生成第一麦克风阵列处理信号,其中所述第一麦克风阵列处理信号与包括多个子带的频带相关联;
第二麦克风阵列处理部件,其被配置为基于从所述多个麦克风接收到的所述多个麦克风信号生成第二麦克风阵列处理信号,其中所述第二麦克风阵列处理信号与包括所述多个子带的所述频带相关联;
第一带分析滤波器部件,其被配置为基于所述第一麦克风阵列处理信号生成第一输出,其中所述第一输出对应于所述多个子带中的第一子带;
第二带分析滤波器部件,其被配置为基于所述第二麦克风阵列处理信号生成第二输出,其中所述第二输出对应于所述第一子带;
第一自适应混合部件,其与所述第一子带相关联,其中所述第一自适应混合部件被配置为基于所述第一输出与所述第二输出的比较来生成与所述第一子带相关联的第一自适应混合器输出;以及
第一合成部件,其与所述第一自适应混合部件相关联,所述第一合成部件被配置为基于所述第一自适应混合器输出生成第一合成子带输出信号。
19.根据权利要求18所述的系统,还包括:
第三带分析滤波器部件,其被配置为基于所述第一麦克风阵列处理信号生成第三输出,其中所述第三输出对应于所述多个子带中的第二子带;
第四带分析滤波器部件,其被配置为基于所述第二麦克风阵列处理信号生成第四输出,其中所述第四输出对应于所述第二子带;
第二自适应混合部件,其与所述第二子带相关联,其中所述第二自适应混合部件被配置为基于所述第三输出与所述第四输出的比较来生成与所述第二子带相关联的第二自适应混合器输出;
第二合成部件,其与所述第二自适应混合部件相关联,所述第二合成部件被配置为基于所述第二自适应混合器输出生成第二合成子带输出信号;以及
组合器,用于基于多个合成子带输出信号生成音频输出信号,所述多个合成子带输出信号至少包括所述第一合成子带输出信号和所述第二合成子带输出信号。
20.根据权利要求18所述的系统,其中所述多个麦克风包括至少一个全向麦克风和至少一个定向麦克风,并且其中所述多个麦克风被布置在耳机内。
CN201680019380.0A 2015-03-30 2016-03-29 子带信号的自适应混合 Active CN107409255B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/672,683 US9838782B2 (en) 2015-03-30 2015-03-30 Adaptive mixing of sub-band signals
US14/672,683 2015-03-30
PCT/US2016/024736 WO2016160821A1 (en) 2015-03-30 2016-03-29 Adaptive mixing of sub-band signals

Publications (2)

Publication Number Publication Date
CN107409255A true CN107409255A (zh) 2017-11-28
CN107409255B CN107409255B (zh) 2020-01-21

Family

ID=55745834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680019380.0A Active CN107409255B (zh) 2015-03-30 2016-03-29 子带信号的自适应混合

Country Status (5)

Country Link
US (1) US9838782B2 (zh)
EP (1) EP3278572B1 (zh)
JP (1) JP6547003B2 (zh)
CN (1) CN107409255B (zh)
WO (1) WO2016160821A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110767247A (zh) * 2019-10-29 2020-02-07 支付宝(杭州)信息技术有限公司 语音信号处理方法、声音采集装置和电子设备
WO2020252972A1 (zh) * 2019-06-20 2020-12-24 潍坊歌尔微电子有限公司 耳机的麦克风阵列降噪方法、装置、耳机及tws耳机

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US10117021B1 (en) * 2017-03-31 2018-10-30 Polycom, Inc. Audio feedback reduction utilizing adaptive filters and nonlinear processing
IT201700040732A1 (it) * 2017-04-12 2018-10-12 Inst Rundfunktechnik Gmbh Verfahren und vorrichtung zum mischen von n informationssignalen
US10229698B1 (en) * 2017-06-21 2019-03-12 Amazon Technologies, Inc. Playback reference signal-assisted multi-microphone interference canceler
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
US10581481B1 (en) * 2018-09-18 2020-03-03 Battelle Energy Alliance, Llc Communication device, spread-spectrum receiver, and related method using normalized matched filter for improving signal-to-noise ratio in harsh environments
US10938992B1 (en) 2019-05-06 2021-03-02 Polycom, Inc. Advanced audio feedback reduction utilizing adaptive filters and nonlinear processing
US11062723B2 (en) * 2019-09-17 2021-07-13 Bose Corporation Enhancement of audio from remote audio sources

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1565144A (zh) * 2001-08-08 2005-01-12 数字信号处理工厂有限公司 使用过采样滤波器组的定向音频信号处理
US20060013412A1 (en) * 2004-07-16 2006-01-19 Alexander Goldin Method and system for reduction of noise in microphone signals
US20070217629A1 (en) * 2006-03-14 2007-09-20 Starkey Laboratories, Inc. System for automatic reception enhancement of hearing assistance devices
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
WO2013172827A1 (en) * 2012-05-16 2013-11-21 Nuance Communications, Inc. Speech communication system for combined voice recognition, hands-free telephony and in-communication
CN103986995A (zh) * 2013-02-07 2014-08-13 奥迪康有限公司 减少音频处理装置中的不相关噪声的方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049607A (en) * 1998-09-18 2000-04-11 Lamar Signal Processing Interference canceling method and apparatus
US7206421B1 (en) * 2000-07-14 2007-04-17 Gn Resound North America Corporation Hearing system beamformer
US6748086B1 (en) * 2000-10-19 2004-06-08 Lear Corporation Cabin communication system without acoustic echo cancellation
US20060227976A1 (en) * 2005-04-07 2006-10-12 Gennum Corporation Binaural hearing instrument systems and methods
EP1732352B1 (en) 2005-04-29 2015-10-21 Nuance Communications, Inc. Detection and suppression of wind noise in microphone signals
JP4724054B2 (ja) * 2006-06-15 2011-07-13 日本電信電話株式会社 特定方向収音装置、特定方向収音プログラム、記録媒体
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
US8912522B2 (en) 2009-08-26 2014-12-16 University Of Maryland Nanodevice arrays for electrical energy storage, capture and management and method for their formation
US8798278B2 (en) 2010-09-28 2014-08-05 Bose Corporation Dynamic gain adjustment based on signal to ambient noise level
US8488829B2 (en) 2011-04-01 2013-07-16 Bose Corporartion Paired gradient and pressure microphones for rejecting wind and ambient noise
US8620650B2 (en) 2011-04-01 2013-12-31 Bose Corporation Rejecting noise with paired microphones
JP6371516B2 (ja) * 2013-11-15 2018-08-08 キヤノン株式会社 音響信号処理装置および方法
US9886966B2 (en) * 2014-11-07 2018-02-06 Apple Inc. System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1565144A (zh) * 2001-08-08 2005-01-12 数字信号处理工厂有限公司 使用过采样滤波器组的定向音频信号处理
CN100534221C (zh) * 2001-08-08 2009-08-26 艾玛复合信号公司 用于使用过采样滤波器组处理定向音频信号的方法和系统
US20060013412A1 (en) * 2004-07-16 2006-01-19 Alexander Goldin Method and system for reduction of noise in microphone signals
US20070217629A1 (en) * 2006-03-14 2007-09-20 Starkey Laboratories, Inc. System for automatic reception enhancement of hearing assistance devices
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
WO2013172827A1 (en) * 2012-05-16 2013-11-21 Nuance Communications, Inc. Speech communication system for combined voice recognition, hands-free telephony and in-communication
CN103986995A (zh) * 2013-02-07 2014-08-13 奥迪康有限公司 减少音频处理装置中的不相关噪声的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020252972A1 (zh) * 2019-06-20 2020-12-24 潍坊歌尔微电子有限公司 耳机的麦克风阵列降噪方法、装置、耳机及tws耳机
CN110767247A (zh) * 2019-10-29 2020-02-07 支付宝(杭州)信息技术有限公司 语音信号处理方法、声音采集装置和电子设备
CN110767247B (zh) * 2019-10-29 2021-02-19 支付宝(杭州)信息技术有限公司 语音信号处理方法、声音采集装置和电子设备

Also Published As

Publication number Publication date
EP3278572B1 (en) 2020-11-18
CN107409255B (zh) 2020-01-21
EP3278572A1 (en) 2018-02-07
JP6547003B2 (ja) 2019-07-17
WO2016160821A1 (en) 2016-10-06
JP2018513625A (ja) 2018-05-24
US20160295322A1 (en) 2016-10-06
US9838782B2 (en) 2017-12-05

Similar Documents

Publication Publication Date Title
CN107409255A (zh) 子带信号的自适应混合
US8965003B2 (en) Signal processing using spatial filter
US8180067B2 (en) System for selectively extracting components of an audio input signal
US7386135B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
JP4690072B2 (ja) マイクロフォン・アレイを使用するビーム・フォーミングのシステムおよび方法
US8880396B1 (en) Spectrum reconstruction for automatic speech recognition
US9521486B1 (en) Frequency based beamforming
US20150063589A1 (en) Method, apparatus, and manufacture of adaptive null beamforming for a two-microphone array
US10623854B2 (en) Sub-band mixing of multiple microphones
Reddy et al. Unambiguous speech DOA estimation under spatial aliasing conditions
EP1913591B1 (en) Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dependance of the background noise
US9406293B2 (en) Apparatuses and methods to detect and obtain desired audio
CN108735228B (zh) 语音波束形成方法及系统
AU2020316738B2 (en) Speech-tracking listening device
JPWO2018167921A1 (ja) 信号処理装置
Al-Ali et al. Enhanced forensic speaker verification performance using the ICA-EBM algorithm under noisy and reverberant environments
Seltzer et al. Subband parameter optimization of microphone arrays for speech recognition in reverberant environments
EP4171064A1 (en) Spatial dependent feature extraction in neural network based audio processing
McCowan et al. Adaptive parameter compensation for robust hands-free speech recognition using a dual beamforming microphone array
Yu et al. Deep Audio Zooming: Beamwidth-Controllable Neural Beamformer
Zhang et al. A frequency domain approach for speech enhancement with directionality using compact microphone array.
Yang et al. Binaural Angular Separation Network
Mora-Regalado et al. SMCS: Automatic Real-Time Classification of Ambient Sounds, Based on a Deep Neural Network and Mel Frequency Cepstral Coefficients
CN117121104A (zh) 估计用于处理所获取的声音数据的优化掩模
Beh et al. Adaptive interference rejection using generalized sidelobe canceller in spherical harmonics domain

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant