CN101369427A - 通过组合的波束形成和后滤波的降噪 - Google Patents

通过组合的波束形成和后滤波的降噪 Download PDF

Info

Publication number
CN101369427A
CN101369427A CNA2008101473859A CN200810147385A CN101369427A CN 101369427 A CN101369427 A CN 101369427A CN A2008101473859 A CNA2008101473859 A CN A2008101473859A CN 200810147385 A CN200810147385 A CN 200810147385A CN 101369427 A CN101369427 A CN 101369427A
Authority
CN
China
Prior art keywords
signal
wave beam
noise contribution
power density
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101473859A
Other languages
English (en)
Other versions
CN101369427B (zh
Inventor
马库斯·巴克
托拜厄斯·沃尔夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Harman Becker Automotive Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman Becker Automotive Systems GmbH filed Critical Harman Becker Automotive Systems GmbH
Publication of CN101369427A publication Critical patent/CN101369427A/zh
Application granted granted Critical
Publication of CN101369427B publication Critical patent/CN101369427B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/25Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix

Abstract

本发明涉及用于音频信号处理的方法,包括通过麦克风阵列检测音频信号以获得麦克风信号(ym);通过波束形成装置(11)处理麦克风信号(ym)以获得波束形成的信号(A);通过阻塞矩阵装置(12)处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分(Um)获得平均短时功率密度(V);基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度并且基于波束形成的信号(A)的噪声成分(An)的估计的功率密度(
Figure 200810147385.9_AB_0
),对波束形成的信号(A)进行后滤波以获得增强的波束形成的信号(P)。

Description

通过组合的波束形成和后滤波的降噪
技术领域
本发明涉及电子辅助通信环境中的音频信号的降噪技术。具体而言,本发明涉及麦克风信号的波束形成和波束形成的信号的后滤波以获得增强的声学信号,尤其是语音信号。
背景技术
相互发射和接收音频信号,尤其是语音信号的双方双向语音通信通常遭受背景噪声引起的音频信号的质量的衰减。噪声环境中的背景噪声可能严重影响声音交流的质量和可理解性,且在最坏情况,可能导致通信的完全中断。
一个突出的示例是交通工具中的免持语音通信。免持电话提供尤其用于机动车辆的舒适和安全的通信系统。在免持电话的情况下,强制抑制噪声以确保通信。例如由于车辆的速度和道路噪声,噪声信号的幅度和频率是随时间变化的。
在现有技术中,采用谱减法的单通道降噪方法是公知的。例如,语音信号通过某些子带滤波装置被分割成子带,且降噪算法被应用于每一个子带。然而,这些方法(大多数)限制于平稳噪声扰动(stationarynoise perturbation)和正信噪距离(positive signal-to-noise distance)。因为根据这些方法,扰动不能消除,而是抑制了被噪声影响的频谱分量,所以处理的语音信号失真。因而语音信号的可理解性通常不能得到充分改善。
在远距离谈话语音获取中改善信号质量的另一方法是利用多通道系统,即麦克风阵列,例如,如在“Microphone Arrays:Signal ProcessingTechniques and Applications”,eds.Brandstein,M.and Ward,D.,Springer,Berlin 2001中所描述的麦克风阵列。执行多个麦克风信号的波束形成以获得增强的声学信号。
当前的多通道系统主要使用所谓的“广义旁瓣相消器”(GSC),例如,见“An alternative approach to linearly constrained adaptivebeamforming”,by Griffiths,L.J.and Jim,C.W.,IEEE Transactions onAntennas and Propagation,vol.30.,p.27,1982。GSC包括两个信号处理路径:具有阻塞矩阵和自适应噪声相消装置的第一(或下)自适应路径以及具有固定波束形成器的第二(或上)非自适应路径。
固定波束形成器例如使用固定波束图案通过用于时间延迟补偿的装置改善预处理的信号。自适应处理方法的特征在于系统操作过程中诸如滤波器系数之类的处理参数的持久自适应。GSC的下信号处理路径被优化以产生用于减去固定波束形成器的输出信号的残余噪声的噪声参考信号。降噪信号处理路径通常包括接收语音信号且用于产生噪声参考信号的阻塞矩阵。在最简单的实现中,阻塞矩阵执行对接收的信号的相邻通道的减法。
然而,由于用于自适应所需的有限的收敛时间,自适应波束形成器在随时间高度变换的扰动的情况中并不是很成功。另一方面,非平稳扰动在真实生活应用中是极其普遍的。
因而,需要用于在麦克风信号的波束形成的环境中进行降噪的改进的方法和系统。
发明内容
鉴于上述情况,在本发明中,提供一种用于音频信号处理的方法,包括:
通过麦克风阵列检测音频信号,尤其是语音信号,以获得麦克风信号(ym);
通过波束形成装置(11)处理麦克风信号(ym)以获得波束形成的信号(A);
通过阻塞矩阵装置(12)处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分(noise contribution)的(频谱)功率密度(Um);
处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V);
基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的(频谱)功率密度;以及
基于波束形成的信号(A)的噪声成分(An)的估计的(频谱)功率密度对波束形成的信号(A)进行后滤波以获得增强的波束形成的信号(P)。
麦克风阵列包括很多(M个)麦克风,具体而言,方向性麦克风。每个麦克风检测声音,例如,口头说话,并产生麦克风信号ym(m=1,..,M)。本发明的目的是通过降噪增强这些麦克风信号。为了获得该目的,麦克风信号被波束形成装置(例如本领域中已知的固定(非自适应)波束形成器)波束形成,且被设计成获得噪声信号的阻塞矩阵装置处理,所述噪声信号代表麦克风信号中存在的噪声。
在下面的描述中,假设在子带域中而不是离散时间域中执行信号处理。然而,原则上,本发明可应用于时间和频谱信号表达二者。对于子带体制中的处理,麦克风信号(ym)可通过分析滤波器组分成子带以获得在时间k用于频率子带Ωμ的子带信号
Figure A200810147385D00072
(虚数单元由j表示)。类似地,增强的波束形成的信号(P)可以被合成滤波器组滤波以获得增强的音频信号,例如,降噪的语音信号。
如本领域已知的,子带域中的波束形成的信号代表在时间k用于频率子带Ωμ的离散傅立叶变换系数
Figure A200810147385D00073
波束形成装置的这个输出信号被后滤波以用于降噪。注意,波束形成的信号可以是已经通过阻塞矩阵装置获得的每个麦克风信号(ym)的(功率密度)噪声成分的方式而获得的降噪的信号。例如,当通过采用延迟求和(delay-and-sum)的波束形成器的广义旁瓣相消器(GSC)实现时,对于获得的波束形成的信号每个麦克风信号的噪声成分已经被减去。在这种情况下,后滤波处理移除了在通过GSC对麦克风信号进行处理之后仍存在的残余噪声。
而且,可以采用自适应加权求和波束形成器,其组合M个麦克风的时间校准信号(time aligned signal)ym,以通过采用滤波(波束形成)权重获得一个输出信号,该滤波权重不是在固定波束形成器情况下的与时间无关的权重,但是如有需要,该自适应加权求和波束形成器必须被重复地计算以例如维持所需方向中的灵敏度且最小化噪声源方向中的灵敏度。
本发明的一个本质特征在于基于波束形成的信号(A)的噪声成分(An)的估计的(频谱)功率密度实施波束形成的信号(A)的后滤波处理,其中基于获得的每个麦克风信号(ym)的噪声成分的短时功率密度(V)获得估计的(频谱)功率密度
Figure A200810147385D00082
V ( e j Ω μ , k ) = 1 M Σ m = 1 M U m ( e j Ω μ , k ) U * m ( e j Ω μ , k )
其中M表示麦克风的数目且星号表示共轭复数。在每个子带中,
Figure A200810147385D00084
表示麦克风信号ym(1)中存在的噪声成分的(频谱)功率密度(在麦克风信号的子带滤波之后)。
与现有技术提出的解决方案相比,用于对波束形成的信号进行滤波的波束形成的信号的噪声成分的功率密度的估计的每个麦克风信号的噪声成分的平均短时功率密度的使用导致显著增强(降噪)的波束形成的信号。
对波束形成装置的输出进行后滤波的步骤优选地可以通过某些维纳类滤波器(Wiener like filter)实现。这种滤波器的滤波特征根据波束形成信号的噪声成分的估计的功率密度进行适应。
使用每个麦克风信号的噪声成分的平均短时功率密度以获得用于对波束形成装置的输出信号进行滤波的后滤波装置的滤波系数的有效方法是将每个麦克风信号(ym)的噪声成分的短时功率密度(V)与在k时刻用于频带Ωμ的实数因子
Figure A200810147385D00085
相乘,其中实数因子
Figure A200810147385D00086
被适应以满足期望值E的关系。
E { A ~ n ( e j Ω μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e j Ω μ , k ) = 0 }
其中
Figure A200810147385D00088
Figure A200810147385D00089
Figure A200810147385D000810
分别表示波束形成的信号(A)的噪声成分(An)的估计的功率密度
Figure A200810147385D000811
波束形成信号(A)的噪声成分以及波束形成装置的期望输出信号的部分(A=An+As)。如果处理的被麦克风阵列的M个麦克风探测的音频信号是语音信号,实数系数
Figure A200810147385D000812
的适应优选地仅在语音停顿,即理想地满足 A s ( e j Ω μ , k ) = 0 的时段中实施。
如上所述,对波束形成的信号(A)进行后滤波的步骤可以包括(或由以下步骤组成)通过维纳滤波装置
Figure A200810147385D00091
对波束形成的信号(A)进行滤波以根据 P ( e jΩ μ , k ) = H ( e jΩ μ , k ) A ( e jΩ μ , k ) 获得增强的波束形成的信号(P),其中
H ( e jΩ μ , k ) = 1 - Y ^ a ( e j Ω μ , k ) - 1 ,
其中
Figure A200810147385D00094
表示用于
Figure A200810147385D00095
的估计,其中
Figure A200810147385D00096
是k时刻用于频率子带Ωμ的波束形成的信号
Figure A200810147385D00097
的噪声成分。而
Figure A200810147385D00098
可以容易地从波束形成装置的输出获得,如上所述(也参见下面的详细描述)获得
Figure A200810147385D00099
的估计(即)。这样设计的维纳滤波器的采用导致具有稳定收敛特征的非常有效和可靠的后滤波。此外,通过上述维纳类滤波器的这种后滤波装置的实现在处理器负载和时间消耗方面是有利的。
根据一个优选实施例,根据最大后验估计,通过优化获得即用于的估计。最大后验估计的方法与最大似然方法密切相关并且在现有技术中已知(例如,见M.DeGroot,“OptimalStatistical Decisions”,McGraw-Hill,1970)。最大后验估计导致非常有效地减小波束形成的信号中存在的(残余)噪声的维纳滤波特性。而用于滤波器特性的第一估计由
Figure A200810147385D000913
给出,其中 Y ~ a ( e jΩ μ , k ) = | A ( e jΩ μ , k ) | 2 / β ( e jΩ μ , k ) V ( e jΩ μ , k ) (参见上面和下面的详细描述),如下所述,能够通过最大后验估计的过程的方式进行优化。
在对数表达中,有:
Γ ~ a ( e jΩ μ , k ) = 10 log Y ~ a ( e jΩ μ , k ) = Γ a ( e jΩ μ , k ) + Δ ( e jΩ μ , k )
其中估计的实际比率为 Γ a ( e jΩ μ , k ) = 10 log { | A ( e jΩ μ , k ) | 2 | A n ( e jΩ μ , k ) | - 2 } , 且估计误差 Δ ( e jΩ μ , k ) = 10 log { | A n ( e jΩ μ , k ) | / A ~ n ( e jΩ μ , k ) } 是波束形成信号
Figure A200810147385D000920
的噪声成分的估计的功率密度的测量。在语音停顿 ( Γ a ( e jΩ μ , k ) = 0 ) 期间,估计误差
Figure A200810147385D000922
导致所谓的音乐噪声(musicalnoise)形式的伪迹。通过最大后验估计过程的方式获得估计
Figure A200810147385D000923
以减小音乐噪声。该过程的细节在下面的详细描述中描述。
本发明还提供计算机程序产品,该计算机程序产品包括一个或多个计算机可读媒介,该计算机可读媒介具有用于执行上述发明方法的示例的步骤的计算机可执行指令。
而且,此处提供一种信号处理装置,包括:
麦克风阵列,包括至少两个麦克风,所述至少两个麦克风被配置以获得检测的麦克风信号(ym);
波束形成装置,被配置成处理所述麦克风信号(ym)以获得波束形成的信号(A);
阻塞矩阵装置,被配置成处理所述麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);
处理装置,被配置成处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V);
处理装置,被配置成基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度;以及
后滤波装置,被配置成基于所述波束形成的信号(A)的噪声成分(An)的估计的功率密度
Figure A200810147385D00101
对所述波束形成的信号(A)进行滤波以获得增强的波束形成的信号(P)。
信号处理装置还可以包括分析滤波器组,被配置成对麦克风信号(ym)进行滤波以获得k时刻用于频率子带Ωμ的子带信号
Figure A200810147385D00102
以及合成滤波器组,被配置成对增强的波束形成的信号(P)进行滤波以获得增强的音频信号(p)。
具体而言,信号可以包括广义旁瓣相消器,该广义旁瓣相消器包括波束形成装置、阻塞矩阵和处理装置,该处理装置被配置成输出通过阻塞矩阵装置的方式获得的降噪的波束形成的信号。
应当注意,信号处理装置也可以被配置成通过每个麦克风信号(ym)的噪声成分的短时功率密度(V)与k时刻用于频率子带Ωμ的实数因子
Figure A200810147385D00103
的乘积估计波束形成的信号(A)的噪声成分(An)的功率密度,该实数因子
Figure A200810147385D00104
被适应以满足期望值E的关系
E { A ~ n ( e j Ω μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e j Ω μ , k ) = 0 }
其中
Figure A200810147385D00112
Figure A200810147385D00113
Figure A200810147385D00114
分别表示波束形成的信号(A)的噪声成分(An)的估计的功率密度、波束形成的信号(A)的噪声成分以及波束形成装置的期望输出信号的部分。
后滤波装置可以有利地是维纳类滤波器 H ( e jΩ μ , k ) = 1 - Y ^ a ( e j Ω μ , k ) - 1 , 其中
Figure A200810147385D00116
表示用于
Figure A200810147385D00117
的估计,其中
Figure A200810147385D00118
是k时刻用于频率子带Ωμ的波束形成的信号
Figure A200810147385D00119
的噪声成分。具体而言,根据最大后验估计,可以通过优化获得
Figure A200810147385D001110
此处揭示的信号处理装置的示例可以有利地用在各种电子通信设备中。因而,提供包括信号处理装置的上述示例之一的语音识别或语音对话装置。此外,提供包括信号处理装置的上述示例之一的免持电话机。
将参考附图描述本发明的附加特征和优点。在描述中,对附图做出引用,附图旨在说明本发明的优选实施例。应当理解这些实施例不代表本发明的全部范围。
附图说明
图1示出此处揭示的方法的实例的基本步骤,该方法用于包括GSC处理和后滤波标量(post-filter scalar)的估计的降噪;
图2示出了根据包括GSC、MAP优化装置和后滤波装置的本发明的示例的信号处理装置的组成。
具体实施方式
如图1所示,通过麦克风阵列的M个麦克风(具体而言,方向性麦克风)获得的麦克风信号ym(I),m=1,..,M被GSC(广义旁瓣相消器)处理1,其中I表示离散时间索引。GSC包括两个信号处理路径:具有阻塞矩阵和自适应噪声相消装置的第一自适应路径以及具有使用固定波束图案改善例如通过时间延迟补偿的方式进行预处理的信号的固定波束形成器的第二路径。所述阻塞矩阵被优化以产生用于减去固定波束形成器的输出信号的(残余)噪声的噪声参考信号。
如现有技术中已知的,通过GSC的方式,获得在k时刻用于频率子带Ωμ的离散傅立叶变换(DFT)系数,即子带信号,
Figure A200810147385D00121
(虚数单元由j表示)。而且,对于每个通道m,获得作为被包括在使用的GSC中的阻塞矩阵所输出的子带信号的麦克风信号ym(1)的噪声部分 U m ( e j Ω μ , k ) .
本发明的基本特征在于基于阻塞矩阵的输出
Figure A200810147385D00123
和用于对GSC的输出
Figure A200810147385D0012091500QIETU
进行后滤波3的GSC的输出确定2后滤波标量以获得降噪的DFT系数
Figure A200810147385D00127
且最终获得降噪的音频信号(期望信号)p(1)。本发明尤其考虑的有效和可靠的确定。下面,参考图2描述信号处理和本发明的信号处理装置的示例的细节。
麦克风信号ym(1)被分析滤波器组10处理以获得适于进一步处理的子带信号
Figure A200810147385D00129
分析滤波器组例如可以实现汉宁窗(Hanningwindowing)、汉明窗(Hamming windowing)或高斯窗(Gaussianwindowing)。子带信号被输入在GSC中,该GSC包括波束形成器11和阻塞矩阵12以及降噪装置13,该降噪装置13从子带信号
Figure A200810147385D001211
减去阻塞矩阵12获得的估计的噪声以获得降噪的离散傅立叶变换(DFT)系数
Figure A200810147385D001212
阻塞矩阵12是自适应型滤波装置。阻塞矩阵输出的所得的噪声信号将理想地完全阻隔输入信号内所需的或有用的信号。可以使用Walsh-Hadamard型阻塞矩阵或Griffiths-Jim阻塞矩阵。对于包括M=2n个麦克风的阵列,尤其可以建立Walsh-Hadamard阻塞矩阵。
根据本发明,GSC的输出将经过某种处理以进一步减小残余噪声。后滤波器装置14可以以维纳滤波器或谱减法滤波器的形式实现。维纳类滤波器的滤波特性为:
H ( e jΩ ) = 1 - ( S a s a s ( Ω ) + S a n a n ( Ω ) S a n a n ( Ω ) ) - 1
其中
Figure A200810147385D001214
分别表示期望信号的自动功率密度谱和GSC的输出
Figure A200810147385D00131
中包含的噪声扰动。而且,假设期望信号和噪声扰动不相关。
上述公式的括号中给出的后验信噪比(SNR)通常通过本技术领域中已知的用于平稳扰动的时间平均进行估计。然而,本发明涉及时间相关的扰动的抑制。因而,必须获得用于后滤波标量的时间相关估计
Y a ( e jΩ μ , k ) = | A ( e jΩ μ , k ) | 2 | A n ( e jΩ μ , k ) | 2
(其中An表示A的噪声部分),以用于GSC的输出的后滤波。
为了获得用于
Figure A200810147385D00134
的估计
Figure A200810147385D00135
必须通过估计An获得发声方向的信息。注意A可以直接从GSC的输出获得。An从阻塞矩阵12的输出信号获得。为了更加精确,根据本示例,通过图2的阶段15获得阻塞矩阵的输出信号的平均短时功率密度
V ( e jΩ μ , k ) = 1 M Σ m = 1 M U m ( e jΩ μ , k ) U * m ( e jΩ μ , k )
其中星号表示复数共轭。通过实数因子
Figure A200810147385D00138
可以获得用于
Figure A200810147385D00139
的估计
Figure A200810147385D001310
即, A ~ n ( e jΩ μ , k ) = β ( e jΩ μ , k ) V ( e jΩ μ , k ) . 根据本示例,实数因子
Figure A200810147385D001312
被适应以满足用于期望值E的关系
E { A ~ n ( e j Ω μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e j Ω μ , k ) = 0 }
其中是GSC的输出
Figure A200810147385D001315
的期望信号的部分。因而得到
Y ~ a ( e jΩ μ , k ) = | A ( e jΩ μ , k ) | 2 | A ~ n ( e jΩ μ , k ) | 2
通过因子获得GSC的输出的功率密度的功率自适应16和阻塞矩阵。在图2的阶段17中确定后滤波标量的估计
Figure A200810147385D001318
。在阶段18中执行后滤波标量的优化。下面描述优化处理。
根据图2所示的本示例,后滤波装置14将基于噪声功率谱密度的最大后验(MAP)估计进行自适应。MAP估计能够容易地在对数表达中获得,且因而,用于后滤波标量的对数估计可以以公式表达为:
Γ ~ a ( e jΩ μ , k ) = 10 log Y ~ a ( e jΩ μ , k ) = 10 log | A ( e jΩ μ , k ) | 2 | A n ( e jΩ μ , k ) | 2 + 10 log | A ( e jΩ μ , k ) | 2 | A ~ n ( e jΩ μ , k ) | 2
= 10 log Y a ( e jΩ μ , k ) + 10 log δ ( e jΩ μ , k )
= Γ a ( e jΩ μ , k ) + Δ ( e jΩ μ , k )
其中
Figure A200810147385D00144
代表估计误差。估计误差导致语音停顿期间所谓的音乐噪声伪迹。很明显,希望对该估计误差
Figure A200810147385D00145
进行最小化。
如下获得估计误差
Figure A200810147385D00146
的最小化。应当注意,假设
Figure A200810147385D00147
Figure A200810147385D00148
为随机变量表达。
对于给定的可观察量,即
Figure A200810147385D00149
数量被估计的概率,即
Figure A200810147385D001410
假设通过条件密度
Figure A200810147385D001411
(为简单起见,下面忽略自变量
Figure A200810147385D001412
)给出特定值。根据MAP的原理(细节参见E.
Figure A200810147385D001413
“Statistische Signale”,Springer Verlag,Berlin(Germany),2001),我们必须选择最大化
Figure A200810147385D001414
的Γa的值。
Γ ^ a = arg max ρ ( Γ a | Γ ~ a ) Γ a
通过贝叶斯准则(Bayes rule),条件密度ρ可以表达为:
其中
Figure A200810147385D001417
已知为先验密度。最大化要求:
Figure A200810147385D001418
基于经验研究,条件密度可以通过使用变量ψΔ的高斯分布来模拟:
ρ ( Γ ~ a | Γ a ) = 1 2 π ψ Δ exp ( - ( Γ ~ a - Γ a ) 2 2 ψ Δ ) .
然后,假设期望信号和扰动的实数和虚数部分可以描述为平均自由高斯(average-free Gaussians),同一变量
Figure A200810147385D001420
可以通过下式进行近似:
ρ ( Γ a ) = 1 2 π ψ Γ a ( ξ ) exp ( - ( Γ a - μ Γ a ( ξ ) ) 2 2 ψ Γ a ( ξ ) )
其中先验SNR为ξ=Ψsn ψ Γ a ( ξ ) = Kξ / ( 1 + ξ ) μ Γ a ( ξ ) = 10 log ( ξ + 1 ) , 其中K是变量
Figure A200810147385D00155
的上限。实验显示例如使用K=50可以获得满意的结果。
上述最大化需求的解导致:
Γ ^ a = Kξ Γ ~ a + ( ξ + 1 ) ψ Δ 10 log ( ξ + 1 ) Kξ + ( ξ + 1 ) ψ Δ
从该公式可以容易得出标量估计 Y ^ a = 10 Γ ^ a / 10 .
在上述等式中,即时后验SNR被表达为干扰测量值前验SNRξ以及变量ΨΔ的函数(注意,对于ΨΔ=0, Γ ^ a = Γ ~ a )。注意在ΨΔ→∞的极限中,获得标准维纳特性的滤波权重。而且,如果例如在语音停顿期间前验SNRξ可忽略,滤波器将被关闭以避免音乐噪声伪迹。
因此,为每个时刻k以及频率插入点Ωμ获得用于后滤波装置14的上述维纳特性,如下:
H ( e jΩ μ , k ) = 1 - Y ^ a - 1 ( e jΩ μ , k ) .
GSC的输出,即,DFT系数
Figure A200810147385D001511
被如上所述的自适应的后滤波装置14滤波。该滤波导致降噪的DFT系数 P ( e jΩ μ , k ) = H ( e jΩ μ , k )
Figure A200810147385D001513
最后,采用合成滤波器组19以获得全带降噪音频信号p(1)。
为了实现上述方法,必须确定参数ξ、ΨΔ和K。对于变量
Figure A200810147385D001514
的上限K,已经证明约50的值是成功的。确定先验SNRξ的已知方法是以下论文中介绍的所谓的直接决定方法:Ephraim and Malah,“SpeechEnhancement Using a Minimum Mean-Square Error Short-Time SpectralAmplitude Estimator”,IEEE Transactions on Acoustics,Speech and SignalProcessing,vol.ASSP-32,No.6,December,1984。根据该方法,ξ可以估计为:
ξ ( k ) = a ξ P ( k - 1 ) ψ ^ n ( 1 - a ξ ) F [ | A ( k ) | 2 ψ ^ n - 1 ] , 其中
F [ x ] = x , ifx > 0 0 , else , 且P(k-1)表示时间k-1时后滤波装置14的输出的DFT系数的平方幅度。实数因子aξ是近似1的平滑因子,例如为0.98。
在语音停顿中不通过时间平滑的方式确定干扰的变量的估计。而是通过递归确定
Figure A200810147385D00162
ψ ^ n ( k ) = a n ψ ^ n ( k - 1 ) + ( 1 - a n ) A ~ n ( k )
使用关于干扰的方向的空间信息。平滑因子an可以选自0.6至0.8。
最后,在语音停顿(即Ψs=0)的过程中,根据
ψ ^ Δ ( k ) = a Δ ( k ) ψ ^ Δ ( k - 1 ) + ( 1 - a Δ ( k ) ) ( Γ ~ a ( k ) ) 2 , 其中
a Δ ( k ) = a 0 , if ψ s = 0 0 , else ,
Figure A200810147385D00166
也被递归地确定,平滑因子an可以选自0.6至0.8。
所有上述实施例并不旨在限制目的,而是用作说明本发明的特征和优点的示例。应当理解某些或所有上述特征可以以不同的方式组合。

Claims (12)

1.用于音频信号处理的方法,包括:
通过麦克风阵列检测音频信号以获得麦克风信号(ym);
通过波束形成装置(11)处理麦克风信号(ym)以获得波束形成的信号(A);
通过阻塞矩阵装置(12)处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);
处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V);
基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度;以及
基于波束形成的信号(A)的噪声成分(An)的估计的功率密度
Figure A200810147385C00021
对波束形成的信号(A)进行后滤波以获得增强的波束形成的信号(P)。
2.根据权利要求1所述的方法,其中波束形成的信号(A)是通过阻塞矩阵装置获得的每个麦克风信号(ym)的噪声成分而获得的降噪信号。
3.根据权利要求1或2所述的方法,还包括:
通过分析滤波器组对麦克风信号(ym)进行滤波以获得在k时刻用于频率子带Ωμ的子带信号
Figure A200810147385C00022
以及
通过合成滤波器组对增强的波束形成的信号(P)进行滤波以获得增强的音频信号(p)。
4.根据前述权利要求中任意一项所述的方法,其中通过从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的短时功率密度(V)与在k时刻用于频率子带Ωμ的实数因子
Figure A200810147385C00023
的乘积,估计波束形成的信号(A)的噪声成分(An)的功率密度,实数因子
Figure A200810147385C00031
被适应以满足期望值E的以下关系:
E { A ~ n ( e jΩ μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e jΩ μ , k ) = 0 }
其中
Figure A200810147385C00034
Figure A200810147385C00035
分别表示波束形成的信号(A)的噪声成分(An)的估计的功率密度、波束形成的信号(A)的噪声成分以及波束形成装置的期望输出信号的部分。
5.根据前述权利要求中任意一项所述的方法,其中对波束形成的信号(A)进行后滤波的步骤包括通过维纳滤波装置
Figure A200810147385C00036
对波束形成的信号(A)进行滤波以根据 P ( e jΩ μ , k ) = H ( e jΩ μ , k ) A ( e jΩ μ , k ) 获得增强的波束形成的信号(P),其中
H ( e jΩ μ , k ) = 1 - Y ^ a ( e jΩ μ , k ) - 1 ,
其中
Figure A200810147385C00039
表示用于
Figure A200810147385C000310
的估计,其中是在k时刻用于频率子带Ωμ的波束形成的信号
Figure A200810147385C000312
的噪声成分。
6.根据权利要求5所述的方法,其中根据最大后验估计,通过优化获得即用于
Figure A200810147385C000314
的估计。
7.计算机程序产品,包括一个或多个计算机可读介质,该计算机可读介质具有用于执行如权利要求1-6中的一个的方法的步骤的计算机可执行指令。
8.信号处理装置,包括:
麦克风阵列,包括至少两个麦克风,该至少两个麦克风被配置以获得检测的麦克风信号(ym);
波束形成装置(11),被配置成处理麦克风信号(ym)以获得波束形成的信号(A):
阻塞矩阵装置(12),被配置成处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);
处理装置(15),被配置成处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V);
处理装置(16),被配置成基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度;以及
后滤波装置(14),被配置成基于波束形成的信号(A)的噪声成分(An)的估计的功率密度
Figure A200810147385C00041
对波束形成的信号(A)进行滤波以获得增强的波束形成的信号(P)。
9.根据权利要求8所述的信号处理装置,还包括:
分析滤波器组(10),被配置成对麦克风信号(ym)进行滤波以获得在k时刻用于频率子带Ωμ的子带信号
Figure A200810147385C00042
以及
合成滤波器组(19),被配置成对增强的波束形成的信号(P)进行滤波以获得增强的音频信号(p)。
10.根据权利要求8或9所述的信号处理装置,包括广义旁瓣相消器,该广义旁瓣相消器包括波束形成装置(11)、阻塞矩阵(12)和处理装置(13),该处理装置(13)被配置成输出通过阻塞矩阵装置(12)获得的降噪的波束形成的信号。
11.语音识别或语音会话装置,包括根据权利要求8-10中的一个所述的信号处理装置。
12.免持电话机,包括根据权利要求8-10中的一个所述的信号处理装置。
CN2008101473859A 2007-08-13 2008-08-13 用于音频信号处理的方法和装置 Expired - Fee Related CN101369427B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07015908A EP2026597B1 (en) 2007-08-13 2007-08-13 Noise reduction by combined beamforming and post-filtering
EP07015908.2 2007-08-13

Publications (2)

Publication Number Publication Date
CN101369427A true CN101369427A (zh) 2009-02-18
CN101369427B CN101369427B (zh) 2012-07-04

Family

ID=38982719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101473859A Expired - Fee Related CN101369427B (zh) 2007-08-13 2008-08-13 用于音频信号处理的方法和装置

Country Status (8)

Country Link
US (1) US8180069B2 (zh)
EP (1) EP2026597B1 (zh)
JP (1) JP5436814B2 (zh)
KR (1) KR101526932B1 (zh)
CN (1) CN101369427B (zh)
AT (1) ATE448649T1 (zh)
CA (1) CA2638469A1 (zh)
DE (1) DE602007003220D1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102376309A (zh) * 2010-08-17 2012-03-14 骅讯电子企业股份有限公司 降低环境噪音的系统、方法与应用的装置
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
CN105427860A (zh) * 2015-11-11 2016-03-23 百度在线网络技术(北京)有限公司 远场语音识别方法和装置
TWI581255B (zh) * 2015-06-30 2017-05-01 芋頭科技(杭州)有限公司 前端音頻處理系統
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN107071635A (zh) * 2015-11-20 2017-08-18 哈曼贝克自动系统股份有限公司 音频增强
CN109326301A (zh) * 2017-07-27 2019-02-12 哈曼贝克自动系统股份有限公司 自适应后滤波
CN109616134A (zh) * 2017-10-04 2019-04-12 国光电器股份有限公司 多通道子带处理
WO2019223650A1 (zh) * 2018-05-22 2019-11-28 出门问问信息科技有限公司 一种波束成形方法、多波束成形方法、装置及电子设备
CN110692257A (zh) * 2017-05-29 2020-01-14 哈曼贝克自动系统股份有限公司 声音捕获
CN111863000A (zh) * 2019-04-30 2020-10-30 北京嘀嘀无限科技发展有限公司 音频处理方法、装置、电子设备及可读存储介质
CN112201273A (zh) * 2019-07-08 2021-01-08 北京声智科技有限公司 一种噪声功率谱密度计算方法、系统、设备及介质

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8296135B2 (en) * 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
KR101581885B1 (ko) * 2009-08-26 2016-01-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
ES2906085T3 (es) 2009-10-21 2022-04-13 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
US9215527B1 (en) * 2009-12-14 2015-12-15 Cirrus Logic, Inc. Multi-band integrated speech separating microphone array processor with adaptive beamforming
JP5678445B2 (ja) * 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US8538035B2 (en) * 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5573517B2 (ja) * 2010-09-07 2014-08-20 ソニー株式会社 雑音除去装置および雑音除去方法
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
US8675881B2 (en) 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
CN103295582B (zh) * 2012-03-02 2016-04-20 联芯科技有限公司 噪声抑制方法及其系统
US9538285B2 (en) * 2012-06-22 2017-01-03 Verisilicon Holdings Co., Ltd. Real-time microphone array with robust beamformer and postfilter for speech enhancement and method of operation thereof
EP3462452A1 (en) 2012-08-24 2019-04-03 Oticon A/s Noise estimation for use with noise reduction and echo cancellation in personal communication
CN103730123A (zh) * 2012-10-12 2014-04-16 联芯科技有限公司 噪声抑制中衰减因子的估计方法和装置
TWI524705B (zh) * 2013-05-15 2016-03-01 瑞昱半導體股份有限公司 通訊系統校正方法以及通訊系統校正裝置
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US9978387B1 (en) * 2013-08-05 2018-05-22 Amazon Technologies, Inc. Reference signal generation for acoustic echo cancellation
TW201507489A (zh) * 2013-08-09 2015-02-16 Nat Univ Tsing Hua 利用陣列麥克風消除迴聲的方法
US9437212B1 (en) * 2013-12-16 2016-09-06 Marvell International Ltd. Systems and methods for suppressing noise in an audio signal for subbands in a frequency domain based on a closed-form solution
WO2015141103A1 (ja) * 2014-03-17 2015-09-24 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP2016042132A (ja) 2014-08-18 2016-03-31 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
KR101649198B1 (ko) 2015-06-19 2016-08-18 국방과학연구소 빔형성 정보 기반 최적 스무딩 필터를 이용한 객체 궤적 추정 방법 및 장치
US9721582B1 (en) 2016-02-03 2017-08-01 Google Inc. Globally optimized least-squares post-filtering for speech enhancement
EP3529986A1 (en) * 2016-12-23 2019-08-28 Huawei Technologies Co., Ltd. Low complexity mixed domain collaborative in-loop filter for lossy video coding
CN110731088B (zh) 2017-06-12 2022-04-19 雅马哈株式会社 信号处理装置、远程会议装置以及信号处理方法
WO2021003334A1 (en) 2019-07-03 2021-01-07 The Board Of Trustees Of The University Of Illinois Separating space-time signals with moving and asynchronous arrays
WO2021070278A1 (ja) * 2019-10-09 2021-04-15 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
CN110782913A (zh) * 2019-10-30 2020-02-11 通用微(深圳)科技有限公司 一种基于通用mcu的波束成形语音增强算法的实现

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
AU2002348779A1 (en) * 2002-01-09 2003-07-24 Koninklijke Philips Electronics N.V. Audio enhancement system having a spectral power ratio dependent processor
EP1475997A3 (en) 2003-05-09 2004-12-22 Harman/Becker Automotive Systems GmbH Method and system for communication enhancement in a noisy environment
JP4989967B2 (ja) * 2003-07-11 2012-08-01 コクレア リミテッド ノイズ低減のための方法および装置
CN1212608C (zh) * 2003-09-12 2005-07-27 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
CN1947171B (zh) * 2004-04-28 2011-05-04 皇家飞利浦电子股份有限公司 自适应波束形成器、旁瓣抑制器、自动语音通信设备
EP1640971B1 (en) 2004-09-23 2008-08-20 Harman Becker Automotive Systems GmbH Multi-channel adaptive speech signal processing with noise reduction
CN1753094A (zh) * 2004-09-23 2006-03-29 精碟科技股份有限公司 光信息储存媒体的制造方法
WO2007026827A1 (ja) * 2005-09-02 2007-03-08 Japan Advanced Institute Of Science And Technology マイクロホンアレイ用ポストフィルタ
DE102005047047A1 (de) * 2005-09-30 2007-04-12 Siemens Audiologische Technik Gmbh Mikrofonkalibrierung bei einem RGSC-Beamformer

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102376309A (zh) * 2010-08-17 2012-03-14 骅讯电子企业股份有限公司 降低环境噪音的系统、方法与应用的装置
CN102376309B (zh) * 2010-08-17 2013-12-04 骅讯电子企业股份有限公司 降低环境噪音的系统、方法与应用的装置
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
TWI581255B (zh) * 2015-06-30 2017-05-01 芋頭科技(杭州)有限公司 前端音頻處理系統
CN105427860A (zh) * 2015-11-11 2016-03-23 百度在线网络技术(北京)有限公司 远场语音识别方法和装置
CN107071635A (zh) * 2015-11-20 2017-08-18 哈曼贝克自动系统股份有限公司 音频增强
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN106710601B (zh) * 2016-11-23 2020-10-13 合肥美的智能科技有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN110692257A (zh) * 2017-05-29 2020-01-14 哈曼贝克自动系统股份有限公司 声音捕获
CN110692257B (zh) * 2017-05-29 2021-11-02 哈曼贝克自动系统股份有限公司 声音捕获
CN109326301A (zh) * 2017-07-27 2019-02-12 哈曼贝克自动系统股份有限公司 自适应后滤波
CN109616134A (zh) * 2017-10-04 2019-04-12 国光电器股份有限公司 多通道子带处理
WO2019223650A1 (zh) * 2018-05-22 2019-11-28 出门问问信息科技有限公司 一种波束成形方法、多波束成形方法、装置及电子设备
CN111863000A (zh) * 2019-04-30 2020-10-30 北京嘀嘀无限科技发展有限公司 音频处理方法、装置、电子设备及可读存储介质
CN112201273A (zh) * 2019-07-08 2021-01-08 北京声智科技有限公司 一种噪声功率谱密度计算方法、系统、设备及介质

Also Published As

Publication number Publication date
KR20090017435A (ko) 2009-02-18
JP2009049998A (ja) 2009-03-05
CN101369427B (zh) 2012-07-04
EP2026597A1 (en) 2009-02-18
US8180069B2 (en) 2012-05-15
EP2026597B1 (en) 2009-11-11
KR101526932B1 (ko) 2015-06-08
CA2638469A1 (en) 2009-02-13
ATE448649T1 (de) 2009-11-15
US20090067642A1 (en) 2009-03-12
DE602007003220D1 (de) 2009-12-24
JP5436814B2 (ja) 2014-03-05

Similar Documents

Publication Publication Date Title
CN101369427B (zh) 用于音频信号处理的方法和装置
CN110085248B (zh) 个人通信中降噪和回波消除时的噪声估计
Benesty et al. Speech enhancement in the STFT domain
CN101510426B (zh) 一种噪声消除方法及系统
EP2081189B1 (en) Post-filter for beamforming means
Gannot et al. Adaptive beamforming and postfiltering
EP2237271B1 (en) Method for determining a signal component for reducing noise in an input signal
EP2245861B1 (en) Enhanced blind source separation algorithm for highly correlated mixtures
CN101192411B (zh) 大距离麦克风阵列噪声消除的方法和噪声消除系统
WO2007026827A1 (ja) マイクロホンアレイ用ポストフィルタ
Song et al. An integrated multi-channel approach for joint noise reduction and dereverberation
Freudenberger et al. Microphone diversity combining for in-car applications
Kim et al. Probabilistic spectral gain modification applied to beamformer-based noise reduction in a car environment
Pfeifenberger et al. Blind source extraction based on a direction-dependent a-priori SNR.
Li et al. Adaptive β-order generalized spectral subtraction for speech enhancement
Buck et al. A compact microphone array system with spatial post-filtering for automotive applications
CN102598128A (zh) 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质
Chen et al. Filtering techniques for noise reduction and speech enhancement
Martın-Donas et al. A postfiltering approach for dual-microphone smartphones
Malek et al. Informed generalized sidelobe canceler utilizing sparsity of speech signals
Zhang et al. A robust speech enhancement method based on microphone array
Kim et al. Generalized optimal multi-microphone speech enhancement using sequential minimum variance distortionless response (MVDR) beamforming and postfiltering
Nordholm¹ et al. 10 Adaptive Microphone Array Employing Spatial Quadratic Soft Constraints and Spectral Shaping
Kim Interference suppression using principal subspace modification in multichannel wiener filter and its application to speech recognition
Kim et al. Adaptation mode control with residual noise estimation for beamformer-based multi-channel speech enhancement

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: NUANCE COMMUNICATIONS INC.

Free format text: FORMER OWNER: HARMANBECKER AUTOMOTIVE ELECTRONIC SYSTEMS CO,. LTD.

Effective date: 20100421

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: KARLSBAD, GERMANY TO: MASSACHUSETTS, U.S.A.

TA01 Transfer of patent application right

Effective date of registration: 20100421

Address after: Massachusetts, USA

Applicant after: Nuance Communications Inc

Address before: Carlsbad

Applicant before: Harman Becker Automotive Sys

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20200813

CF01 Termination of patent right due to non-payment of annual fee