CN112017684B - 一种基于麦克风阵列的密闭空间混响消除方法 - Google Patents

一种基于麦克风阵列的密闭空间混响消除方法 Download PDF

Info

Publication number
CN112017684B
CN112017684B CN202010880441.0A CN202010880441A CN112017684B CN 112017684 B CN112017684 B CN 112017684B CN 202010880441 A CN202010880441 A CN 202010880441A CN 112017684 B CN112017684 B CN 112017684B
Authority
CN
China
Prior art keywords
signal
reverberation
microphone
constraint
minimum variance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010880441.0A
Other languages
English (en)
Other versions
CN112017684A (zh
Inventor
闵新宇
郭申
张琨
赵伯阳
郭庆鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Computer Technology and Applications
Original Assignee
Beijing Institute of Computer Technology and Applications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Computer Technology and Applications filed Critical Beijing Institute of Computer Technology and Applications
Priority to CN202010880441.0A priority Critical patent/CN112017684B/zh
Publication of CN112017684A publication Critical patent/CN112017684A/zh
Application granted granted Critical
Publication of CN112017684B publication Critical patent/CN112017684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种基于麦克风阵列的密闭空间混响消除方法,属于计算机、语音信号技术领域。本发明提出的基于麦克风阵列的混响消除方法,其认为阵列中各通道之间的语音信号是相关的,而噪声是不相干的,通过将含混响信号在时域上分为直达信号和经反射信号,在频域上分为低频信号与高频信号,对含混响语音信号从时域和频域上进行分时和分频的处理,利用基于线性约束最小方差后置维纳滤波的方法,在约束方程中增加了分时和分频的处理方式,求得最优权矢量,实现了基于麦克风阵列的混响消除,采用这种方式能在抑制混响的前提下突出不同频率信号的声纹特性,有利于后续语音识别工作的开展,具有计算量小、通用性、灵活性高、易于实现,应用范围广的特点。

Description

一种基于麦克风阵列的密闭空间混响消除方法
技术领域
本发明属于计算机、语音信号技术领域,具体涉及一种基于麦克风阵列的密闭空间混响消除方法。
背景技术
随着计算机、人工智能技术的发展,人们对语音控制的需求越来越大,在指挥控制系统、会议系统、智能家居等领域,使用语音控制设备能够减轻使用者的操作难度,降低出现误操作的可能性,提高设备的可用性。但上述应用系统往往部署在密闭狭小的空间中,语音信号在其中会产生回声与混响,影响麦克风接收到的信号的听觉感受和语音可懂度,同时,该空间中可能存在多个说话者,利用现有的技术从包含多个人声音的语音中区分出某一个人的声音是很困难的。传统的解决以上问题的方法主要是利用麦克风阵列作为语音信号的采集设备,麦克风阵列是指将多个麦克风按照一定的空间位置排布形成阵列,如图1所示,其可以采集到信号中除了时域和频域外的空间域信息,实现对语音信号定向采集的目的,但是由于语音信号在狭小空间中会产生混响,且不同频率信号的混响效果并不相同,传统方法的去混响效果有限,因此,需要提出一种密闭空间混响消除方法。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何有效解决密闭空间中的语音采集问题。
(二)技术方案
为了解决上述技术问题,本发明提供了一种基于麦克风阵列的密闭空间混响消除方法,包括以下步骤:
(1)利用含混响语音信号的数学模型推导出,混响存在时麦克风阵列接收到信号的功率谱,利用线性约束最小方差准则,在保证期望信号增益的情况下,使输出功率最小,依据此线性约束最小方差准则确定约束方程;
(2)依据麦克风接收到的信号存在时间延迟的特点,将含混响语音信号的冲激响应分为直达部分和经反射到达部分;
(3)依据麦克风接收到的信号频带范围较宽的特点,将含混响语音信号分为高频和低频两部分,分别计算各自的滤波器系数;将时域上分解的冲激响应和频域上分解的滤波器系数结合,对步骤1得到的约束方程进行改造,求得最优权矢量的值。
本发明还提供了一种所述的方法在麦克风阵列的语音增强系统中的应用。
本发明又提供了一种所述的方法在语音信号处理技术领域中的应用。
本发明还提供了一种所述的方法在计算机技术领域中的应用。
(三)有益效果
本发明提出的基于麦克风阵列的混响消除方法,其认为阵列中各通道之间的语音信号是相关的,而噪声是不相干的,通过将含混响信号在时域上分为直达信号和经反射信号,在频域上分为低频信号与高频信号,对含混响语音信号从时域和频域上进行分时和分频的处理,利用基于线性约束最小方差后置维纳滤波的方法,在约束方程中增加了分时和分频的处理方式,求得最优权矢量,实现了基于麦克风阵列的混响消除,采用这种方式能在抑制混响的前提下突出不同频率信号的声纹特性,有利于后续语音识别工作的开展,具有计算量小、通用性、灵活性高、易于实现,应用范围广的特点,在指挥控制系统、会议系统或智能家居领域具有广阔的应用前景。
附图说明
图1为麦克风阵列示意图;
图2为远场下麦克风阵列示意图;
图3为本发明中线性约束最小方差后置维纳滤波波束形成法结构图;
图4为本发明中基于麦克风阵列的密闭空间混响消除方法结构图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
在间距相等的线性阵列中,当声源位置距离阵列较远时,可以认为声波是以平面波的形式传播的,即阵列中各阵元接收到的信号幅度是相同的,但在时间上存在延迟,这一时间延迟可以表示为
Figure BDA0002653957070000031
其中τ为两个阵元接收到的信号之间的时间延迟,d为两个阵元之间的间距,θ为信号入射方向与法线之间的夹角,c为声音的传播速度,如图2所示,以左数第一个麦克风为基准参考点,该阵列各阵元接收到的信号方向向量为:
A(f,θ)=[1,exp(-j2πfd sinθ/c),…,exp(-j2πf(M-1)d sinθ/c)]
f为声音信号的频率,M为麦克风阵元数量;
因此,本发明提供的一种基于麦克风阵列的密闭空间混响消除方法,其流程为:
(1)利用含混响语音信号的数学模型推导出,混响存在时麦克风阵列接收到信号的功率谱,利用线性约束最小方差准则,在保证期望信号增益的情况下,使输出功率最小,依据此线性约束最小方差准则确定约束方程;
(2)依据麦克风接收到的信号存在时间延迟的特点,将含混响语音信号的冲激响应分为直达部分和经反射到达部分;
(3)依据麦克风接收到的信号频带范围较宽的特点,将含混响语音信号分为高频和低频两部分,分别计算各自的滤波器系数;将时域上分解的冲激响应和频域上分解的滤波器系数结合,对步骤1得到的约束方程进行改造,求得最优权矢量的值。
步骤1具体为:设基准阵元m0接收到的声源信号为s(t),则第i个阵元mi接收到的信号为xi(t)=s(t-τi),改写成复数形式为
Figure BDA0002653957070000041
即xi(t)=s(t)e-j2πfdsinθ/c,ω0为表示声音信号的频率,τi表示mi与m0接收到的信号之间的时间延迟;所述麦克风阵列是由M个完全相同的麦克风组成的均匀线阵,在一个密闭环境中,第m个麦克风接收到的信号为
Figure BDA0002653957070000042
其中,xm(k)是第m个麦克风接收到的信号,xm(k)即为混响语音,s(k)是信号源发出的纯净语音信号,ka是该信号经过第a次反射后产生的时延,αa为衰减系数,s(k-aka)即为麦克风采集到的s(k)经a次反射后的信号。利用单位冲激函数δ(n),将上式改写为卷积形式为:
Figure BDA0002653957070000051
其中,*表示卷积运算,h(k)为该密闭空间的冲激响应,是反映这一空间中混响效果的重要参数之一,其在频域中的表达式为x(ω)=H(ω)s(ω),在实际环境中,麦克风采集到的信号不仅为沿直线传播的声源信号,还包括经过墙壁等多种物体反射的信号,这种反射效果在密闭狭小空间中的影响尤为明显,根据所述含混响语音信号的数学模型,推导出混响存在时麦克风阵列接收到信号的功率谱φx(ω)为φx(ω)=H(ω)φs(ω)HT(ω),其中,φs(ω)为目标语音信号的功率谱,依据线性约束最小方差的准则,要求输出功率最小,其输出功率表示为E{|y2(ω)|}=v(ω)Hφx(ω)v(ω),其中,v(ω)为此种情况下的滤波器系数,由于φx(ω)=E[|x(ω)xH(ω)|],因此,混响存在时的基于线性约束最小方差的约束方程表示为:
minvH(ω)φx(ω)v(ω) (3)
s.t.vH(ω)H(ω)=P(ω)
步骤2、混响的本质是麦克风接收到的信号存在着多种路径的反射,而这些混响噪声信号与目标信号之间并非不相关,其相干系数随频率变化而变化,在低频部分,其相干系数的模接近1,而在高频部分其模值则较小。麦克风接收到的信号为目标信号经过一系列延时的和,将密闭空间中的冲激响应h(k)按照信号传输的时间分为两部分,其中一部分是信号发出经过较短时间就传输到麦克风的,这部分信号可以看成是信号源经直线直接传输到麦克风的部分ha(k),即直达部分,另一部分则是经过了一段时间才传到麦克风的,即为麦克风接收信号中的混响部分hb(k),即经反射到达部分,这一分解表示为:
Figure BDA0002653957070000061
Figure BDA0002653957070000062
Figure BDA0002653957070000063
其中,β是均值为零的高斯白噪音,γ是混响的衰减系数,这一系数与时间紧密相关,一般符合γ=3ln10/T,ha(k)和hb(k)分别为上述描述的两种情况下的空间脉冲响应,kb是该信号经过第b次反射后产生的时延,b>a,设xma(k)和xmb(k)分别为麦克风接收到的来自于上述两个过程的信号,xma(k)可以认为是信号源直接传输过来的信号,xmb(k)可以认为是经过反射形成的混响噪声,所以其满足以下条件
Figure BDA0002653957070000064
由此,这两部分信号的能量谱函数φa(ω)、φb(ω)表示为
Figure BDA0002653957070000065
求解上述的混响存在时的基于线性约束最小方差的约束方程,利用拉格朗日乘子法,设定目标函数为
L(v)=vH(ω)φx(ω)v(ω)+λ[vH(ω)H(ω)-P(ω)] (9)
其中,λ为拉格朗日乘子,当
Figure BDA0002653957070000066
时,计算得到的最优权矢量为
v(ω)=(φx(ω))-1H(ω)(HH(ω)(φx(ω))-1H(ω))P(ω) (10)
为了更好的达到消除混响的效果,在应用线性约束最小方差约束时还加入了维纳滤波,线性约束最小方差后置维纳滤波波束形成法结构图如图3所示,在混响存在时的基于线性约束最小方差约束并应用了维纳滤波算法的最优权矢量V(ω)表示为V(ω)=v(ω)w(ω)
其中
Figure BDA0002653957070000071
Figure BDA0002653957070000072
为第i个阵元接收到的信号的能量谱函数;
步骤3、这种基于线性约束最小方差约束并应用后置维纳滤波的方法采取的方式是利用直达语音和混响语音到达的时间差异,但事实上,不同频段的信号的混响效果与时间并不是完全相同的,而且衰减系数也不是固定不变的,所以信号中各频率的分量产生的混响时间自然是不同的。从频谱上来看,直接到达的语音信号与经反射到达的语音信号之间的频率分布是相同的,其频谱也是混合在一起的,但是对于宽带信号来说,不同频率分量产生的混响效果是不一样的,因此在频域上采取分类的方法对语音信号的混响进行处理是可行的,在分频的思想下,麦克风接收到信号在频域下为x(ω)=H(ω)s(ω),其中x(ω)=[x1(ω),…,xM(ω)],s(ω)=[s1(ω),…,sN(ω)]表示的是N个信号源发出的信号,H(ω)可以表示为
Figure BDA0002653957070000073
麦克风阵列输出信号为
Figure BDA0002653957070000081
wm(ω)为第m个阵元接收到的信号对应的w(ω);密闭空间内考虑混响情况下的线性约束最小方差后置维纳滤波波束形成的约束方程表示为
minwH(ω)φx(ω)w(ω)
Figure BDA0002653957070000082
其中wH(ω)为基于线性约束最小方差约束并应用后置维纳滤波方法的权矢量,
Figure BDA0002653957070000087
为基于线性约束最小方差约束并应用后置维纳滤波方法中高频段的权矢量,
Figure BDA0002653957070000088
为基于线性约束最小方差约束并应用后置维纳滤波方法中低频段的权矢量,其基本结构图如图4所示。
利用拉格朗日乘子法对上述约束方程求解,可以得到此时的最优权矢量为
Figure BDA0002653957070000083
根据以上全频段的权矢量,利用后置维纳滤波输出的信息计算
Figure BDA0002653957070000084
Figure BDA0002653957070000085
的最优值w(ω)=αwH(ω)+(1-α)wL(ω),其中,α是加权系数,设维纳滤波器的最优权向量为v(ω),则在混响存在的情况下,基于时频域线性约束最小方差并应用后置维纳滤波的波束形成算法最优权矢量W(ω)表示为
W(ω)=(αwH(ω)+(1-α)wL(ω))v(ω)
Figure BDA0002653957070000086
在麦克风阵列的语音增强系统中,各通道信号是相干的,而噪声信号可以认为是不相干的,因此采用后置维纳滤波计算各通道信号之间的互功率谱,并由此确定维纳滤波系数,为得到更好的去混响效果,通过不同的冲激响应将含混响信号分为前期直达信号和后期反射信号,通过两者的功率谱来改进维纳滤波系统,同时,在应用线性约束最小方差时,分别计算高频段和低频段的权矢量,加权得到最优权矢量,削弱了不同频率信号混响效果不同的影响,达到了更好的去混响效果。
可以看出,本发明涉及一种基于麦克风阵列的应用于密闭空间中的混响消除方法。该种方法特别适用于密闭狭小、存在多种声源或干扰的空间。本发明提供的混响消除方法使用麦克风阵列作为信号采集设备,可以提取到语音信号中的空间域信息,达到定向采集的目的,由于语音信号在密闭空间中易产生混响,本方法利用不同频率信号的混响效果不同的特点,对麦克风接收到的信号进行分时和分频处理,达到了较好的混响抑制效果。本发明能有效解决密闭空间中的语音采集问题,在指挥控制系统、会议系统或智能家居领域具有广阔的应用前景。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (7)

1.一种基于麦克风阵列的密闭空间混响消除方法,其特征在于,包括以下步骤:
(1)利用含混响语音信号的数学模型推导出,混响存在时麦克风阵列接收到信号的功率谱,利用线性约束最小方差准则,在保证期望信号增益的情况下,使输出功率最小,依据此线性约束最小方差准则确定约束方程;
(2)依据麦克风接收到的信号存在时间延迟的特点,将含混响语音信号的冲激响应分为直达部分和经反射到达部分;
(3)依据麦克风接收到的信号频带范围的特点,将含混响语音信号分为高频和低频两部分,分别计算各自的滤波器系数;将时域上分解的冲激响应和频域上分解的滤波器系数结合,对步骤1得到的约束方程进行改造,求得最优权矢量的值;
步骤1具体为:
设基准阵元m0接收到的声源信号为s(t),则第i个阵元mi接收到的信号为xi(t)=s(t-τi),改写成复数形式为
Figure FDA0003556231160000011
Figure FDA0003556231160000013
ω0为表示声音信号的频率,τi表示mi与m0接收到的信号之间的时间延迟;所述麦克风阵列是由M个完全相同的麦克风组成的均匀线阵,在一个密闭环境中,第m个麦克风接收到的信号为
Figure FDA0003556231160000012
其中,xm(k)是第m个麦克风接收到的信号,xm(k)即为混响语音,s(k)是信号源发出的纯净语音信号,ka是该信号经过第a次反射后产生的时延,αa为衰减系数,s(k-aka)即为麦克风采集到的s(k)经a次反射后的信号,利用单位冲激函数δ(n),将上式改写为卷积形式为:
Figure FDA0003556231160000021
其中,*表示卷积运算,h(k)为该密闭空间的冲激响应,是反映这一空间中混响效果的重要参数之一,其在频域中的表达式为x(ω)=H(ω)s(ω),根据式(1)、式(2)表示的含混响语音信号的数学模型,推导出混响存在时麦克风阵列接收到信号的功率谱φx(ω)为φx(ω)=H(ω)φs(ω)HT(ω),其中,φs(ω)为目标语音信号的功率谱,依据线性约束最小方差的准则,要求输出功率最小,其输出功率表示为E{|y2(ω)|}=v(ω)Hφx(ω)v(ω),其中,v(ω)为此种情况下的滤波器系数,由于φx(ω)=E[|x(ω)xH(ω)|],因此,混响存在时的基于线性约束最小方差的约束方程表示为:
minvH(ω)φx(ω)v(ω) (3);
s.t.vH(ω)H(ω)=P(ω)
步骤2中,将密闭空间中的冲激响应h(k)按照信号传输的时间分为两部分,其中一部分是信号发出经过较短时间就传输到麦克风的,这部分信号可以看成是信号源经直线直接传输到麦克风的部分ha(k),即直达部分,另一部分则是经过了一段时间才传到麦克风的,即为麦克风接收信号中的混响部分hb(k),即经反射到达部分,这一分解表示为:
Figure FDA0003556231160000031
Figure FDA0003556231160000032
Figure FDA0003556231160000033
其中,β是均值为零的高斯白噪音,γ是混响的衰减系数,ha(k)和hb(k)分别为两种情况下的空间脉冲响应,kb是该信号经过第b次反射后产生的时延,设xma(k)和xmb(k)分别为麦克风接收到的来自于两个过程的信号,xma(k)认为是信号源直接传输过来的信号,xmb(k)认为是经过反射形成的混响噪声,所以其满足以下条件
Figure FDA0003556231160000034
由此,这两部分信号的能量谱函数φa(ω)、φb(ω)表示为
φx(ω)=φa(ω)+φb(ω) (8)
φb(ω)=e-2γkφx(ω)
求解上述的混响存在时的基于线性约束最小方差的约束方程,利用拉格朗日乘子法,设定目标函数为L(v)=vH(ω)φx(ω)v(ω)+λ[vH(ω)H(ω)-P(ω)],其中,λ为拉格朗日乘子,当
Figure FDA0003556231160000035
时,计算得到的最优权矢量为
v(ω)=(φx(ω))-1H(ω)(HH(ω)(φx(ω))-1H(ω))P(ω) (9)
在应用线性约束最小方差约束时加入维纳滤波,在混响存在时的基于线性约束最小方差约束并应用了维纳滤波算法的最优权矢量V(ω)表示为V(ω)=v(ω)w(ω)
其中
Figure FDA0003556231160000041
Figure FDA00035562311600000410
为第i个阵元接收到的信号的能量谱函数;
步骤3中,在频域上采取分类的方法对语音信号的混响进行处理,在分频的思想下,麦克风接收到信号在频域下为x(ω)=H(ω)s(ω),其中x(ω)=[x1(ω),…,xM(ω)],s(ω)=[s1(ω),…,sN(ω)]表示的是N个信号源发出的信号,H(ω)表示为
Figure FDA0003556231160000042
麦克风阵列输出信号为
Figure FDA0003556231160000043
wm(ω)为第m个阵元接收到的信号对应的w(ω);密闭空间内考虑混响情况下的线性约束最小方差后置维纳滤波波束形成的约束方程表示为
Figure FDA0003556231160000044
其中wH(ω)为基于线性约束最小方差约束并应用后置维纳滤波方法的权矢量,
Figure FDA0003556231160000045
为基于线性约束最小方差约束并应用后置维纳滤波方法中高频段的权矢量,
Figure FDA0003556231160000046
为基于线性约束最小方差约束并应用后置维纳滤波方法中低频段的权矢量;
利用拉格朗日乘子法对式(12)的约束方程求解,得到此时的最优权矢量为
Figure FDA0003556231160000047
根据以上全频段的权矢量,利用后置维纳滤波输出的信息计算
Figure FDA0003556231160000048
Figure FDA0003556231160000049
的最优值w(ω)=αwH(ω)+(1-α)wL(ω),其中,α是加权系数,设维纳滤波器的最优权向量为v(ω),则在混响存在的情况下,基于时频域线性约束最小方差并应用后置维纳滤波的波束形成算法最优权矢量W(ω)表示为
Figure FDA0003556231160000051
2.如权利要求1所述的方法,其特征在于,γ是混响的衰减系数与时间相关。
3.如权利要求2所述的方法,其特征在于,γ=3ln10/T,其中T为周期。
4.如权利要求3所述的方法,其特征在于,b>a。
5.一种如权利要求1至4中任一项所述的方法在麦克风阵列的语音增强系统中的应用。
6.一种如权利要求1至4中任一项所述的方法在语音信号处理技术领域中的应用。
7.一种如权利要求1至4中任一项所述的方法在计算机技术领域中的应用。
CN202010880441.0A 2020-08-27 2020-08-27 一种基于麦克风阵列的密闭空间混响消除方法 Active CN112017684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010880441.0A CN112017684B (zh) 2020-08-27 2020-08-27 一种基于麦克风阵列的密闭空间混响消除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010880441.0A CN112017684B (zh) 2020-08-27 2020-08-27 一种基于麦克风阵列的密闭空间混响消除方法

Publications (2)

Publication Number Publication Date
CN112017684A CN112017684A (zh) 2020-12-01
CN112017684B true CN112017684B (zh) 2022-06-24

Family

ID=73502331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010880441.0A Active CN112017684B (zh) 2020-08-27 2020-08-27 一种基于麦克风阵列的密闭空间混响消除方法

Country Status (1)

Country Link
CN (1) CN112017684B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782590A (zh) * 2016-12-14 2017-05-31 南京信息工程大学 基于混响环境下麦克风阵列波束形成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2884491A1 (en) * 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782590A (zh) * 2016-12-14 2017-05-31 南京信息工程大学 基于混响环境下麦克风阵列波束形成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LCMV分频的改进维纳滤波后置波束形成算法;郭业才等;《电子测量与仪器学报》;20171015(第10期);摘要,第0节第1段,第1-2节 *
基于子带广义旁瓣相消器的麦克风阵列语音增强;何成林等;《计算机应用研究》;20060410(第04期);全文 *

Also Published As

Publication number Publication date
CN112017684A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN105590631B (zh) 信号处理的方法及装置
CN106782590B (zh) 基于混响环境下麦克风阵列波束形成方法
Benesty et al. Speech enhancement in the STFT domain
CN111161751A (zh) 复杂场景下的分布式麦克风拾音系统及方法
EP2749042B1 (en) Processing signals
JP5091948B2 (ja) ブラインド信号抽出
US10515650B2 (en) Signal processing apparatus, signal processing method, and signal processing program
Yang et al. Robust dereverberation with Kronecker product based multichannel linear prediction
CN108597532A (zh) 基于mvdr的隐声方法
CN108337605A (zh) 基于差分波束形成的隐声方法
CN112331226A (zh) 一种针对主动降噪系统的语音增强系统及方法
Song et al. An integrated multi-channel approach for joint noise reduction and dereverberation
Kim Hearing aid speech enhancement using phase difference-controlled dual-microphone generalized sidelobe canceller
Kim et al. Factorized MVDR deep beamforming for multi-channel speech enhancement
Simmer et al. Suppression of coherent and incoherent noise using a microphone array
Wu et al. A reverberation-time-aware DNN approach leveraging spatial information for microphone array dereverberation
CN112017684B (zh) 一种基于麦克风阵列的密闭空间混响消除方法
Lee et al. Deep neural network-based speech separation combining with MVDR beamformer for automatic speech recognition system
Madhu et al. Localisation-based, situation-adaptive mask generation for source separation
Li et al. A two-microphone noise reduction method in highly non-stationary multiple-noise-source environments
Leng et al. On speech enhancement using microphone arrays in the presence of co-directional interference
Bagekar et al. Dual channel coherence based speech enhancement with wavelet denoising
Yousefian et al. Power level difference as a criterion for speech enhancement
Bai et al. Kalman filter-based microphone array signal processing using the equivalent source model
Wang et al. Speech Enhancement Algorithms with Adaptive Methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant