CN111540371A - 麦克风阵列波束成形的方法、装置和计算机设备 - Google Patents
麦克风阵列波束成形的方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN111540371A CN111540371A CN202010322791.5A CN202010322791A CN111540371A CN 111540371 A CN111540371 A CN 111540371A CN 202010322791 A CN202010322791 A CN 202010322791A CN 111540371 A CN111540371 A CN 111540371A
- Authority
- CN
- China
- Prior art keywords
- target direction
- designated
- microphones
- microphone array
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims abstract description 51
- 238000012937 correction Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 32
- 230000003044 adaptive effect Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 5
- 230000021615 conjugation Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
本申请揭示了麦克风阵列波束成形的方法,包括:麦克风阵列包括M个均匀分布在同一圆环上的麦克风,M=2n,n=2,3,4…,且麦克风阵列的孔径c为声速,f为信号最高频率,方法包括:接收音频输入信号,并根据声源定位确定目标方向,目标方向为任意角度的方向;通过指定运算方式将音频输入信号,在目标方向上生成指定波束,其中,指定运算方式由矩阵C推导得到,矩阵C的表达式为:b为正实数,δ为非负数;在距离目标方向指定角度范围内,生成指定波束对应的修正波束;利用自适应滤波器将修正波束与指定波束对消,得到目标方向的波束输出;向目标方向输出所述波束输出。通过矩阵C得到小孔径麦克风阵列指向任意角度方向上的输出信号波束。
Description
技术领域
本申请涉及到计算机领域,特别是涉及到麦克风阵列波束成形的方法、装置和计算机设备。
背景技术
基于麦克风阵列的波束成形方法,对音频降噪的效果比较明显,可以针对不同方向的干扰进行有效抑制,而对目标声源做增强。基于麦克风阵列的波束成形方法中,MVDR、SD、GSC等现有技术,在麦克风阵列尺寸偏小导致空间孔径较小的情况下,降噪效果会削弱,而且在麦克风阵列尺寸偏小的情况下,由于空间区域的限制,使得波束成形时只能在麦克风端射方向形成,无法使波束精确地指向其它任意方位角,不能满足流行趋势的指向性语音交互的使用需求。
发明内容
本申请的主要目的为提供麦克风阵列波束成形的方法,旨在解决麦克风阵列孔径偏小时,无法使输出波束精确地指向任意方位角的技术问题。
接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;
通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:
在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;
利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;
向所述目标方向输出所述波束输出。
优选地,所述通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束的步骤,包括:
赋值矩阵C中的δ=0;
通过W1(k)=a(k,ψ)C得到第一空域滤波系数,其中,所述W1(k)为所述第一空域滤波系数,a(k,ψ)为指向角度为ψ的导向矢量;
通过Y1(k)=X(k)W1 H(k)在所述目标方向上生成所述指定波束,其中,X(k)是所述音频输入的频域信号,W1 H(k)是所述第一空域滤波系数W1(k)的共轭转置。
优选地,在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束的步骤,包括:
确定与所述目标方向相差180度的指定方向;
以所述指定方向为中心,以远离所述指定方向产生的偏角范围为界限,确定所述指定角度范围;
在所述指定角度范围内生成DMA波束,作为所述指定波束对应的修正波束。
优选地,所述在所述指定角度范围内生成DMA波束,作为所述指定波束对应的修正波束的步骤,包括:
获取所述麦克风阵列中所有麦克风之间的孔径;
通过所述指定麦克风生成所述DMA波束。
优选地,所述指定麦克风为两个,所述通过所述指定麦克风生成所述DMA波束的步骤,包括:
若是,则选择端射方向上距离所述目标方向最近的两个麦克风,作为所述指定麦克风;
根据所述导向矢量矩阵D(k),依据计算公式W2(k)=D(k)-1β,得到第二空域滤波系数,其中,W2(k)为所述第二空域滤波系数,·-1为矩阵取逆,若θ1相比θ2靠近所述目标方向,若θ2相比θ1靠近所述目标方向,
优选地,所述利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出的步骤,包括:
根据步长调节因子确定所述自适应滤波器的滤波器系数G(l,k),其中,l为帧索引,k为频率索引,且k=1,2,...,K,K为FFT变换的点数,Y 2(l,k)为Y2(l,k)的历史缓存值,Y 2(l,k)=[Y2(l,k),Y2(l-1,k),...,Y2(l-ORD+1,k)],ORD为缓存的帧数,μ是步长调节因子,·*表示求共轭;
根据所述滤波器系数G(l,k),通过E(l,k)=Y1(l,k)-Y2(l,k)G(l,k)将所述指定波束与所述修正波束对消,得到所述目标方向对应的输出信号波束,其中,所述E(l,k)为所述目标方向对应的输出信号波束。
接收模块,用于接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;
第一生成模块,用于通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:
第二生成模块,用于在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;
对消模块,用于利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;
输出模块,用于向所述目标方向输出所述波束输出。
优选地,所述第一生成模块,包括:
赋值子模块,用于赋值矩阵C中的δ=0;
得到子模块,用于通过W1(k)=a(k,ψ)C得到第一空域滤波系数,其中,所述W1(k)为所述第一空域滤波系数,a(k,ψ)为指向角度为ψ的导向矢量;
生成子模块,用于通过Y1(k)=X(k)W1 H(k)在所述目标方向上生成所述指定波束,其中,X(k)是所述音频输入的频域信号,W1 H(k)是所述第一空域滤波系数W1(k)的共轭转置。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本申请通过设计用于目标方向上生成指定波束的矩阵C,使得波束具有可指向任意方位角的任意指向性,且通过靠近目标方向反方向的角度上生成修正波束,对消掉指定波束在目标方向之外的旁瓣,得到目标方向的波束输出,实现了小孔径麦克风阵列可指向任意角度的波束形成。
附图说明
图1本申请一实施例的麦克风阵列波束成形的方法流程示意图;
图2本申请一实施例的麦克风阵列的位置布局结构示意图;
图3本申请一实施例的双极型波束与DMA波束对消示意图;
图4本申请一实施例的麦克风阵列波束成形的装置结构示意图;
图5本申请一实施例的计算机设备内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
S1:接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;
S2:通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:
S3:在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;
S4:利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;
S5:向所述目标方向输出所述输出信号波束。
本申请的波束成形方法适用于孔径的小孔径麦克风阵列,在任意角度方向的波束成形。通过设计用于目标方向上生成指定波束的矩阵C,使得波束具有特定指向性,且上述特定指向性可指向任意方位角。本申请在获取音频输入信号时实现360度全方位获取音频信号,获取麦克风通道数据x(l),通过短时傅里叶变换,得到频域信号X(l,k),l是帧索引,k是所在的频点,k=0,1,...,K,K是FFT的点数。然后通过声源定位确定目标方向为ψ,并控制在目标方向上生成指定波束,通过靠近目标方向反方向的角度上生成修正波束,对消掉指定波束在目标方向之外的旁瓣,得到目标方向的波束输出,实现了小孔径麦克风阵列可指向任意角度的波束形成。本申请的麦克风阵列由四个或四个以上麦克风均匀分布在同一圆环上形成,上述孔径指麦克风阵列所在圆环的半径。举例地,麦克风阵列由四个麦克风组成,四个麦克风的位置组成方形,方形对应的外接圆即为上述圆环。
进一步地,所述通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束的步骤S2,包括:
S21:赋值矩阵C中的δ=0;
S22:通过W1(k)=a(k,ψ)C得到第一空域滤波系数,其中,所述W1(k)为所述第一空域滤波系数,a(k,ψ)为指向角度为ψ的导向矢量;
S22:通过Y1(k)=X(k)W1 H(k)在所述目标方向上生成所述指定波束,其中,X(k)是所述音频输入的频域信号,W1 H(k)是所述第一空域滤波系数W1(k)的共轭转置。
本申请矩阵C中所有δ所在位置,为矩阵C的对角线,当δ取不同的值时,对应指定波束的形状也不同。通过对δ进行针对性的赋值可控制指定波束的形状,实现在小孔径麦克风阵列中,不仅可在任意角度方向形成指定波束,且可控制指定波束的形状。通过控制指定波束的形状可在不同的小孔径尺寸下,优化选择修正波束,提升目标方向的波束输出的效果,以抑制干扰的效果更强。上述δ=0的时候,指定波束是一个双极型波束,逐渐δ取值的增大则逐渐由双极型波束变形为接近心形波束,但当δ取值大到一定程度则该波束会失去指向性,故具体到不同的小孔径麦克风阵列,δ最大取值为心形波束对应的赋值。δ=0,上述矩阵C是一个以0为对角线的实对称矩阵时,每一行都含有(M-2)个1,距离对角线元素M/2个元素的位置上为(2-M),通过Y1(k)=X(k)W1 H(k)在目标方向上生成双极型波束。
进一步地,在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束的步骤S3,包括:
S31:确定与所述目标方向相差180度的指定方向;
S32:以所述指定方向为中心,以远离所述指定方向产生的偏角范围为界限,确定所述指定角度范围;
S33:在所述指定角度范围内生成DMA波束,作为所述指定波束对应的修正波束。
本申请中,与目标方向相差180度的指定方向,为目标方向的反方向。通过先确定目标方向的反方向,然后再确定偏角范围。上述偏角范围为生成修正波束的指向性偏差角度。举例地,目标方向为330°所在方向,则指定方向为150°所在方向,但在生成DMA波束时指向性较差,产生了偏角5°,则在145°所在方向或155°所在方向生成了DMA波束,则上述指定角度范围为[145°,155°]。
进一步地,所述在所述指定角度范围内生成DMA波束,作为所述指定波束对应的修正波束的步骤S33,包括:
S331:获取所述麦克风阵列中所有麦克风之间的孔径;
S333:通过所述指定麦克风生成所述DMA波束。
本申请中,用于形成DMA波束的指定麦克风为两个或两个以上,当指定麦克风为两个时,两个麦克风之间的孔径,指两两麦克风之间的直线距离;当指定麦克风为两个以上时,孔径为所有指定麦克风所处外接圆的半径。通过选择麦克风之间的孔径符合的两个或两个以上的指定麦克风形成DMA波束,比如两个指定麦克风或四个指定麦克风组成新阵列,形成DMA波束,可以较好的对消目标方向的反方向上的旁瓣,抑制干扰的效果更佳。四个指定麦克风形成DMA波束,相比于两个指定麦克风形成DMA波束,所适合产生指定波束的麦克风阵列的尺寸更大些。
进一步地,所述指定麦克风为两个,所述通过所述指定麦克风生成所述DMA波束的步骤S333,包括:
S3332:若是,则选择端射方向上距离所述目标方向最近的两个麦克风,作为所述指定麦克风;
S3333:获取两个所述指定麦克风端射方向的导向矢量,并组成导向矢量矩阵D(k),其中,所述θ1,θ2是两个所述指定麦克风的端射方向,d(k,θ1)为指向θ1的导向矢量,d(k,θ2)为指向θ2的导向矢量;
S3334:根据所述导向矢量矩阵D(k),依据计算公式W2(k)=D(k)-1β,得到第二空域滤波系数,其中,W2(k)为所述第二空域滤波系数,·-1为矩阵取逆,θ1相比θ2靠近目标方向,若θ2相比θ1靠近所述目标方向,
S3335:通过Y2(k)=X(k)W2 H(k)生成所述DMA波束。
本实施例以两个指定麦克风形成DMA波束,对消双极型指定波束为例进行详细说明。由于四个指定麦克风形成DMA波束只能指向四个方向,即四个指定麦克风的对角线方向,若在四个指定麦克风里任意挑选两个指定麦克风做DMA波束,可以指向8个方向。而且四个指定麦克风形成DMA波束的旁瓣比较多,主瓣比较窄,而两个指定麦克风形成DMA波束呈心形,没有旁瓣且主瓣宽,所以本申请优选两个指定麦克风形成DMA波束。如图2所示,双极型波束由一个小孔径四麦阵列生成,小孔径四麦阵列由麦克风1、2、3、4采用双极型波束输出,形成的双极型波束如图3所示的波束A。四个麦克风两两可以构成生成DMA波束的指定麦克风,且指向端射方向。上述端射方向指构成DMA的两个指定麦克风中心的连线。例如目标方向在330°,双极型波束2kHz输出如图3中波束A,选择麦克风1、2构成DMA并令其DMA波束指向135°,2kHz时如图3中波束B。将此两个波束做自适应滤波,把双极型波束中指向150°的部分消掉,便可得到指向330°的超指向波束。上述的·H表示共轭转置,本申请其他处的相同用语,作用相同不赘述。
进一步地,所述利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出的步骤S4,包括:
S41:根据步长调节因子确定所述自适应滤波器的滤波器系数G(l,k),其中,l为帧索引,k为频率索引,且k=1,2,...,K,K为FFT变换的点数,Y 2(l,k)为Y2(l,k)的历史缓存值,Y 2(l,k)=[Y2(l,k),Y2(l-1,k),...,Y2(l-ORD+1,k)],ORD为缓存的帧数,μ是步长调节因子,·*表示求共轭;
S42:根据所述滤波器系数G(l,k),通过E(l,k)=Y1(l,k)-Y 2(l,k)G(l,k)将所述指定波束与所述修正波束对消,得到所述目标方向对应的输出信号波束,其中,所述E(l,k)为所述目标方向对应的输出信号波束。
参照图4,本申请一实施例的麦克风阵列波束成形的装置,包括:
接收模块1,用于接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;
第一生成模块2,用于通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:
第二生成模块3,用于在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;
对消模块4,用于利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;
输出模块5,用于向所述目标方向输出所述输出信号波束。
本申请的波束成形方法适用于孔径的小孔径麦克风阵列,在任意角度方向的波束成形。通过设计用于目标方向上生成指定波束的矩阵C,使得波束具有特定指向性,且上述特定指向性可指向任意方位角。本申请在获取音频输入信号时实现360度全方位获取音频信号,获取麦克风通道数据x(l),通过短时傅里叶变换,得到频域信号X(l,k),l是帧索引,k是所在的频点,k=0,1,...,K,K是FFT的点数。然后通过声源定位确定目标方向为ψ,并控制在目标方向上生成指定波束,通过靠近目标方向反方向的角度上生成修正波束,对消掉指定波束在目标方向之外的旁瓣,得到目标方向的波束输出,实现了小孔径麦克风阵列可指向任意角度的波束形成。本申请的麦克风阵列由四个或四个以上麦克风均匀分布在同一圆环上形成,上述孔径指麦克风阵列所在圆环的半径。举例地,麦克风阵列由四个麦克风组成,四个麦克风的位置组成方形,方形对应的外接圆即为上述圆环。
进一步地,第一生成模块2,包括:
赋值子模块,用于赋值矩阵C中的δ=0;
得到子模块,用于通过W1(k)=a(k,ψ)C得到第一空域滤波系数,其中,所述W1(k)为所述第一空域滤波系数,a(k,ψ)为指向角度为ψ的导向矢量;
生成子模块,用于通过Y1(k)=X(k)W1 H(k)在所述目标方向上生成所述指定波束,其中,X(k)是所述音频输入的频域信号,W1 H(k)是所述第一空域滤波系数W1(k)的共轭转置。
本申请矩阵C中所有δ所在位置,为矩阵C的对角线,当δ取不同的值时,对应指定波束的形状也不同。通过对δ进行针对性的赋值可控制指定波束的形状,实现在小孔径麦克风阵列中,不仅可在任意角度方向形成指定波束,且可控制指定波束的形状。通过控制指定波束的形状可在不同的小孔径尺寸下,优化选择修正波束,提升目标方向的波束输出的效果,以抑制干扰的效果更强。上述δ=0的时候,指定波束是一个双极型波束,δ取值的逐渐增大则逐渐由双极型波束变形为接近心形波束,但当δ取值大到一定程度则该波束会失去指向性,故具体到不同的小孔径麦克风阵列,δ最大取值为心形波束对应的赋值。δ=0,上述矩阵C是一个以0为对角线的实对称矩阵时,每一行都含有(M-2)个1,距离对角线元素M/2个元素的位置上为(2-M),通过Y1(k)=X(k)W1 H(k)在目标方向上生成双极型波束。
进一步地,第二生成模块3,包括:
第一确定子模块,用于确定与所述目标方向相差180度的指定方向;
第二确定子模块,用于以所述指定方向为中心,以远离所述指定方向产生的偏角范围为界限,确定所述指定角度范围;
作为子模块,用于在所述指定角度范围内生成DMA波束,作为所述指定波束对应的修正波束。
本申请中,与目标方向相差180度的指定方向,为目标方向的反方向。通过先确定目标方向的反方向,然后再确定偏角范围。上述偏角范围为生成修正波束的指向性偏差角度。举例地,目标方向为330°所在方向,则指定方向为150°所在方向,但在生成DMA波束时指向性较差,产生了偏角5°,则在145°所在方向或155°所在方向生成了DMA波束,则上述指定角度范围为[145°,155°]。
进一步地,作为子模块,包括:
获取单元,用于获取所述麦克风阵列中所有麦克风之间的孔径;
生成单元,用于通过所述指定麦克风生成所述DMA波束。
本申请中,用于形成DMA波束的指定麦克风为两个或两个以上,当指定麦克风为两个时,两个麦克风之间的孔径,指两两麦克风之间的直线距离;当指定麦克风为两个以上时,孔径为所有指定麦克风所处外接圆的半径。通过选择麦克风之间的孔径符合的两个或两个以上的指定麦克风形成DMA波束,比如两个指定麦克风或四个指定麦克风组成新阵列,形成DMA波束,可以较好的对消目标方向的反方向上的旁瓣,抑制干扰的效果更佳。四个指定麦克风形成DMA波束,相比于两个指定麦克风形成DMA波束,所适合产生指定波束的麦克风阵列的尺寸更大些。
进一步地,所述指定麦克风为两个,生成单元,包括:
获取子单元,用于获取两个所述指定麦克风端射方向的导向矢量,并组成导向矢量矩阵D(k),其中,所述θ1,θ2是两个所述指定麦克风的端射方向,d(k,θ1)为指向θ1的导向矢量,d(k,θ2)为指向θ2的导向矢量;
得到子单元,用于根据所述导向矢量矩阵D(k),依据计算公式W2(k)=D(k)-1β,得到第二空域滤波系数,其中,W2(k)为所述第二空域滤波系数,·-1为矩阵取逆,θ1相比θ2靠近目标方向,若θ2相比θ1靠近所述目标方向,
生成子单元,用于通过Y2(k)=X(k)W2 H(k)生成所述DMA波束。
本实施例以两个指定麦克风形成DMA波束,对消双极型指定波束为例进行详细说明。由于四个指定麦克风形成DMA波束只能指向四个方向,即四个指定麦克风的对角线方向,若在四个指定麦克风里任意挑选两个指定麦克风做DMA波束,可以指向8个方向。而且四个指定麦克风形成DMA波束的旁瓣比较多,主瓣比较窄,而两个指定麦克风形成DMA波束呈心形,没有旁瓣且主瓣宽,所以本申请优选两个指定麦克风形成DMA波束。如图2所示,双极型波束由一个小孔径四麦阵列生成,小孔径四麦阵列由麦克风1、2、3、4采用双极型波束输出,形成的双极型波束如图3所示的波束A。四个麦克风两两可以构成生成DMA波束的指定麦克风,且指向端射方向。上述端射方向指构成DMA的两个指定麦克风中心的连线。例如目标方向在330°,双极型波束2kHz输出如图3中波束A,选择麦克风1、2构成DMA并令其DMA波束指向135°,2kHz时如图3中波束B。将此两个波束做自适应滤波,把双极型波束中指向150°的部分消掉,便可得到指向330°的超指向波束。
进一步地,对消模块4,包括:
第三确定子模块,用于根据步长调节因子确定所述自适应滤波器的滤波器系数G(l,k),其中,l为帧索引,k为频率索引,且k=1,2,...,K,K为FFT变换的点数,Y 2(l,k)为Y2(l,k)的历史缓存值,Y 2(l,k)=[Y2(l,k),Y2(l-1,k),...,Y2(l-ORD+1,k)],ORD为缓存的帧数,μ是步长调节因子,·*表示求共轭;
对消子模块,用于根据所述滤波器系数G(l,k),通过E(l,k)=Y1(l,k)-Y2(l,k)G(l,k)将所述指定波束与所述修正波束对消,得到所述目标方向对应的输出信号波束,其中,所述E(l,k)为所述目标方向对应的输出信号波束。
参照图5,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储麦克风阵列波束成形的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现麦克风阵列波束成形的方法。
上述处理器执行上述麦克风阵列波束成形的方法,包括:所述麦克风阵列包括M个均匀分布在同一圆环上的麦克风,M=2n,n=2,3,4…,且麦克风阵列的孔径c为声速,f为信号最高频率,方法包括:接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:b为正实数,δ为非负数;在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;向所述目标方向输出所述波束输出。
上述计算机设备,通过设计用于目标方向上生成指定波束的矩阵C,使得波束具有可指向任意方位角的任意指向性,且通过靠近目标方向反方向的角度上生成修正波束,对消掉指定波束在目标方向之外的旁瓣,得到目标方向的波束输出,实现了小孔径麦克风阵列可指向任意角度的波束形成。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现麦克风阵列波束成形的方法,包括:包括:所述麦克风阵列包括M个均匀分布在同一圆环上的麦克风,M=2n,n=2,3,4…,且麦克风阵列的孔径c为声速,f为信号最高频率,方法包括:接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:b为正实数,δ为非负数;在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;向所述目标方向输出所述波束输出。
上述计算机可读存储介质,通过设计用于目标方向上生成指定波束的矩阵C,使得波束具有可指向任意方位角的任意指向性,且通过靠近目标方向反方向的角度上生成修正波束,对消掉指定波束在目标方向之外的旁瓣,得到目标方向的波束输出,实现了小孔径麦克风阵列可指向任意角度的波束形成。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;
通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:
在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;
利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;
向所述目标方向输出所述波束输出。
2.根据权利要求1所述的麦克风阵列波束成形的方法,其特征在于,所述通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束的步骤,包括:
赋值矩阵C中的δ=0;
通过W1(k)=a(k,ψ)C得到第一空域滤波系数,其中,所述W1(k)为所述第一空域滤波系数,a(k,ψ)为指向角度为ψ的导向矢量;
通过Y1(k)=X(k)W1 H(k)在所述目标方向上生成所述指定波束,其中,X(k)是所述音频输入的频域信号,W1 H(k)是所述第一空域滤波系数W1(k)的共轭转置。
3.根据权利要求1所述的麦克风阵列波束成形的方法,其特征在于,在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束的步骤,包括:
确定与所述目标方向相差180度的指定方向;
以所述指定方向为中心,以远离所述指定方向产生的偏角范围为界限,确定所述指定角度范围;
在所述指定角度范围内生成DMA波束,作为所述指定波束对应的修正波束。
5.根据权利要求4所述的麦克风阵列波束成形的方法,其特征在于,所述指定麦克风为两个,所述通过所述指定麦克风生成所述DMA波束的步骤,包括:
若是,则选择端射方向上距离所述目标方向最近的两个麦克风,作为所述指定麦克风;
根据所述导向矢量矩阵D(k),依据计算公式W2(k)=D(k)-1β,得到第二空域滤波系数,其中,W2(k)为所述第二空域滤波系数,·-1为矩阵取逆,若θ1相比θ2靠近所述目标方向,若θ2相比θ1靠近所述目标方向,
通过Y2(k)=X(k)W2 H(k)生成所述DMA波束。
6.根据权利要求5所述的麦克风阵列波束成形的方法,其特征在于,所述利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出的步骤,包括:
根据步长调节因子确定所述自适应滤波器的滤波器系数G(l,k),其中,l为帧索引,k为频率索引,且k=1,2,...,K,K为FFT变换的点数,Y 2(l,k)为Y2(l,k)的历史缓存值,Y 2(l,k)=[Y2(l,k),Y2(l-1,k),...,Y2(l-ORD+1,k)],ORD为缓存的帧数,μ是步长调节因子,·*表示求共轭;
根据所述滤波器系数G(l,k),通过E(l,k)=Y1(l,k)-Y 2(l,k)G(l,k)将所述指定波束与所述修正波束对消,得到所述目标方向对应的输出信号波束,其中,所述E(l,k)为所述目标方向对应的输出信号波束。
接收模块,用于接收音频输入信号,并根据声源定位确定目标方向,其中,所述目标方向为任意角度的方向;
第一生成模块,用于通过指定运算方式将所述音频输入信号,在所述目标方向上生成指定波束,其中,所述指定运算方式由矩阵C推导得到,所述矩阵C的表达式为:
第二生成模块,用于在距离所述目标方向指定角度范围内,生成所述指定波束对应的修正波束;
对消模块,用于利用自适应滤波器将所述修正波束与所述指定波束对消,得到所述目标方向的波束输出;
输出模块,用于向所述目标方向输出所述波束输出。
8.根据权利要求7所述的麦克风阵列波束成形的装置,其特征在于,所述第一生成模块,包括:
赋值子模块,用于赋值矩阵C中的δ=0;
得到子模块,用于通过W1(k)=a(k,ψ)C得到第一空域滤波系数,其中,所述W1(k)为所述第一空域滤波系数,a(k,ψ)为指向角度为ψ的导向矢量;
生成子模块,用于通过Y1(k)=X(k)W1 H(k)在所述目标方向上生成所述指定波束,其中,X(k)是所述音频输入的频域信号,W1 H(k)是所述第一空域滤波系数W1(k)的共轭转置。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010322791.5A CN111540371B (zh) | 2020-04-22 | 2020-04-22 | 麦克风阵列波束成形的方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010322791.5A CN111540371B (zh) | 2020-04-22 | 2020-04-22 | 麦克风阵列波束成形的方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111540371A true CN111540371A (zh) | 2020-08-14 |
CN111540371B CN111540371B (zh) | 2020-11-03 |
Family
ID=71969670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010322791.5A Active CN111540371B (zh) | 2020-04-22 | 2020-04-22 | 麦克风阵列波束成形的方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111540371B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112492452A (zh) * | 2020-11-26 | 2021-03-12 | 北京字节跳动网络技术有限公司 | 波束系数存储方法、装置、设备和存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831898A (zh) * | 2012-08-31 | 2012-12-19 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
CN102879790A (zh) * | 2011-07-13 | 2013-01-16 | 北京泰豪联星技术有限公司 | 基于数字波束形成与空时调零级联的抗干扰系统和方法 |
CN102969002A (zh) * | 2012-11-28 | 2013-03-13 | 厦门大学 | 一种可抑制移动噪声的麦克风阵列语音增强装置 |
JP2015079080A (ja) * | 2013-10-16 | 2015-04-23 | 日本電信電話株式会社 | 音源位置推定装置、方法及びプログラム |
CN106301498A (zh) * | 2016-08-17 | 2017-01-04 | 河海大学 | 子带处理方法及频空级联的宽带自适应波束获取方法 |
CN106340305A (zh) * | 2016-11-04 | 2017-01-18 | 北京声智科技有限公司 | 自校准的远场语音交互设备及远场语音自校准方法 |
CN106688194A (zh) * | 2014-12-31 | 2017-05-17 | 华为技术有限公司 | 一种阵列天线波束调整装置和方法 |
CN108447496A (zh) * | 2018-06-22 | 2018-08-24 | 成都瑞可利信息科技有限公司 | 一种基于麦克风阵列的语音增强方法及装置 |
CN109119092A (zh) * | 2018-08-31 | 2019-01-01 | 广东美的制冷设备有限公司 | 基于麦克风阵列的波束指向切换方法和装置 |
CN109600152A (zh) * | 2018-12-17 | 2019-04-09 | 西北工业大学 | 一种基于子空间基变换的自适应波束形成方法 |
CN109856593A (zh) * | 2018-12-21 | 2019-06-07 | 南京理工大学 | 面向声源测向的微型智能阵列式声传感器及其测向方法 |
CN110169083A (zh) * | 2017-01-06 | 2019-08-23 | 伯斯有限公司 | 麦克风阵列波束形成 |
CN110931036A (zh) * | 2019-12-07 | 2020-03-27 | 杭州国芯科技股份有限公司 | 一种麦克风阵列波束形成方法 |
-
2020
- 2020-04-22 CN CN202010322791.5A patent/CN111540371B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102879790A (zh) * | 2011-07-13 | 2013-01-16 | 北京泰豪联星技术有限公司 | 基于数字波束形成与空时调零级联的抗干扰系统和方法 |
CN102831898A (zh) * | 2012-08-31 | 2012-12-19 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
CN102969002A (zh) * | 2012-11-28 | 2013-03-13 | 厦门大学 | 一种可抑制移动噪声的麦克风阵列语音增强装置 |
JP2015079080A (ja) * | 2013-10-16 | 2015-04-23 | 日本電信電話株式会社 | 音源位置推定装置、方法及びプログラム |
CN106688194A (zh) * | 2014-12-31 | 2017-05-17 | 华为技术有限公司 | 一种阵列天线波束调整装置和方法 |
CN106301498A (zh) * | 2016-08-17 | 2017-01-04 | 河海大学 | 子带处理方法及频空级联的宽带自适应波束获取方法 |
CN106340305A (zh) * | 2016-11-04 | 2017-01-18 | 北京声智科技有限公司 | 自校准的远场语音交互设备及远场语音自校准方法 |
CN110169083A (zh) * | 2017-01-06 | 2019-08-23 | 伯斯有限公司 | 麦克风阵列波束形成 |
CN108447496A (zh) * | 2018-06-22 | 2018-08-24 | 成都瑞可利信息科技有限公司 | 一种基于麦克风阵列的语音增强方法及装置 |
CN109119092A (zh) * | 2018-08-31 | 2019-01-01 | 广东美的制冷设备有限公司 | 基于麦克风阵列的波束指向切换方法和装置 |
CN109600152A (zh) * | 2018-12-17 | 2019-04-09 | 西北工业大学 | 一种基于子空间基变换的自适应波束形成方法 |
CN109856593A (zh) * | 2018-12-21 | 2019-06-07 | 南京理工大学 | 面向声源测向的微型智能阵列式声传感器及其测向方法 |
CN110931036A (zh) * | 2019-12-07 | 2020-03-27 | 杭州国芯科技股份有限公司 | 一种麦克风阵列波束形成方法 |
Non-Patent Citations (3)
Title |
---|
M.HAWKES: ""Acoustic vector-sensor beamforming and capon direction estimation"", 《IEEE 》 * |
杨洁: ""提高麦克风阵列波束指向性性能的虚拟扩展方法"", 《西安电子科技大学学报(自然科学版)》 * |
潘超: ""面向语音通信的麦克风阵列波束形成算法研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112492452A (zh) * | 2020-11-26 | 2021-03-12 | 北京字节跳动网络技术有限公司 | 波束系数存储方法、装置、设备和存储介质 |
CN112492452B (zh) * | 2020-11-26 | 2022-08-26 | 北京字节跳动网络技术有限公司 | 波束系数存储方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111540371B (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10506337B2 (en) | Frequency-invariant beamformer for compact multi-ringed circular differential microphone arrays | |
JP3701940B2 (ja) | 目的信号源から雑音環境に放射される信号を処理するシステム及び方法 | |
Mabande et al. | Design of robust superdirective beamformers as a convex optimization problem | |
EP1429581B1 (en) | Method of broadband constant directivity beamforming for non linear and non axi-symmetric sensor arrays embedded in a obstacle | |
CN111128220B (zh) | 去混响方法、装置、设备及存储介质 | |
Buchris et al. | Incoherent synthesis of sparse arrays for frequency-invariant beamforming | |
CN111540371B (zh) | 麦克风阵列波束成形的方法、装置和计算机设备 | |
EP3320691A1 (en) | An audio signal processing apparatus and a sound emission apparatus | |
Kajala et al. | Filter-and-sum beamformer with adjustable filter characteristics | |
Huang et al. | Kronecker product beamforming with multiple differential microphone arrays | |
Pan et al. | On the design of target beampatterns for differential microphone arrays | |
Lai et al. | Design of steerable spherical broadband beamformers with flexible sensor configurations | |
Albertini et al. | Two-stage beamforming with arbitrary planar arrays of differential microphone array units | |
Kleiman et al. | Constant-beamwidth beamforming with nonuniform concentric ring arrays | |
Alon et al. | Spherical microphone array with optimal aliasing cancellation | |
CN105974377A (zh) | 一种对数字阵列雷达自适应调零技术的干扰方法 | |
Mabande et al. | A time-domain implementation of data-independent robust broadband beamformers with lowfilter order | |
Zhang et al. | Selective frequency invariant uniform circular broadband beamformer | |
CN113491137B (zh) | 具有分数阶的灵活差分麦克风阵列 | |
Markovich‐Golan et al. | Spatial filtering | |
Chan et al. | Theory and design of uniform concentric circular arrays with frequency invariant characteristics [sensor arrays] | |
CN115866483A (zh) | 一种音频信号的波束形成方法及设备 | |
Patel et al. | On the design of optimal linear microphone array geometries | |
CN114731467A (zh) | 线性差分定向麦克风阵列 | |
Chan et al. | Adaptive beamforming using uniform concentric circular arrays with frequency invariant characteristics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Method, device, and computer equipment for microphone array beamforming Granted publication date: 20201103 Pledgee: Shenzhen Shunshui Incubation Management Co.,Ltd. Pledgor: SHENZHEN YOUJIE ZHIXIN TECHNOLOGY Co.,Ltd. Registration number: Y2024980029366 |