CN110931036A - 一种麦克风阵列波束形成方法 - Google Patents

一种麦克风阵列波束形成方法 Download PDF

Info

Publication number
CN110931036A
CN110931036A CN201911246555.3A CN201911246555A CN110931036A CN 110931036 A CN110931036 A CN 110931036A CN 201911246555 A CN201911246555 A CN 201911246555A CN 110931036 A CN110931036 A CN 110931036A
Authority
CN
China
Prior art keywords
microphone array
directions
beam forming
time
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911246555.3A
Other languages
English (en)
Other versions
CN110931036B (zh
Inventor
卢燕
梁骏
姚欢
王坤鹏
陈谢
汪文轩
沈旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou National Chip Science & Technology Co Ltd
Original Assignee
Hangzhou National Chip Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou National Chip Science & Technology Co Ltd filed Critical Hangzhou National Chip Science & Technology Co Ltd
Priority to CN201911246555.3A priority Critical patent/CN110931036B/zh
Publication of CN110931036A publication Critical patent/CN110931036A/zh
Application granted granted Critical
Publication of CN110931036B publication Critical patent/CN110931036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

本发明公开了一种麦克风阵列波束形成方法。本发明针对麦克风阵列波束形成算法在嘈杂及多语音干扰环境中无法很好地估计噪声及干扰协方差矩阵以及源语音信号导向矢量的问题,提出了一种麦克风阵列波束形成方法。本发明在传统麦克风阵列波束形成的基础上,构造方向模板,利用时频单元信号的相位差矢量与不同方向模板的夹角余弦得到时频掩蔽值TFmask,以较低的计算量在短时傅里叶变换域中尽可能地区分开了源信号与其他方向的语音干扰。

Description

一种麦克风阵列波束形成方法
技术领域
本发明属于噪声及干扰抑制技术领域,具体涉及一种麦克风阵列波束形成方法。
背景技术
麦克风阵列波束形成通过估计环境协方差矩阵(噪声及干扰)以及源语音信号导向矢量,为提高语音通话质量、提升智能语音交互准确率,设计相关的波束形式滤波权值,以达到提高信干噪比(Signal-to-Interferences-plus-Noise Ratio,SINR)的目的。
传统的麦克风阵列波束形成方法的效果依赖于环境协方差矩阵以及源语音信号导向矢量估计的准确性。
针对环境协方差矩阵的估计,常用的方法有两种:(1)使用语音活动检测(VoiceActivity Detection,VAD)算法,在期望信息的无声段(即语音间隙)来估计和更新噪声协方差矩阵。尽管这种方法在平稳噪声(例如白噪声)或者是不存在语音干扰的情况下可以取得令人满意的效果,但在更多的现实场景中,例如餐厅或者办公室场景,噪声谱不断变化且存在其他人声干扰,对噪声协方差矩阵的估计变得不尽理想。(2)基于复高斯混合模型(Complex Gaussian Mixture Model,CGMM),用期望最大化算法(ExpectationMaximization,EM)迭代求得每个时频单元的时频掩蔽值(Time-Frequency Mask,TFmask),进而得到环境协方差矩阵。一方面,迭代要求的高计算量限制了该方法的实际使用;另一方面,该方法仍旧未能将感兴趣的语音(目标语音)和来自其他方向的干扰语音进行有效的区分。
针对源语音信号导向矢量(Steering Vector,ST)的估计,常常基于语音波达方向估计(Direction of Arrival,DOA)方法和已知的阵列参数进行构造。而在实际场景中,往往存在一定的信号折射,这给DOA带来了较大的挑战,特别是当信号折射与多个强干扰并存,且麦克风个数较少的时候,DOA极其容易判断错误。
发明内容
本发明的目的就是针对现有技术的缺陷,提出了一种适用于非平稳噪声环境以及存在干扰语音情况下,更有效的估计环境协方差矩阵,确定源语音信号导向矢量,提升麦克风阵列波束形成效果的方法。
本发明方法具体步骤是:
步骤(1).确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量;
步骤(2).计算导向矢量相位,并对第一个麦克风阵元的相位归一化得到方向模板;
步骤(3).将麦克风阵列接收信号经过短时傅里叶变换(Short Time FourierTransform,STFT)得到短时傅里叶变换域(Short Time Fourier Transform Domain,STFTDomain)信号,其中每一个单元称之为时频单元;进而得到一个时频单元中信号的相位差矢量,计算相位差矢量与每一个方向的方向模板的夹角的余弦值,该夹角余弦值表征了当前时频单元中信号与N个方向的距离;
步骤(4).将N个夹角的余弦值归一化至[0 1]:将其通过softmax函数,得到N个方向上存在语音信号的概率,即时频掩蔽值TFmask;
步骤(5).依据得到的时频掩蔽值TFmask更新噪声干扰协方差矩阵;
步骤(6).利用噪声干扰协方差矩阵,依据最小方差无失真响应(MinimumVariance Distortionless Response,MVDR)波束形成算法得到滤波权值wopt,进而滤波得到波束形成增强信号。
进一步,步骤(1)具体方法是:首先确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量
Figure BDA0002307465360000021
其中,M为麦克风阵列的阵元个数,θ∈[0,π]为俯仰角,
Figure BDA0002307465360000022
为方向角,
Figure BDA0002307465360000023
为第m个麦克风阵元的相移,m=1,2,…,M;针对第f个频率单元,所有N个方向的向矢量组成一个导向矢量组:
Figure BDA0002307465360000024
进一步,步骤(2)具体方法是:计算导向矢量的相位,并对第一个麦克风阵元的相位归一化,得到
Figure BDA0002307465360000025
Figure BDA0002307465360000026
称为方向模板,并统一记为
Figure BDA0002307465360000027
其中angle(·)为求相位角运算;针对第f个频率单元,所有N个方向的方向模板组成一个方向模板组,记为
Figure BDA0002307465360000028
进一步,步骤(3)具体方法是:分别求N个方向的方向模板
Figure BDA0002307465360000029
与当前时频单元(t,f)的相位差矢量zt,f的夹角余弦值γt,f=[γt,f,1 γt,f,2 … γt,f,n … γt,f,N]∈C1×N
其中,
Figure BDA0002307465360000031
进一步,步骤(4)具体方法是:将N个方向夹角余弦值γt,f通过softmax函数,得到时频掩蔽值
Figure BDA0002307465360000032
其中
Figure BDA0002307465360000033
且有
Figure BDA0002307465360000034
softmax函数将γt,f转换成当前时频单元(t,f)在N个方向存在语音信号的概率,即
Figure BDA0002307465360000035
即是N个方向对应的信号的时频掩蔽值TFmask;所述的语音信号为源语音信号或者干扰语音信号;
Figure BDA0002307465360000036
表示干扰和噪声的时频掩蔽值TFmask。
进一步,步骤(5)具体方法是:对噪声及干扰协方差矩阵进行更新,得到更新后的噪声及干扰协方差矩阵
Figure BDA0002307465360000037
Figure BDA0002307465360000038
其中l∈{1 … L}是一个最小批(Mini Batch),βl表示第l个最小批的所有帧的集合,中
Figure BDA0002307465360000039
是所有帧的
Figure BDA00023074653600000310
之和,由
Figure BDA00023074653600000311
更新得到;初始估计的噪声及干扰协方差矩阵根据
Figure BDA00023074653600000312
计算得到。
进一步,步骤(6)具体方法是:得到最优的波束形成滤波权值
Figure BDA00023074653600000313
最终得到滤波之后的增强信号yt,f=wopt Hxt,f,其中xt,f为麦克风阵列接收信号。
本发明的有益效果是:针对麦克风阵列波束形成算法在嘈杂及多语音干扰环境中无法很好地估计噪声及干扰协方差矩阵以及源语音信号导向矢量的问题,提出了一种麦克风阵列波束形成方法。本发明在传统麦克风阵列波束形成的基础上,构造方向模板,利用时频单元信号的相位差矢量与不同方向模板的夹角余弦得到时频掩蔽值TFmask,以较低的计算量在短时傅里叶变换域中尽可能地区分开了源信号与其他方向的语音干扰。
本方法的优势在于:
(1)跟“根据VAD更新噪声协方差矩阵”方法相比,引入方向模板,能够区分与源信号不同方向的语音干扰,实现对语音干扰的最大化压制。
(2)跟“基于CGMM”方法相比,不需要使用迭代算法,以较小的计算量得到了时频掩蔽值TFmask。
(3)跟“根据DOA构造源语音信号导向矢量”方法相比,在存在强折射且有多个强语音干扰的场景中,本发明利用方向模板,可以不依赖于DOA算法的性能,算法整体更鲁棒,抗干扰能力更强。
附图说明
图1为本发明的流程示意图;
图2为本发明中麦克风阵列模型示意图。
具体实施方式
为了便于理解本发明,为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便充分理解本发明,附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解地更加透彻全面。本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
一种麦克风阵列波束形成方法,整体流程如图1所示。
信号模型:
考虑一个M阵元麦克风阵列,在短时傅里叶变换域中,整个麦克风阵列接收信号可以表示为:
Figure BDA0002307465360000041
其中xt,f,m为第m个麦克风在时间单元t和频率单元f的信号;st,f,i表示在时间单元t和频率单元f的第i个语音信号(i=1,…,I);
Figure BDA0002307465360000042
表示其对应的M维导向矢量,其中φm为第m个麦克风阵元的相移,
Figure BDA0002307465360000043
分别代表信号入射俯仰角和方位角;nt,f=[nt,f,1 … nt,f,M]TM维噪声矢量;其中·T表示转置。为了方便叙述,假设第1个语音信号是感兴趣的源语音信号,而第2,…,I个语音信号是不需要的干扰语音信号,麦克风阵列接收信号可以重写为:
Figure BDA0002307465360000044
其中,xt,f,target是麦克风阵列接收到的感兴趣的源语音信号,xt,f,interf是麦克风阵列接收到的语音干扰信号,nt,f是噪声信号。
导向矢量以及方向模板的构造:
实际应用时,本发明方法不局限于麦克风阵列的形状,已知阵列参数的均匀线阵,均匀圆阵,抑或是不规则阵列均适用。下面便于阐述本发明的技术原理,以均匀圆阵为例,介绍导向矢量以及方向模板的构造。考虑如图2所示的具有M个麦克风的均匀圆阵列的几何结构,圆阵半径为R。麦克风阵元m的坐标为pm=[Rcos[2π(m-1)/M] Rsin[2π(m-1)/M] 0]。
以原点作为参考点,假设信号从
Figure BDA0002307465360000051
方向入射,其中θ∈[0,π]为俯仰角,定义为z轴到入射方向的角度;
Figure BDA0002307465360000052
为方向角,定义为x轴到入射方向在xoy平面投影的角度。
信号的入射方向的单位向量为
Figure BDA0002307465360000053
假设麦克风阵元m接收到的入射波的时间滞后于信号到达参考点的时间,阵元m相对于参考点的时延可以表示为:
Figure BDA0002307465360000054
其中v=340m/s为音速,相应的相移为:
Figure BDA0002307465360000055
此时导向矢量可以表示为
Figure BDA0002307465360000056
计算导向矢量的相位,并对第一个麦克风阵元的相位归一化,得到
Figure BDA0002307465360000057
其中angle(·)为求相位角运算。当该频率单元不存在频率混叠时,等价于:
Figure BDA0002307465360000058
但如果存在频率混叠,情况将将有所变化,将
Figure BDA0002307465360000059
称为方向模板,并统一记为:
Figure BDA00023074653600000510
针对第f个频率单元,所有N个方向的方向模板组成一个方向模板组,记为:
Figure BDA00023074653600000511
考虑到圆阵一般水平放置,针对远场情况时,入射角一般垂直于z轴,即俯仰角θ≈90°,所以简化导向矢量,设置俯仰角θ=90°。对于N个源语音信号和干扰信号的可能方向,我们可以通过DOA相关算法计算得到,也把全方向方位角(线阵[0,π],圆阵[0,2π))均匀分成N个方向,得到固定的N个方向,即
Figure BDA0002307465360000061
时频掩蔽值TFmask的计算:
在短时傅里叶变换域中,针对时频单元(t,f),整个麦克风阵列接收信号可以表示为
Figure BDA0002307465360000062
对时频单元(t,f)求阵列信号相位并归一化得到:
zt,f=[0 angle(xt,f,2)-angle(xt,f,1) … angle(xt,f,M)-angle(xt,f,1)]T∈CM×1
zt,f为时频单元(t,f)的相位差矢量。
假设源语音信号与噪声、干扰源信号在短时傅里叶变换域中满足稀疏性假设,则在大部分源信号占优的时频单元中,可以认为噪声、干扰源信号的影响是比较小的。当时频单元(t,f)中源语音信号占优时,可以认为:
Figure BDA0002307465360000063
其中<>表示求两向量的夹角。又因为向量间的夹角与其余弦值一一对应,所以为了优化计算,用向量间的夹角余弦作为两个向量夹角大小的度量,两向量的夹角余弦由下式得到
Figure BDA0002307465360000064
其中a≠0且b≠0。
分别求N个方向的方向模板与当前时频单元(t,f)的相位差矢量的夹角余弦值,记为:γt,f=[γt,f,1 γt,f,2 … γt,f,n … γt,f,N]∈C1×N,其中
Figure BDA0002307465360000065
从向量夹角以及夹角余弦的定义可以知道,两个向量夹角越小,其对应的夹角余弦越接近于1,而相反地,两个向量夹角越大,其对应的夹角余弦越接近0。所以将γt,f通过softmax函数,得到
Figure BDA0002307465360000066
其中
Figure BDA0002307465360000067
Softmax函数将γt,f转换成当前时频单元(t,f)在N个方向存在语音信号(源语音信号或者干扰语音信号)的概率,即
Figure BDA0002307465360000071
即是N个方向对应的时频掩蔽值TFmask。
基于时频掩蔽值TFmask的协方差矩阵流式迭代方法:
Figure BDA0002307465360000072
表示时频单元中包含感兴趣的源语音信号st,f的概率,即时频掩蔽值TFmask,
Figure BDA0002307465360000073
表示时频单元(t,f)中包含噪声以及干扰语音信号的概率,则可以估计初始的噪声及干扰协方差矩阵,得到
Figure BDA0002307465360000074
流式处理时,记l∈{1 … L}是一个最小批(Mini Batch),βl表示第l个最小批的所有帧的集合,则
Figure BDA0002307465360000075
其中
Figure BDA0002307465360000076
是所有帧的
Figure BDA0002307465360000077
之和,并通过以下公式进行更新
Figure BDA0002307465360000078
最小方差无失真响应算法:
利用波束形成器处理阵列接收信号,通过改变滤波器权值,可使某些期望方向的信号通过滤波器,同时抑制其他方向的信号。
针对频率f,M阵元麦克风阵列的接收信号xt,f作为M抽头横向滤波器的输入,滤波器权向量可以表示wf=[w1 w2 … wM]T∈CM×1;空域滤波器的输出为yt,f=wf Hxt,f;输出的平均功率
Figure BDA0002307465360000079
Figure BDA00023074653600000710
其中
Figure BDA00023074653600000711
是接收信号的协方差矩阵。
假设感兴趣的信号(源语音信号)st,f
Figure BDA00023074653600000712
方向入射,麦克风阵列对该方向的接收信号为
Figure BDA00023074653600000713
为了使该方向入射的信号无失真的通过空域滤波器,应有
Figure BDA00023074653600000714
所以,空域滤波权矢量应满足
Figure BDA00023074653600000715
在保证上式成立的情况下,选择滤波权矢量w,使得空域滤波器的平均输出功率
Figure BDA00023074653600000716
最小,即对其他方向的信号和噪声尽量抑制。则问题描述为
Figure BDA00023074653600000717
因为实际应用中,估计的信号方向可能与实际信号方向存在误差,并不能保证信号完全无失真通过滤波器,所以一般将接收信号的协方差矩阵Rf替换为需要抑制的信号(噪声和干扰)对应的协方差矩阵
Figure BDA0002307465360000081
Figure BDA0002307465360000082
这是一个条件极值问题,用拉格朗日乘子法求解可以得到最优的波束形成滤波权值
Figure BDA0002307465360000083
进而得到滤波之后的增强信号yt,f=wopt Hxt,f

Claims (7)

1.一种麦克风阵列波束形成方法,其特征在于该方法具体步骤是:
步骤(1).确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量;
步骤(2).计算导向矢量相位,并对第一个麦克风阵元的相位归一化得到方向模板;
步骤(3).将麦克风阵列接收信号经过短时傅里叶变换得到短时傅里叶变换域信号,其中每一个单元称之为时频单元;进而得到一个时频单元中信号的相位差矢量,计算相位差矢量与每一个方向的方向模板的夹角的余弦值,该夹角余弦值表征了当前时频单元中信号与N个方向的距离;
步骤(4).将N个夹角的余弦值归一化至[0 1]:将其通过softmax函数,得到N个方向上存在语音信号的概率,即时频掩蔽值TFmask;
步骤(5).依据得到的时频掩蔽值TFmask更新噪声干扰协方差矩阵;
步骤(6).利用噪声干扰协方差矩阵,依据最小方差无失真响应波束形成算法得到滤波权值wopt,进而滤波得到波束形成增强信号。
2.如权利要求1所述的一种麦克风阵列波束形成方法,其特征在于,步骤(1)具体方法是:首先确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量
Figure FDA0002307465350000011
其中,M为麦克风阵列的阵元个数,θ∈[0,π]为俯仰角,
Figure FDA0002307465350000012
为方向角,
Figure FDA0002307465350000013
为第m个麦克风阵元的相移,m=1,2,…,M;针对第f个频率单元,所有N个方向的向矢量组成一个导向矢量组:
Figure FDA0002307465350000014
3.如权利要求1所述的一种麦克风阵列波束形成方法,其特征在于,步骤(2)具体方法是:计算导向矢量的相位,并对第一个麦克风阵元的相位归一化,得到
Figure FDA0002307465350000015
Figure FDA0002307465350000016
称为方向模板,并统一记为
Figure FDA0002307465350000017
其中angle(·)为求相位角运算;针对第f个频率单元,所有N个方向的方向模板组成一个方向模板组,记为
Figure FDA0002307465350000021
4.如权利要求1所述的一种麦克风阵列波束形成方法,其特征在于,步骤(3)具体方法是:分别求N个方向的方向模板
Figure FDA0002307465350000022
与当前时频单元(t,f)的相位差矢量zt,f的夹角余弦值γt,f=[γt,f,1 γt,f,2…γt,f,n…γt,f,N]∈C1×N;其中,
Figure FDA0002307465350000023
5.如权利要求1所述的一种麦克风阵列波束形成方法,其特征在于,步骤(4)具体方法是:将N个方向夹角余弦值γt,f通过softmax函数,得到时频掩蔽值
Figure FDA0002307465350000024
其中
Figure FDA0002307465350000025
且有
Figure FDA0002307465350000026
softmax函数将γt,f转换成当前时频单元(t,f)在N个方向存在语音信号的概率,即
Figure FDA0002307465350000027
即是N个方向对应的信号的时频掩蔽值TFmask;所述的语音信号为源语音信号或者干扰语音信号;
Figure FDA0002307465350000028
表示干扰和噪声的时频掩蔽值TFmask。
6.如权利要求1所述的一种麦克风阵列波束形成方法,其特征在于,步骤(5)具体方法是:对噪声及干扰协方差矩阵进行更新,得到更新后的噪声及干扰协方差矩阵
Figure FDA0002307465350000029
Figure FDA00023074653500000210
其中l∈{1…L}是一个最小批(Mini Batch),βl表示第l个最小批的所有帧的集合,中
Figure FDA00023074653500000211
是所有帧的
Figure FDA00023074653500000212
之和,由
Figure FDA00023074653500000213
更新得到;初始估计的噪声及干扰协方差矩阵根据
Figure FDA00023074653500000214
计算得到。
7.如权利要求1所述的一种麦克风阵列波束形成方法,其特征在于,步骤(6)具体方法是:得到最优的波束形成滤波权值
Figure FDA00023074653500000215
最终得到滤波之后的增强信号yt,f=wopt Hxt,f,其中xt,f为麦克风阵列接收信号。
CN201911246555.3A 2019-12-07 2019-12-07 一种麦克风阵列波束形成方法 Active CN110931036B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911246555.3A CN110931036B (zh) 2019-12-07 2019-12-07 一种麦克风阵列波束形成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911246555.3A CN110931036B (zh) 2019-12-07 2019-12-07 一种麦克风阵列波束形成方法

Publications (2)

Publication Number Publication Date
CN110931036A true CN110931036A (zh) 2020-03-27
CN110931036B CN110931036B (zh) 2022-03-22

Family

ID=69858372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911246555.3A Active CN110931036B (zh) 2019-12-07 2019-12-07 一种麦克风阵列波束形成方法

Country Status (1)

Country Link
CN (1) CN110931036B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508516A (zh) * 2020-03-31 2020-08-07 上海交通大学 基于信道关联时频掩膜的语音波束形成方法
CN111540371A (zh) * 2020-04-22 2020-08-14 深圳市友杰智新科技有限公司 麦克风阵列波束成形的方法、装置和计算机设备
CN111866665A (zh) * 2020-07-22 2020-10-30 海尔优家智能科技(北京)有限公司 麦克风阵列波束形成方法及装置
CN113053408A (zh) * 2021-03-12 2021-06-29 云知声智能科技股份有限公司 一种声源分离方法及装置
CN113050035A (zh) * 2021-03-12 2021-06-29 云知声智能科技股份有限公司 一种二维定向拾音方法及装置
CN113707136A (zh) * 2021-10-28 2021-11-26 南京南大电子智慧型服务机器人研究院有限公司 服务型机器人语音交互的音视频混合语音前端处理方法
CN113763982A (zh) * 2020-06-05 2021-12-07 阿里巴巴集团控股有限公司 音频处理方法、装置、电子设备及可读存储介质
CN113782047A (zh) * 2021-09-06 2021-12-10 云知声智能科技股份有限公司 语音分离方法、装置、设备和存储介质
CN113782046A (zh) * 2021-09-09 2021-12-10 清华大学 一种用于远距离语音识别的麦克风阵列拾音方法及系统
CN115359804A (zh) * 2022-10-24 2022-11-18 北京快鱼电子股份公司 一种基于麦克风阵列的定向音频拾取方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070274536A1 (en) * 2006-05-26 2007-11-29 Fujitsu Limited Collecting sound device with directionality, collecting sound method with directionality and memory product
US20120263315A1 (en) * 2011-04-18 2012-10-18 Sony Corporation Sound signal processing device, method, and program
US9640197B1 (en) * 2016-03-22 2017-05-02 International Business Machines Corporation Extraction of target speeches
CN107018470A (zh) * 2016-01-28 2017-08-04 讯飞智元信息科技有限公司 一种基于环形麦克风阵列的语音记录方法及系统
CN107976651A (zh) * 2016-10-21 2018-05-01 杭州海康威视数字技术股份有限公司 一种基于麦克风阵列的声源定位方法及装置
CN109859769A (zh) * 2019-01-30 2019-06-07 科大讯飞股份有限公司 一种掩码估计方法及装置
CN110400572A (zh) * 2019-08-12 2019-11-01 苏州思必驰信息科技有限公司 音频增强方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070274536A1 (en) * 2006-05-26 2007-11-29 Fujitsu Limited Collecting sound device with directionality, collecting sound method with directionality and memory product
US20120263315A1 (en) * 2011-04-18 2012-10-18 Sony Corporation Sound signal processing device, method, and program
CN107018470A (zh) * 2016-01-28 2017-08-04 讯飞智元信息科技有限公司 一种基于环形麦克风阵列的语音记录方法及系统
US9640197B1 (en) * 2016-03-22 2017-05-02 International Business Machines Corporation Extraction of target speeches
CN107976651A (zh) * 2016-10-21 2018-05-01 杭州海康威视数字技术股份有限公司 一种基于麦克风阵列的声源定位方法及装置
CN109859769A (zh) * 2019-01-30 2019-06-07 科大讯飞股份有限公司 一种掩码估计方法及装置
CN110400572A (zh) * 2019-08-12 2019-11-01 苏州思必驰信息科技有限公司 音频增强方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YUJIE GU: "Robust_Adaptive_Beamforming_Based_on_Interference_Covariance_Matrix_Reconstruction_and_Steering_Vector_Estimation", 《IEEE TRANSACTIONS ON SIGNAL PROCESSING》 *
何礼: "利用相位时频掩蔽的麦克风阵列噪声消除方法", 《信号处理》 *
张华等: "基于声源时延估计的欠定盲分离方法", 《数据采集与处理》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508516A (zh) * 2020-03-31 2020-08-07 上海交通大学 基于信道关联时频掩膜的语音波束形成方法
CN111540371A (zh) * 2020-04-22 2020-08-14 深圳市友杰智新科技有限公司 麦克风阵列波束成形的方法、装置和计算机设备
CN111540371B (zh) * 2020-04-22 2020-11-03 深圳市友杰智新科技有限公司 麦克风阵列波束成形的方法、装置和计算机设备
CN113763982A (zh) * 2020-06-05 2021-12-07 阿里巴巴集团控股有限公司 音频处理方法、装置、电子设备及可读存储介质
CN111866665A (zh) * 2020-07-22 2020-10-30 海尔优家智能科技(北京)有限公司 麦克风阵列波束形成方法及装置
CN113053408B (zh) * 2021-03-12 2022-06-14 云知声智能科技股份有限公司 一种声源分离方法及装置
CN113053408A (zh) * 2021-03-12 2021-06-29 云知声智能科技股份有限公司 一种声源分离方法及装置
CN113050035A (zh) * 2021-03-12 2021-06-29 云知声智能科技股份有限公司 一种二维定向拾音方法及装置
CN113050035B (zh) * 2021-03-12 2022-11-25 云知声智能科技股份有限公司 一种二维定向拾音方法及装置
CN113782047A (zh) * 2021-09-06 2021-12-10 云知声智能科技股份有限公司 语音分离方法、装置、设备和存储介质
CN113782047B (zh) * 2021-09-06 2024-03-08 云知声智能科技股份有限公司 语音分离方法、装置、设备和存储介质
CN113782046A (zh) * 2021-09-09 2021-12-10 清华大学 一种用于远距离语音识别的麦克风阵列拾音方法及系统
CN113707136B (zh) * 2021-10-28 2021-12-31 南京南大电子智慧型服务机器人研究院有限公司 服务型机器人语音交互的音视频混合语音前端处理方法
CN113707136A (zh) * 2021-10-28 2021-11-26 南京南大电子智慧型服务机器人研究院有限公司 服务型机器人语音交互的音视频混合语音前端处理方法
CN115359804A (zh) * 2022-10-24 2022-11-18 北京快鱼电子股份公司 一种基于麦克风阵列的定向音频拾取方法和系统
CN115359804B (zh) * 2022-10-24 2023-01-06 北京快鱼电子股份公司 一种基于麦克风阵列的定向音频拾取方法和系统

Also Published As

Publication number Publication date
CN110931036B (zh) 2022-03-22

Similar Documents

Publication Publication Date Title
CN110931036B (zh) 一种麦克风阵列波束形成方法
Gannot et al. A consolidated perspective on multimicrophone speech enhancement and source separation
CN109087664B (zh) 语音增强方法
US8363850B2 (en) Audio signal processing method and apparatus for the same
Shahbazpanahi et al. Robust adaptive beamforming for general-rank signal models
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
CN109616136B (zh) 一种自适应波束形成方法、装置及系统
CN111415676B (zh) 一种基于分离矩阵初始化频点选择的盲源分离方法及系统
US9291697B2 (en) Systems, methods, and apparatus for spatially directive filtering
EP2647221B1 (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
US7626889B2 (en) Sensor array post-filter for tracking spatial distributions of signals and noise
Salvati et al. Incoherent frequency fusion for broadband steered response power algorithms in noisy environments
CN104854878B (zh) 使用双麦克风阵列抑制空间干扰的设备、方法和计算机介质
US20080288219A1 (en) Sensor array beamformer post-processor
WO2008121905A2 (en) Enhanced beamforming for arrays of directional microphones
CN109459744B (zh) 一种实现多干扰抑制的稳健自适应波束形成方法
Niwa et al. Post-filter design for speech enhancement in various noisy environments
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN111681665A (zh) 一种全向降噪方法、设备及存储介质
US9502021B1 (en) Methods and systems for robust beamforming
Niwa et al. PSD estimation in beamspace using property of M-matrix
CN113593596A (zh) 一种基于子阵划分的鲁棒自适应波束形成定向拾音方法
Gao et al. An order-aware scheme for robust direction of arrival estimation in the spherical harmonic domain
CN111060867A (zh) 一种指向性麦克风微阵列波达方向估计方法
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant