CN110931036A - 一种麦克风阵列波束形成方法 - Google Patents
一种麦克风阵列波束形成方法 Download PDFInfo
- Publication number
- CN110931036A CN110931036A CN201911246555.3A CN201911246555A CN110931036A CN 110931036 A CN110931036 A CN 110931036A CN 201911246555 A CN201911246555 A CN 201911246555A CN 110931036 A CN110931036 A CN 110931036A
- Authority
- CN
- China
- Prior art keywords
- microphone array
- directions
- beam forming
- time
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims abstract description 25
- 230000000873 masking effect Effects 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims description 13
- 230000010363 phase shift Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 abstract description 3
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000003491 array Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
本发明公开了一种麦克风阵列波束形成方法。本发明针对麦克风阵列波束形成算法在嘈杂及多语音干扰环境中无法很好地估计噪声及干扰协方差矩阵以及源语音信号导向矢量的问题,提出了一种麦克风阵列波束形成方法。本发明在传统麦克风阵列波束形成的基础上,构造方向模板,利用时频单元信号的相位差矢量与不同方向模板的夹角余弦得到时频掩蔽值TFmask,以较低的计算量在短时傅里叶变换域中尽可能地区分开了源信号与其他方向的语音干扰。
Description
技术领域
本发明属于噪声及干扰抑制技术领域,具体涉及一种麦克风阵列波束形成方法。
背景技术
麦克风阵列波束形成通过估计环境协方差矩阵(噪声及干扰)以及源语音信号导向矢量,为提高语音通话质量、提升智能语音交互准确率,设计相关的波束形式滤波权值,以达到提高信干噪比(Signal-to-Interferences-plus-Noise Ratio,SINR)的目的。
传统的麦克风阵列波束形成方法的效果依赖于环境协方差矩阵以及源语音信号导向矢量估计的准确性。
针对环境协方差矩阵的估计,常用的方法有两种:(1)使用语音活动检测(VoiceActivity Detection,VAD)算法,在期望信息的无声段(即语音间隙)来估计和更新噪声协方差矩阵。尽管这种方法在平稳噪声(例如白噪声)或者是不存在语音干扰的情况下可以取得令人满意的效果,但在更多的现实场景中,例如餐厅或者办公室场景,噪声谱不断变化且存在其他人声干扰,对噪声协方差矩阵的估计变得不尽理想。(2)基于复高斯混合模型(Complex Gaussian Mixture Model,CGMM),用期望最大化算法(ExpectationMaximization,EM)迭代求得每个时频单元的时频掩蔽值(Time-Frequency Mask,TFmask),进而得到环境协方差矩阵。一方面,迭代要求的高计算量限制了该方法的实际使用;另一方面,该方法仍旧未能将感兴趣的语音(目标语音)和来自其他方向的干扰语音进行有效的区分。
针对源语音信号导向矢量(Steering Vector,ST)的估计,常常基于语音波达方向估计(Direction of Arrival,DOA)方法和已知的阵列参数进行构造。而在实际场景中,往往存在一定的信号折射,这给DOA带来了较大的挑战,特别是当信号折射与多个强干扰并存,且麦克风个数较少的时候,DOA极其容易判断错误。
发明内容
本发明的目的就是针对现有技术的缺陷,提出了一种适用于非平稳噪声环境以及存在干扰语音情况下,更有效的估计环境协方差矩阵,确定源语音信号导向矢量,提升麦克风阵列波束形成效果的方法。
本发明方法具体步骤是:
步骤(1).确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量;
步骤(2).计算导向矢量相位,并对第一个麦克风阵元的相位归一化得到方向模板;
步骤(3).将麦克风阵列接收信号经过短时傅里叶变换(Short Time FourierTransform,STFT)得到短时傅里叶变换域(Short Time Fourier Transform Domain,STFTDomain)信号,其中每一个单元称之为时频单元;进而得到一个时频单元中信号的相位差矢量,计算相位差矢量与每一个方向的方向模板的夹角的余弦值,该夹角余弦值表征了当前时频单元中信号与N个方向的距离;
步骤(4).将N个夹角的余弦值归一化至[0 1]:将其通过softmax函数,得到N个方向上存在语音信号的概率,即时频掩蔽值TFmask;
步骤(5).依据得到的时频掩蔽值TFmask更新噪声干扰协方差矩阵;
步骤(6).利用噪声干扰协方差矩阵,依据最小方差无失真响应(MinimumVariance Distortionless Response,MVDR)波束形成算法得到滤波权值wopt,进而滤波得到波束形成增强信号。
进一步,步骤(1)具体方法是:首先确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量其中,M为麦克风阵列的阵元个数,θ∈[0,π]为俯仰角,为方向角,为第m个麦克风阵元的相移,m=1,2,…,M;针对第f个频率单元,所有N个方向的向矢量组成一个导向矢量组:
进一步,步骤(2)具体方法是:计算导向矢量的相位,并对第一个麦克风阵元的相位归一化,得到将称为方向模板,并统一记为其中angle(·)为求相位角运算;针对第f个频率单元,所有N个方向的方向模板组成一个方向模板组,记为
进一步,步骤(4)具体方法是:将N个方向夹角余弦值γt,f通过softmax函数,得到时频掩蔽值其中且有softmax函数将γt,f转换成当前时频单元(t,f)在N个方向存在语音信号的概率,即即是N个方向对应的信号的时频掩蔽值TFmask;所述的语音信号为源语音信号或者干扰语音信号;表示干扰和噪声的时频掩蔽值TFmask。
进一步,步骤(5)具体方法是:对噪声及干扰协方差矩阵进行更新,得到更新后的噪声及干扰协方差矩阵 其中l∈{1 … L}是一个最小批(Mini Batch),βl表示第l个最小批的所有帧的集合,中是所有帧的之和,由更新得到;初始估计的噪声及干扰协方差矩阵根据计算得到。
本发明的有益效果是:针对麦克风阵列波束形成算法在嘈杂及多语音干扰环境中无法很好地估计噪声及干扰协方差矩阵以及源语音信号导向矢量的问题,提出了一种麦克风阵列波束形成方法。本发明在传统麦克风阵列波束形成的基础上,构造方向模板,利用时频单元信号的相位差矢量与不同方向模板的夹角余弦得到时频掩蔽值TFmask,以较低的计算量在短时傅里叶变换域中尽可能地区分开了源信号与其他方向的语音干扰。
本方法的优势在于:
(1)跟“根据VAD更新噪声协方差矩阵”方法相比,引入方向模板,能够区分与源信号不同方向的语音干扰,实现对语音干扰的最大化压制。
(2)跟“基于CGMM”方法相比,不需要使用迭代算法,以较小的计算量得到了时频掩蔽值TFmask。
(3)跟“根据DOA构造源语音信号导向矢量”方法相比,在存在强折射且有多个强语音干扰的场景中,本发明利用方向模板,可以不依赖于DOA算法的性能,算法整体更鲁棒,抗干扰能力更强。
附图说明
图1为本发明的流程示意图;
图2为本发明中麦克风阵列模型示意图。
具体实施方式
为了便于理解本发明,为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便充分理解本发明,附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解地更加透彻全面。本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
一种麦克风阵列波束形成方法,整体流程如图1所示。
信号模型:
考虑一个M阵元麦克风阵列,在短时傅里叶变换域中,整个麦克风阵列接收信号可以表示为:其中xt,f,m为第m个麦克风在时间单元t和频率单元f的信号;st,f,i表示在时间单元t和频率单元f的第i个语音信号(i=1,…,I);表示其对应的M维导向矢量,其中φm为第m个麦克风阵元的相移,分别代表信号入射俯仰角和方位角;nt,f=[nt,f,1 … nt,f,M]TM维噪声矢量;其中·T表示转置。为了方便叙述,假设第1个语音信号是感兴趣的源语音信号,而第2,…,I个语音信号是不需要的干扰语音信号,麦克风阵列接收信号可以重写为:其中,xt,f,target是麦克风阵列接收到的感兴趣的源语音信号,xt,f,interf是麦克风阵列接收到的语音干扰信号,nt,f是噪声信号。
导向矢量以及方向模板的构造:
实际应用时,本发明方法不局限于麦克风阵列的形状,已知阵列参数的均匀线阵,均匀圆阵,抑或是不规则阵列均适用。下面便于阐述本发明的技术原理,以均匀圆阵为例,介绍导向矢量以及方向模板的构造。考虑如图2所示的具有M个麦克风的均匀圆阵列的几何结构,圆阵半径为R。麦克风阵元m的坐标为pm=[Rcos[2π(m-1)/M] Rsin[2π(m-1)/M] 0]。
考虑到圆阵一般水平放置,针对远场情况时,入射角一般垂直于z轴,即俯仰角θ≈90°,所以简化导向矢量,设置俯仰角θ=90°。对于N个源语音信号和干扰信号的可能方向,我们可以通过DOA相关算法计算得到,也把全方向方位角(线阵[0,π],圆阵[0,2π))均匀分成N个方向,得到固定的N个方向,即
时频掩蔽值TFmask的计算:
对时频单元(t,f)求阵列信号相位并归一化得到:
zt,f=[0 angle(xt,f,2)-angle(xt,f,1) … angle(xt,f,M)-angle(xt,f,1)]T∈CM×1;
zt,f为时频单元(t,f)的相位差矢量。
假设源语音信号与噪声、干扰源信号在短时傅里叶变换域中满足稀疏性假设,则在大部分源信号占优的时频单元中,可以认为噪声、干扰源信号的影响是比较小的。当时频单元(t,f)中源语音信号占优时,可以认为:其中<>表示求两向量的夹角。又因为向量间的夹角与其余弦值一一对应,所以为了优化计算,用向量间的夹角余弦作为两个向量夹角大小的度量,两向量的夹角余弦由下式得到其中a≠0且b≠0。
从向量夹角以及夹角余弦的定义可以知道,两个向量夹角越小,其对应的夹角余弦越接近于1,而相反地,两个向量夹角越大,其对应的夹角余弦越接近0。所以将γt,f通过softmax函数,得到其中Softmax函数将γt,f转换成当前时频单元(t,f)在N个方向存在语音信号(源语音信号或者干扰语音信号)的概率,即即是N个方向对应的时频掩蔽值TFmask。
基于时频掩蔽值TFmask的协方差矩阵流式迭代方法:
最小方差无失真响应算法:
利用波束形成器处理阵列接收信号,通过改变滤波器权值,可使某些期望方向的信号通过滤波器,同时抑制其他方向的信号。
针对频率f,M阵元麦克风阵列的接收信号xt,f作为M抽头横向滤波器的输入,滤波器权向量可以表示wf=[w1 w2 … wM]T∈CM×1;空域滤波器的输出为yt,f=wf Hxt,f;输出的平均功率为其中是接收信号的协方差矩阵。
Claims (7)
1.一种麦克风阵列波束形成方法,其特征在于该方法具体步骤是:
步骤(1).确定源语音信号和干扰信号可能存在的N个方向,根据麦克风阵列参数确定对应方向的导向矢量;
步骤(2).计算导向矢量相位,并对第一个麦克风阵元的相位归一化得到方向模板;
步骤(3).将麦克风阵列接收信号经过短时傅里叶变换得到短时傅里叶变换域信号,其中每一个单元称之为时频单元;进而得到一个时频单元中信号的相位差矢量,计算相位差矢量与每一个方向的方向模板的夹角的余弦值,该夹角余弦值表征了当前时频单元中信号与N个方向的距离;
步骤(4).将N个夹角的余弦值归一化至[0 1]:将其通过softmax函数,得到N个方向上存在语音信号的概率,即时频掩蔽值TFmask;
步骤(5).依据得到的时频掩蔽值TFmask更新噪声干扰协方差矩阵;
步骤(6).利用噪声干扰协方差矩阵,依据最小方差无失真响应波束形成算法得到滤波权值wopt,进而滤波得到波束形成增强信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911246555.3A CN110931036B (zh) | 2019-12-07 | 2019-12-07 | 一种麦克风阵列波束形成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911246555.3A CN110931036B (zh) | 2019-12-07 | 2019-12-07 | 一种麦克风阵列波束形成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110931036A true CN110931036A (zh) | 2020-03-27 |
CN110931036B CN110931036B (zh) | 2022-03-22 |
Family
ID=69858372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911246555.3A Active CN110931036B (zh) | 2019-12-07 | 2019-12-07 | 一种麦克风阵列波束形成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110931036B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111508516A (zh) * | 2020-03-31 | 2020-08-07 | 上海交通大学 | 基于信道关联时频掩膜的语音波束形成方法 |
CN111540371A (zh) * | 2020-04-22 | 2020-08-14 | 深圳市友杰智新科技有限公司 | 麦克风阵列波束成形的方法、装置和计算机设备 |
CN111866665A (zh) * | 2020-07-22 | 2020-10-30 | 海尔优家智能科技(北京)有限公司 | 麦克风阵列波束形成方法及装置 |
CN113053408A (zh) * | 2021-03-12 | 2021-06-29 | 云知声智能科技股份有限公司 | 一种声源分离方法及装置 |
CN113050035A (zh) * | 2021-03-12 | 2021-06-29 | 云知声智能科技股份有限公司 | 一种二维定向拾音方法及装置 |
CN113707136A (zh) * | 2021-10-28 | 2021-11-26 | 南京南大电子智慧型服务机器人研究院有限公司 | 服务型机器人语音交互的音视频混合语音前端处理方法 |
CN113763982A (zh) * | 2020-06-05 | 2021-12-07 | 阿里巴巴集团控股有限公司 | 音频处理方法、装置、电子设备及可读存储介质 |
CN113782047A (zh) * | 2021-09-06 | 2021-12-10 | 云知声智能科技股份有限公司 | 语音分离方法、装置、设备和存储介质 |
CN113782046A (zh) * | 2021-09-09 | 2021-12-10 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
CN115359804A (zh) * | 2022-10-24 | 2022-11-18 | 北京快鱼电子股份公司 | 一种基于麦克风阵列的定向音频拾取方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070274536A1 (en) * | 2006-05-26 | 2007-11-29 | Fujitsu Limited | Collecting sound device with directionality, collecting sound method with directionality and memory product |
US20120263315A1 (en) * | 2011-04-18 | 2012-10-18 | Sony Corporation | Sound signal processing device, method, and program |
US9640197B1 (en) * | 2016-03-22 | 2017-05-02 | International Business Machines Corporation | Extraction of target speeches |
CN107018470A (zh) * | 2016-01-28 | 2017-08-04 | 讯飞智元信息科技有限公司 | 一种基于环形麦克风阵列的语音记录方法及系统 |
CN107976651A (zh) * | 2016-10-21 | 2018-05-01 | 杭州海康威视数字技术股份有限公司 | 一种基于麦克风阵列的声源定位方法及装置 |
CN109859769A (zh) * | 2019-01-30 | 2019-06-07 | 科大讯飞股份有限公司 | 一种掩码估计方法及装置 |
CN110400572A (zh) * | 2019-08-12 | 2019-11-01 | 苏州思必驰信息科技有限公司 | 音频增强方法及系统 |
-
2019
- 2019-12-07 CN CN201911246555.3A patent/CN110931036B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070274536A1 (en) * | 2006-05-26 | 2007-11-29 | Fujitsu Limited | Collecting sound device with directionality, collecting sound method with directionality and memory product |
US20120263315A1 (en) * | 2011-04-18 | 2012-10-18 | Sony Corporation | Sound signal processing device, method, and program |
CN107018470A (zh) * | 2016-01-28 | 2017-08-04 | 讯飞智元信息科技有限公司 | 一种基于环形麦克风阵列的语音记录方法及系统 |
US9640197B1 (en) * | 2016-03-22 | 2017-05-02 | International Business Machines Corporation | Extraction of target speeches |
CN107976651A (zh) * | 2016-10-21 | 2018-05-01 | 杭州海康威视数字技术股份有限公司 | 一种基于麦克风阵列的声源定位方法及装置 |
CN109859769A (zh) * | 2019-01-30 | 2019-06-07 | 科大讯飞股份有限公司 | 一种掩码估计方法及装置 |
CN110400572A (zh) * | 2019-08-12 | 2019-11-01 | 苏州思必驰信息科技有限公司 | 音频增强方法及系统 |
Non-Patent Citations (3)
Title |
---|
YUJIE GU: "Robust_Adaptive_Beamforming_Based_on_Interference_Covariance_Matrix_Reconstruction_and_Steering_Vector_Estimation", 《IEEE TRANSACTIONS ON SIGNAL PROCESSING》 * |
何礼: "利用相位时频掩蔽的麦克风阵列噪声消除方法", 《信号处理》 * |
张华等: "基于声源时延估计的欠定盲分离方法", 《数据采集与处理》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111508516A (zh) * | 2020-03-31 | 2020-08-07 | 上海交通大学 | 基于信道关联时频掩膜的语音波束形成方法 |
CN111540371A (zh) * | 2020-04-22 | 2020-08-14 | 深圳市友杰智新科技有限公司 | 麦克风阵列波束成形的方法、装置和计算机设备 |
CN111540371B (zh) * | 2020-04-22 | 2020-11-03 | 深圳市友杰智新科技有限公司 | 麦克风阵列波束成形的方法、装置和计算机设备 |
CN113763982A (zh) * | 2020-06-05 | 2021-12-07 | 阿里巴巴集团控股有限公司 | 音频处理方法、装置、电子设备及可读存储介质 |
CN111866665A (zh) * | 2020-07-22 | 2020-10-30 | 海尔优家智能科技(北京)有限公司 | 麦克风阵列波束形成方法及装置 |
CN113053408B (zh) * | 2021-03-12 | 2022-06-14 | 云知声智能科技股份有限公司 | 一种声源分离方法及装置 |
CN113053408A (zh) * | 2021-03-12 | 2021-06-29 | 云知声智能科技股份有限公司 | 一种声源分离方法及装置 |
CN113050035A (zh) * | 2021-03-12 | 2021-06-29 | 云知声智能科技股份有限公司 | 一种二维定向拾音方法及装置 |
CN113050035B (zh) * | 2021-03-12 | 2022-11-25 | 云知声智能科技股份有限公司 | 一种二维定向拾音方法及装置 |
CN113782047A (zh) * | 2021-09-06 | 2021-12-10 | 云知声智能科技股份有限公司 | 语音分离方法、装置、设备和存储介质 |
CN113782047B (zh) * | 2021-09-06 | 2024-03-08 | 云知声智能科技股份有限公司 | 语音分离方法、装置、设备和存储介质 |
CN113782046A (zh) * | 2021-09-09 | 2021-12-10 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
CN113707136B (zh) * | 2021-10-28 | 2021-12-31 | 南京南大电子智慧型服务机器人研究院有限公司 | 服务型机器人语音交互的音视频混合语音前端处理方法 |
CN113707136A (zh) * | 2021-10-28 | 2021-11-26 | 南京南大电子智慧型服务机器人研究院有限公司 | 服务型机器人语音交互的音视频混合语音前端处理方法 |
CN115359804A (zh) * | 2022-10-24 | 2022-11-18 | 北京快鱼电子股份公司 | 一种基于麦克风阵列的定向音频拾取方法和系统 |
CN115359804B (zh) * | 2022-10-24 | 2023-01-06 | 北京快鱼电子股份公司 | 一种基于麦克风阵列的定向音频拾取方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110931036B (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110931036B (zh) | 一种麦克风阵列波束形成方法 | |
Gannot et al. | A consolidated perspective on multimicrophone speech enhancement and source separation | |
CN109087664B (zh) | 语音增强方法 | |
US8363850B2 (en) | Audio signal processing method and apparatus for the same | |
Shahbazpanahi et al. | Robust adaptive beamforming for general-rank signal models | |
CN103308889B (zh) | 复杂环境下被动声源二维doa估计方法 | |
CN109616136B (zh) | 一种自适应波束形成方法、装置及系统 | |
CN111415676B (zh) | 一种基于分离矩阵初始化频点选择的盲源分离方法及系统 | |
US9291697B2 (en) | Systems, methods, and apparatus for spatially directive filtering | |
EP2647221B1 (en) | Apparatus and method for spatially selective sound acquisition by acoustic triangulation | |
US7626889B2 (en) | Sensor array post-filter for tracking spatial distributions of signals and noise | |
Salvati et al. | Incoherent frequency fusion for broadband steered response power algorithms in noisy environments | |
CN104854878B (zh) | 使用双麦克风阵列抑制空间干扰的设备、方法和计算机介质 | |
US20080288219A1 (en) | Sensor array beamformer post-processor | |
WO2008121905A2 (en) | Enhanced beamforming for arrays of directional microphones | |
CN109459744B (zh) | 一种实现多干扰抑制的稳健自适应波束形成方法 | |
Niwa et al. | Post-filter design for speech enhancement in various noisy environments | |
CN110534126B (zh) | 一种基于固定波束形成的声源定位和语音增强方法及系统 | |
CN111681665A (zh) | 一种全向降噪方法、设备及存储介质 | |
US9502021B1 (en) | Methods and systems for robust beamforming | |
Niwa et al. | PSD estimation in beamspace using property of M-matrix | |
CN113593596A (zh) | 一种基于子阵划分的鲁棒自适应波束形成定向拾音方法 | |
Gao et al. | An order-aware scheme for robust direction of arrival estimation in the spherical harmonic domain | |
CN111060867A (zh) | 一种指向性麦克风微阵列波达方向估计方法 | |
JP5635024B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |