CN110827846B - 采用加权叠加合成波束的语音降噪方法及装置 - Google Patents

采用加权叠加合成波束的语音降噪方法及装置 Download PDF

Info

Publication number
CN110827846B
CN110827846B CN201911114506.4A CN201911114506A CN110827846B CN 110827846 B CN110827846 B CN 110827846B CN 201911114506 A CN201911114506 A CN 201911114506A CN 110827846 B CN110827846 B CN 110827846B
Authority
CN
China
Prior art keywords
phi
rho
initial
noise reduction
updated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911114506.4A
Other languages
English (en)
Other versions
CN110827846A (zh
Inventor
陈俊彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Youjie Zhixin Technology Co ltd
Original Assignee
Shenzhen Youjie Zhixin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Youjie Zhixin Technology Co ltd filed Critical Shenzhen Youjie Zhixin Technology Co ltd
Priority to CN201911114506.4A priority Critical patent/CN110827846B/zh
Publication of CN110827846A publication Critical patent/CN110827846A/zh
Application granted granted Critical
Publication of CN110827846B publication Critical patent/CN110827846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明揭示了采用加权叠加合成波束的语音降噪方法及装置,它将收集到的音频信号进行波束成形后,进行加权叠加,形成最终输出的波束。本发明不依赖传统的声源定位即可对音频信号进行有效的降噪处理,输出的波束可以指向人声比较强的方向从而增强语音,而其它方向的声音则会受到抑制。本发明同时简化了整个语音降噪的运算量,适用范围更广。

Description

采用加权叠加合成波束的语音降噪方法及装置
技术领域
本发明涉及到语音设备领域,特别是涉及到采用加权叠加合成波束的语音降噪方法及装置。
背景技术
基于麦克风阵列的多通道降噪技术,可以有效地抑制干扰声,增强目标语音,而且具有一定的抗混响能力,适用于远场拾音。在市面的产品中,麦克风阵列的应用越来越广泛了,例如智能音箱、机器人、会议通话设备等。主流的基于麦克风阵列的多通道降噪算法有波束成形、盲源分离等。目前波束成形大多方案是先通过声源定位、跟踪,然后对目标源方向进行波束成形,这种方法非常依赖声源定位,在没有唤醒词的应用场景,例如语音通话、人机聊天模式,波束成形的方法很可能会出现声源定位失配的情况,若是声源定位失配,则可能把目标语音消除掉,把噪声增强了。声源位置的变动引起波束的硬切换,可能会导致输出语音的听感不自然。
此外,也有采用盲源分离的方法,这个方法不依赖于声源定位,但是消耗较多的运算资源,因而其应用并没有波束成形方法广。
发明内容
本发明的主要目的为提供一种采用加权叠加合成波束的语音降噪方法及装置,以解决在降噪时依赖声源定位和运算量大的问题。
本发明提出以下技术方案:
一种采用加权叠加合成波束的语音降噪方法,包括:
将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束;通过VAD判断音频信号的初始权值向量是否需要更新,其中,初始权值向量为:ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],ρ表征音频信号在每个方向上的相关性大小,φ表征音频信号在每个方向上的人声强度,ω为ρ和φ的合成向量;
若是,则更新ρ和φ,得到更新后的ρ1和φ1
将ρ1和φ1合成得到新的ω1
将ω1与初始波束相乘叠加,得到最终的输出波束。
进一步地,将接收到的音频信号,生成对应预设的N个方向的初始方向向量的初始波束的步骤之前,包括:
根据麦克风阵列参数构造N个方向的方向向量;
给初始权值向量进行赋值,得到ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN]。
进一步地,根据麦克风阵列参数构造N个方向的方向向量的步骤,包括:
根据所用的波束主瓣宽度或者具体应用场景的声源范围确定N的数值。
进一步地,通过VAD判断音频信号的初始权值向量是否需要更新的步骤,包括:
根据接收到的音频信号,设置一个VAD向量υ=[v1,v2,...,vT],T为求取一次权值所需的帧长与VAD的帧长之比;
当υ的元素前面部分是1,后面部分是0或者元素全是0,则不更新权值向量ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],否则更新权值向量ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN]。
进一步地,将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束的步骤,包括:
将所述音频信号利用MVDR、SD以及GSC中的一种或多种波束成形算法,生成对应预设的N个方向的方向向量的初始波束。
进一步地,更新ρ和φ,得到更新后的ρ1和φ1的步骤中,更新权值向量ρ=[p1,p2,...,pN]的算法为基于广义互相关的SRP-PHAT。
进一步地,更新ρ和φ,得到更新后的ρ1和φ1的步骤中,更新权值向量ρ=[p1,p2,...,pN]的算法还可以为基于波束能量的SRP。
进一步地,更新ρ和φ,得到更新后的ρ1和φ1的步骤中,更新权值向量φ=[q1,q2,...,qN]的算法为:对N个初始波束求Kurtosis值。
本发明还提供一种采用加权叠加合成波束的语音降噪装置,包括:
接收生成单元,用于将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束;
判断单元,用于通过VAD判断音频信号的初始权值向量是否需要更新,其中,初始权值向量为:ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],ρ表征音频信号在每个方向上的相关性大小,φ表征音频信号在每个方向上的人声强度,ω为ρ和φ的合成向量;
第一更新单元,用于若通过VAD判定音频信号的初始权值向量需要更新,则更新ρ和φ,得到更新后的ρ1和φ1
合成单元,用于将ρ1和φ1合成得到新的ω1
叠加输出单元,用于将ω1与初始波束相乘叠加,得到最终的输出波束。
本发明基于传统的波束成形方法,提供一种采用加权叠加合成波束的语音降噪方法及装置,不依赖声源定位,可以有效增强输出波束的鲁棒性,因而在声源位置变动的时候,输出语音的听感比较自然。该方法输出的波束可以指向人声比较强的方向从而增强语音,而其它方向的声音则会受到抑制。此外,该方法运算量比较小,从而可以用在嵌入式平台中,适用范围更广。
附图说明
图1为本发明一实施例的采用加权叠加合成波束的语音降噪方法的流程示意图;
图2为本申请一实施例的采用加权叠加合成波束的语音降噪装置的结构示意框图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,本申请实施例提供一种采用加权叠加合成波束的语音降噪方法,包括:
S1、将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束;
S2、通过VAD判断音频信号的初始权值向量是否需要更新,其中,初始权值向量为:ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],ρ表征音频信号在每个方向上的相关性大小,φ表征音频信号在每个方向上的人声强度,ω为ρ和φ的合成向量;
S3、若是,则更新ρ和φ,得到更新后的ρ1和φ1
S4、将ρ1和φ1合成得到新的ω1
S5、将ω1与初始波束相乘叠加,得到最终的输出波束。
如上述步骤S1所述,可使用MVDR波束成形算法(MinimumVarianceDistortionless Response最小方差无畸变响应)进行波束成形,波束输出为
Figure BDA0002273692920000042
求得每个方向的波束,其中X(f)是音频输入信号,f是所在的频点,f=0,1,...,K,K是FFT的点数,Wn(f)为MVDR的空域滤波系数,
Figure BDA0002273692920000043
是Wn(f)的共轭转置,其表达式为:
Figure BDA0002273692920000041
αn(f)为导向向量,Rvv为噪声协方差矩阵。
如上述步骤S2所述,将接收到的音频信号通过VAD(Voice Activity Detection语音活动检测)判断是否更新权值向量ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN]。
首先,根据接收到的音频信号设置一个VAD向量υ=[v1,v2,...,vT],T为求取一次权值所需的帧长与VAD的帧长之比;由于后面求取权值向量所需帧长比VAD所需的要长,假设求一次权值所需的帧长为4096点,而VAD的帧长为512点,则帧长比为T=8。当υ的元素前面部分是1,后面部分是0或者元素全是0,则不更新权值向量ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],否则更新权值向量ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN]。若更新,则进入下一步,若不更新,则直接跳到S5。因为语音尾部的混响比较强,这样做可以尽可能减少反射声的影响,同时也能节约运算量。
如上述步骤S3所述,求取权值向量ρ。
其中,求第n个权值的方法为:
pn=normalization{max[F(dn,X),0]γ}
其中,γ∈R+,其作用是为了让权值之间的差异更大,从而使得接近声源方向的波束拥有更大的权值。F(dn,X)是输入信号X在给定的第n个方向向量时的SRP-PHAT(SteeredResponse Power-Phase Transform基于相位变换加权的可控响应功率)值,其表达式为:
Figure BDA0002273692920000051
其中Rijij(dn)]为第i和第l个麦克风的接受信号的基于相位变换加权的广义互相关函数GCC-PHAT(Generalized Cross Correlation-Phase Transform基于相位变换加权的广义互相关),其表达式为:
Figure BDA0002273692920000052
实际应用的时候可以选择直达语音最强的频段,以减少混响和噪声的影响。其中,
Figure BDA0002273692920000053
是Xl(f)的共轭,
Figure BDA0002273692920000054
τil(dn)表示方向向量dn到达第i个和第l个麦克风的到达时间差TDOA(Time Difference of Arrival到达时间差)。以ri和rl分别表示第i个和第l个麦克风的直角坐标向量,c为声速(大约342m/s),则
Figure BDA0002273692920000055
其中,||·||表示向量的2-范数。
求取权值向量φ。
其中,求第n个权值的方法为:
qn=normalization{max[G(yn),0]ξ}
其中,yn是时域中第n个波束的输出,ξ∈R+,其作用是为了让人声比较强的波束拥有更大的权值。normalization(·)是对数值求归一化,G(yn)是第n个波束的峰度Kurtosis(峰度),其表达式为:
Figure BDA0002273692920000061
其中,L是输出序列的长度,
Figure BDA0002273692920000062
是yn平均值。
如上述步骤S4所述,将权值向量ρ与权值向量φ合并得到最终的权值向量ω。
求第n个权值的方法为:
wn=normalization(pnqn)
如上述步骤S5所述,权值向量ω与对应的初始波束相乘叠加,得到最终的输出波束:
Figure BDA0002273692920000063
在一个实施例中,上述将接收到的音频信号,生成对应预设的N个方向的初始方向向量的初始波束的步骤之前,包括:
S01、根据麦克风阵列参数构造N个方向的所述方向向量;
S02、给所述初始权值向量进行赋值,得到所述ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN]。
其中,如上述步骤S01所述,根据麦克风阵列参数,在单位球上选取N个点,构造成N个方向向量[d1,d2,...,dn,...,dN],n=1,2,...,N。
可以根据所用的波束主瓣宽度,设置方向向量的密度。假设主瓣宽度为54°,那么N为:
Figure BDA0002273692920000064
ceil(·)表示向上取整。
也可以根据具体应用场景设置方向向量的覆盖范围,例如有些设备是贴着墙使用的,目标声源只存在于水平角0°到180°,仍然假设主瓣宽度为54°,那么,
Figure BDA0002273692920000065
本发明通过加权叠加波束成形后输出的波束经过了有效的降噪处理,最终输出的音频清晰自然。
本技术方案不唯一,仅为本发明较佳的具体实施方式。例如:方案中波束成形算法采用MVDR,可以考虑用SD(Superdirective beamforming,超指向型波束),GSC(Generalized Sidelobe Canceller广义旁瓣相消器)等来替代。求权值的方法,基于广义互相关的SRP-PHAT,可以考虑基于波束能量的SRP来替代,Kurtosis(峰度)则可以采用基于子带能量的GMM(高斯混合模型)值来替代等。这体现了本发明技术方案的灵活性和可操作性,适用于多种应用场景。
参照图2,本申请实施例还提供一种采用加权叠加合成波束的语音降噪装置,包括:
接收生成单元10,用于将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束;
判断单元20,用于通过VAD判断音频信号的初始权值向量是否需要更新,其中,初始权值向量为:ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],ρ表征音频信号在每个方向上的相关性大小,φ表征音频信号在每个方向上的人声强度,ω为ρ和φ的合成向量;
第一更新单元30,用于若通过VAD判定音频信号的初始权值向量需要更新,则更新ρ和φ,得到更新后的ρ1和φ1
合成单元40,用于将ρ1和φ1合成得到新的ω1
叠加输出单元50,用于将ω1与初始波束相乘叠加,得到最终的输出波束。
上述语音降噪装置的各个单元都可集成在一个主控芯片里,主控芯片可选用瑞芯微电子的RK3399。主控芯片完成了本申请上述的采用加权叠加合成波束的语音降噪方法的所有内容,多个步骤多种功能集成在一个芯片上,使得整个语音降噪装置具备体积小、重量轻、可靠性高、性能好的优点,同时成本低,便于大规模生产。
本发明基于传统的波束成形方法,提供一种采用加权叠加合成波束的语音降噪方法及装置,它不依赖声源定位,不仅解决了声源定位失配的问题,也有效增强了输出波束的鲁棒性,因而在声源位置变动的时候,输出语音的听感比较自然。本发明输出的波束可以指向人声比较强的方向从而增强语音,而其它方向的声音则会受到抑制。同时,该方法运算量比较小,从而可以用在嵌入式平台中。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种采用加权叠加合成波束的语音降噪方法,其特征在于,包括:
将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束;通过VAD判断所述音频信号的初始权值向量是否需要更新,其中,所述初始权值向量为:ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],ρ表征所述音频信号在每个方向上的相关性大小,φ表征所述音频信号在每个方向上的人声强度,ω为ρ和φ的合成向量;
若是,则更新所述ρ和φ,得到更新后的ρ1和φ1
将所述ρ1和φ1合成得到新的ω1
将所述ω1与所述初始波束相乘叠加,得到最终的输出波束。
2.根据权利要求1所述的采用加权叠加合成波束的语音降噪方法,其特征在于:所述将接收到的音频信号,生成对应预设的N个方向的初始方向向量的初始波束的步骤之前,包括:
根据麦克风阵列参数构造N个方向的所述方向向量;
给所述初始权值向量进行赋值,得到所述ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN]。
3.根据权利要求2所述的采用加权叠加合成波束的语音降噪方法,其特征在于:所述根据麦克风阵列参数构造N个方向的所述方向向量的步骤,包括:
根据所用的波束主瓣宽度或者具体应用场景的声源范围确定N的数值。
4.根据权利要求1所述的采用加权叠加合成波束的语音降噪方法,其特征在于:所述将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束的步骤,包括:
将所述音频信号利用MVDR、SD以及GSC中的一种或多种波束成型算法,生成对应预设的N个方向的方向向量的初始波束。
5.根据权利要求1所述的采用加权叠加合成波束的语音降噪方法,其特征在于:
所述更新ρ和φ,得到更新后的ρ1和φ1的步骤中,
更新权值向量ρ=[p1,p2,...,pN]的算法为基于广义互相关的SRP-PHAT。
6.根据权利要求5所述的采用加权叠加合成波束的语音降噪方法,其特征在于:
所述更新ρ和φ,得到更新后的ρ1和φ1的步骤中,更新权值向量ρ=[p1,p2,...,pN]的算法还可以为:基于波束能量的SRP。
7.根据权利要求6所述的采用加权叠加合成波束的语音降噪方法,其特征在于:
所述更新ρ和φ,得到更新后的ρ1和φ1的步骤中,更新权值向量φ=[q1,q2,...,qN]的算法为:对N个初始波束求Kurtosis值。
8.一种采用加权叠加合成波束的语音降噪装置,其特征在于,包括:
接收生成单元,用于将接收到的音频信号,生成对应预设的N个方向的方向向量的初始波束;
判断单元,用于通过VAD判断所述音频信号的初始权值向量是否需要更新,其中,所述初始权值向量为:ρ=[p1,p2,...,pN]、φ=[q1,q2,...,qN]以及ω=[w1,w2,...,wN],ρ表征音频信号在每个方向上的相关性大小,φ表征所述音频信号在每个方向上的人声强度,ω为ρ和φ的合成向量;
第一更新单元,用于若通过VAD判定所述音频信号的初始权值向量需要更新,则更新所述ρ和φ,得到更新后的ρ1和φ1
合成单元,用于将所述ρ1和φ1合成得到新的ω1
叠加输出单元,用于将所述ω1与所述初始波束相乘叠加,得到最终的输出波束。
CN201911114506.4A 2019-11-14 2019-11-14 采用加权叠加合成波束的语音降噪方法及装置 Active CN110827846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911114506.4A CN110827846B (zh) 2019-11-14 2019-11-14 采用加权叠加合成波束的语音降噪方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911114506.4A CN110827846B (zh) 2019-11-14 2019-11-14 采用加权叠加合成波束的语音降噪方法及装置

Publications (2)

Publication Number Publication Date
CN110827846A CN110827846A (zh) 2020-02-21
CN110827846B true CN110827846B (zh) 2022-05-10

Family

ID=69555486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911114506.4A Active CN110827846B (zh) 2019-11-14 2019-11-14 采用加权叠加合成波束的语音降噪方法及装置

Country Status (1)

Country Link
CN (1) CN110827846B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435685B (zh) * 2020-11-24 2024-04-12 深圳市友杰智新科技有限公司 强混响环境的盲源分离方法、装置、语音设备和存储介质
CN113284505A (zh) * 2021-04-21 2021-08-20 瑞芯微电子股份有限公司 一种自适应波束形成方法和存储设备
CN113053406B (zh) * 2021-05-08 2024-06-18 北京小米移动软件有限公司 声音信号识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324237A (zh) * 2011-05-30 2012-01-18 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
CN108269582A (zh) * 2018-01-24 2018-07-10 厦门美图之家科技有限公司 一种基于双麦克风阵列的定向拾音方法及计算设备
CN110136732A (zh) * 2019-05-17 2019-08-16 湖南琅音信息科技有限公司 双通道智能音频信号处理方法、系统及音频设备
CN110310651A (zh) * 2018-03-25 2019-10-08 深圳市麦吉通科技有限公司 波束形成的自适应语音处理方法、移动终端及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9049503B2 (en) * 2009-03-17 2015-06-02 The Hong Kong Polytechnic University Method and system for beamforming using a microphone array
US10015588B1 (en) * 2016-12-20 2018-07-03 Verizon Patent And Licensing Inc. Beamforming optimization for receiving audio signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324237A (zh) * 2011-05-30 2012-01-18 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
CN108269582A (zh) * 2018-01-24 2018-07-10 厦门美图之家科技有限公司 一种基于双麦克风阵列的定向拾音方法及计算设备
CN110310651A (zh) * 2018-03-25 2019-10-08 深圳市麦吉通科技有限公司 波束形成的自适应语音处理方法、移动终端及存储介质
CN110136732A (zh) * 2019-05-17 2019-08-16 湖南琅音信息科技有限公司 双通道智能音频信号处理方法、系统及音频设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A study of learning based beamforming methods for speech recognition;Xiong Xiao;《CHiME_2016》;20161231;全文 *
基于波束形成与最大似然估计的近距离双麦克风语音增强算法;宫琴;《清华大学学报:自然科学版》;20180615(第6期);第603-608段 *
麦克风阵列的自适应降噪算法研究;聂欣欣;《中国优秀硕士学位论文全文数据库》;20170430(第4期);I136-75 *

Also Published As

Publication number Publication date
CN110827846A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN110827846B (zh) 采用加权叠加合成波束的语音降噪方法及装置
US9641929B2 (en) Audio signal processing method and apparatus and differential beamforming method and apparatus
US8204247B2 (en) Position-independent microphone system
US7099821B2 (en) Separation of target acoustic signals in a multi-transducer arrangement
JP2021500634A (ja) マイク・アレイに基づく対象音声取得方法及び装置
US9628905B2 (en) Adaptive beamforming for eigenbeamforming microphone arrays
US8615392B1 (en) Systems and methods for producing an acoustic field having a target spatial pattern
CN109270493B (zh) 声源定位方法和装置
Fahim et al. PSD estimation and source separation in a noisy reverberant environment using a spherical microphone array
CN111681665A (zh) 一种全向降噪方法、设备及存储介质
CN115457971A (zh) 一种降噪方法、电子设备及存储介质
Pan et al. On the design of target beampatterns for differential microphone arrays
US11546691B2 (en) Binaural beamforming microphone array
Wan et al. Improved steered response power method for sound source localization based on principal eigenvector
Tourbabin et al. Speaker localization by humanoid robots in reverberant environments
Do et al. Stochastic particle filtering: A fast SRP-PHAT single source localization algorithm
CN113223552B (zh) 语音增强方法、装置、设备、存储介质及程序
CN115866483A (zh) 一种音频信号的波束形成方法及设备
Firoozabadi et al. Combination of nested microphone array and subband processing for multiple simultaneous speaker localization
JPS5972295A (ja) 多点受音装置
CN113491137B (zh) 具有分数阶的灵活差分麦克风阵列
CN112017684B (zh) 一种基于麦克风阵列的密闭空间混响消除方法
Wang Speech enhancement using fiber acoustic sensor
Orchard et al. Localisation of a sound source in different positions using Kinect sensors
Mendoza-Velazquez et al. Ensemble learning approach with class rotation for three-dimensional classification on direction-of-arrival estimation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant