CN111210836B

CN111210836B - 一种麦克风阵列波束形成动态调整方法

Info

Publication number: CN111210836B
Application number: CN202010157395.1A
Authority: CN
Inventors: 许兵; 何云鹏; 高君效
Original assignee: Chipintelli Technology Co Ltd
Current assignee: Chipintelli Technology Co Ltd
Priority date: 2020-03-09
Filing date: 2020-03-09
Publication date: 2023-04-25
Anticipated expiration: 2040-03-09
Also published as: CN111210836A

Abstract

一种麦克风阵列波束形成动态调整方法，包括如下步骤：S1.计算出麦克风阵列采集得到的输入信噪比；S2.如果得到的输入信噪比大于高门限值，则采用第一算法处理；如果得到的输入信噪比低于低门限值，则采用第二算法处理；如果得到的输入信噪比介于高门限值和低门限值，则维持波束形成方法；所述高门限值和低门限值为预先设定的高低不同的门限值，所述第一算法的波束增强效果优于第二算法。采用本发明所述麦克风阵列波束形成动态调整方法，通过计算环境中的信噪比（SNR，信号与噪声的比例）来动态调整波束形成的方法，降低环境变化对语音信号接收的影响，提高波束形成的稳健性，从而提高了语音识别率。

Description

一种麦克风阵列波束形成动态调整方法

技术领域

本发明属于语音识别技术领域，具体涉及一种麦克风阵列波束形成动态调整方法。

背景技术

为提高语音识别率，在进行语音处理时通常有两种途径：增强目标语音信号或抑制噪音信号。对于麦克风阵列，通常会用到波束形成技术，实现的方法又包括广义旁瓣噪声消除器(Generalized Sidelobe Canceller，GSC)、延时-相加处理(delay-sum)、超指向等，而不同的方法效果也各不一样；对麦克风阵列语音信号调整的目的在于获得尽可能清晰的目标声源信息,而抑制除目标声源信息之外的其他噪音信息。

发明内容

为提高波束形成的稳健性，从而提高语音识别率，本发明公开了一种麦克风阵列波束形成动态调整方法。

本发明所述麦克风阵列波束形成动态调整方法，包括如下步骤：

S1.计算出麦克风阵列采集得到的输入信噪比；

S2.如果得到的输入信噪比大于高门限值，则采用第一算法处理；如果得到的输入信噪比低于低门限值，则采用第二算法处理；如果得到的输入信噪比介于高门限值和低门限值，则维持波束形成方法；

所述高门限值和低门限值为预先设定的高低不同的门限值，所述第一算法的波束增强效果优于第二算法。

具体的，所述第一算法为GSC算法中目标波束方向滤波，第二算法为GSC算法中的目标方向波束增强及陷波方向抑制，或者delay-sum算法。

优选的，所述步骤S1中输入信噪比的计算过程如下：

S11.计算第一个麦克风与其他麦克风信号的互相关系

数

其中，y(l,k)为傅里叶变换系数,y的下标1表示第1个麦克风，E()代表期望运算，上标“*”代表共轭运算；m表示第m个麦克风，l表示第l时间帧，k表示第k个频带；

S12.计算期望方向语音的相关系数：

θ为目标声源方向，

K为频带数量,f_s代表采样率；下标S代表语音，d_1，m表示第1个麦克风和第m个麦克风之间的距离；

S13.计算散射噪声的相关系数：

下标v代表噪音；

S14.计算基于选定麦克风和其他麦克风的信噪比，估计信噪比

下标y代表麦克风信号；

S15.再通过对全部麦克风求和取平均值的均值信噪比；

M为麦克风总数；

得到的均值信噪比为所述输入信噪比。

采用本发明所述麦克风阵列波束形成动态调整方法，通过计算环境中的信噪比(SNR，信号与噪声的比例)来动态调整波束形成的方法，降低环境变化对语音信号接收的影响，提高波束形成的稳健性，从而提高了语音识别率。

附图说明

图1为本发明所述麦克风阵列波束形成动态调整方法的一种具体实施方式流程示意图

图2为本发明所述方法的一个应用环境示意图。

具体实施方式

下面结合附图，对本发明的具体实施方式作进一步的详细说明。

S1.计算出麦克风阵列采集得到的输入信噪比；

所述高门限值和低门限值为预先设定的高低不同的门限值，所述第一算法的波束增强效果优于第二算法：

包含多个麦克风y₁,y₂...y_m,的语音装置在接收多路采样信号后，根据所述多路采样信号得到输入的信噪比,如图2所示。

假设共有M(M大于1)个麦克风，

y_m(l，k)，m＝1，2，...，M代表第m个麦克风在第l时间帧，第k个频带的傅里叶变换系数，共K个频带。

c＝340m/s代表声速，f_s代表采样率，d_m，n代表第m个麦克风与第n个麦克风的间距，θ为目标声源方向，

K为频带数量。

选定第一个麦克风作为选定麦克风,则信噪比计算过程如下：

S11.计算第一个麦克风与第m＝2,...,M个麦克风信号的互相关系数

其中，E()代表期望运算，上标“*”代表共轭运算。

S12.计算期望方向语音的相关系数：

下标S代表语音。

S13.计算散射噪声的相关系数：

下标v代表噪音。

S14.计算基于第1个和第m个麦克风的信噪比，估计信噪比

下标y代表麦克风信号。

S15.再通过对全部麦克风求和取平均值的均值信噪比

当实时环境中得到的均值信噪比λ(l,k)大于高门限值N时，则认为环境相对安静，则波束形成选用波束增强比较大的方法；如GSC算法中目标波束方向滤波，不做旁瓣方向的抑制滤波。

当实时环境中得到的均值信噪比λ(l,k)小于低门限值M时，则认为环境噪音相对较大，则波束形成选用对目标方向波束增强比较大的办法，同时对其他方向做一定波束抑制。比如GSC算法中做目标方向的波束增强，同时也可以做陷波方向的抑制，或者采用delay-sum算法。

当实时环境中得到的信噪比λ(l,k)介于高门限值N和低门限值M之间时，则维持该时刻之前波束形成的方法；例如：如果在10点的时候信噪比大于N，就选用波束增强比较大的方法，如果在10点半的时候信噪比介于N和M之间，则维持之前的波束增强比较大的方法。

如果初始的信噪比λ₀介于高门限值N和低门限值M之间，则默认为采用delay-sum方法。因为delay-sum算法在一定环境下能够较好抑制噪音，但又不损伤目标语音。

前文所述的为本发明的各个优选实施例，各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提，各个优选实施方式都可以任意叠加组合使用，所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程，并非用以限制本发明的专利保护范围，本发明的专利保护范围仍然以其权利要求书为准，凡是运用本发明的说明书及附图内容所作的等同结构变化，同理均应包含在本发明的保护范围内。