CN108447499A

CN108447499A - 一种双层圆环麦克风阵列语音增强方法

Info

Publication number: CN108447499A
Application number: CN201810346345.0A
Authority: CN
Inventors: 梅晗; 张东
Original assignee: Sun Yat Sen University; SYSU CMU Shunde International Joint Research Institute; Research Institute of Zhongshan University Shunde District Foshan
Current assignee: Sun Yat Sen University; SYSU CMU Shunde International Joint Research Institute; Research Institute of Zhongshan University Shunde District Foshan
Priority date: 2018-04-18
Filing date: 2018-04-18
Publication date: 2018-08-24
Anticipated expiration: 2038-04-18
Also published as: CN108447499B

Abstract

本发明公开了一种双层圆环麦克风阵列语音增强方法，根据声场环境的不同采用不同的波束形成方法，提高了麦克风阵列的对噪声的鲁棒性，其中当声场环境为散射噪声场时，在不同频段分别采用一阶和二阶差分波束形成器项组合的方法进行语音增强，可以在不牺牲白噪声增益的情况下获得较高的方向性因数。

Description

一种双层圆环麦克风阵列语音增强方法

技术领域

本发明涉及信号处理技术领域，特别是一种双层圆环麦克风阵列语音增强方法。

背景技术

麦克风阵列是由多个麦克风组成的具有特定拓扑结构的声音处理系统，其采集到的信号与噪声的相关信息要远大于单个麦克风，因此可以解决多种单麦克风无法处理的实际的声学问题。

环境中存在多种类型的噪声，不同的语音增强算法适用于不同的噪声场，因此，能否适应不同类型的噪声场，是评价麦克风阵列性能的重要指标，为了研究方便，抽象出了三种类型的噪声场：相干噪声场，非相干噪声场，散射噪声场；在相干噪声场中，麦克风阵列中的各阵元接收到的噪声信号具有强相关性；非相干噪声场指在给定空间位置的噪声信号与该空间中所有其他位置的噪声信号都不相关，这是一种理想环境，在实际中并不存在，但在麦克风阵列信号处理领域，通常将阵列自身的电学噪声视为非相干噪声进行处理；而当空间中相干噪声与非相干噪声同时存在时，将这种声场称为散射噪声场，许多实际噪声环境都可以被看作散射噪声,如会议室、汽车噪声等，而任何一个噪声场都会影响到麦克风阵列的语音质量，因此，如何去除噪声以及干扰是语音增强的主要目标之一。

麦克风阵列的性能通过信噪比增益来度量，其定义为输出信噪比与输入信噪比的比值，信噪比增益反映了信号通过阵列前后信噪比的改善程度，差分麦克风阵列中常用白噪声增益和方向性因数2个指标，白噪声增益表示当声场为非相干噪声时的阵增益；方向性因数表示当声场为散射噪声时的阵增益，而在差分麦克风阵列中提高方向性因数需要以牺牲白噪声增益为代价，二者不能同时提高。

发明内容

为解决上述问题，本发明的目的在于提供一种双层圆环麦克风阵列语音增强方法，在不同的声场环境下采用不同的波束形成方法，可以提高麦克风阵列对噪声的鲁棒性，同时可以在不牺牲白噪声增益的情况下获得较高的方向性因数。

本发明解决其问题所采用的技术方案是：

一种双层圆环麦克风阵列语音增强方法，包括以下步骤：

A、采集通道的时域信号；

B、对采集到的通道的时域信号进行分帧、加窗后得到通道的接收信号的频域表示；

C、对通道的接收信号的频域表示进行短时傅里叶变换，得到整个麦克风阵列接收的信号的频率子带；

D、根据静音段不同通道间的相干函数对声场环境进行判定；

E、当声场环境为非相关噪声场时，在子带上采用一阶差分波束形成器进行波束形成得到权向量；当声场环境为散射噪声场时，在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量，在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量；

F、根据权向量计算得到输出信号；

G、将输出信号进行变换后得到增强后的语音信号。

进一步，所述步骤A采集通道的时域信号中，由麦克风阵列对通道的时域信号进行采集，采集到的时域信号为：

y_p,m(k)＝x_p,m(k)+v_p,m(k)；

其中x_p,m(k)为期望信号，v_p,m(k)为噪声，y_p,m(k)为第p个环上第m个麦克风采集的时域信号，k为采样后的时间序列索引。

进一步，所述步骤B中通道的接收信号的频域表示为：

其中r_p为双层圆环麦克风的内外圆半径，p＝1或p＝2，p＝1时r₁为内圆半径，p＝2时r₂为外圆半径，ψ_p,m为内圆或外圆上第m个麦克风的方位角，其中M为内圆以及外圆上分别设置的麦克风数量。

进一步，所述步骤C中整个麦克风阵列接收的信号的频率子带为：

其中，

将y_p(ω)＝d_p(ω,θ)X(ω)+V_p(ω)代入到频率子带y(ω)的计算公式中得到y(ω)＝d(ω,θ)X(ω)+V(ω)；

其中，p＝1,2，p表示双层麦克风阵列的内外圆，p＝1为内圆麦克风阵列，p＝2为外圆麦克风阵列，Y_p,1(ω)表示内圆或外圆上第一个麦克风的接收信号的频域表示，M为麦克风的内圆或外圆上麦克风的数量，d(ω,θ)为导向向量，其中 V_p(ω)为单环麦克风所接收的噪声，V(ω)为整个麦克风阵列所接收的噪声。

进一步，所述步骤D根据静音段不同通道间的相干函数对声场环境进行判定中，相干函数的表达式为：

其中φ_mn、φ_mm为任取阵列中的两路信号的互功率谱和自功率谱，在得到相干函数后，令r_mn＝‖Re(Γ_mn)‖₂，并遍历所有的通道组合，得到所有的r_mn，若所有的r_mn都小于H₁，则判定为非相关噪声场；若所有的r_mn都大于H₂，则判定为相关噪声场；若所有的r_mn大于位于H₁、H₂之间，则判定为散射噪声场，其中H₁、H₂为预设的阈值。

进一步，所述步骤E当声场环境为非相关噪声场时，在子带上采用一阶差分波束形成器进行波束形成得到权向量；当声场环境为散射噪声场时，在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量，在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量中，构建权向量的表达式：

h(ω)＝Ψ ^H(ω)[Ψ(ω)Ψ ^H(ω)]^-1b_N+1；

其中，b_N,n为预设的参数，用于构建理想的N阶差分阵列波束，N＝1或2，当声场环境为非相关噪声场时，N取1；当声场环境为散射噪声场时，N取1和2两个值并分别得到不同的权向量；Ψ(ω)为导向矩阵，且Ψ(ω)＝[Ψ₁(ω)Ψ₂(ω)]^T，其中Ψ_p(ω)的表达式为：

其中，J_n()为第一类n阶贝塞尔函数,p＝1，2。

进一步，所述步骤F根据权向量计算得到输出信号中，输出信号的表达式为：

Z(ω)＝h ^H(ω)d(ω,θ)X(ω)+h ^H(ω)V(ω)；

其中，Z(ω)为输出信号，h(ω)为权向量，d(ω,θ)为导向向量，X(ω)为期望信号，V(ω)为整个麦克风阵列的噪声。

进一步，所述步骤G将输出信号进行变换后得到增强后的语音信号中，对输出信号进行逆傅里叶变换后采用重叠相加法得到增强后的语音信号。

本发明的有益效果是：本发明采用的一种双层圆环麦克风阵列语音增强方法，根据声场环境的不同采用不同的波束形成方法，提高了麦克风阵列的对噪声的鲁棒性，其中当声场环境为散射噪声场时，在不同频段分别采用一阶和二阶差分波束形成器项组合的方法进行语音增强，可以在不牺牲白噪声增益的情况下获得较高的方向性因数。

附图说明

下面结合附图和实例对本发明作进一步说明。

图1是双层圆环麦克风阵列的结构示意图；

图2是本发明一种双层圆环麦克风阵列语音增强方法的流程图。

具体实施方式

本发明所选用的麦克风阵列为双层圆环麦克风阵列，传统的麦克风阵列一般为线性结构或单环结构，相对于线性麦克风阵列，圆环形麦克风阵列的波束可以偏转到多个方向上，同时具有很好的频率一致性，而单环麦克风阵列在麦克风数量增加时会存在严重的空间混叠，采用双圆环结构就可以避免这一问题。

本发明由于存在内外两个圆，为了方便区分，以下涉及到的公式中，字母下方有下划线的表示双环麦克风，没有下划线的为表示单环麦克风，例如d(ω,θ)表示双环麦克风的导向向量，而d_p(ω,θ)表示单环麦克风的导向向量。

参照图1所示的双层圆环麦克风阵列，其由两个同心圆组成，内外圆的半径为r_p(p＝1,2)，p＝1表示内圆，r₁为内圆半径，p＝2表示外圆，r₂为外圆半径，内外圆上都均匀分布着M(M为偶数)个麦克风，则第p个环上第m个麦克风的坐标为r_p,m＝(r_pcosψ_p,m,r_psinψ_p,m)，其中为该麦克风的方位角，根据所有麦克风的方位角可以构造出内圆以及外圆的导向向量，单环导向向量由单环导向向量d_p(ω,θ)可以得到整个双层圆环麦克风阵列的导向向量其中c为声速。

每一个麦克风为一个通道，即本发明有2M个通道，对应的在采集通道时域信号时，有2M个通道的时域信号。

参照图2，本发明的一种双层圆环麦克风阵列语音增强方法，包括以下步骤：

A、采集通道的时域信号；

由麦克风阵列对通道的时域信号进行采集，采集到的时域信号为：

y_p,m(k)＝x_p,m(k)+v_p,m(k)；

B、对采集到的通道时域信号进行分帧、加窗后得到通道的接收信号的频域表示为：

X(ω)为整个麦克风阵列的期望信号，V_p,m(ω)第p个环上第m个麦克风噪声的频域表示；

C、对通道的接收信号的频域表示进行短时傅里叶变换，得到整个麦克风阵列接收的信号的频率子带：

其中，

其中，V_p(ω)为单环麦克风所接收的噪声，V(ω)为整个麦克风阵列所接收的噪声。

D、根据静音段不同通道间的相干函数对声场环境进行判定，室内环境中，在一段固定时间内声场的性质保持不变，通常带噪语音的前100ms为静音段，可以通过对静音段进行相关性检测来对声场进行分类，方法如下：任取阵列中的两路信号作为一个组合构建相干函数，其中相干函数的表达式为：

φ_mn、φ_mm为任取阵列中的两路信号的互功率谱和自功率谱，在得到相干函数后，令r_mn＝‖Re(Γ_mn)‖₂，并遍历所有的通道组合，得到所有的r_mn，若所有的r_mn都小于H₁，则判定为非相关噪声场；若所有的r_mn都大于H₂，则判定为相关噪声场；若所有的r_mn大于位于H₁、H₂之间，则判定为散射噪声场，其中H₁、H₂为预设的阈值。

F、根据权向量计算得到输出信号；

G、将输出信号进行变换后得到增强后的语音信号。

y(ω)会根据声场的不同通过不同的波束形成器，然后可以得到整个双层圆环麦克风阵列的输出为：其中Y_p,m(ω)为单通道接收信号的频域表示，而可以根据以下公式进行转换：

首先设置权向量其中h₁(ω)为内圆的权向量，h₂(ω)为外圆的权向量，对于单环的权向量h_p(ω)而言，其表达式为其中H′_p，m(ω)与H_p,M(ω)的转换通过以下公式实现：

时的权向量根据差分阵列的对称性约束得到：

H_p,m+1(ω)＝H_p,M-m+1(ω)

根据以上所述的h(ω)、h_p(ω)、H′_p，m(ω)、H_p,M(ω)四者之间的关系，可以对整个双层圆环麦克风阵列的输出Z(ω)的表达式进行扩展，即：

Z(ω)＝h ^H(ω)y(ω)；

而由之前的步骤已经得到y(ω)＝d(ω,θ)X(ω)+V(ω)，所以可以得到Z(ω)＝h ^H(ω)d(ω,θ)X(ω)+h ^H(ω)V(ω)，所以对于Z(ω)的求解就转换成为对权向量h(ω)的求解。

而权向量h(ω)是通过波束形成器对信号进行波束形成而得到的，首先理想的N阶差分阵列波束图的表达式为：表示θ不同的时候阵列对入射信号的敏感度例如0度为人说话，90度为干扰，设计一个波束图使得B_N(0)＝1，B_N(90)＝0，就可以抑制干扰，其中b_N,n这个参数是预先指定的，b_N,n的值不同，设计出来的波束图形状也不一样；

构造公式Ψ(ω)h(ω)＝b_N+1，其中N＝1或2，当声场环境为非相关噪声场时，N取1；当声场环境为散射噪声场时，N取1和2两个值并分别得到不同的权向量；Ψ(ω)为导向矩阵，且Ψ(ω)＝[Ψ₁(ω)Ψ₂(ω)]^T，其中Ψ_p(ω)的表达式为：

其中，J_n()为第一类n阶贝塞尔函数,p＝1，2。

根据Ψ(ω)以及b_N+1可以得到权向量h(ω)的表达式为：

h(ω)＝Ψ ^H(ω)[Ψ(ω)Ψ ^H(ω)]^-1b_N+1

在得到h(ω)之后，将h(ω)带入到Z(ω)的表达式中，即可得到输出信号，然后对输出信号进行逆傅里叶变换后采用重叠相加法可以得到增强后的语音信号。

本发明根据声场环境的不同，采用不同的波束形成方法，提高了麦克风阵列对噪声的鲁棒性，当声场环境为散射噪声场时，在低频段(例如0-4kHz)的子带上，采用一阶差分波束形成器进行波束形成，在高频段(例如4-8kHz)的子带上，采用二阶差分波束形成器进行波束形成，可以在不牺牲白噪声增益的情况下获得较高的方向性因数。

以上所述，只是本发明的较佳实施例而已，本发明并不局限于上述实施方式，只要其以相同的手段达到本发明的技术效果，都应属于本发明的保护范围。

Claims

1.一种双层圆环麦克风阵列语音增强方法，其特征在于：包括以下步骤：

A、采集通道的时域信号；

D、根据静音段不同通道间的相干函数对声场环境进行判定；

F、根据权向量计算得到输出信号；

G、将输出信号进行变换后得到增强后的语音信号。

2.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤A采集通道的时域信号中，由麦克风阵列对通道的时域信号进行采集，采集到的时域信号为：

y_p,m(k)＝x_p,m(k)+v_p,m(k)；

3.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤B中通道的接收信号的频域表示为：

4.根据权利要求3所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤C中整个麦克风阵列接收的信号的频率子带为：

其中，

其中，p＝1,2，p表示双层麦克风阵列的内外圆，p＝1为内圆麦克风阵列，p＝2为外圆麦克风阵列，Y_p,1(ω)表示内圆或外圆上第一个麦克风的接收信号的频域表示，M为麦克风的内圆或外圆上麦克风的数量，d(ω,θ)为导向向量，其中

V_p(ω)为单环麦克风所接收的噪声，V(ω)为整个麦克风阵列所接收的噪声。

5.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤D根据静音段不同通道间的相干函数对声场环境进行判定中，相干函数的表达式为：

6.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤E当声场环境为非相关噪声场时，在子带上采用一阶差分波束形成器进行波束形成得到权向量；当声场环境为散射噪声场时，在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量，在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量中，构建权向量的表达式：

h(ω)＝Ψ ^H(ω)[Ψ(ω)Ψ ^H(ω)]^-1b_N+1；

其中，J_n()为第一类n阶贝塞尔函数,p＝1，2。

7.根据权利要求6所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤F根据权向量计算得到输出信号中，输出信号的表达式为：

Z(ω)＝h ^H(ω)d(ω,θ)X(ω)+h ^H(ω)V(ω)；

8.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法，其特征在于：所述步骤G将输出信号进行变换后得到增强后的语音信号中，对输出信号进行逆傅里叶变换后采用重叠相加法得到增强后的语音信号。