CN1866356A

CN1866356A - 一种宽带波束形成方法和装置

Info

Publication number: CN1866356A
Application number: CNA200510090740XA
Authority: CN
Inventors: 居太亮; 邵怀宗; 林静然; 彭启琮; 余水安
Original assignee: Huawei Technologies Co Ltd; University of Electronic Science and Technology of China
Current assignee: Huawei Technologies Co Ltd; University of Electronic Science and Technology of China
Priority date: 2005-08-15
Filing date: 2005-08-15
Publication date: 2006-11-22
Anticipated expiration: 2025-08-15
Also published as: CN100466061C

Abstract

本发明提供一种宽带波束形成方法和装置，其方法和装置的核心均为：确定输入各麦克风的信号对应的各子带信号，确定各子带信号的频域相关矩阵，根据信号源的三维空间传输矢量、所述各频域相关矩阵确定各子带信号的权向量，根据各子带信号的权向量和各子带信号确定输出的信号。本发明能够将频域和空域结合起来对语音信号进行处理，解决了三维空间滤波问题，抑制了空间干扰信号和噪声，提高了输出信号的信噪比，本发明能够适用于宽带信号源、近场信号源；从而实现了提高语音增强性能，提高语音系统实用性的目的。

Description

一种宽带波束形成方法和装置

技术领域

本发明涉及音频处理技术，具体涉及一种宽带波束形成方法和装置。

背景技术

随着现代科学的蓬勃发展，通信或信息交换已成为人类社会存在的必要条件，而语音作为语言的声学表现，是人类交流信息最自然、最有效、最方便的手段之一。

在语音通信过程中，不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声、乃至其他讲话者的干扰。这些干扰最终会使语音接收者接收到的语音不再是纯净的原始语音，而是被噪声污染过的带噪语音。例如，汽车、街道、机场中的电话，常会受到强背景噪声的于扰，从而严重影响了通话质量。环境噪声的污染还会使得许多语音处理系统的性能急剧恶化。例如，语音识别系统已取得重大进展，正步入实用阶段，但是，目前的语音识别系统大都是在安静环境中工作的，在噪声环境中尤其是在强噪声环境中，语音识别系统的识别率将会受到严重影响。低速率语音编码，特别是参数编码，也遇到类似问题。由于语音生成模型是低速率编码的基础，当模型参数的提取受到混杂在语音中背景噪声严重干扰时，重建语音的质量将急剧恶化，甚至变得完全不可懂。

语音增强技术能够有效的抑制背景噪声，提高语音通信质量，提高语音处理系统的抗干扰能力，维持语音处理系统的性能。因此，研究语音增强技术在实际应用中有着重要的价值。语音增强技术己在语音处理系统、通信系统、多媒体技术、数字化家电等领域得到了越来越广泛的应用。

语音增强技术的主要目的是：从带噪语音信号中提取尽可能纯净的原始语音。然而，由于干扰通常都是随机的，从带噪语音中提取完全纯净的语音几乎是不可能。在此情况下，语音增强的主要目的是：通过对带噪语音进行处理，以消除背景噪声，改善语音质量，提高语音的清晰度、可懂度和舒适度，提高语音处理系统的性能。这些目的往往不能兼得，通常需要根据语音处理系统的具体需要而定。

语音增强技术的研究始于20世纪70年代中期。随着数字信号处理理论的成熟，语音增强已发展成为语音信号处理领域的一个重要分支。1978年，Lim和Oppenheim提出了语音增强的维纳滤波方法。1979年，Boll提出了谱相减方法来抑制噪声。1980年，Maulay和Malpass提出了软判决噪声抑制方法。1984年，Ephraim和Malah提出基于MMSE短时谱幅度估计的语音增强方法。1987年，Paliwal把卡尔曼滤波引入到语音增强领域。在近30年的研究中，各种语音增强方法不断被提出，它奠定了语音增强理论的基础并使之逐渐走向成熟。

近些年来，随着VLSI(超大规模集成电路)技术的发展和高速DSP(数字信号处理)芯片的出现，语音增强技术逐步走向实用，同时新的语音增强技术又相继涌现。

语音增强、去噪的方法可以简单的分为基于时域、频域和空域的滤波技术，如维纳滤波的语音增强技术、基于频域的谱抵消技术等。近年来，阵列处理技术也引入到语音处理中，形成了基于波束的空域滤波技术，如时延求和波束形成技术(DSB)等。

MVDR(Minim Variance Distortion Response，窄带最小方差无失真)波束形成技术主要用于传统的窄带信号处理过程中。

设定有M个传感器组成如附图1所示的天线阵列，接收来自方向₀的窄带信号s(t)，用MVDR波束形成技术对接收信号进行空域滤波的主要步骤如下：

步骤1、把每个传感器接收到的模拟信号转换为数字信号，将数字信号组成输入数据矩阵X(n)：

X(n)＝[x₁(n) x₂(n)…x_M(n)]^T (1)

其中，[·]^T表示对矩阵或向量·作转置运算，x₁(n)表示第n时刻第i个传感器接收到的经过AD变换后的数字信号、且i＝1，…，M。

到步骤2、取L次快拍的L点数据，即取n时刻，n-1时刻，……，n-L+1时刻每个传感器上采集的数据，并根据公式(2)求输入信号的频域相关矩阵R：

R = \frac{1}{L} Σ_{l = 1}^{L} {X (n - l + 1) * X^{H} (n - l + 1)} - - - (2)

其中，[·]^H表示对矩阵或向量·作转置并对每个元素取共额运算。例如：

A = [\begin{matrix} 1 + 2 i & 2 + 4 i \\ 4 - 4 i & 5 - 8 i \end{matrix}],

则

A^{H} = [\begin{matrix} 1 - 2 i & 4 + 4 i \\ 2 - 4 i & 5 + 8 i \end{matrix}] .

到步骤3、根据信号源的方向₀和阵列拓扑结构求出信号源的方向矢量a。在获取信号源的方向矢量a时，阵列拓扑结构不限，如可以为均匀圆阵、均匀直线阵或其他的阵列结构，且信号源的方向₀的获得方法不限。

设定M个传感器以间距d组成均匀直线阵列、且以第一个传感器为参考点，则信号源的方向矢量a为：

a＝[1 e^-jφ…e^-j(M-1)φ]^T (3)

在公式(3)中，φ为空间相位、且

其中，λ为入射信号的波长，d为阵列间距，₀为入射信号的入射角度。

到步骤4、根据信号源的方向矢量a和频域相关矩阵R求最优权向量W_opt：

W_{opt} = \frac{R^{- 1} a}{a^{H} R^{- 1} a} - - - (5)

到步骤5、根据最优权向量对输入信号进行空间滤波，得到输出信号y(n)：

y (n) = W_{opt}^{H} * X (n) - - - (6)

然后，将数字信号y(n)转换成模拟信号即可。

上述MVDR波束形成技术只能适用于窄带信号源，当该方法用于宽带信号源时，其语音增强性能会大幅度下降，而且，该技术只能适用于远场信号源，即入射信号为平面波，当该技术适用于近场信号源，即入射信号为球面波时，语音增强性能同样会大幅度下降。

发明内容

本发明的目的在于，提供一种宽带波束形成方法和装置，通过结合频域和空域对语音信号进行处理，以实现提高语音增强性能的目的。

为达到上述目的，本发明提供的一种宽带波束形成方法，包括：

a、确定输入各麦克风的信号对应的各子带信号；

b、确定所述各子带信号的频域相关矩阵；

c、根据信号源的三维空间传输矢量、所述各频域相关矩阵确定各子带信号的权向量；

d、根据所述各子带信号的权向量和各子带信号确定输出的信号。

所述步骤a具体包括：

a1、对输入各麦克风的信号进行语音检测，并确定语音帧；

a2、确定所述语音帧对应的各子带信号。

设定输入各麦克风的信号为：F(t)＝[f₁(t)…f_i(t)…f_M(t)]^T；

其中：f_i(t)表示第i个麦克风接收到的信号，i＝1，…，M，M为麦克风的数量，[·]^T表示矩阵的转置运算；

且所述步骤a1具体包括：

a11、根据预定采样频率对输入各麦克风的信号进行AD转换：

F(n)＝[f₁(n)…f_i(n)…f_M(n)]^T；

a12、从所述AD转换后的信号中选取信号帧进行短时傅立叶变换：

F (ω) = Σ_{m = 1}^{N} F (n) w (n - m) \exp (- jωm) = [\begin{matrix} Σ_{m = 1}^{N} f_{1} (n) w (n - m) \exp (- jωm) \\ \cdot \cdot \cdot \\ Σ_{m = 1}^{N} f_{M} (n) w (n - m) \exp (- jωm) \end{matrix}];

a13、对傅立叶变换后的信号帧进行语音检测，确定语音帧。

所述步骤a13具体包括如下步骤：

对傅立叶变换后的信号帧进行语音检测；

在确定信号帧不为语音帧时，将该信号帧存储为当前估计噪声谱；

在确定信号帧为语音帧时，根据当前估计噪声谱将所述语音帧进行谱抵消去噪，确定谱抵消去噪后的语音帧S(ω)为：

S (ω) = F (ω) - N (ω) = {[\begin{matrix} s_{1} (1) & \cdot \cdot \cdot & s_{1} (NFFT) \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ s_{M} (1) & \cdot \cdot \cdot & s_{M} (NFFT) \end{matrix}]}_{M \times NFFT};

其中:

N (ω) = {[\begin{matrix} n_{1} (1) & \cdot \cdot \cdot & n_{1} (NFFT) \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ n_{M} (1) & \cdot \cdot \cdot & n_{M} (NFFT) \end{matrix}]}_{M \times NFFT}

为当前估计噪声谱，NFFT为短时傅立叶变换的频率采样点数，F(ω)为短时傅立叶变换后的信号帧，M为麦克风的数量。

所述步骤a2具体包括：

根据K个预定频带将语音帧划分为K个子带信号，并将K个预定频率ω_i，i＝1，…K，确定为各子带的中心频率；

确定第i个子带的信号分量S(ω_i)为：

S (ω_{i}) = [\begin{matrix} S_{1} (i) \\ \cdot \cdot \cdot \\ S_{M} (i) \end{matrix}];

其中：M为麦克风阵列的麦克风数量，i＝1，…K，K为子带数量。

所述步骤b具体包括：

确定各子带信号的频域相关矩阵R(i)：

R(i)＝E{S(ω_i)S^H(ω_i)}；

其中：S(ω_i)为第i个子带的信号分量，且

S (ω_{i}) = [\begin{matrix} S_{1} (i) \\ \cdot \cdot \cdot \\ S_{M} (i) \end{matrix}] .

所述步骤c中信号源的三维空间传输矢量可通过如下步骤获得：

c1、获取信号源位置(f₀，θ₀，φ₀)坐标矢量S＝r₀*[sinθ₀cosφ₀ sinθ₀sinφ₀ cosθ₀]；

c2、获取各麦克风的坐标矢量P_i＝r_i*[sinθ_icosφ_i sinθ_isinφ_i cosθ_i]；

c3、确定信号源位置(r₀，θ₀，φ₀)到第i个麦克风的相对幅度衰减因子_m为：

{&PartialD;}_{i} = \frac{| | S | |}{| | P_{i} - S | |};

其中：‖*‖表示矢量*的范数；

c4、确定信号源位置(r₀，θ₀，φ₀)到第i个麦克风的相对时间延迟因子τ_i为：

τ_{i} = \frac{| | S - P_{i} | | - | | S | |}{c};

其中：c为声音在空气中的传播速度，‖*‖表示矢量*的范数；

c5、确定信号源位置(r₀，θ₀，φ₀)的三维空间传输矢量a(r，θ，φ)为：

a (r, θ, φ) = [\begin{matrix} {&PartialD;}_{1} e^{- j ω_{i} τ_{1}} & \cdot \cdot \cdot {&PartialD;}_{m} e^{- j ω_{i} τ_{m}} \cdot \cdot \cdot & {&PartialD;}_{M} e^{- j ω_{i} τ_{M}} \end{matrix}];

其中：ω_i为各子带的中心频率。

所述步骤c具体包括：

确定第i个子带的最优权向量W_opt ⁱ为：

W_{opt}^{i} = \frac{R {(i)}^{- 1} a}{a^{H} R {(i)}^{- 1} a};

其中：R(i)为第i个子带信号的频域相关矩阵，a为所述信号源位置(r₀，θ₀，φ₀)的三维空间传输矢量。

所述步骤d包括：

根据各子带信号的最优权向量对各子带信号进行子带空间滤波，得到第i个子带的频域输出信号y(ω_i)：

y (ω_{i}) = {(W_{opt}^{i})}^{H} * S (ω_{i});

其中：W_opt ⁱ为第i个子带的最优权向量，S(ω_i)为第i个子带的信号分量；

将各子带的频域输出信号组合为Y(ω)：

Y(ω)＝[y(ω₁) y(ω₂)…y(ω_K)]^T；

对组合后的频域输出信号Y(ω)进行逆快速傅立叶变换得到输出信号Y(n)；

将所述Y(n)转换成模拟信号y(t)，并将y(t)进行低通滤波后信号确定为需要输出的语音信号。

本发明还提供一种宽带波束形成装置，包括：

划分子带信号模块：确定输入各麦克风的信号对应的各子带信号，并将各子带信号传输至频域相关矩阵模块；

频域相关矩阵模块：确定所述各子带信号的频域相关矩阵，并将其传输至权向量模块；

权向量模块：根据信号源的三维空间传输矢量、所述各频域相关矩阵确定各子带信号的权向量，并将其传输至输出模块；

输出模块：根据所述各子带信号的权向量、各子带信号确定输出的信号。

所述划分子带信号模块包括：

采样子模块：根据预定采样频率对输入各麦克风的信号进行AD转换，并从所述AD转换后的信号中选取信号帧进行短时傅立叶变换；

语音检测子模块：对傅立叶变换后的信号帧进行语音检测，在确定信号帧不为语音帧时，将该信号帧存储为当前估计噪声谱，在确定信号帧为语音帧时，将该语音帧传输至谱抵消去噪子模块；

谱抵消去噪子模块：根据当前估计噪声谱将其接收的语音帧进行谱抵消去噪，并传输至划分子带信号子模块；

划分子带信号子模块：根据预定频带将其接收的语音帧划分为多个子带信号，并将各子带信号传输至频域相关矩阵模块。

通过上述技术方案的描述可知，本发明通过对信号源位置矢量采用三维空间传播矢量a(r₀，θ₀，φ₀)，解决了三维空间滤波问题，抑制了空间干扰信号和噪声，提高了输出信号的信噪比；通过将语音信号划分为多个子带，对每个子带分别进行三维空间滤波，使本发明能够将频域和空域结合起来对语音信号进行处理，使本发明能够很好的适用于宽带信号源、近场信号源；通过采用过零率、短时能量相结合等语音检测技术来确定语音帧，避免了在没有语音信号输入时，消耗系统资源的现象，提高了输出语音信号的准确性和稳定性；通过采用谱抵消技术去除系统噪声，避免了非白高斯噪声对系统的影响，有效提高了语音信号的滤波性能；在确定信号源位置矢量a(r₀，θ₀，φ₀)过程中，通过采用信号源位置到各麦克风的相对幅度衰减因子和相对时间延迟因子，且幅度衰减因子采用信号源到各麦克风的距离与信号源到参考麦克风的距离的比值、时延因子采用信号源到各麦克风的时延与信号源到参考麦克风的时延的差，使本发明与子空间理论的模型假设一致，减少了模型误差，提高了三维空间滤波性能；通过根据窄带信号假设条件和语音信号的特点，将输入麦克风的语音信号划分为若干个子带，根据各子带的信号分量确定各子带的频域相关矩阵，大大减少了运算量，提高了系统的实时性，节约了硬件成本；从而通过本发明提供的技术方案实现了提高语音增强性能，提高语音系统实用性的目的。

附图说明

图1是均匀直线麦克风阵列示意图；

图2是本发明的宽带波束形成方法流程图；

图3是近场信号模型示意图。

具体实施方式

本发明的方法和装置的核心均为：确定输入各麦克风的信号对应的各子带信号，确定各子带信号的频域相关矩阵，根据信号源的三维空间传输矢量、各频域相关矩阵确定各子带信号的权向量，根据各子带信号的权向量、各子带信号确定输出的信号。

下面基于本发明的核心思想对本发明提供的技术方案做进一步的描述。

本发明中的麦克风类型为全向麦克风，麦克风的拾音距离可根据具体的应用环境来确定，如房间大小为长5米、宽10米、高4米，如果要求对该房间内的所有声音进行处理，则麦克风的拾音距离至少为10米。本发明对构成麦克风的支架材料不限，但是，支架材料的几何尺寸越小越好，以减小支架对声音的反射，减小多径效应。

本发明中的麦克风阵列的拓扑结构可以为任意形式，如ULA(均匀直线阵列)、UCA(均匀圆环阵列)等。

本发明基于麦克风阵列的宽带信号源波束形成方法的流程图如附图2所示。

在图2中，本发明的方法主要包括三大部分，即信号采集预处理部分、宽带信号处理部分和输出信号处理部分。

下面结合附图2对本发明的基于麦克风阵列的宽带波束形成方法的详细实现过程进行描述。

信号采集预处理部分主要包括如下5个步骤：

步骤1、设定M个普通全向麦克风按照一定的拓扑结构组成麦克风阵列，麦克风阵列拾取信号源发出的声音信号、及其他处于麦克风接收范围内的所有语音信号。

麦克风阵列拾取的信号用数学公式可以表示为：

F(t)＝[f₁(t)…f_i(t)…f_M(t)]^T (7)

公式(7)中：f_i(t)表示第i个麦克风接收到的语音信号，i＝1，…，M，M为麦克风阵列中麦克风的数量，[·]^T表示矩阵的转置运算。

设定第i个麦克风的坐标矢量为：

p_i＝{x_i，y_i，z_i}＝r_i*((sinθ_icos_i，sinθ_isin_i，cosθ_i))，i＝1，…，M (8)

公式(8)中：r_i为第i个麦克风距麦克风阵列中心的距离，麦克风阵列中心即坐标原点，坐标原点可以为麦克风阵列的中心位置，也可以为麦克风阵列中的任意一个麦克风的位置，或其他位置；θ_i为第i个麦克风的坐标矢量与Z轴正方向的夹角，_i为第i个麦克风坐标矢量在XOY平面的投影与X轴正方向的夹角。

M个麦克风的坐标矢量组成整个麦克风阵列的坐标矩阵为：

步骤2、对各麦克风接收到的信号进行AD变换。

在进行AD变换时，可以根据对声音质量的要求来选取采样频率和采样精度，如采样频率可以为：16KHz、22KHz或44Khz等，采样精度可以为：8bit、16bit或32bit等。本发明对采样的技术和芯片不限。

采样后形成多路数字语音信号，即：

F(n)＝[f₁(n)…f_i(n)…f_M(n)]^T (10)

公式(10)中：i＝1，…，M，M为麦克风阵列中麦克风的数量。

步骤3、从公式(10)的每路采样信号中选取帧长为32ms的信号帧，进行短时傅立叶变换，短时傅立叶变换可以选用汉明窗或其它窗函数。

一般情况下可以用NFFT的512点的FFT(快速傅立叶变换)来实现短时傅立叶变换。即：

F (ω) = Σ_{m = 1}^{N} F (n) w (n - m) \exp (- jωm) = [\begin{matrix} Σ_{m = 1}^{N} f_{1} (n) w (n - m) \exp (- jωm) \\ \cdot \cdot \cdot \\ Σ_{m = 1}^{N} f_{M} (n) w (n - m) \exp (- jωm) \end{matrix}] - - - (11)

步骤4、对公式(11)中经过短时傅立叶变换后的信号帧进行语音检测，语音检测技术可以为过零率、短时能量相结合等，本发明对采用的语音检测技术不限。

根据语音检测技术，在确定信号帧为非语音帧时，将非语音帧存储为当前估计噪声谱，当前估计噪声谱的初始值可设置为0矩阵；在确定信号帧为语音帧时，对该语音帧进行下述步骤5的处理。

步骤5、对语音帧采用谱抵消方法即减谱法进行谱抵消去噪。

设定当前估计噪声谱为：

N (ω) = {[\begin{matrix} n_{1} (1) & \cdot \cdot \cdot & n_{1} (NFFT) \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ n_{M} (1) & \cdot \cdot \cdot & n_{M} (NFFT) \end{matrix}]}_{M \times NFFT} - - - (12)

对语音帧进行谱抵消去噪后的语音帧为：

S (ω) = F (ω) - N (ω) = {[\begin{matrix} s_{1} (1) & \cdot \cdot \cdot & s_{1} (NFFT) \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ s_{M} (1) & \cdot \cdot \cdot & s_{M} (NFFT) \end{matrix}]}_{M \times NFFT} - - - (13)

经过上述步骤1到步骤5，完成了本发明对信号的采集预处理过程。下面的步骤6为实现了本发明的宽带信号处理过程。

步骤6、根据信号的频率特点将公式(13)中的S(ω)划分为各干个子带，然后，从各子带中分别选取一个感兴趣的频率ω_i，其中：i＝1，…K，K为子带的数量。将频率ω_i作为其对应的子带的中心频率。

设第i个子带信号的信号分量S(ω_i)为：

S (ω_{i}) = [\begin{matrix} S_{1} (i) \\ \cdot \cdot \cdot \\ S_{M} (i) \end{matrix}] - - - (14)

公式(14)中：M为麦克风阵列中麦克风的数量。

对公式(14)的各子带作如下四方面的处理：

1、获得语音帧的频域相关矩阵R(i)：R(i)＝E{S(ω_i)S^H(ω_i)} (15)

2、获得信号源位置矢量a(r₀，θ₀，φ₀)：

设定第i个麦克风的坐标矢量为P_i，信号源位置(r₀，θ₀，φ₀)的坐标矢量为S，如附图3所示，r₀为信号源到坐标原点的距离，θ₀为信号源与三维坐标的Z轴的夹角，φ₀为信号源在XOY平面上的投影与X轴的夹角。即：

S＝r₀*[sinθ₀cosφ₀ sinθ₀sinφ₀ cosθ₀] (16)

P_i＝r_i*[sinθ_icosφ_i sinθ_isinφ_i cosθ_i] (17)

从信号源位置(r₀，θ₀，φ₀)到第i个麦克风的相对幅度衰减因子_i为：

{&PartialD;}_{i} = \frac{| | S | |}{| | P_{i} - S | |} - - - (18)

从信号源位置(r₀，θ₀，φ₀)到第i个麦克风的相对时间延迟因子τ_i为：

τ_{i} = \frac{| | S - P_{i} | | - | | S | |}{c} - - - (19)

公式(19)中c为声音在空气中的传播速度，在室温时可以取340米/秒，‖·‖表示求·矢量的范数，如矢量a＝[x y z]，则

| | a | | = \sqrt{x^{2} + y^{2} + z^{2}} .

信号源位置(r₀，θ₀，φ₀)的位置矢量a(r₀，θ₀，φ₀)为：

a (r_{0}, θ_{0}, φ_{0}) = [\begin{matrix} {&PartialD;}_{1} e^{- j ω_{i} τ_{1}} & \cdot \cdot \cdot {&PartialD;}_{m} e^{- j ω_{i} τ_{m}} \cdot \cdot \cdot & {&PartialD;}_{M} e^{- j ω_{i} τ_{M}} \end{matrix}] - - - (20)

3、获取第i个子带的最优权向量W_opt ⁱ。根据公式(20)获得的信号源的位置矢量a(r₀，θ₀，φ₀)和公式(15)获得的频域频域相关矩阵R(i)，获取第i子带的最优权向量W_opt ⁱ。

第i个子带的最优权向量W_opt ⁱ为：

W_{opt}^{i} = \frac{R {(i)}^{- 1} a}{a^{H} R {(i)}^{- 1} a} - - - (21)

4、利用最优权向量和子带信号进行子带空间滤波，得到第i个子带的频域输出信号：

y (ω_{i}) = {(W_{opt}^{i})}^{H} * S (ω_{i}) - - - (22)

在上述各公式中，通过采用三维空间坐标来表示麦克风的位置和信号源位置，使本发明的方法可以用于任意拓扑结构的麦克风阵列，本发明的麦克风阵列不限定于圆阵、直线阵列等。由于本发明中的麦克风、信号源等位置信息都是三维的，所以，本发明的滤波技术属于三维空间滤波技术，但是，当麦克风使用一维阵列时如ULA、均匀直线阵列等，三维滤波特性消失。

本发明中使用的方向矢量求解方法适用于任意拓扑结构的麦克风阵列。

下面的步骤7、步骤8为输出信号处理部分。

步骤7、将K个子带的频域输出信号组合成频域输出信号Y(ω)：

Y(ω)＝[y(ω₁) y(ω₁)…y(ω_K)]^T (23)

步骤8、对Y(ω)进行逆FFT，得到输出信号Y(n)，然后把Y(n)转换成模拟信号y(t)，对y(t)进行低通滤波，得到语音输出信号。

本发明提供的基于麦克风阵列的宽带波束形成装置主要包括：划分子带信号模块、频域相关矩阵模块、权向量模块和输出模块。划分子带信号模块的功能由采样子模块、语音检测子模块、谱抵消去噪子模块和划分子带信号子模块来实现。

采样子模块主要用于根据预定采样频率对输入各麦克风的信号进行AD转换，然后，从AD转换后的信号中选取信号帧进行短时傅立叶变换。上述采样频率可以为：16KHz、22KHz或44Khz等，采样精度可以为：8bit、16bit或32bit等，短时傅立叶变换可通过NFFT的512点的FFT来实现、且短时傅立叶变换可以选用汉明窗或其它窗函数等。具体实现过程如方法中F(n)和F(ω)的描述。

语音检测子模块主要用于对采样子模块处理的、傅立叶变换后的信号帧进行语音检测，在确定信号帧不为语音帧时，将该信号帧存储为当前估计噪声谱，在确定信号帧为语音帧时，将该语音帧传输至谱抵消去噪子模块。语音检测子模块采用的语音检测技术可以为过零率、短时能量相结合等。

谱抵消去噪子模块主要用于根据语音检测子模块存储的当前估计噪声谱，将语音检测子模块传输来的语音帧进行谱抵消去噪，并将谱抵消去噪后的语音帧传输至划分子带信号子模块。谱抵消去噪后过程和谱抵消去噪后的信号如上述方法中S(ω)的描述。

划分子带信号子模块主要用于根据预定频带将谱抵消去噪子模块传输来的语音帧划分为多个子带信号，并将各子带信号传输至频域相关矩阵模块和输出模块，语音帧的各子带信号如上述方法中S(ω_i)的描述。

频域相关矩阵模块主要用于确定其接收的各子带信号的频域相关矩阵，并将其传输至权向量模块。获得频域相关矩阵R(i)的方法如上述方法中的描述。

权向量模块主要用于根据信号源的三维空间传输矢量a(r₀，θ₀，φ₀)、其接收的各频域相关矩阵R(i)确定各子带信号的最优权向量W_opt ⁱ，并将W_opt ⁱ传输至输出模块。信号源的三维空间传输矢量a(r₀，θ₀，φ₀)、最优权向量W_opt ⁱ的获取方法如上述方法中的描述。

输出模块主要用于根据权向量模块传输来的各子带信号的权向量对划分子带信号子模块传输来的各子带信号进行子带空间滤波，得到各子带的频域输出信号，将K个子带的频域输出信号组合成频域输出信号，并将组合成的频域输出信号进行逆FFT，然后，转换成模拟信号，将该模拟信号进行低通滤波后的信号确定为需要输出的语音信号。

虽然通过实施例描绘了本发明，本领域普通技术人员知道，本发明有许多变形和变化而不脱离本发明的精神，本发明的申请文件的权利要求包括这些变形和变化。

Claims

1、一种宽带波束形成方法，其特征在于，包括步骤：

a、确定输入各麦克风的信号对应的各子带信号；

b、确定所述各子带信号的频域相关矩阵；

2、如权利要求1所述的一种宽带波束形成方法，其特征在于，所述步骤a具体包括如下步骤：

a1、对输入各麦克风的信号进行语音检测，并确定语音帧；

a2、确定所述语音帧对应的各子带信号。

3、如权利要求2所述的一种宽带波束形成方法，其特征在于：

设定输入各麦克风的信号为：F(t)＝[f₁(t)…f_i(t)…f_M(t)]^T；

且所述步骤a1具体包括如下步骤：

a11、根据预定采样频率对输入各麦克风的信号进行AD转换：F(n)＝[f₁(n)…f_i(n)…f_M(n)]^T；

F (ω) = Σ_{m = 1}^{N} F (n) w (n - m) \exp (- jωm) = [\begin{matrix} Σ_{m = 1}^{N} f_{1} (n) w (n - m) \exp (- jωm) \\ . . . \\ Σ_{m = 1}^{N} f_{M} (n) w (n - m) \exp (- jωm) \end{matrix}];

a13、对傅立叶变换后的信号帧进行语音检测，确定语音帧。

4、如权利要求3所述的一种宽带波束形成方法，其特征在于，所述步骤a13具体包括如下步骤：

对傅立叶变换后的信号帧进行语音检测；

S (ω) = F (ω) - N (ω) = {[\begin{matrix} s_{1} (1) & \cdot \cdot \cdot & s_{1} (NFFT) \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ s_{M} (1) & \cdot \cdot \cdot & s_{M} (NFFT) \end{matrix}]}_{M \times NFFT};

其中：

N (ω) = {[\begin{matrix} n_{1} (1) & \cdot \cdot \cdot & n_{1} (NFFT) \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ n_{M} (1) & \cdot \cdot \cdot & n_{M} (NFFT) \end{matrix}]}_{M \times NFFT}

5、如权利要求2、3或4所述的一种宽带波束形成方法，其特征在于，所述步骤a2具体包括如下步骤：

确定第i个子带的信号分量S(ω_i)为：

S (ω_{i}) = [\begin{matrix} S_{1} (i) \\ . . . \\ S_{M} (i) \end{matrix}];

6、如权利要求5所述的一种宽带波束形成方法，其特征在于，所述步骤b具体包括：

确定各子带信号的频域相关矩阵R(i)：

R(i)＝E{S(ω_i)S^H(ω_i)}；

其中：S(ω_i)为第i个子带的信号分量，且

S (ω_{i}) = [\begin{matrix} S_{1} (i) \\ . . . \\ S_{M} (i) \end{matrix}] .

7、如权利要求5所述的一种宽带波束形成方法，其特征在于，所述步骤c中信号源的三维空间传输矢量可通过如下步骤获得：

c1、获取信号源位置(r₀，θ₀，φ₀)坐标矢量S＝r₀*[sinθ₀cosφ₀ sinθ₀sinφ₀ cosθ₀]；

{&PartialD;}_{i} = \frac{| | S | |}{| | P_{i} - S | |};

其中：‖*‖表示矢量*的范数；

τ_{i} = \frac{| | S - P_{i} | | - | | S | |}{c};

a (r, θ, φ) = [{&PartialD;}_{i} e^{- j ω_{i} τ_{i}} \cdot \cdot {\cdot &PartialD;}_{m} e^{- j ω_{i} τ_{m}} \cdot \cdot \cdot {&PartialD;}_{M} e^{- j ω_{i} τ_{M}}];

其中：ω_i为各子带的中心频率。

8、如权利要求1、2、3或4所述的一种宽带波束形成方法，其特征在于，所述步骤c具体包括：

确定第i个子带的最优权向量W_opt ⁱ为：

W_{opt}^{i} = \frac{R {(i)}^{- 1} a}{a^{H} R {(i)}^{- 1} a};

9、如权利要求1、2、3或4所述的一种宽带波束形成方法，其特征在于，所述步骤d具体包括如下步骤：

y (ω_{i}) = {(W_{opt}^{i})}^{H} * S (ω_{i});

其中：W_opt ⁱ为第i个子带的最优权向量，S(ω_i)为第i个子带的信号分量；将各子带的频域输出信号组合为Y(ω)：

Y(ω)＝[y(ω₁)y(ω₂)…y(ω_K)]^T；

10、一种宽带波束形成装置，其特征在于，包括：

11、如权利要求10所述的一种宽带波束形成装置，其特征在于，所述划分子带信号模块包括：