CN112565119A

CN112565119A - 一种基于时变混合信号盲分离的宽带doa估计方法

Info

Publication number: CN112565119A
Application number: CN202011385852.9A
Authority: CN
Inventors: 何鹏举; 朱瑞霖
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-11-30
Filing date: 2020-11-30
Publication date: 2021-03-26
Anticipated expiration: 2040-11-30
Also published as: CN112565119B

Abstract

本发明公开了一种基于时变混合信号盲分离的宽带DOA估计方法，包括：获取声学相机系统的多声源混响数据；通过GPR‑UKF‑NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC‑PHAT算法、MVDR波束形成算法，形成深度盲波束形成算法；通过深度盲波束形成算法，对多声源混响数据进行时变盲源分离、去混响、及DOA估计。本发明基于GPR‑UKF‑NMFD盲分离方法、变分贝叶斯盲分离方法和时变在线盲分离方法，GCC‑PHAT的DOA估计方法和MVDR波束形成方法，提出了一种适用于多声源DOA估计的声学相机系统的深度盲波束形成算法，将该算法移植到声学相机系统中，通过半实物仿真实验实现了实测多声源的时变盲分离、定位以及去混响。

Description

一种基于时变混合信号盲分离的宽带DOA估计方法

技术领域

本发明涉及信号盲分离处理技术领域，更具体的涉及一种基于时变混合信号盲分离的宽带DOA估计方法。

背景技术

声学相机在可视化声场和识别噪声源领域应用广泛，它是用于定位声源并对其进行表征的成像设备。该设备由若干个麦克风传感器和一个光学照相机组合而成，麦克风传感器不同的摆放形式产生了不同的阵列形状，其中，光学照相机用于拍摄实际声源环境场景，而麦克风阵列则用于接收入射声源。由于声音以已知的速度通过不同的介质传播，因此阵列中的每个麦克风会在不同的时刻以不同的声音强度感知“观察”区域中的每个声源。该设备的关键技术之一就是波束形成，而波束形成依赖于远场假设，其目的是通过麦克风阵列进行单次测量来确定各声源的波达方向(Directionofarrival，DOA)。宽带DOA估计的声学成像方法在设备无损监测方面有着广阔的应用前景，它可以预先估计出声源的大致波达方向，再利用波束形成进一步确定声源位置，最后实现声场可视化，由此可以及时地反映出设备的工况，进而评估机器设备的健康状况。因此，研究宽带信号源的DOA估计方法具有广泛的现实意义和重要的应用价值。

目前声学相机系统普遍还面临着无法满足声源在复杂混响环境下的实时定位问题，该问题解决的重难点在于对声源的波达方向估计。平面波的到达角或波束估计问题被认为是DOA估计问题或测向问题。DOA估计在声纳、雷达、电子监视、地震系统和医学诊断等领域发挥着巨大的作用。波束形成被认为是估计DOA最常用的方法。在过去的几十年中，DOA估计由于其应用的广泛性和确定最优估计量的复杂性而引起了研究人员的关注。由于实际应用中的信号大多为宽带信号，如噪声，语音源等，且宽带阵列信号因具有目标回波携带信息量大，目标检测、参量估计和目标特征提取更容易等特点，催生了DOA估计在有源探测系统中的广泛应用。因此，研究如何合理充分地利用宽带信息，获得更适合宽带信号的阵列高分辨测向算法，并去除噪声、混响的影响，也成为了各个领域国内外学者们的研究重点。

然而，若要将宽带多信号源DOA估计运用到声学相机系统中时，目前仍然有一些问题亟需解决。例如，在噪声混响环境下，未涉及混合系统为时变系统时的多个声源的定位及去混响；未研究适用于实时性要求高的应用场合的在线宽带多源DOA估计。

发明内容

本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法和系统，用以解决上述背景技术提出的问题。

本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法，包括：

获取声学相机系统的多声源混响数据；

通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法，形成深度盲波束形成算法；

通过深度盲波束形成算法，对多声源混响数据进行时变盲源分离、去混响、及DOA估计。

进一步地，所述通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法，形成深度盲波束形成算法，包括：

通过GPR-UKF-NMFD盲分离算法，对多声源混响数据进行第一次盲分离；

通过变分贝叶斯盲分离算法，对第一次盲分离后数据进行第二次盲分离；

通过时变在线盲分离算法，对第二次盲分离后数据进行第三次盲分离；

通过GCC-PHAT算法，对第三次盲分离后数据进行DOA估计；

将DOA估计后数据代入MVDR波束形成算法，获得深度盲波束形成算法。

进一步地，所述通过GPR-UKF-NMFD盲分离算法，对多声源混响数据进行第一次盲分离，包括：

采用高斯过程回归GPR理论建立动态系统模型，再结合无迹卡尔曼滤波UKF理论对观测信号进行实时在线滤波，形成GPR-UKF状态预估计算法；其过程如下：

1.1)建立高斯过程带加性噪声的非线性动态系统模型：

式中，x_k和y_k分别为k时刻的状态变量和量测变量，w_k为量测噪声，且

1.2)分别确定状态模型和量测模型中的训练数据量D_f和D_h，输入与输出数据的维度为N与M，并初始化统计量μk-1和Pχ，k-1；

1.3)通过向量x的均值μ和方差P_x构造Sigma点集{χ_i|i＝0，1，…2n}

式中，k为尺度参数，是调节精度的参数，该组采样点表示x服从的高斯分布，并将该点集带入状态方程中，得到状点集

1.4)计算均值

1.5)计算方差

1.6)将

和

代入1.3)中公式，重新得到一组Sigma点集

并将其代入量测方程中，得观测量的点集

1.7)计算观测量的均值

1.8)计算观测量的方差

1.9)计算互协方差

1.10)根据卡尔曼增益

更新状态，并将其作为新一轮的统计量；

根据GPR-UKF状态预估计算法，结合非负矩阵分解解卷积NMFD理论，

形成GPR-UKF-NMFD盲分离算法；其过程如下：

2.1)根据GPR-UKF状态预估计算法，对观测信号χ_i(t)通过GPR理论建立状态空间模型，然后通过UKF理论估计状态变量

2.2)对

进行短时傅里叶变换得到J×P维的复数矩阵V₀，并计算V₀的功率谱值v′，具体为

且

2.3)随机初始化非负矩阵W和H，再将V，W，H代入如下非负矩阵分解更新规则中：

2.4)将上一步更新得到的W_new和H_new代入如下两式中，得到E：

2.5)令W＝W_new，H＝H_new，继续代入更新规则至E＜E₀时停止更新，E₀为设定的阈值，此时非负矩阵分别为W_fin，H_fin；

2.6)令

利用

将其转化为复数矩阵

2.7)对

进行短时傅里叶逆变换，得到分离信号

此时的分离信号为去混响后的信号。

进一步地，所述通过变分贝叶斯盲分离算法，对第一次盲分离后数据进行第二次盲分离，包括：

3.1)对第m(m＝1，…，M)个阵元上的观测信号

进行短时傅里叶变换，并得到第一帧的

3.2)初始化二值矩阵G、参数θ以及混合系统后验统计量

3.3)重复以下VBE-C步、VBE-A步，至下界收敛：

VBE-C步：用下式计算

其中，U_fl∈C^J×J是J×J维的矩阵，其第jr^th个元素

是

的第jr^th个元素，

并通过下式估计出

VBE-A步：用下式计算

再使用卡尔曼平滑得到参数

VBM步：用以下公式更新参数θ；

其中，

被定义为

3.4)返回源信号的估计值

3.5)m++，继续执行3.1)～3.5)步，直到m＝M，并返回

得到分离信号。

进一步地，所述通过时变在线盲分离算法，对第二次盲分离后数据进行第三次盲分离，包括：

4.1)初始化：初始化参数Θ⁽⁰⁾，用前4帧的信号与混合系统数据来训练GPR模型参数，即初始核超参数Ω⁽⁰⁾，随机初始化其余超参数Ψ⁽⁰⁾，超参数Φ＝Ω∪Ψ；

4.2)对前2个阵元上的每一帧的观测信号

4.3)VBE步：估计后验分布q(A^(l))，q(S^(l))，q(P^(l))；

4.4)VBM步：估计各参数的期望值E(S^(l))，E(X^(l))，

4.5)更新核函数的超参数

与其余超参数Ψ^(l)；

4.6)算出负变分自由能的变化量ΔF＝|F(Θ^new)-F(Θ^old)|；

4.7)若ΔF＜tol，分离信号S^(l)＝E(S^(l))，l++，返回步骤2)，否则，返回步骤3)；如此反复，直到得到最终的分离结果S^1，2＝{S^(l)}。

进一步地，所述通过GCC-PHAT算法，对第三次盲分离后数据进行DOA估计，包括：

各阵元处接收到观测信号为χ_j(t)＝α_js(t-τ_j)+n_j(t)，j＝1，2…n；其中，s(t)为源信号，τ_i为声源到第j个麦克风的时间延迟，α_j(t)是声源到第j个麦克风的衰减幅度，n_i(t)是加性噪声；

假设声源到两个麦克风的时间差为τ₁₂，则麦克风接收到的语音信号的互相关函数为

GCC-PHAT算法则在频域中利用PHAT加权函数

来改进原互功率谱密度函数，改进后的

为

若以L型阵列为例，假设其x轴时延为τ₁₂，y轴时延为τ₁₃，方位角θ与俯仰角

由下式计算：

进一步地，所述将DOA估计后数据代入MVDR波束形成算法，获得深度盲波束形成算法，包括：

假设某一空间中期望信号的来波方向为φ_e，并存在K个以φ_k为入射角的干扰信号，其对应的导向矢量分别为a(φ_e)和a(φ_k)，权向量与导向矢量之间需要满足约束条件w^Hα(φ_e)＝1，w^Ha(φ_k)＝0，此时的目标函数即为

得输出功率最小同时信干噪比最大的最优权值

对时间对齐后的信号进行加权处理，最后将加权后的结果叠加，以使得阵列在期望方向上产生一个主瓣波束，而对其他方向上产生旁瓣波束；这样对整个空间进行波束扫描即估计出目标信号的位置。

本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法，与现有技术相比，其有益效果如下：

本发明基于GPR-UKF-NMFD盲分离方法、变分贝叶斯盲分离方法和时变在线盲分离方法，GCC-PHAT的DOA估计方法和MVDR波束形成方法，提出了一种适用于多声源DOA估计的声学相机系统的深度盲波束形成算法，将该算法移植到声学相机系统中，通过半实物仿真实验实现了实测多声源的时变盲分离、定位以及去混响。具体地，三种基于盲源分离方法，其中包括：两种基于时变盲分离的DOA估计方法，其可以解决声源的实时盲分离和去混响问题；一种深度盲源分离方法，基于该方法实现了多声源的时变盲分离、去混响以及DOA估计。

附图说明

图1为本发明实施例提供的深度盲波束形成算法结构图；

图2为本发明实施例提供的时变卷积混合的概率模型图；

图3为本发明实施例提供的OLGP-TVCBSS模型贝叶斯网络；

图4为本发明实施例提供的L型阵列示意图；

图5为本发明实施例提供的阵元1、阵元2上两路接收混合声源；

图6为本发明实施例提供的深度盲波束形成算法的分离结果；

图7为本发明实施例提供的相关系数Pxy随信噪比的变化关系图；

图8a为本发明实施例提供的两个实测声源的空间谱；

图8b为本发明实施例提供的两个实测声源的空间谱投影图；

图9a为本发明实施例提供的纯净语音语谱图；

图9b为本发明实施例提供的混响语音语谱图；

图10为本发明实施例提供的去混响后的语音信号语谱图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有的宽带DOA估计方法对实际环境中存在的混响与噪声干扰考虑较少，且混合系统缺乏时变性。为此，本发明提出的深度盲源分离方法实现了多声源的时变盲分离、去混响以及DOA估计。本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法，该方法包括：

步骤1，获取声学相机系统的多声源混响数据。

步骤2，通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法形成深度盲波束形成算法。

步骤3，通过深度盲波束形成算法，对多声源混响数据进行时变盲源分离、去混响、及DOA估计。

其中，上述步骤2具体包括：

步骤21，通过GPR-UKF-NMFD盲分离算法，对多声源混响数据进行第一次盲分离。

步骤22，通过变分贝叶斯盲分离算法，对第一次盲分离后数据进行第二次盲分离。

步骤23，通过时变在线盲分离算法，对第二次盲分离后数据进行第三次盲分离。

步骤24，通过GCC-PHAT算法，对第三次盲分离后数据进行DOA估计。

步骤25，将DOA估计后数据代入MVDR波束形成算法，获得深度盲波束形成算法。

对于上述步骤1～3、及步骤21～25的具体分析如下：

本发明所提出的深度盲波束形成算法就是基于图1中的结构来实现多声源的DOA估计。具体实现步骤大致可分为四大部分：多声源数据输入、盲源分离、DOA估计(时延估计+波束形成)以及空间谱输出。其中，盲源分离和DOA估计部分的具体内容大致如下：

(1)盲源分离

该部分采用三个隐藏层来描述，各层的激活函数(算法)依次为GPR-UKF-NMFD算法、变分贝叶斯EM(VBEM)算法和OLGP-TVCBSS算法。具体的数据传输过程为：将阵元n上的一路观测信号代入GPR-UKF-NMFD层中得到两个预信号S^* ₁和S^* ₂，再将其作为初始化信号代入至VBEM层中，通过计算得到了估计信号源S’₁和S’₁，最后，又将S’₁和S’₁作为输入数据传入OLGP-TVCBSS层中得到S^₁₁，S^₂₂。该过程可以简述为将上一层神经网络的输出作为下一层的输入，再通过该层的神经元上激活函数(盲分离算法)的处理得到新的输出。以此类推也可得到其他阵元上的估计声源S^_n1，S^_n2。

先运用高斯过程回归-无损卡尔曼滤波(Gaussianprocessregression-unscentedKalmanfilter，GPR-UKF)方法建立状态空间模型并完成状态预估计，再采用非负矩阵分解解卷积(Nonnegativematrixfactorizationdeconvolution，NMFD)完成了混合信号的盲分离和去混响。

使用高斯过程回归来建立动态系统模型，再结合UKF实现对观测信号的实时在线滤波，将这一滤波方法称为GPR-UKF方法，过程如下：

1)建立高斯过程带加性噪声的非线性动态系统模型

式中，χ_k和y_k分别为k时刻的状态变量和量测变量，k为系统噪声，w_k为量测噪声，且

2)分别确定状态模型和量测模型中的训练数据量D_f和D_n，输入与输出数据的维度N与M，并初始化统计量μk-1和Pχ，k-1。

3)通过向量x的均值μ和方差P来构造Sigma点集{χ_i|i＝0，1，…2n}

式中，k为尺度参数，是调节精度的参数。该组采样点就可以近似表示x服从的高斯分布。并将该点集带入状态方程中，得到状点集

4)计算状态一步预测的均值

5)计算状态一步预测的方差

6)将

和

再代入3)中公式可重新得到一组Sigma点集

并将其代入量测方程中，可得观测量的点集

7)计算观测量的均值

8)计算观测量的方差

9)互协方差

10)结合卡尔曼增益

来更新状态，并将其作为新一轮的统计量。

综合上述的GPR-UKF状态预估计方法，提出了基于GPR-UKF-NMFD盲分离方法，步骤如下：

1)运用上述GPR-UKF方法对观测信号χ_i(t)通过GPR建立状态空间模型，然后UKF估计状态变量

2)对

且

3)随机初始化非负矩阵W和H，再将V，W，H代入如下非负矩阵分解更新规则中：

4)将上一步更新得到的W_new和H_new代入如下两式中，得到E：

5)令W＝W_new，H＝H_new，继续代入更新规则至E＜E₀时停止更新，E₀为设定的阈值，此时非负矩阵分别为W_fin，H_fin。

6)令

利用

将其转化为复数矩阵

7)对

做短时傅里叶逆变换得到分离信号

此时的分离信号为去混响后的信号。

将局部复高斯模型和非负矩阵分解的概率框架作为源信号的先验，通过连续时间随机过程来模拟时变混合矩阵，在此基础上，运用变分贝叶斯期望最大化得到分离信号。

系统建模，参见图2，源信号：时频域中点(f，l)上的每个源信号s_j，fl可视为K_j个隐变量成分c_k，fl之和，即

若每个隐变量成分c_k，fl服从均值为零，方差为w_fkh_kl的复高斯分布，则c_k，fl～N_c(0，w_fkh_kl)。假设c_k，fl在时频域上相互独立，因此可得源信号s_j，fl的概率分布形式如下

使用NMF模型对S_j，fl的功率谱密度(powerspectraldensity，PSD)矩阵进行建模，即

混合矩阵模型：定义时频域中的观测信号x_fl＝[χ_1，fl，…，χ_I，fl]^T，零均值的复高斯噪声为b_fl＝[b_1，fl，…，b_I，fl]^T，且b_fl～N_c(0，v_fI_I)，混合矩阵A_fl＝[a_1，fl，…，α_J，fl]^T。因此，时频域的模型可以写成x_fl＝A_fls_fl+b_fl，式中，A_fl为时变混合系统。对混合矩阵中的参数利用高斯过程进行建模：

其中，

为均值向量，

为协方差矩阵，a_：，j为A_fl的列向量，

基于VBEM盲分离方法步骤如下：

1)对第m个阵元上的观测信号

进行短时傅里叶变换，并得到第一帧的

2)初始化二值矩阵G、参数θ以及混合系统后验统计量

3)重复以下两步，至下界收敛：

VBE-C步：用下式计算

其中，U_fl∈C^J×J是J×J维的矩阵，其第jr^th个元素

是

的第jr^th个元素，

并通过下式估计出

VBE-A步：用下式计算

再使用卡尔曼平滑得到参数

VBM步：用以下公式更新参数θ。

其中，

被定义为

4)返回源信号的估计值

k∈[1，K]。

5)m++，继续执行1)～5)步，直到m＝M，并返回

得到分离信号。

其中，基于时变在线盲分离方法，使用高斯过程自回归模型学习混合矩阵和源信号时间结构，通过变分贝叶斯推理近似得到模型参数和超参数，并将超参数作为下一帧的先验进行传递，从而实现在线贝叶斯学习。

时变卷积混合的概率分布模型：当存在K个非平稳的宽带信号源时，N个接收阵元，且N≥K。若将某一时间段内接收到的观测信号分帧，则每一帧的模型可以表示为

其中，s^(l)(t)＝[s₁(t)，s₂(t)，…，s_K(t)]^T为第I帧的源信号向量，D为卷积混合信道的阶数，χ^(l)(t)＝[x₁(t)，χ₂(t)，…χ_P(t)]^T是第I帧的观测信号向量，ε^(l)(t)为加性高斯白噪声向量，

为N×K维的混合矩阵。

令

且A^(l)列满秩。对接收到的卷积混合信号进行扩维变为(J+1)N×K(D+J+1)维Toeplitz矩阵

此时，简化后的瞬时混合模型形式为

噪声

服从

服从伽马分布，可表示为

令

此时混合模型为

若用

表示

中的元素，第I帧的元素

间的相关性关系用隐函数f(·)表示。源信号

中的每个元素

与它的前后时刻对应的值之间也是时间相关的，该相关性关系用隐函数g(·)表示；在不同帧之间，混合矩阵

中的每个元素

连续变化。若当前时刻的

只与前p个时刻有关，则

式中，混合系数

为独立同分布的零均值高斯白噪声，且

为平方指数核函数，具体形式为

其中，

为对角矩阵，

为比例因子。则

的先验分布为

对于源信号而言，若当前时刻的

只与前p个时刻有关，则

式中，

为独立同分布的零均值高斯白噪声，且

源信号满足的高斯核函数如下：

由此可得，

的先验分布为

综上，本次卷积混合模型中得到的模型参数为Θ^(l)＝{s^(l)，A^(l)，N^(l)，P^(l)}，模型超参数为

其中，关于混合矩阵的超参数分别为

而

为噪声的超参数。将上述的卷积混合模型称为在线高斯过程时变卷积盲源分离(OnlineGaussianProcessTimeVaryingConvolutionBlindSourceSeparation，OLGP-TVCBSS)模型，该模型完整的贝叶斯网络如图3所示。

基于OLGP-TVCBSS的方法步骤如下：

1)初始化：初始化参数Θ⁽⁰⁾，用前4帧的信号与混合系统数据来训练GPR模型参数，即初始核超参数Ω⁽⁰⁾，随机初始化其余超参数Ψ⁽⁰⁾，超参数Φ＝Ω∪Ψ。

2)对前2个阵元上的每一帧的观测信号

3)VBE步(估计后验分布)：

估计后验分布q(A^(l))，q(S^(l))，q(P^(l))。

4)VBM步(估计模型参数)：

估计各参数的期望值E(S^(l))，E(X^(l))，

5)更新核函数的超参数

与其余超参数Ψ^(l)。

6)算出负变分自由能的变化量ΔF＝|F(Θ^new)-F(Θ^old)|。

7)若ΔF＜tol，分离信号S^(l)＝E(S^(l))，I++，返回步骤2)，否则，返回步骤3)。如此反复，直到得到最终的分离结果S^1，2＝{S^(l)}。

(2)DOA估计

关联阵元上分出的同一信号源，采用广义互相关-相位变换(GeneralizedCrossCorrelationPhaseTransformation，GCC-PHAT)算法估计时延及初始方向(方位角与俯仰角)，最后运用最小方差无畸变响应(MinimumVarianceDistortionlessResponse，MVDR)波束形成算法得到信号源各自的空间谱。

其中，GCC-PHAT算法如下：

各阵元处接收到观测信号为χ_j(t)＝α_js(t-τ_j)+n_j(t)，j＝1，2…n。其中，s(t)为源信号，τ_j为声源到第j个麦克风的时间延迟，α_j(t)是声源到第j个麦克风的衰减幅度，n_j(t)是加性噪声。假设声源到两个麦克风的时间差为τ₁₂，则麦克风接收到的语音信号的互相关函数为

GCC-PHAT算法则在频域中利用PHAT加权函数

来改进原互功率谱密度函数，改进后的

为

若以L型阵列为例(参见图4)，假设其x轴时延为τ₁₂，y轴时延为τ₁₃，方位角θ与俯仰角

可由下式计算：

MVDR波束形成算法如下：

假设某一空间中期望信号的来波方向为φ_e，并存在K个以φ_k为入射角的干扰信号，其对应的导向矢量分别为a(φ_e)和a(φ_k)，权向量与导向矢量之间需要满足约束条件w^Ha(φ_e)＝1，w^Ha(φ_k)＝0，此时的目标函数即为

得输出功率最小同时信干噪比最大的最优权值

对时间对齐后的信号进行加权处理，最后将加权后的结果叠加，以使得阵列在期望方向上产生一个主瓣波束，而对其他方向上产生旁瓣波束。这样对整个空间进行波束扫描即可估计出目标信号的位置。

该深度盲波束形成算法是一种无监督学习的方法，可以仅通过观测信号实现信号的有效分离，并进一步估计各声源的具体位置。

声学相机因其有声源定位、异音异响测试和轨迹跟踪定位等功能，使其成为了工业现场中不可缺少的监测设备，声成像技术是声学相机的关键技术之一，该技术的研究重点就是各声源的DOA估计方法但现有的宽带DOA估计方法对实际环境中存在的混响与噪声干扰考虑较少，且混合系统缺乏时变性。为此，目前声学相机系统普遍还面临着无法满足声源在复杂混响环境下的实时定位问题，该问题解决的重难点在于对声源的波达方向估计。为此，本发明提出了一种深度盲波束形成算法，为声学相机在复杂环境下的声源定位提供了一种方法。

实验分析

深度盲波束形成算法半实物仿真实验：麦克风阵列选型，声源数据及摆放位置：可以估计声源的二维波达方向的阵列类型有L阵，圆阵和平面阵等，其中，L型阵列由于结构简单、易于传统DOA算法移植、更高DOA估计精度与更小的克拉美罗界(CRB)等优点，使得基于L型阵列的二维测向研究受到学者的重视。因此，实验处理的声源信号是由小型九阵元(麦克风)L型阵列接收的语音信号。实验在西北工业大学自动化学院某实验室进行，实验室的空间大小(长*宽*高)为7.47*3.63*3.14(m3)，实验采集的目标声源数据是从TIMIT标准语音库中选取的两路语音信号源，分别为男声信号S1和女声信号S2，两个语音源信号由两个扬声器同时播放，此外，还有室内的环境背景噪声存在，麦克风阵列上单个阵元接收到的语音信号即为带有混响和噪声的两路语音信号的混合数据。

目标声源的确定：待检测的目标声源具体为TIMIT标准语音库中的两个声源：男声信号S1(dr1/fakso/sa1.wav)，女声信号S2(dr1/mdabo/sa2.wav)。信号采集模块中的采样率为48KHz。两路声源的波形如图5所示。对其接收信号执行深度盲波束形成方法，得到的两路分离信号如图6所示。

为了评价算法的分离性能，这里采用相关系数(Pxy)和信噪比(SNR)这两个指标。将深度盲波束形成算法同NB-ICA算法进行对比。源信号与两路分离信号间的相关系数Pxy随信噪比的变化关系如图7所示。由图7可以看出，深度盲波束形成算法和NB-ICA算法都呈现出了较好的分离效果，即当信噪比的增大时其对应的相关系数也随之增大。但深度盲波束形成算法整体的相关系数高于NB-ICA算法，故其分离效果更优。

以此类推，对L型阵列上的其他阵元上的接收信号，同样采用本章提到的深度盲波束形成算法进行盲分离，再对同一个估计信号运用GCC-PHAT和MVDR方法求出其DOA。则声源S1和S2的空间谱如图8a、8b所示。图中两个谱峰对应的位置角度即为两声源的估计方位角与俯仰角，将估计结果、标准声源位置信息以及角度误差整理，可得表1：

表1实测两声源的估计结果及误差

由表1可得，估计得到的声源S1、S2的位置分别为(12°，12°)，(132°，15°)，位置误差的角度范围为0.381°～5.267°。对空间谱中谱峰对应的俯仰角与方位角，通过坐标转换方法在光学照相机采集到的实验场景环境图找出其对应位置。观察图中的高亮点可看出其能较为准确的定位到两声源，实现了实测声源的DOA估计。

声源去混响的验证：使用语谱图来衡量提出深度盲波束形成算法的去混响能力。以阵元1上接收的男声信号S1为例，图9a为原始纯净语音信号语谱图，图9b为混响语音信号语谱图，语谱图横坐标为时间，单位为秒，纵坐标为频率，单位为Hz。图10去混响后的语音信号语谱图。

利用提出的深度盲波束形成算法对混响语音去混响处理，混响信号消减处理后的语音信号语谱图，如图9所示。从图中可以看出，输出语音语谱图相对于混响语音语谱图清晰度有明显的改善，证明了深度盲波束形成算法具有较好的去混响能力。所提出的深度盲波束形成算法，在混合系统为时变系统且对实时性要求较高的场所，可同时实现实测多声源的时变盲分离、定位以及去混响功能，具有广泛的应用。

以上公开的仅为本发明的几个具体实施例，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围，但是，本发明实施例并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围内。