CN108445452B

CN108445452B - 改进的频域srp声源方位估计方法

Info

Publication number: CN108445452B
Application number: CN201810102202.5A
Authority: CN
Inventors: 丁少为; 关海欣; 马金龙
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2018-02-01
Filing date: 2018-02-01
Publication date: 2020-04-24
Anticipated expiration: 2038-02-01
Also published as: CN108445452A

Abstract

本发明公开的改进的频域SRP声源方位估计方法，包括：麦克风阵列采集声源的时域信号，并将所述时域信号进行频谱变换，得到声源频域信号；使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域；使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域，作为声源的最终估计区域；其中，所述得到声源的第一估计区域，为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿，并据此将可控响应功率函数值最大的区域作为声源的第一估计区域。本发明不仅能解决均匀线阵高频容易出现混叠导致的声源方位估计偏离至端射方向的问题，还能显著降低SRP算法的计算量。

Description

改进的频域SRP声源方位估计方法

技术领域

本发明涉及语音信号处理技术领域，特别涉及一种改进的频域SRP声源方位估计方法。

背景技术

在进行声源方位估计时，常常通过SRP(Steered Response Power)方法估计空间上的功率谱分布，找出功率最大的位置，作为声源的位置。而SRP方法在计算信号功率谱时，高频部分容易出现混叠现象，由于高频容易出现混叠，导致即使在安静环境下也存在声源方位估计偏离至端射方向的问题。

发明内容

为解决以上问题，本发明提供一种改进的频域SRP声源方位估计方法，包括：

麦克风阵列采集声源的时域信号，并将所述时域信号进行频谱变换，得到声源频域信号；

使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域；

使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域，作为声源的最终估计区域；

其中，所述得到声源的第一估计区域，为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿，并据此将可控响应功率函数值最大的区域作为声源的第一估计区域；所述得到声源的第二估计区域，为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿，并据此将可控响应功率函数值最大的区域作为声源的第二估计区域。

优选的，所述改进的频域SRP声源方位估计方法，可具体实施为：

麦克风阵列采集声源的时域信号；

将声源空间划分为多个网格区域；

将所述时域信号进行频域变换得到频域信号，并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值；

选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域；

将声源的第一估计区域划分为多个二次网格区域；

仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值；

选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域。

优选的，

在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后，

还选取与第一估计区域之间的距离小于第一预设阈值的网格区域，作为第二估计区域，所述距离为网格区域的形心之间的距离；

将所述第二估计区域与第一估计区域合并，形成新的第一估计区域。

优选的，

还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域，作为第三估计区域；

将所述第三估计区域与第一估计区域合并，形成新的第一估计区域。

优选的，

所述声源频域信号的低频部分，为声源频域信号中频率不高于分界频率的部分；

所述声源频域信号的高频部分，为声源频域信号中频率高于分界频率的部分；

所述分界频率，由不发生混叠的最大频率乘以预设的系数得到，所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到，所述预设的系数为大于0.5且小于1的正实数。

优选的，

所述麦克风阵列，为均匀线阵。

优选的，

所述将声源空间划分为多个网格区域，可实施为：

以麦克风阵列的阵元中心为坐标原点，建立的平面直角坐标系；

将坐标系按等方位角均分；

当为远场声场时，所述划分的结果即为将声源空间划分的多个网格区域。

本发明的一些有益效果可以包括：

通过本发明的方法，不仅能解决高频容易出现混叠导致的声源方位估计偏离至端射方向的问题，还能显著降低SRP算法的计算量。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种改进的频域SRP声源方位估计方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

图1为本发明实施例中一种改进的频域SRP声源方位估计方法的流程图，如图1所示，包括步骤：

步骤S101、麦克风阵列采集声源的时域信号，并将所述时域信号进行频谱变换，得到声源频域信号；

步骤S102、使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域；

步骤S103、使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域，作为声源的最终估计区域；

本发明提供的方法，针对声音信号高频部分容易出现混叠，而低频部分相对稳定的特点，先通过低频部分对声源方位进行初步估计，然后在其附近进行高频功率谱峰值检测，能够有效避开端射方向由于混叠造成的伪峰，提高声源方位估计的准确率，同时，由于第二估计区域是在第一估计区域的基础上进行的进一步估计，在相同的估计精度下，本发明提供的方法较常规方法的计算量更小。

在本发明的一个实施例中，所述改进的频域SRP声源方位估计方法，可具体实施为：

麦克风阵列采集声源的时域信号；

将声源空间划分为多个网格区域；

将声源的第一估计区域划分为多个二次网格区域；

本发明提供的方法，由于使用2次网格划分，在相同的精度下，有效的降低了SRP算法的计算量，例如，在远场声场的情况下，(以球坐标系为例)当方位角和仰角的分辨率为1°时，直接使用SRP算法需要计算180×180＝32400个网格区域的可控响应功率函数值，在本发明的实施例中，在将声源空间划分为多个网格区域时，可以将方位角和仰角的分辨率设为10°，此时使用SRP算法需要计算18×18＝324个网格区域的可控响应功率函数值，得到第一估计区域后，在划分二次网格区域时，将方位角和仰角的分辨率设为1°，此时使用SRP算法需要计算10×10＝100个网格区域的可控响应功率函数值，总共需要计算324+100＝424次，比32400次的计算量大大降低。

由于在识别第一估计区域时可能有误差的影响，可能会识别到声源附近的区域，为了使第一估计区域能够包含声源，需要将识别到的区域附近也纳入第一估计区域，在本发明的一个实施例中，

由于在识别第一估计区域时可能有误差的影响，可能会识别到声源附近的其他区域，为了使第一估计区域能够包含声源，需要将可控响应功率函数值较大的区域也纳入第一估计区域，在本发明的一个实施例中，

为了降低高频混叠的影响，需要对原始信号进行低通滤波，在在本发明的一个实施例中，

为了提高声源方位估计速度，降低滤波所需的计算时间，省去了对原始信号的滤波处理，在在本发明的一个实施例中，

在常用的麦克风阵列中，圆阵和球阵不存在端射方向，端射方向仅对于线阵存在(线阵两端)，因此仅需处理线阵的麦克风阵列，在本发明的一个实施例中，

所述麦克风阵列，为均匀线阵。

当所要识别的是远场声场时，需要将声源空间按角度均匀划分，在本发明的一个实施例中，

所述将声源空间划分为多个网格区域，可实施为：

将坐标系按等方位角均分；

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种改进的频域SRP声源方位估计方法，其特征在于，包括：

其中，所述得到声源的第一估计区域，为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿，并据此将可控响应功率函数值最大的区域作为声源的第一估计区域；所述得到声源的第二估计区域，为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿，并据此将可控响应功率函数值最大的区域作为声源的第二估计区域；

麦克风阵列采集声源的时域信号；

将声源空间划分为多个网格区域；

将声源的第一估计区域划分为多个二次网格区域；

选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域；

将所述第二估计区域与第一估计区域合并，形成新的第一估计区域；

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1所述的方法，其特征在于，

所述麦克风阵列，为均匀线阵。

4.根据权利要求3所述的方法，其特征在于，

所述将声源空间划分为多个网格区域为：

将坐标系按等方位角均分；