CN108445452B - 改进的频域srp声源方位估计方法 - Google Patents
改进的频域srp声源方位估计方法 Download PDFInfo
- Publication number
- CN108445452B CN108445452B CN201810102202.5A CN201810102202A CN108445452B CN 108445452 B CN108445452 B CN 108445452B CN 201810102202 A CN201810102202 A CN 201810102202A CN 108445452 B CN108445452 B CN 108445452B
- Authority
- CN
- China
- Prior art keywords
- sound source
- estimation
- frequency
- region
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开的改进的频域SRP声源方位估计方法,包括:麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域。本发明不仅能解决均匀线阵高频容易出现混叠导致的声源方位估计偏离至端射方向的问题,还能显著降低SRP算法的计算量。
Description
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种改进的频域SRP声源方位估计方法。
背景技术
在进行声源方位估计时,常常通过SRP(Steered Response Power)方法估计空间上的功率谱分布,找出功率最大的位置,作为声源的位置。而SRP方法在计算信号功率谱时,高频部分容易出现混叠现象,由于高频容易出现混叠,导致即使在安静环境下也存在声源方位估计偏离至端射方向的问题。
发明内容
为解决以上问题,本发明提供一种改进的频域SRP声源方位估计方法,包括:
麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;
使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;
使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;
其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域;所述得到声源的第二估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第二估计区域。
优选的,所述改进的频域SRP声源方位估计方法,可具体实施为:
麦克风阵列采集声源的时域信号;
将声源空间划分为多个网格区域;
将所述时域信号进行频域变换得到频域信号,并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值;
选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域;
将声源的第一估计区域划分为多个二次网格区域;
仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值;
选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域。
优选的,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取与第一估计区域之间的距离小于第一预设阈值的网格区域,作为第二估计区域,所述距离为网格区域的形心之间的距离;
将所述第二估计区域与第一估计区域合并,形成新的第一估计区域。
优选的,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域,作为第三估计区域;
将所述第三估计区域与第一估计区域合并,形成新的第一估计区域。
优选的,
所述声源频域信号的低频部分,为声源频域信号中频率不高于分界频率的部分;
所述声源频域信号的高频部分,为声源频域信号中频率高于分界频率的部分;
所述分界频率,由不发生混叠的最大频率乘以预设的系数得到,所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到,所述预设的系数为大于0.5且小于1的正实数。
优选的,
所述麦克风阵列,为均匀线阵。
优选的,
所述将声源空间划分为多个网格区域,可实施为:
以麦克风阵列的阵元中心为坐标原点,建立的平面直角坐标系;
将坐标系按等方位角均分;
当为远场声场时,所述划分的结果即为将声源空间划分的多个网格区域。
本发明的一些有益效果可以包括:
通过本发明的方法,不仅能解决高频容易出现混叠导致的声源方位估计偏离至端射方向的问题,还能显著降低SRP算法的计算量。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种改进的频域SRP声源方位估计方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例中一种改进的频域SRP声源方位估计方法的流程图,如图1所示,包括步骤:
步骤S101、麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;
步骤S102、使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;
步骤S103、使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;
其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域;所述得到声源的第二估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第二估计区域。
本发明提供的方法,针对声音信号高频部分容易出现混叠,而低频部分相对稳定的特点,先通过低频部分对声源方位进行初步估计,然后在其附近进行高频功率谱峰值检测,能够有效避开端射方向由于混叠造成的伪峰,提高声源方位估计的准确率,同时,由于第二估计区域是在第一估计区域的基础上进行的进一步估计,在相同的估计精度下,本发明提供的方法较常规方法的计算量更小。
在本发明的一个实施例中,所述改进的频域SRP声源方位估计方法,可具体实施为:
麦克风阵列采集声源的时域信号;
将声源空间划分为多个网格区域;
将所述时域信号进行频域变换得到频域信号,并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值;
选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域;
将声源的第一估计区域划分为多个二次网格区域;
仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值;
选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域。
本发明提供的方法,由于使用2次网格划分,在相同的精度下,有效的降低了SRP算法的计算量,例如,在远场声场的情况下,(以球坐标系为例)当方位角和仰角的分辨率为1°时,直接使用SRP算法需要计算180×180=32400个网格区域的可控响应功率函数值,在本发明的实施例中,在将声源空间划分为多个网格区域时,可以将方位角和仰角的分辨率设为10°,此时使用SRP算法需要计算18×18=324个网格区域的可控响应功率函数值,得到第一估计区域后,在划分二次网格区域时,将方位角和仰角的分辨率设为1°,此时使用SRP算法需要计算10×10=100个网格区域的可控响应功率函数值,总共需要计算324+100=424次,比32400次的计算量大大降低。
由于在识别第一估计区域时可能有误差的影响,可能会识别到声源附近的区域,为了使第一估计区域能够包含声源,需要将识别到的区域附近也纳入第一估计区域,在本发明的一个实施例中,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取与第一估计区域之间的距离小于第一预设阈值的网格区域,作为第二估计区域,所述距离为网格区域的形心之间的距离;
将所述第二估计区域与第一估计区域合并,形成新的第一估计区域。
由于在识别第一估计区域时可能有误差的影响,可能会识别到声源附近的其他区域,为了使第一估计区域能够包含声源,需要将可控响应功率函数值较大的区域也纳入第一估计区域,在本发明的一个实施例中,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域,作为第三估计区域;
将所述第三估计区域与第一估计区域合并,形成新的第一估计区域。
为了降低高频混叠的影响,需要对原始信号进行低通滤波,在在本发明的一个实施例中,
为了提高声源方位估计速度,降低滤波所需的计算时间,省去了对原始信号的滤波处理,在在本发明的一个实施例中,
所述声源频域信号的低频部分,为声源频域信号中频率不高于分界频率的部分;
所述声源频域信号的高频部分,为声源频域信号中频率高于分界频率的部分;
所述分界频率,由不发生混叠的最大频率乘以预设的系数得到,所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到,所述预设的系数为大于0.5且小于1的正实数。
在常用的麦克风阵列中,圆阵和球阵不存在端射方向,端射方向仅对于线阵存在(线阵两端),因此仅需处理线阵的麦克风阵列,在本发明的一个实施例中,
所述麦克风阵列,为均匀线阵。
当所要识别的是远场声场时,需要将声源空间按角度均匀划分,在本发明的一个实施例中,
所述将声源空间划分为多个网格区域,可实施为:
以麦克风阵列的阵元中心为坐标原点,建立的平面直角坐标系;
将坐标系按等方位角均分;
当为远场声场时,所述划分的结果即为将声源空间划分的多个网格区域。
通过本发明的方法,不仅能解决高频容易出现混叠导致的声源方位估计偏离至端射方向的问题,还能显著降低SRP算法的计算量。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (4)
1.一种改进的频域SRP声源方位估计方法,其特征在于,包括:
麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;
使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;
使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;
其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域;所述得到声源的第二估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第二估计区域;
麦克风阵列采集声源的时域信号;
将声源空间划分为多个网格区域;
将所述时域信号进行频域变换得到频域信号,并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值;
选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域;
将声源的第一估计区域划分为多个二次网格区域;
仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值;
选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域;
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取与第一估计区域之间的距离小于第一预设阈值的网格区域,作为第二估计区域,所述距离为网格区域的形心之间的距离;
将所述第二估计区域与第一估计区域合并,形成新的第一估计区域;
所述声源频域信号的低频部分,为声源频域信号中频率不高于分界频率的部分;
所述声源频域信号的高频部分,为声源频域信号中频率高于分界频率的部分;
所述分界频率,由不发生混叠的最大频率乘以预设的系数得到,所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到,所述预设的系数为大于0.5且小于1的正实数。
2.根据权利要求1所述的方法,其特征在于,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域,作为第三估计区域;
将所述第三估计区域与第一估计区域合并,形成新的第一估计区域。
3.根据权利要求1所述的方法,其特征在于,
所述麦克风阵列,为均匀线阵。
4.根据权利要求3所述的方法,其特征在于,
所述将声源空间划分为多个网格区域为:
以麦克风阵列的阵元中心为坐标原点,建立的平面直角坐标系;
将坐标系按等方位角均分;
当为远场声场时,所述划分的结果即为将声源空间划分的多个网格区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810102202.5A CN108445452B (zh) | 2018-02-01 | 2018-02-01 | 改进的频域srp声源方位估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810102202.5A CN108445452B (zh) | 2018-02-01 | 2018-02-01 | 改进的频域srp声源方位估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108445452A CN108445452A (zh) | 2018-08-24 |
CN108445452B true CN108445452B (zh) | 2020-04-24 |
Family
ID=63191695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810102202.5A Active CN108445452B (zh) | 2018-02-01 | 2018-02-01 | 改进的频域srp声源方位估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108445452B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110888112B (zh) * | 2018-09-11 | 2021-10-22 | 中国科学院声学研究所 | 一种基于阵列信号的多目标定位识别方法 |
CN111505569B (zh) * | 2020-05-20 | 2022-04-19 | 浙江大华技术股份有限公司 | 声源定位方法以及相关设备、装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104535964A (zh) * | 2014-12-24 | 2015-04-22 | 大连大学 | 基于低频衍射时延差的头盔式麦克风阵列声源定位方法 |
US9621984B1 (en) * | 2015-10-14 | 2017-04-11 | Amazon Technologies, Inc. | Methods to process direction data of an audio input device using azimuth values |
-
2018
- 2018-02-01 CN CN201810102202.5A patent/CN108445452B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104535964A (zh) * | 2014-12-24 | 2015-04-22 | 大连大学 | 基于低频衍射时延差的头盔式麦克风阵列声源定位方法 |
US9621984B1 (en) * | 2015-10-14 | 2017-04-11 | Amazon Technologies, Inc. | Methods to process direction data of an audio input device using azimuth values |
Non-Patent Citations (1)
Title |
---|
《基于差分麦克风阵列和语音稀疏性的多源方位估计方法》;何赛娟 等;《Journal of Data Acquisition and Processing》;20150331;第30卷(第2期);第372-381段 * |
Also Published As
Publication number | Publication date |
---|---|
CN108445452A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107976651B (zh) | 一种基于麦克风阵列的声源定位方法及装置 | |
AU2015292238B2 (en) | Planar sensor array | |
KR102009274B1 (ko) | 빔-포밍 필터들에 대한 fir 계수 계산 | |
US9299336B2 (en) | Computationally efficient broadband filter-and-sum array focusing | |
CN106443587B (zh) | 一种高分辨率的快速反卷积声源成像算法 | |
EP2988527A1 (en) | System and method for detecting location of sound sources in a three-dimensional space | |
CN108445452B (zh) | 改进的频域srp声源方位估计方法 | |
CN105631939B (zh) | 一种基于曲率滤波的三维点云畸变校正方法及其系统 | |
CN103117064A (zh) | 处理信号 | |
CN107247193B (zh) | 天线近场测试方法及装置 | |
US20160249152A1 (en) | System and method for evaluating an acoustic transfer function | |
CN108717495A (zh) | 多波束波束成形的方法、装置及电子设备 | |
WO2023207047A1 (zh) | 一种高分辨率谱估计声阵列成像方法 | |
CN112420066B (zh) | 降噪方法、装置、计算机设备和计算机可读存储介质 | |
CN113223552B (zh) | 语音增强方法、装置、设备、存储介质及程序 | |
KR20170035327A (ko) | 빔 형성 어레이의 드라이버 장치들을 위한 음향 빔 형성 방법 및 음향 장치 | |
CN108551625A (zh) | 波束成形的方法、装置及电子设备 | |
CN111142072B (zh) | 用于声源定位的传声器阵列优化方法 | |
WO2020186434A1 (en) | Flexible differential microphone arrays with fractional order | |
CN113219409B (zh) | 一种基于聚焦网格筛选的声学成像和多声源定位方法 | |
CN106448693B (zh) | 一种语音信号处理方法及装置 | |
WO2015160455A2 (en) | Systems, apparatus, and methods for location estimation of a mobile device | |
CN111998934B (zh) | 一种声源声功率测试方法 | |
CN107846241B (zh) | 脉冲噪声环境下的波束形成方法、存储介质及波束形成器 | |
del-Val et al. | Optimisation of sensor positions in random linear arrays based on statistical relations between geometry and performance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000 Applicant after: Yunzhisheng Intelligent Technology Co., Ltd. Address before: 100000 AOC mansion, floor 12, building No. 1, No. 16, Center Road, Sun Palace, Chaoyang District, Beijing Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |