CN108445452A - 改进的频域srp声源方位估计方法 - Google Patents

改进的频域srp声源方位估计方法 Download PDF

Info

Publication number
CN108445452A
CN108445452A CN201810102202.5A CN201810102202A CN108445452A CN 108445452 A CN108445452 A CN 108445452A CN 201810102202 A CN201810102202 A CN 201810102202A CN 108445452 A CN108445452 A CN 108445452A
Authority
CN
China
Prior art keywords
region
sound source
estimation
frequency
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810102202.5A
Other languages
English (en)
Other versions
CN108445452B (zh
Inventor
丁少为
关海欣
马金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunzhisheng Information Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201810102202.5A priority Critical patent/CN108445452B/zh
Publication of CN108445452A publication Critical patent/CN108445452A/zh
Application granted granted Critical
Publication of CN108445452B publication Critical patent/CN108445452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开的改进的频域SRP声源方位估计方法,包括:麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域。本发明不仅能解决均匀线阵高频容易出现混叠导致的声源方位估计偏离至端射方向的问题,还能显著降低SRP算法的计算量。

Description

改进的频域SRP声源方位估计方法
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种改进的频域SRP声源方位估计方法。
背景技术
在进行声源方位估计时,常常通过SRP(Steered Response Power)方法估计空间上的功率谱分布,找出功率最大的位置,作为声源的位置。而SRP方法在计算信号功率谱时,高频部分容易出现混叠现象,由于高频容易出现混叠,导致即使在安静环境下也存在声源方位估计偏离至端射方向的问题。
发明内容
为解决以上问题,本发明提供一种改进的频域SRP声源方位估计方法,包括:
麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;
使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;
使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;
其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域;所述得到声源的第二估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第二估计区域。
优选的,所述改进的频域SRP声源方位估计方法,可具体实施为:
麦克风阵列采集声源的时域信号;
将声源空间划分为多个网格区域;
将所述时域信号进行频域变换得到频域信号,并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值;
选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域;
将声源的第一估计区域划分为多个二次网格区域;
仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值;
选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域。
优选的,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取与第一估计区域之间的距离小于第一预设阈值的网格区域,作为第二估计区域,所述距离为网格区域的形心之间的距离;
将所述第二估计区域与第一估计区域合并,形成新的第一估计区域。
优选的,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域,作为第三估计区域;
将所述第三估计区域与第一估计区域合并,形成新的第一估计区域。
优选的,
所述声源频域信号的低频部分,为声源频域信号中频率不高于分界频率的部分;
所述声源频域信号的高频部分,为声源频域信号中频率高于分界频率的部分;
所述分界频率,由不发生混叠的最大频率乘以预设的系数得到,所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到,所述预设的系数为大于0.5且小于1的正实数。
优选的,
所述麦克风阵列,为均匀线阵。
优选的,
所述将声源空间划分为多个网格区域,可实施为:
以麦克风阵列的阵元中心为坐标原点,建立的平面直角坐标系;
将坐标系按等方位角均分;
当为远场声场时,所述划分的结果即为将声源空间划分的多个网格区域。
本发明的一些有益效果可以包括:
通过本发明的方法,不仅能解决高频容易出现混叠导致的声源方位估计偏离至端射方向的问题,还能显著降低SRP算法的计算量。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种改进的频域SRP声源方位估计方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例中一种改进的频域SRP声源方位估计方法的流程图,如图1所示,包括步骤:
步骤S101、麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;
步骤S102、使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;
步骤S103、使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;
其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域;所述得到声源的第二估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第二估计区域。
本发明提供的方法,针对声音信号高频部分容易出现混叠,而低频部分相对稳定的特点,先通过低频部分对声源方位进行初步估计,然后在其附近进行高频功率谱峰值检测,能够有效避开端射方向由于混叠造成的伪峰,提高声源方位估计的准确率,同时,由于第二估计区域是在第一估计区域的基础上进行的进一步估计,在相同的估计精度下,本发明提供的方法较常规方法的计算量更小。
在本发明的一个实施例中,所述改进的频域SRP声源方位估计方法,可具体实施为:
麦克风阵列采集声源的时域信号;
将声源空间划分为多个网格区域;
将所述时域信号进行频域变换得到频域信号,并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值;
选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域;
将声源的第一估计区域划分为多个二次网格区域;
仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值;
选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域。
本发明提供的方法,由于使用2次网格划分,在相同的精度下,有效的降低了SRP算法的计算量,例如,在远场声场的情况下,(以球坐标系为例)当方位角和仰角的分辨率为1°时,直接使用SRP算法需要计算180×180=32400个网格区域的可控响应功率函数值,在本发明的实施例中,在将声源空间划分为多个网格区域时,可以将方位角和仰角的分辨率设为10°,此时使用SRP算法需要计算18×18=324个网格区域的可控响应功率函数值,得到第一估计区域后,在划分二次网格区域时,将方位角和仰角的分辨率设为1°,此时使用SRP算法需要计算10×10=100个网格区域的可控响应功率函数值,总共需要计算324+100=424次,比32400次的计算量大大降低。
由于在识别第一估计区域时可能有误差的影响,可能会识别到声源附近的区域,为了使第一估计区域能够包含声源,需要将识别到的区域附近也纳入第一估计区域,在本发明的一个实施例中,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取与第一估计区域之间的距离小于第一预设阈值的网格区域,作为第二估计区域,所述距离为网格区域的形心之间的距离;
将所述第二估计区域与第一估计区域合并,形成新的第一估计区域。
由于在识别第一估计区域时可能有误差的影响,可能会识别到声源附近的其他区域,为了使第一估计区域能够包含声源,需要将可控响应功率函数值较大的区域也纳入第一估计区域,在本发明的一个实施例中,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域,作为第三估计区域;
将所述第三估计区域与第一估计区域合并,形成新的第一估计区域。
为了降低高频混叠的影响,需要对原始信号进行低通滤波,在在本发明的一个实施例中,
为了提高声源方位估计速度,降低滤波所需的计算时间,省去了对原始信号的滤波处理,在在本发明的一个实施例中,
所述声源频域信号的低频部分,为声源频域信号中频率不高于分界频率的部分;
所述声源频域信号的高频部分,为声源频域信号中频率高于分界频率的部分;
所述分界频率,由不发生混叠的最大频率乘以预设的系数得到,所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到,所述预设的系数为大于0.5且小于1的正实数。
在常用的麦克风阵列中,圆阵和球阵不存在端射方向,端射方向仅对于线阵存在(线阵两端),因此仅需处理线阵的麦克风阵列,在本发明的一个实施例中,
所述麦克风阵列,为均匀线阵。
当所要识别的是远场声场时,需要将声源空间按角度均匀划分,在本发明的一个实施例中,
所述将声源空间划分为多个网格区域,可实施为:
以麦克风阵列的阵元中心为坐标原点,建立的平面直角坐标系;
将坐标系按等方位角均分;
当为远场声场时,所述划分的结果即为将声源空间划分的多个网格区域。
通过本发明的方法,不仅能解决高频容易出现混叠导致的声源方位估计偏离至端射方向的问题,还能显著降低SRP算法的计算量。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种改进的频域SRP声源方位估计方法,其特征在于,包括:
麦克风阵列采集声源的时域信号,并将所述时域信号进行频谱变换,得到声源频域信号;
使用声源频域信号的低频部分通过SRP声源方位估计方法从声源空间得到声源的第一估计区域;
使用声源频域信号的高频部分通过SRP声源方位估计方法从声源的第一估计区域得到声源的第二估计区域,作为声源的最终估计区域;
其中,所述得到声源的第一估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第一估计区域;所述得到声源的第二估计区域,为通过SRP声源方位估计方法对麦克风阵列中的非参考麦克风的信号进行时延补偿,并据此将可控响应功率函数值最大的区域作为声源的第二估计区域。
2.根据权利要求1所述的方法,其特征在于,具体实施为:
麦克风阵列采集声源的时域信号;
将声源空间划分为多个网格区域;
将所述时域信号进行频域变换得到频域信号,并仅根据频域信号的低频部分计算第一可控响应功率函数在每个网格区域的值;
选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域;
将声源的第一估计区域划分为多个二次网格区域;
仅根据频域信号的高频部分计算第二可控响应功率函数在每个二次网格区域的值;
选取第二可控响应功率函数值最大的二次网格区域作为声源的最终估计区域。
3.根据权利要求2所述的方法,其特征在于,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取与第一估计区域之间的距离小于第一预设阈值的网格区域,作为第二估计区域,所述距离为网格区域的形心之间的距离;
将所述第二估计区域与第一估计区域合并,形成新的第一估计区域。
4.根据权利要求2所述的方法,其特征在于,
在选取第一可控响应功率函数值最大的网格区域作为声源的第一估计区域之后,
还选取第一可控响应功率函数值与第一估计区域的可控响应功率函数值之比大于第二预设阈值的网格区域,作为第三估计区域;
将所述第三估计区域与第一估计区域合并,形成新的第一估计区域。
5.根据权利要求2所述的方法,其特征在于,
所述声源频域信号的低频部分,为声源频域信号中频率不高于分界频率的部分;
所述声源频域信号的高频部分,为声源频域信号中频率高于分界频率的部分;
所述分界频率,由不发生混叠的最大频率乘以预设的系数得到,所述不发生混叠的最大频率为根据麦克风阵列的阵元间距通过空间采样定理得到,所述预设的系数为大于0.5且小于1的正实数。
6.根据权利要求2所述的方法,其特征在于,
所述麦克风阵列,为均匀线阵。
7.根据权利要求6所述的方法,其特征在于,
所述将声源空间划分为多个网格区域,可实施为:
以麦克风阵列的阵元中心为坐标原点,建立的平面直角坐标系;
将坐标系按等方位角均分;
当为远场声场时,所述划分的结果即为将声源空间划分的多个网格区域。
CN201810102202.5A 2018-02-01 2018-02-01 改进的频域srp声源方位估计方法 Active CN108445452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810102202.5A CN108445452B (zh) 2018-02-01 2018-02-01 改进的频域srp声源方位估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810102202.5A CN108445452B (zh) 2018-02-01 2018-02-01 改进的频域srp声源方位估计方法

Publications (2)

Publication Number Publication Date
CN108445452A true CN108445452A (zh) 2018-08-24
CN108445452B CN108445452B (zh) 2020-04-24

Family

ID=63191695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810102202.5A Active CN108445452B (zh) 2018-02-01 2018-02-01 改进的频域srp声源方位估计方法

Country Status (1)

Country Link
CN (1) CN108445452B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110888112A (zh) * 2018-09-11 2020-03-17 中国科学院声学研究所 一种基于阵列信号的多目标定位识别方法
CN111505569A (zh) * 2020-05-20 2020-08-07 浙江大华技术股份有限公司 声源定位方法以及相关设备、装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104535964A (zh) * 2014-12-24 2015-04-22 大连大学 基于低频衍射时延差的头盔式麦克风阵列声源定位方法
US9621984B1 (en) * 2015-10-14 2017-04-11 Amazon Technologies, Inc. Methods to process direction data of an audio input device using azimuth values

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104535964A (zh) * 2014-12-24 2015-04-22 大连大学 基于低频衍射时延差的头盔式麦克风阵列声源定位方法
US9621984B1 (en) * 2015-10-14 2017-04-11 Amazon Technologies, Inc. Methods to process direction data of an audio input device using azimuth values

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何赛娟 等: "《基于差分麦克风阵列和语音稀疏性的多源方位估计方法》", 《JOURNAL OF DATA ACQUISITION AND PROCESSING》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110888112A (zh) * 2018-09-11 2020-03-17 中国科学院声学研究所 一种基于阵列信号的多目标定位识别方法
CN111505569A (zh) * 2020-05-20 2020-08-07 浙江大华技术股份有限公司 声源定位方法以及相关设备、装置
CN111505569B (zh) * 2020-05-20 2022-04-19 浙江大华技术股份有限公司 声源定位方法以及相关设备、装置

Also Published As

Publication number Publication date
CN108445452B (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
US10419849B2 (en) FIR filter coefficient calculation for beam-forming filters
JP4418390B2 (ja) 3次元形状処理装置及び曲面生成プログラム並びに方法
CN108831498B (zh) 多波束波束成形的方法、装置及电子设备
US9552828B2 (en) Audio signal processing device
US20220223149A1 (en) Narrowband direction of arrival for full band beamformer
CN106031196B (zh) 信号处理装置、方法以及程序
Chu et al. Deconvolution using CLEAN-SC for acoustic source identification with spherical microphone arrays
CN107247193B (zh) 天线近场测试方法及装置
CN108445452A (zh) 改进的频域srp声源方位估计方法
CN112362966A (zh) 基于小波包变换与stft相融合的电网谐波检测方法及装置
CN112818619A (zh) 一种耳机主动降噪的仿真方法及装置
JP6862799B2 (ja) 信号処理装置、方位算出方法及び方位算出プログラム
US10057702B2 (en) Audio signal processing apparatus and method for modifying a stereo image of a stereo signal
CN103426162A (zh) 图像处理设备、图像处理方法和程序
US9159336B1 (en) Cross-domain filtering for audio noise reduction
CN112420066A (zh) 降噪方法、装置、计算机设备和计算机可读存储介质
Sarradj Three-dimensional acoustic source mapping
WO2020024320A1 (zh) 一种基于细化傅里叶变换的信号分析方法及设备
CN112578458B (zh) 叠前弹性阻抗随机反演方法、装置、存储介质及处理器
JP6296882B2 (ja) 適応型周波数領域ウィンドウイング
Hahn et al. Spatial Aliasing in Continuous Measurement of Spatial Room Impulse Responses
JP2016181789A (ja) 雑音抑圧装置、雑音抑圧方法、及び、プログラム
CN109581423B (zh) 一种运用子空间投影的线性扫频干扰抑制方法及系统
Zhou et al. A narrowband active noise control system with coarse frequency estimator and spectrum shifter
CN112014884A (zh) 压制近炮点强能量噪声的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Applicant after: Yunzhisheng Intelligent Technology Co., Ltd.

Address before: 100000 AOC mansion, floor 12, building No. 1, No. 16, Center Road, Sun Palace, Chaoyang District, Beijing

Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant