CN114578289B - 一种高分辨率谱估计声阵列成像方法 - Google Patents

一种高分辨率谱估计声阵列成像方法 Download PDF

Info

Publication number
CN114578289B
CN114578289B CN202210446298.3A CN202210446298A CN114578289B CN 114578289 B CN114578289 B CN 114578289B CN 202210446298 A CN202210446298 A CN 202210446298A CN 114578289 B CN114578289 B CN 114578289B
Authority
CN
China
Prior art keywords
resolution
frequency
energy
spectrum
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210446298.3A
Other languages
English (en)
Other versions
CN114578289A (zh
Inventor
徐东阳
王智
蔡盛盛
胡南
张宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou Institute of Zhejiang University
Original Assignee
Huzhou Institute of Zhejiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou Institute of Zhejiang University filed Critical Huzhou Institute of Zhejiang University
Priority to CN202210446298.3A priority Critical patent/CN114578289B/zh
Publication of CN114578289A publication Critical patent/CN114578289A/zh
Application granted granted Critical
Publication of CN114578289B publication Critical patent/CN114578289B/zh
Priority to PCT/CN2022/133106 priority patent/WO2023207047A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开一种高分辨率谱估计声阵列成像方法,包括:对麦克风阵列接收的声音信号进行快速傅里叶变换,得到频域数据;通过恒定束宽波束形成器确定高分辨区域和低分辨率区域;通过延时求和波束形成器计算低分辨率声压分布;在高分辨率区域,对低分辨率声压分布进行排序,聚焦声源位置点附近,提升分辨率后再计算空间谱分布,如此循环迭代最终达到目标空间高分辨率;对声源高分辨率空间谱进行频率点能量排序,聚焦声源频率点附近,提升频率分辨率,计算非整数数字傅里叶变换,计算频率谱,如此循环迭代最终达到目标频率高分辨率。利用本发明,可以有效减小环境噪声区域的声压分布计算,得到声源附近高分辨率的空间和频率声像图分布。

Description

一种高分辨率谱估计声阵列成像方法
技术领域
本发明涉及声学成像领域,尤其涉及一种高分辨率谱估计声阵列成像方法。
背景技术
工业生产中关键生产设备的运行状态直接影响着产品的质量和生产效率,甚至威胁到生命财产安全。声音作为对于关键生产设备进行监控的一种重要手段,已经在电力、化工、矿山等生产环境大量使用,例如电力巡检需要通过声音检测绝缘子是否有高频放电以及确定放电位置,从而排除安全隐患。对于此类需求,声学成像仪作为一种可视化的声学检测工具已经用在越来越多的安全监测和巡检场景。声学成像仪把摄像头和多个同步采样的麦克风集成在一起,摄像头采集视频,麦克风阵列采集声音,通过算法处理在视频画面上计算每一个位置不同频率范围的声压大小,并以颜色深浅来表示。从声学成像仪上能很方便的定位异常声源位置,同时测量出异常声音的分贝和频率。
声学成像仪最重要的指标就是声压分布的位置分辨率和频率分辨率,然而位置分辨率和频率分辨率越高,带来的计算量也越大。一般声学成像仪先通过减小位置分辨率和频率分辨率,计算离散点的声压级来获得一个粗略估计,然后通过线性插值的方法,填充更高分辨率的位置点和频点。对于环境噪音,这种做法影响不大,但是对于目标声源,这种做法不能给出目标声源点空间位置和频率的准确估计。
发明内容
为解决以上现有技术存在的问题,本发明提出一种高分辨率谱估计声阵列成像方法,以较低的算力实现了目标声源高分辨率空间谱和频谱谱估计。
本发明可通过以下技术方案予以实现:
一种高分辨率谱估计声阵列成像方法,包括以下步骤:
1)通过含M个麦克风的麦克风阵列接收声音信号;
2)对所述麦克风阵列接收的声音信号进行时域转频域处理:对所述麦克风阵列收集的声音信号进行快速傅里叶变换;
3)多区域恒定束宽波束形成处理;
4)高分辨率候选区域和低分辨率后续区域选择:根据波束形成的输出,计算工作频率范围内每一个区域的能量,通过能量排序选取高分辨率候选区域和低分辨率候选区域;
5)粗分辨率延时求和波束形成:分别对高分辨率和低分辨率的区域进行一个粗分辨率的延时求和波束形成处理;
6)高分辨率待选区域空间分辨率迭代:计算工作频率范围内所述步骤5)得到的粗分辨率延时求和波束形成能量输出,获得空间谱估计,通过能量排序,确定高能量位置点,进行分辨率网格拆分,扩充空间分辨率,再使用延时求和滤波器计算空间谱,选出高能量位置点,进行分辨率网格拆分,获得更高的分辨率,如此循环往复,直到达到目标的高分辨率空间谱;
7)目标声源位置高分辨率频谱迭代:获得所述步骤6)的高分辨空间谱后,选取待频率扩充的空间位置点,计算每个频点的能量,通过能量排序,选取待扩充的高分辨频谱区域,进行频率分辨率扩充,通过非整数离散傅里叶变换计算空间谱,然后通过能量排序,确定待频率扩充的频率点,进行进一步扩充,如此循环往复,直到达到目标的高分辨率频率谱;
8)空间谱和频率谱插值填充:对于未进行频率扩充精细计算的空间点和频率点,为了达到高分辨率的声像图输出,采用空间和频率插值的方式,实现目标的高分辨率空间谱和频率谱估计;
9)高分辨空间谱和频率合成:将实际计算的高分辨率区域的高分辨率空间谱和频率谱和通过插值得到空间谱和频率谱进行整合,获得最终的自适应聚焦的高分辨率空间谱声学成像图。
进一步地,所述步骤2)的具体实现方法为:首先将麦克风阵列收集的时域语音信号进行分帧,通过傅立叶变换转换为频域语音信号;假设第m个麦克风拾取到的第l帧语音信号表示为[xm((l-1)*N+1),…,xm(l*N)]T,其中N表示帧长,那么频域信号表示为
xm(l)=FFT{[xm((l-1)*N+1),…,xm(l*N)]T} (3)
其中xm(l)=[xm(0,l),…,xm(k,l),…,xm(2/N,l)]T是(N/2+1)×1列矢量,包含(N/2+1)个频点信号值,第k个频点代表的频率为fk;假设M个麦克风拾取到的声音信号表示为x(fk,l)=[x1(fk,l),…,xM(fk,l)],其中x(fk,l)是M×1的列矢量,xm(fk,l)表示第m个麦克风信号在第l帧的fk频率的信号值;由于只关注每一帧的输出,一般情况下,可以忽略掉帧计数l,第k个频点的麦克风阵列信号表示为x(fk)。
进一步地,所述步骤3)具体为:将摄像头拍摄区域进行空间分割,每个区域包含一定范围的方位角和俯仰角方位,根据方位角和俯仰角范围进行恒定束宽波束形成设计。
进一步地,所述步骤4)具体实现方法为:获得每个区域的恒定束宽波束形成输出后,将待选频谱范围(fmin~fmax)内所有的频谱能量求和,获得每个区域的能量综合,计算公式如下:
Figure GDA0003775068400000031
上式中Pn表示第n个区域波束输出的能量总和,wn(fk)是第n个区域波束第k个频点的恒定波束形成系数,fmin表示待选频率范围的最小值对应的频率,fmax表示待选频率范围的最大值对应的频率,通过能量排序,将能量较高的区域挑出来,获得高分辨率候选区域和低分辨率后续区域。
进一步地,所述步骤5)中,对于粗分辨率的每个位置点,分别对应不同的方位角和俯仰角,可以通过延时求和波束形成算法,求出该位置点的所选频谱范围的能量总和,
每个位置点的延时求和波束形成的权重计算公式如下:
Figure GDA0003775068400000032
其中
Figure GDA0003775068400000033
为粗分辨率下导向矢量a对应的方位角和俯仰角,然后通过计算能量获得粗分辨率的声像图,计算公式如下所示
Figure GDA0003775068400000034
其中fk表示第k个频率点对应的频率,fmin表示待选频率范围的最小值对应的频率,fmax
表示待选频率范围的最大值对应的频率,相对恒定束宽波束形成算法,该算法需要在每个分辨率位置点计算,获得该空间分辨率下的声像图能量分布。
进一步地,所述步骤6)中,获得粗分辨率的声像图能量分布后,待选的高分辨率区域通过延时求和波束形成能量排序可以获得存在声源点的位置信息,将这些位置点挑选出来,在这些位置点进行更高分辨率的位置点扩充,通过延时求和波束形成计算这些更高分辨率的位置点能量,然后再进行能量排序,如此循环往复,最终获得声源位置附近的目标高分辨率声像图分布。
进一步地,所述步骤7)中为:由于信号是实数,经过离散傅里叶变换(DFT)计算后,频域信号前一半后一半共轭对称,因此只需要取前一半,DFT计算公式如下:
Figure GDA0003775068400000041
其中x[n]表示长度为N的序列,X[k]表示长度为N的DFT变换,由于第k个频点代表的频率是
Figure GDA0003775068400000042
(fs表示采样频率,N表示DFT帧长),可以得到
Figure GDA0003775068400000043
带入DFT公式可以得到
Figure GDA0003775068400000044
上述运算中f可以取任意频率(0≤f≤fs/2),即可得到更高分辨率的频点。
有益效果
相对于传统的插值扩充法或者以高算力直接计算实现的高分辨率空间和频率谱估计,本发明以较低的算力代价实现了声学成像仪对目标声源高分辨的空间谱和频率谱估计,具有重要的工程和社会意义。
附图说明
图1为本发明流程图;
图2为方位角、俯仰角示意图;
图3为空间分辨率迭代示意图;
图4为频率分辨率迭代示意图。
具体实施方式
以下通过特定的具体实施例说明本发明的实施方式,本领域的技术人员可由本说明书所揭示的内容轻易地了解本发明的其他优点及功效。
本发明的高分辨率谱估计声阵列成像方法先使用较粗的空间分辨率,将摄像头拍摄的画面进行区域分割,对每一个分割区域使用恒定束宽波束形成算法进行估计,然后计算选定频率范围的每一块区域声压能量大小,进行排序,将能量较大的几个区域选取出来,作为高分辨率备选目标区域,剩下区域作为低分辨率区域。对于所有区域先采用较粗的空间分辨率,计算有限的离散点,通过延时求和波束形成器获得粗分辨的空间谱和频率谱。对于备选高分辨率目标区域,可以先用较粗的空间和频率分辨率进行声压级排序,然后将能量较大的几个位置点挑出来,对这几个位置点进行进一步的拆分细化,提升分辨率,获得更精确的能量空间分布,循环往复,最终获得高分辨的空间谱估计。对于声源的高分辨频率分布,可以采用类似的方案,实现高分辨的频率。对于不存在声源的其他区域可直接采用插值的方法扩充到高分辨率,最终获得一个高分辨率的声像图。
具体地,本发明的高分辨率谱估计声阵列成像方法包括以下步骤:
步一:基于麦克风阵列接收声学成像仪信号;
本发明中,声学成像仪基于麦克风阵列(含M个麦克风)用于接收用户语音信号。所述麦克风阵列一般情况下是屏幕阵,可以均匀分布,也可以根据实际应用情况非均匀分布。本发明提出的方案适用于任意麦克风阵型。
步二:对阵列声音信号进行时域转频域处理;
本发明对麦克风阵列收集的声音信号,进行快速傅里叶变换(FFT),具体实现方法如下所述:
由于语音信号处理一般在频域进行,首先将麦克风阵列收集的时域语音信号进行分帧,通过傅立叶变换(FFT)转换为频域语音信号。假设第m个麦克风拾取到的第l帧语音信号表示为[xm((l-1)*N+1),…,xm(l*N)]T,其中N表示帧长,那么频域信号表示为
xm(l)=FFT{[xm((l-1)*N+1),…,xm(l*N)]T} (5)
其中xm(l)=[xm(0,l),…,xm(k,l),…,xm(2/N,l)]T是(N/2+1)×1列矢量,包含(N/2+1)个频点信号值,第k个频点代表的频率为fk;假设M个麦克风拾取到的声音信号表示为x(fk,l)=[x1(fk,l),…,xM(fk,l)],其中x(fk,l)是M×1的列矢量,xm(fk,l)表示第m个麦克风信号在第l帧的fk频率的信号值;由于只关注每一帧的输出,一般情况下,可以忽略掉帧计数l,第k个频点的麦克风阵列信号表示为x(fk)。
步三:多区域恒定束宽波束形成处理;将摄像头拍摄区域进行空间分割,每个区域包含一定范围的方位角和俯仰角方位,根据方位角和俯仰角范围进行恒定束宽波束形成设计,具体实现方法如下所述:首先对摄像头拍摄画幅进行区域划分,划分方法如下示例:
区域1 区域2 区域3 区域4
区域5 区域6 区域7 区域8
区域9 区域10 区域11 区域12
区域13 区域14 区域15 区域16
每个区域范围对应一定方位角和俯仰角范围,定义第n个区域覆盖的角度范围为
Figure GDA0003775068400000061
声学成像仪的麦克风阵列先通过恒定束宽波束形成,设计指向不同区域的波束,然后通过计算信号能量,获得每个区域的能量。
介绍恒定束宽波束形成之前,先计算介绍一下波束形成器定义。
(1)波束形成器
假设波束形成系数w(fk)=[w1(fk),…,wM(fk)]T,则固定波束形成器的频响输出表示为
Figure GDA0003775068400000071
通过调整权重w(fk),可以实现指向不同方向的波束。对于入射到阵列上的信号,导向矢量表示为
Figure GDA0003775068400000072
其中θ表示为声音入射的方位角,
Figure GDA0003775068400000073
表示为声音入射的俯仰角。图1为方位角、俯仰角示意图。
(2)恒定束宽波束形成器设计
一般情况下不同频率的波束形成主瓣宽度是不一致的,为了保证能拾取每个区域所有频点的能量,首先在各个频点进行恒定束宽设计,相当于在每个频率fk上求取w(fk),时期满足:
Figure GDA0003775068400000074
式中,
Figure GDA0003775068400000075
为期望波束在主瓣方向的波束输出,Θmain为期望的波束的主瓣区域,覆盖目标区域方位和俯仰角范围。具体设计方法如下:
Figure GDA0003775068400000076
式中,δb控制波束的旁瓣电平高度,Θside为非主瓣区域。通过凸优化软件,可以求出该区域每个频点对应的权重w(fk)。
步四:高分辨率候选区域和低分辨率后续区域选择;
根据波束形成的输出,计算工作频率范围内每一个区域的能量,通过能量排序选取高分辨率候选区域和低分辨率候选区域,具体实现方法如下所述:
获得每个区域的恒定束宽波束形成输出后,将待选频谱范围(fmin~fmax)内所有的频谱能量求和,获得每个区域的能量综合,计算公式如下:
Figure GDA0003775068400000081
上式中Pn表示第n个区域波束输出的能量总和,wn(fk)是第n个区域波束第k个频点的恒定波束形成系数,fmin表示待选频率范围的最小值对应的频率,fmax表示待选频率范围的最大值对应的频率,通过能量排序,将能量较高的区域挑出来,获得高分辨率候选区域和低分辨率后续区域。
步五:粗分辨率延时求和波束形成;
分别对高分辨率和低分辨率的区域进行一个粗分辨率的延时求和波束形成处理,具体实现方法如下所述:
恒定束宽波束形成可以用来区分高分辨率和低分辨率区域,但是不能给出粗分辨率位置点的能量分布。
对于粗分辨率的每个位置点,分别对应不同的方位角和俯仰角,可以通过延时求和波束形成算法,求出该位置点的所选频谱范围的能量总和。
每个位置点的延时求和波束形成的权重计算公式如下:
Figure GDA0003775068400000082
其中
Figure GDA0003775068400000083
为粗分辨率下导向矢量a对应的方位角和俯仰角。然后通过计算能量获得粗分辨率的声像图,计算公式如下所示
Figure GDA0003775068400000084
其中fk表示第k个频率点对应的频率,fmin表示待选频率范围的最小值对应的频率,fmax
表示待选频率范围的最大值对应的频率。相对恒定束宽波束形成算法,该算法需要在每个分辨率位置点计算,获得该空间分辨率下的声像图能量分布。
步六:高分辨率待选区域空间分辨率迭代
具体的,计算工作频率范围内步五得到的粗分辨率延时求和波束形成能量输出,获得空间谱估计,通过能量排序,确定高能量位置点,进行分辨率网格拆分,扩充空间分辨率,再使用延时求和滤波器计算空间谱,选出高能量位置点,进行分辨率网格拆分,获得更高的分辨率。如此循环往复,直到达到目标的高分辨率空间谱。具体实现方法如下所述:
获得粗分辨率的声像图能量分布后,再待选的高分辨率区域通过延时求和波束形成能量排序可以获得存在声源点的位置信息,将这些位置点挑选出来,在这些位置点进行更高分辨率的位置点扩充,通过延时求和波束形成计算这些更高分辨率的位置点能量,然后再进行能量排序,如此循环往复,最终获得声源位置附近的目标高分辨率声像图分布。空间分辨率迭代过程如图3所示。
步七:目标声源位置高分辨率频谱迭代
获得步六的高分辨空间谱后,选取待频率扩充的空间位置点,计算每个频点的能量,通过能量排序,选取待扩充的高分辨频谱区域,进行频率分辨率扩充,通过非整数离散傅里叶变换(DFT)计算空间谱,然后通过能量排序,确定待频率扩充的频率点,进行进一步扩充,如此循环往复,直到达到目标的高分辨率频率谱。获得高分辨率空间谱后,一般还需要对声源的频率分布进行高分辨率分析,前面所述的信号经过FFT处理后,第k个频点代表的实际频率表示为kfs/N,(0≤k≤N/2),不能获得任意频率的声压级。为了获得更高分辨率,在获得高分辨率空间谱的声源区域,可采用非整数的DFT算法,获得分辨率更高的频谱声压能量分布。
由于信号是实数,经过DFT计算后,频域信号前一半后一半共轭对称,因此只需要取前一半,DFT计算公式如下:
Figure GDA0003775068400000091
其中x[n]表示长度为N的序列,X[k]表示长度为N的DFT变换。由于第k个频点代表的频率是
Figure GDA0003775068400000092
(fs表示采样频率,N表示DFT帧长),可以得到
Figure GDA0003775068400000093
带入DFT公式可以得到
Figure GDA0003775068400000101
上述运算中f可以取任意频率(0≤f≤fs/2),即可得到更高分辨率的频点。
高分辨率频谱能量分布的迭代过程跟高分辨率空间谱迭代过程类似,首先由步六得到高分辨空间谱分布区间后,在该区域进行能量排序,获得能量最高的待选频率点,然后在这些频率点附近进行非整数的DFT算法,获得频率拆分扩充后的多通道数据,再通过延时求和波束形成计算更高分辨率的声压分布,如此循环迭代,最终达到目标分辨率。频率分辨率迭代示意图如图4所示。
步八:空间谱和频率谱插值填充
对于步五、步六和步七没有实现高分辨率频率区域和空间区域,需要在粗分辨率基础上实现高分辨率声像图的拟合输出,可以采用线性插值的方式进行能量分布填充,用于拟合声像图。
步九:高分辨空间谱和频率合成
将步六和步七获得准确和高分辨率空间谱和频率谱和步八合成的高分辨率空间谱和频率谱进行整合,最终获得一张高分辨的声像图分布。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种高分辨率谱估计声阵列成像方法,其特征在于,包括以下步骤:
1)通过含M个麦克风的麦克风阵列接收声音信号;
2)对所述麦克风阵列接收的声音信号进行时域转频域处理:对所述麦克风阵列收集的声音信号进行快速傅里叶变换;
3)多区域恒定束宽波束形成处理;
4)高分辨率候选区域和低分辨率候选区域选择:根据波束形成的输出,计算工作频率范围内每一个区域的能量,通过能量排序选取高分辨率候选区域和低分辨率候选区域;
5)粗分辨率延时求和波束形成:分别对高分辨率和低分辨率的区域进行一个粗分辨率的延时求和波束形成处理;
6)高分辨率待选区域空间分辨率迭代:计算工作频率范围内所述步骤5)得到的粗分辨率延时求和波束形成能量输出,获得空间谱估计,通过能量排序,确定高能量位置点,进行分辨率网格拆分,扩充空间分辨率,再使用延时求和滤波器计算空间谱,选出高能量位置点,进行分辨率网格拆分,获得更高的分辨率,如此循环往复,直到达到目标的高分辨率空间谱;
7)目标声源位置高分辨率频谱迭代:获得所述步骤6)的高分辨空间谱后,选取待频率扩充的空间位置点,计算每个频点的能量,通过能量排序,选取待扩充的高分辨频谱区域,进行频率分辨率扩充,通过非整数离散傅里叶变换计算空间谱,然后通过能量排序,确定待频率扩充的频率点,进行进一步扩充,如此循环往复,直到达到目标的高分辨率频率谱;
8)空间谱和频率谱插值填充:对于未进行频率扩充精细计算的空间点和频率点,为了达到高分辨率的声像图输出,采用空间和频率插值的方式,实现目标的高分辨率空间谱和频率谱估计;
9)高分辨空间谱和频率合成:将实际计算的高分辨率区域的高分辨率空间谱和频率谱和通过插值得到空间谱和频率谱进行整合,获得最终的自适应聚焦的高分辨率空间谱声学成像图。
2.根据权利要求1所述的高分辨率谱估计声阵列成像方法,其特征在于,所述步骤2)的具体实现方法为:首先将麦克风阵列收集的时域语音信号进行分帧,通过傅立叶变换转换为频域语音信号;假设第m个麦克风拾取到的第l帧语音信号表示为[xm((l-1)*N+1),…,xm(l*N)]T,其中N表示帧长,那么频域信号表示为
xm(l)=FFT{[xm((l-1)*N+1),…,xm(l*N)]T} (1)
其中xm(l)=[xm(0,l),…,xm(k,l),…,xm(2/N,l)]T是(N/2+1)×1列矢量,包含(N/2+1)个频点信号值,第k个频点代表的频率为fk假设M个麦克风拾取到的声音信号表示为x(fk,l)=[x1(fk,l),…,xM(fk,l)],其中x(fk,l)是M×1的列矢量,xm(fk,l)表示第m个麦克风信号在第l帧的fk频率的信号值由于只关注每一帧的输出,一般情况下,可以忽略掉帧计数l,第k个频点的麦克风阵列信号表示为X(fk)。
3.根据权利要求1所述的高分辨率谱估计声阵列成像方法,其特征在于,所述步骤3)具体为:将摄像头拍摄区域进行空间分割,每个区域包含一定范围的方位角和俯仰角方位,根据方位角和俯仰角范围进行恒定束宽波束形成设计。
4.根据权利要求1所述的高分辨率谱估计声阵列成像方法,其特征在于,所述步骤4)具体实现方法为:获得每个区域的恒定束宽波束形成输出后将待选频谱范围fmin~fmax内所有的频谱能量求和,获得每个区域的能量综合,计算公式如下:
Figure FDA0003821898780000021
上式中Pn表示第n个区域波束输出的能量总和wn(fk)是第n个区域波束第k个频点的恒定波束形成系数,fmin表示待选频率范围的最小值对应的频率,fmax表示待选频率范围的最大值对应的频率,通过能量排序,将能量较高的区域挑出来,获得高分辨率候选区域和低分辨率后续区域。
5.根据权利要求1所述的高分辨率谱估计声阵列成像方法,其特征在于,所述步骤5)中,对于粗分辨率的每个位置点,分别对应不同的方位角和俯仰角,可以通过延时求和波束形成算法,求出该位置点的所选频谱范围的能量总和;
每个位置点的延时求和波束形成的权重计算公式如下:
Figure FDA0003821898780000022
其中
Figure FDA0003821898780000023
为粗分辨率下导向矢量a对应的方位角和俯仰角,然后通过计算能量获得粗分辨率的声像图,计算公式如下所示
Figure FDA0003821898780000024
其中fmin表示待选频率范围的最小值对应的频率,fmax表示待选频率范围的最大值对应的频率,相对恒定束宽波束形成算法,该算法需要在每个分辨率位置点计算,获得该空间分辨率下的声像图能量分布。
6.根据权利要求1所述的高分辨率谱估计声阵列成像方法,其特征在于,所述步骤6)中,获得粗分辨率的声像图能量分布后,待选的高分辨率区域通过延时求和波束形成能量排序可以获得存在声源点的位置信息,将这些位置点挑选出来,在这些位置点进行更高分辨率的位置点扩充,通过延时求和波束形成计算这些更高分辨率的位置点能量,然后再进行能量排序,如此循环往复,最终获得声源位置附近的目标高分辨率声像图分布。
7.根据权利要求1所述的高分辨率谱估计声阵列成像方法,其特征在于,所述步骤7)中为:由于信号是实数,经过DFT计算后,频域信号前一半后一半共轭对称,因此只需要取前一半,DFT计算公式如下:
Figure FDA0003821898780000031
其中x[n]表示长度为N的序列,X[k]表示长度为N的DFT变换,由于第k个频点代表的频率是
Figure FDA0003821898780000032
N表示DFT帧长,可以得到
Figure FDA0003821898780000033
带入DFT公式,并将fk替换f为可以得到
Figure FDA0003821898780000034
上述运算中f可以取任意频率,即可得到更高分辨率的频点。
CN202210446298.3A 2022-04-26 2022-04-26 一种高分辨率谱估计声阵列成像方法 Active CN114578289B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210446298.3A CN114578289B (zh) 2022-04-26 2022-04-26 一种高分辨率谱估计声阵列成像方法
PCT/CN2022/133106 WO2023207047A1 (zh) 2022-04-26 2022-11-21 一种高分辨率谱估计声阵列成像方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210446298.3A CN114578289B (zh) 2022-04-26 2022-04-26 一种高分辨率谱估计声阵列成像方法

Publications (2)

Publication Number Publication Date
CN114578289A CN114578289A (zh) 2022-06-03
CN114578289B true CN114578289B (zh) 2022-09-27

Family

ID=81779420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210446298.3A Active CN114578289B (zh) 2022-04-26 2022-04-26 一种高分辨率谱估计声阵列成像方法

Country Status (2)

Country Link
CN (1) CN114578289B (zh)
WO (1) WO2023207047A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114578289B (zh) * 2022-04-26 2022-09-27 浙江大学湖州研究院 一种高分辨率谱估计声阵列成像方法
CN115620742B (zh) * 2022-12-01 2023-03-31 杭州兆华电子股份有限公司 一种应用于声学成像的自动选频方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0467856A (ja) * 1990-07-09 1992-03-03 Yokogawa Medical Syst Ltd バイスタティック送受信による超音波イメージャー
JP2018170718A (ja) * 2017-03-30 2018-11-01 沖電気工業株式会社 収音装置、プログラム及び方法
CN109493844A (zh) * 2018-10-17 2019-03-19 南京信息工程大学 基于fir滤波器的恒定束宽波束形成方法
CN110383378A (zh) * 2019-06-14 2019-10-25 深圳市汇顶科技股份有限公司 差分波束形成方法及模块、信号处理方法及装置、芯片
CN111175698A (zh) * 2020-01-18 2020-05-19 国网山东省电力公司菏泽供电公司 一种基于声振结合的变压器噪声源定位方法、系统和装置
CN111239680A (zh) * 2020-01-19 2020-06-05 西北工业大学太仓长三角研究院 一种基于差分阵列的波达方向估计方法
CN113176536A (zh) * 2021-04-28 2021-07-27 江铃汽车股份有限公司 一种对噪声源进行快速精确定位的分步聚焦算法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610228B (zh) * 2011-01-19 2014-01-22 上海弘视通信技术有限公司 音频异常事件检测系统及其标定方法
US20180049720A1 (en) * 2016-08-17 2018-02-22 Carestream Health, Inc. Ultrasound beamforming system and method
CN108389586A (zh) * 2017-05-17 2018-08-10 宁波桑德纳电子科技有限公司 一种远程集音装置、监控装置及远程集音方法
CN107422305B (zh) * 2017-06-06 2020-03-13 歌尔股份有限公司 一种麦克风阵列声源定位方法和装置
CN111624554B (zh) * 2019-02-27 2023-05-02 北京京东尚科信息技术有限公司 声源定位方法和装置
CN114578289B (zh) * 2022-04-26 2022-09-27 浙江大学湖州研究院 一种高分辨率谱估计声阵列成像方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0467856A (ja) * 1990-07-09 1992-03-03 Yokogawa Medical Syst Ltd バイスタティック送受信による超音波イメージャー
JP2018170718A (ja) * 2017-03-30 2018-11-01 沖電気工業株式会社 収音装置、プログラム及び方法
CN109493844A (zh) * 2018-10-17 2019-03-19 南京信息工程大学 基于fir滤波器的恒定束宽波束形成方法
CN110383378A (zh) * 2019-06-14 2019-10-25 深圳市汇顶科技股份有限公司 差分波束形成方法及模块、信号处理方法及装置、芯片
CN111175698A (zh) * 2020-01-18 2020-05-19 国网山东省电力公司菏泽供电公司 一种基于声振结合的变压器噪声源定位方法、系统和装置
CN111239680A (zh) * 2020-01-19 2020-06-05 西北工业大学太仓长三角研究院 一种基于差分阵列的波达方向估计方法
CN113176536A (zh) * 2021-04-28 2021-07-27 江铃汽车股份有限公司 一种对噪声源进行快速精确定位的分步聚焦算法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Acoustic Imaging Using a 64-Node Microphone Array and Beamformer System;Su Feng;《IEEE International Symposium on Signal Processing and Information Technology (ISSPIT)》;20151210;全文 *
Combining sound source tracking algorithms based on microphone array to improve real-time localization;Ibala, C;《2012 MIXDES - 19th International Conference "Mixed Design of Integrated Circuits & Systems"》;20120526;全文 *
一种优化的宽带聚焦波束形成算法;毕杨等;《电声技术》;20131117(第11期);全文 *
改进正则化正交匹配追踪波达方向估计方法;蔡盛盛等;《声学学报》;20140115(第01期);全文 *
球谐函数波束形成声源识别扩展方法;褚志刚等;《机械工程学报》;20151031(第20期);全文 *
麦克风基阵结构的噪声源识别性能研究;王雁等;《测试技术学报》;20130830(第04期);全文 *

Also Published As

Publication number Publication date
CN114578289A (zh) 2022-06-03
WO2023207047A1 (zh) 2023-11-02

Similar Documents

Publication Publication Date Title
CN114578289B (zh) 一种高分辨率谱估计声阵列成像方法
JP4248445B2 (ja) マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置
KR100493172B1 (ko) 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
CN112526451B (zh) 基于麦克风阵列成像的压缩波束形成及系统
Ward et al. Particle filter beamforming for acoustic source localization in a reverberant environment
KR101238362B1 (ko) 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
CN108375763B (zh) 一种应用于多声源环境的分频定位方法
JP2006522538A (ja) ブロードバンドアンテナに基づくビーム整形方法および装置
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN109116297B (zh) 一种被动雷达空间谱估计与合成波束的联合测向方法
CN112735461B (zh) 拾音方法以及相关装置、设备
CN109343003B (zh) 一种快速迭代收缩波束形成声源识别方法
CN111175727B (zh) 一种基于条件波数谱密度的宽带信号方位估计的方法
CN110095755B (zh) 一种声源定位方法
CN109001678B (zh) 一种基于三维麦克风阵列的雷声检测与定位方法
CN103983946A (zh) 一种声源定位过程中的多测量通道信号处理方法
CN109541526A (zh) 一种利用矩阵变换的圆环阵方位估计方法
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
CN116309921A (zh) 基于cuda技术的延迟求和声成像并行加速方法
CN107241131B (zh) 一种利用信号非圆特性的波束形成方法
CN110907892A (zh) 一种球麦克风阵列语音信号到达角估计方法
CN113189544B (zh) 一种利用活动强度矢量加权移除野点的多声源定位方法
CN115825944A (zh) 基于外辐射源雷达的单快拍多目标来波方向估计方法
CN111543066A (zh) 麦克风阵列、记录装置和方法以及程序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant