CN117496997B - 基于惩罚机制的声源检测方法、装置及存储介质 - Google Patents
基于惩罚机制的声源检测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN117496997B CN117496997B CN202311819268.3A CN202311819268A CN117496997B CN 117496997 B CN117496997 B CN 117496997B CN 202311819268 A CN202311819268 A CN 202311819268A CN 117496997 B CN117496997 B CN 117496997B
- Authority
- CN
- China
- Prior art keywords
- matrix
- sound source
- result
- beam output
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 49
- 230000007246 mechanism Effects 0.000 title claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 128
- 239000013598 vector Substances 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 67
- 230000006870 function Effects 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 40
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 2
- 238000004088 simulation Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 18
- 238000003384 imaging method Methods 0.000 description 13
- 229920013655 poly(bisphenol-A sulfone) Polymers 0.000 description 7
- 241001077419 Damas Species 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Abstract
本发明实施例提供了一种基于惩罚机制的声源检测方法、装置及存储介质,涉及声源检测技术的技术领域。其方法包括:获取初始波束输出矩阵,并对初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素;基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;对第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;基于所述目标加权向量,对预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;基于所述第一输出结果确定目标区域的声源检测结果。通过本发明,解决了声源检测效率低的问题,进而达到了提高声源检测精度及效率的效果。
Description
技术领域
本发明实施例涉及声源检测技术领域,具体而言,涉及一种基于惩罚机制的声源检测方法、装置及存储介质。
背景技术
在电力、天然气等行业中,确保设备的正常工作极其重要。
一些设备在发生故障时会伴有噪声的产生,不同的设备发生故障时会产生不同频率范围的噪声源,因此可以通过监听噪声源来对设备状态进行监测和以及进行故障诊断。
传声器阵列声成像技术能够针对上述故障诊断提供可视化声场结果,其通过采集传声器阵列测量的声压信号,基于波束形成算法处理后得到声学成像图,并匹配摄像头获取的光学图像,直观指示声源的空间位置,被称为“声像仪”。
现有的声像检测技术存在大维数矩阵迭代运算,耗时严重以及动态范围不理想,存在虚假声源,污染成像图的问题,这些问题会影响声源检测效率和声源检测结果。
发明内容
本发明实施例提供了一种基于惩罚机制的声源检测方法、装置及存储介质,以至少解决相关技术中声源检测效率低的问题。
根据本发明的一个实施例,提供了一种基于惩罚机制的声源检测方法,包括:
获取初始波束输出矩阵,并对所述初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素,其中,所述初始波束输出矩阵是基于函数波束形成算法的输出结果得到的;
基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;
对所述第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;
基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;
基于所述第一输出结果确定目标区域的声源检测结果。
在一个示例性实施例中,在所述基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果之后,所述方法还包括:
基于预设的点扩散函数对所述第一输出结果进行第一处理,以得到第一处理结果;
基于所述第一处理结果确定所述声源检测结果。
在一个示例性实施例中,所述获取初始波束输出矩阵包括:
将待检测区域划分为多个目标区域;
通过常规波束形成算法计算所述目标区域的声源功率,以得到第一波束输出矩阵以及所述加权向量;
对函数波束形成算法中的互谱矩阵进行特征值分解处理,以得到互谱指数函数;
基于所述互谱指数函数,对所述第一波束输出矩阵进行替换处理,并对所述常规波束形成算法的输出结果进行第一值的幂次运算,以得到所述函数波束形成算法的初始波束输出结果,所述初始波束输出矩阵是基于所述初始波束输出结果得到的。
根据本发明的另一个实施例,提供了一种基于惩罚机制的声源检测装置,包括:
初始矩阵模块,用于获取初始波束输出矩阵,并对所述初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素,其中,所述初始波束输出矩阵是基于函数波束形成算法的输出结果得到的;
归一化模块,用于基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;
第一计算模块,用于对所述第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;
迭代模块,用于基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;
声源检测模块,用于基于所述第一输出结果确定目标区域的声源检测结果。
在一个示例性实施例中,所述装置还包括:
第一处理模块,用于在所述基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果之后,基于预设的点扩散函数对所述第一输出结果进行第一处理,以得到第一处理结果;
第一检测模块,用于基于所述第一处理结果确定所述声源检测结果。
在一个示例性实施例中,所述初始矩阵模块包括:
区域划分单元,用于将待检测区域划分为多个目标区域;
功率计算单元,用于通过常规波束形成算法计算所述目标区域的声源功率,以得到第一波束输出矩阵以及所述加权向量;
特征分解单元,用于对所述常规波束形成算法中的互谱矩阵进行特征值分解处理,以得到互谱指数函数;
初始矩阵单元,用于基于所述互谱指数函数,对所述第一波束输出矩阵进行替换处理,并对所述常规波束形成算法的输出结果进行第一值的幂次运算,以得到所述函数波束形成算法的初始波束输出结果,所述初始波束输出矩阵是基于所述初始波束输出结果得到的。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于首先将函数波束形成算法的输出结果作为先验信息,归一化运算后得到惩罚矩阵;然后计算惩罚矩阵和加权向量的第一积值,利用包含函数波束形成算法声源分布先验信息的惩罚矩阵精确“惩罚”非声源点的加权向量,提升加权向量中真实声源对应的权重;再经过少量次数的迭代即可得到用于进行声源检测的检测结果,该过程减少了迭代次数以及数据计算量,因此,可以解决声源检测效率低的问题,达到提高声源检测精度和效率的效果。
附图说明
图1是本发明实施例的一种基于惩罚机制的声源检测方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种基于惩罚机制的声源检测方法的流程图;
图3是根据本发明具体实施例的一种基于惩罚机制下函数波束形成算法的原理图;
图4是根据本发明具体实施例的网格平面空间关系图;
图5是根据本发明具体实施例的仿真阵列图;
图6是根据本发明具体实施例的单声源仿真识别结果图一;
图6(a)是根据本发明具体实施例的常规波束形成CBF的单声源仿真识别结果图;
图6(b)是根据本发明具体实施例的函数波束形成FB的单声源仿真识别结果图;
图7是根据本发明具体实施例的单声源仿真识别结果图二;
图7(a)是根据本发明具体实施例的反卷积波束形成DAMAS的单声源仿真识别结果图;
图7(b)是根据本发明具体实施例的基于惩罚机制的函数波束形成P-FB的单声源仿真识别结果图;
图8是根据本发明具体实施例的非相干声源仿真识别结果图一;
图8(a)是根据本发明具体实施例的常规波束形成CBF的非相干声源仿真识别结果图;
图8(b)是根据本发明具体实施例的函数波束形成FB的非相干声源仿真识别结果图;
图9是根据本发明具体实施例的非相干声源仿真识别图二;
图9(a)是根据本发明具体实施例的反卷积波束形成DAMAS的非相干声源仿真识别结果图;
图9(b)是根据本发明具体实施例的基于惩罚机制的函数波束形成P-FB的非相干声源仿真识别结果图;
图10是根据本发明实施例的一种基于惩罚机制的声源检测装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种基于惩罚机制的声源检测方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于惩罚机制的声源检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种基于惩罚机制的声源检测方法,图2是根据本发明实施例的一种基于惩罚机制的声源检测方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取初始波束输出矩阵,并对所述初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素,其中,所述初始波束输出矩阵是基于函数波束形成算法的输出结果得到的;
步骤S202,基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;
步骤S203,对所述第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;
步骤S204,基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;
步骤S205,基于所述第一输出结果确定目标区域的声源检测结果。
在本实施例中,本方法提出惩罚机制与FB相结合的声源成像改进算法,即基于惩罚机制的函数波束形成(Functional beamforming based on penalty matrix,P-FB)算法。该方法首先将FB(函数波束形成算法)输出结果作为先验信息,归一化运算后得到惩罚矩阵(对应前述第一惩罚矩阵);然后计算惩罚矩阵和加权向量(对应前述预设的加权向量)的Hadamard积(对应前述第一积值),利用包含FB声源分布先验信息的惩罚矩阵精确“惩罚”非声源点的加权向量,提升加权向量中真实声源对应的权重;经过少量次数的迭代(对应前述迭代计算),即可得到P-FB算法输出的声源分布信息。
具体的,首先,P-FB算法将作为初始波束输出矩阵(对应前述初始波束输出矩阵),从中搜寻最大值/>(对应前述第一矩阵元素),通过下述公式1基于最大值/>对进行归一化,使得矩阵里面的元素取值范围(0,1),从而得到惩罚矩阵/>:
(公式1)
其中,表示绝对值,i为迭代次数。
然后,通过下述公式2将惩罚矩阵和加权向量(对应前述预设的加权向量)进行Hadamard积计算(对应前述第一积值计算),更新加权向量/>(对应前述更新后的目标加权向量):
(公式2)
其原理是利用包含声源分布先验信息的惩罚矩阵,不断精确地“惩罚”迭代非声源点位置的加权向量。惩罚矩阵中,真实声源对应的元素值为1,与加权向量相乘,声源点的方向向量不变;非声源点的元素值,和加权向量相乘,惩罚矩阵给非声源点的方向向量施加负反馈使其不断减小,并随着迭代次数的增加逐渐趋近于0。
最后,利用更新得到的加权向量,通过公式3计算P-FB输出结果:
(公式3)
直至完成规定迭代次数,终止迭代,以得到最终的输出结果(对应前述第一输出结果),随后根据最终的输出结果即可确定声源检测结果。
以上过程不涉及矩阵求逆运算,因此算法具有较高的稳健性。同时需要注意的是,算法迭代次数不宜过高,否则得到的波束输出结果中,只有声源处的有输出值,而其它非声源点位置波束输出值收敛至0导致无法成像。P-FB算法原理如图3所示。
在一个可选的实施例中,在所述基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果之后,所述方法还包括:
步骤S206,基于预设的点扩散函数对所述第一输出结果进行第一处理,以得到第一处理结果;
步骤S207,基于所述第一处理结果确定所述声源检测结果。
在本实施例中,为了方便进行观察,可以从PSF的原理来解释基于惩罚机制可以改善空间分辨率。因为函数波束形成的本质是PSF和加权向量的卷积,如果PSF性能越好(越接近狄拉克函数),那么他们之间的卷积结果越好,空间分辨率越高;此时可以将公式3进一步表示为关于PSF的表达式,如下述公式4所示:
(公式4)
式中
(公式5)
其中,表示位于网格点/>处的单位强度声源在搜索网格点/>处的波束输出,则搜索网格点/>处的波束形成输出量等于各声源在该位置的波束形成输出和。只有当搜索网格点与声源点重合时,/>等于1。同时,当搜索网格点位于声源附近时,非声源点的/>略小于1,FB算法通过提高v值,旁瓣PSF值衰减的幅度也很小。
因此,FB算法相较于其它高分辨率算法,其改善空间分辨率的效果并不理想。P-FB算法通过惩罚矩阵迭代更新加权向量,使得声源点附近的方向向量趋近于0,迅速衰减。相较于FB算法,P-FB算法将惩罚机制与高阶次幂指数相结合,使其PSF更接近于理想的狄拉克函数(Dirac-delta function,DF),能有效抑制旁瓣、缩减主瓣,提高空间分辨率。
在一个可选的实施例中,所述获取初始波束输出矩阵包括:
步骤S20101,将待检测区域划分为多个目标区域;
在本实施例中,如图4所示,将搜索声源区域(对应亲属待检测区域)划分成网格平面,网格平面包含多个平面网格(对应前述目标区域),以方便计算各个网格点内的声源情况。
步骤S20102,通过常规波束形成算法计算所述目标区域的声源功率,以得到第一波束输出矩阵以及所述加权向量;
在本实施例中,通过CBF算法(对应前述常规波束形成算法)计算每个网格点上的声源功率,空间关系如图4所示,具体如下述公式所示:
记传声器数为M,快拍数为K,搜索平面上存在L个点声源,阵列接收信号频域模型为:
(公式6)
其中,为声源频率,/>为M×K维阵列接收信号,/>为L×K维声源信号,为M×K维高斯噪声信号。/>为M×L维格林函数矩阵,且/>为M×1维方向向量,表示/>处声源到各传声器的辐射过程,/>表达如公式7所示:
(公式7)
其中,为第l个点声源与第m个传声器之间的距离,c为声速。互谱矩阵CSM为:
(公式8)
其中,为噪声的方差,I为单位矩阵,/>表示共轭转置运算。CBF在各搜索位置处的输出(对应前述第二波束输出矩阵)为:
(公式9)
其中,为加权向量(对应前述预设的加权向量),表示为:
(公式10)
其中,为网格点/>处的方向向量。
步骤S20103,对常规波束形成算法中的互谱矩阵进行特征值分解处理,以得到互谱指数函数;
在本实施例中,对前述互谱矩阵CSM做特征值分解,定义是在/>上的互谱指数函数,具体如公式11所示:
(公式11)
其中,v表示指数函数的幂次;为CSM的特征向量构成的酉矩阵,含有声源位置的矢量信息;/>为CSM的特征值构成的对角矩阵,含有声源功率信息。
步骤S20104,基于所述互谱指数函数,对所述第一波束输出矩阵进行替换处理,并对所述常规波束形成算法的输出结果进行第一值的幂次运算,以得到所述函数波束形成算法的初始波束输出结果,所述初始波束输出矩阵是基于所述初始波束输出结果得到的。
在本实施例中,将互谱指数函数替换公式9中的CSM,并对前述常规波束形成算法的波束形成结果进行等量的幂次运算,随后才得到FB结果(对应前述函数波束形成算法的初始波束输出结果),其在网格点处的输出为:
(公式12)
当搜索位置与声源位置一致时,,输出为峰值/>;当不一致时,,输出为/>。因此,提高v值可增加峰值与非峰值输出间的比值,从而改善成像的动态范围。
特别的,针对上述内容进行参数仿真,其过程如下:
步骤1,传声器阵列选择为声成像系统中普遍应用的多臂螺旋结构,阵元间距≤0.02m、阵列孔径0.15m、阵元为64,阵列布局如图5所示,阵列中心位置位于(x0, y0, z0) =(0, 0, 0)m处。
步骤2,为验证P-FB算法的性能,考虑单声源、非相干声源场景,根据声学传播理论,仿真产生各阵元接收到的声信号,并计算CSM。基于CBF、FB、DAMAS和P-FB算法得到声成像图,对比算法性能,表1列出了仿真参数。
表1 仿真参数
随后分别进行单声源仿真识别(仿真识别结果如图6-7所示 )和非相干声源仿真识别(仿真识别结果如图8-9所示)。
从图6(a)-(b)、图7(a)-(b)中可以看出,这四种波束形成算法在设定声源处均出现声学中心,定位出声源位置,其中,FB、DAMAS及P-FB算法成像图中的旁瓣被有效抑制,主瓣宽度大幅缩减,而综合来说,P-FB算法的成像性能是四种算法中最优的;同理,从图8(a)可知,在6kHz时,两声源点主瓣宽大,在(0, 0)m处出现主瓣融合的现象,CBF无法有效分辨距离较近的非相干声源,定位误差大;如图8(b)所示,FB有效抑制了旁瓣干扰,但两声源在低于峰值-25dB左右出现主瓣融合现象。如图9(a) 所示,DAMAS成像结果未出现主瓣融合,空间分辨率比FB高,但由于多声源叠加作用,导致声源聚焦点对应的阵列PSF相关性增大,因此DAMAS算法迭代结果存在少量虚假声源,动态范围不够理想;如图9(b)所示,P-FB能精确的定位非相干双声源的位置,并在此基础上,有效抑制旁瓣干扰、缩减主瓣宽度,提升空间分辨率和动态范围。
总之,为了提高FB的空间分辨率,本方法利用惩罚矩阵对FB算法进行了改进,提出P-FB算法。该算法将FB输出结果作为先验信息,进行归一化处理后得到惩罚矩阵,利用包含FB声源分布先验信息的惩罚矩阵精确“惩罚”非声源点处的加权向量。然后,基于更新后的加权向量与FB算法结合得到P-FB成像结果。通过模拟仿真和实验验证了P-FB算法相较于FB算法能够进一步提升空间分辨率,抑制旁瓣干扰,使得声源定位性能更精准。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种基于惩罚机制的声源检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图10是根据本发明实施例的一种基于惩罚机制的声源检测装置的结构框图,如图10所示,该装置包括:
初始矩阵模块1001,用于获取初始波束输出矩阵,并对所述初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素,其中,所述初始波束输出矩阵是基于函数波束形成算法的输出结果得到的;
归一化模块1002,用于基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;
第一计算模块1003,用于对所述第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;
迭代模块1004,用于基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;
声源检测模块1005,用于基于所述第一输出结果确定目标区域的声源检测结果。
在一个可选的实施例中,所述装置还包括:
第一处理模块,用于在所述基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果之后,基于预设的点扩散函数对所述第一输出结果进行第一处理,以得到第一处理结果;
第一检测模块,用于基于所述第一处理结果确定所述声源检测结果。
在一个可选的实施例中,所述初始矩阵模块包括:
区域划分单元,用于将待检测区域划分为多个目标区域;
功率计算单元,用于通过常规波束形成算法计算所述目标区域的声源功率,以得到第一波束输出矩阵以及所述加权向量;
特征分解单元,用于对所述常规波束形成算法中的互谱矩阵进行特征值分解处理,以得到互谱指数函数;
初始矩阵单元,用于基于所述互谱指数函数,对所述第一波束输出矩阵进行替换处理,并对所述函数波束形成算法的输出结果进行第一值的幂次运算,以得到所述函数波束形成算法的初始波束输出结果,所述初始波束输出矩阵是基于所述初始波束输出结果得到的。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于惩罚机制的声源检测方法,其特征在于,包括:
获取初始波束输出矩阵,并对所述初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素,其中,所述初始波束输出矩阵是基于函数波束形成算法的输出结果得到的;
基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;
对所述第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;
基于所述目标加权向量,对预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;
基于所述第一输出结果确定目标区域的声源检测结果。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果之后,所述方法还包括:
基于预设的点扩散函数对所述第一输出结果进行第一处理,以得到第一处理结果;
基于所述第一处理结果确定所述声源检测结果。
3.根据权利要求1所述的方法,其特征在于,所述获取初始波束输出矩阵包括:
将待检测区域划分为多个目标区域;
通过常规波束形成算法计算所述目标区域的声源功率,以得到第一波束输出矩阵以及所述加权向量;
对所述常规波束形成算法中的互谱矩阵进行特征值分解处理,以得到互谱指数函数;
基于所述互谱指数函数,对所述第一波束输出矩阵进行替换处理,并对所述常规波束形成算法的输出结果进行第一值的幂次运算,以得到所述函数波束形成算法的初始波束输出结果,所述初始波束输出矩阵是基于所述初始波束输出结果得到的。
4.一种基于惩罚机制的声源检测装置,其特征在于,包括:
初始矩阵模块,用于获取初始波束输出矩阵,并对所述初始波束输出矩阵进行搜索处理,以得到所述初始波束输出矩阵中满足预设条件的第一矩阵元素,其中,所述初始波束输出矩阵是基于函数波束形成算法的输出结果得到的;
归一化模块,用于基于所述第一矩阵元素对所述初始波束输出矩阵进行归一化处理,以得到第一惩罚矩阵;
第一计算模块,用于对所述第一惩罚矩阵以及预设的加权向量进行第一积值计算,以得到更新后的目标加权向量;
迭代模块,用于基于所述目标加权向量,对预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果;
声源检测模块,用于基于所述第一输出结果确定目标区域的声源检测结果。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于在所述基于所述目标加权向量,对所述预设的波束形成函数进行目标次数的迭代计算,以得到第一输出结果之后,基于预设的点扩散函数对所述第一输出结果进行第一处理,以得到第一处理结果;
第一检测模块,用于基于所述第一处理结果确定所述声源检测结果。
6.根据权利要求4所述的装置,其特征在于,所述初始矩阵模块包括:
区域划分单元,用于将待检测区域划分为多个目标区域;
功率计算单元,用于通过常规波束形成算法计算所述目标区域的声源功率,以得到第一波束输出矩阵以及所述加权向量;
特征分解单元,用于对所述常规波束形成算法中的互谱矩阵进行特征值分解处理,以得到互谱指数函数;
初始矩阵单元,用于基于所述互谱指数函数,对所述第一波束输出矩阵进行替换处理,并对所述常规波束形成算法的输出结果进行第一值的幂次运算,以得到所述函数波束形成算法的初始波束输出结果,所述初始波束输出矩阵是基于所述初始波束输出结果得到的。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至3任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至3任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311819268.3A CN117496997B (zh) | 2023-12-27 | 2023-12-27 | 基于惩罚机制的声源检测方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311819268.3A CN117496997B (zh) | 2023-12-27 | 2023-12-27 | 基于惩罚机制的声源检测方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117496997A CN117496997A (zh) | 2024-02-02 |
CN117496997B true CN117496997B (zh) | 2024-04-05 |
Family
ID=89678548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311819268.3A Active CN117496997B (zh) | 2023-12-27 | 2023-12-27 | 基于惩罚机制的声源检测方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117496997B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6862252B1 (en) * | 2003-03-25 | 2005-03-01 | Robert Hickling | Method and apparatus for acoustic detection of buried objects |
CN111308423A (zh) * | 2019-12-11 | 2020-06-19 | 中国人民解放军陆军工程大学 | 鲁棒声源定位系统及其方法 |
CN116148770A (zh) * | 2023-04-21 | 2023-05-23 | 湖南工商大学 | 基于阵列信号处理的声源定位方法、装置及系统 |
CN116301195A (zh) * | 2023-05-16 | 2023-06-23 | 湖南工商大学 | 函数波束优化方法与装置 |
CN116859336A (zh) * | 2023-07-14 | 2023-10-10 | 苏州大学 | 一种声源定位的高精度实现方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7266044B2 (en) * | 2004-12-17 | 2007-09-04 | United States Of America Represented By The Secretary Of The Navy | Method and apparatus for acoustic source tracking using a horizontal line array |
EP2380033B1 (en) * | 2008-12-16 | 2017-05-17 | Koninklijke Philips N.V. | Estimating a sound source location using particle filtering |
JP5629249B2 (ja) * | 2011-08-24 | 2014-11-19 | 本田技研工業株式会社 | 音源定位システム及び音源定位方法 |
US10395667B2 (en) * | 2017-05-12 | 2019-08-27 | Cirrus Logic, Inc. | Correlation-based near-field detector |
WO2019044157A1 (ja) * | 2017-08-30 | 2019-03-07 | パナソニックIpマネジメント株式会社 | 収音装置、収音方法、及びプログラム |
-
2023
- 2023-12-27 CN CN202311819268.3A patent/CN117496997B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6862252B1 (en) * | 2003-03-25 | 2005-03-01 | Robert Hickling | Method and apparatus for acoustic detection of buried objects |
CN111308423A (zh) * | 2019-12-11 | 2020-06-19 | 中国人民解放军陆军工程大学 | 鲁棒声源定位系统及其方法 |
CN116148770A (zh) * | 2023-04-21 | 2023-05-23 | 湖南工商大学 | 基于阵列信号处理的声源定位方法、装置及系统 |
CN116301195A (zh) * | 2023-05-16 | 2023-06-23 | 湖南工商大学 | 函数波束优化方法与装置 |
CN116859336A (zh) * | 2023-07-14 | 2023-10-10 | 苏州大学 | 一种声源定位的高精度实现方法 |
Non-Patent Citations (4)
Title |
---|
A fast deconvolution method for multiple sound source localization based on Hilbert curve;C Yang 等;Digital Signal Processing;20230331;第1-5页 * |
An improved functional beamforming algorithm for far-field multi-sound source localization based on Hilbert curve;C. Yang 等;Applied Acoustics;20220430;第1-5页 * |
基于球面阵的低频噪声源定位识别方法;杨博全 等;哈尔滨工程大学学报;20230331;第361-364页 * |
基于高阶矩阵函数的广义逆波束形成改进算法;陈思;张志飞;徐中明;贺岩松;黎术;;振动与冲击;20170528(第10期);第98-103页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117496997A (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lylloff et al. | Improving the efficiency of deconvolution algorithms for sound source localization | |
Dorfan et al. | Tree-based recursive expectation-maximization algorithm for localization of acoustic sources | |
Grobler et al. | Sound based localization and identification in industrial environments | |
KR20140040727A (ko) | 상관된 소스들의 블라인드 측위를 위한 시스템들 및 방법들 | |
CN107765221B (zh) | 适用于识别相干和非相干声源的反卷积声源成像方法 | |
Yang et al. | Functional delay and sum beamforming for three-dimensional acoustic source identification with solid spherical arrays | |
CN116148770B (zh) | 基于阵列信号处理的声源定位方法、装置及系统 | |
KR20190125624A (ko) | 딥-러닝을 통한 무선신호 전파 채널 해석을 이용한 실내공간의 구조를 예측하는 방법 | |
CN109343003B (zh) | 一种快速迭代收缩波束形成声源识别方法 | |
Zou et al. | Multi-source DOA estimation using an acoustic vector sensor array under a spatial sparse representation framework | |
CN117496997B (zh) | 基于惩罚机制的声源检测方法、装置及存储介质 | |
Suleiman et al. | Search-free decentralized direction-of-arrival estimation using common roots for non-coherent partly calibrated arrays | |
CN111698011B (zh) | 一种对称噪声中非对称信号的稳健自适应波束形成方法 | |
CN113159447A (zh) | 一种激光雷达电磁环境效应预测方法及系统 | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
Herold et al. | An approach to estimate the reliability of microphone array methods | |
Astapov et al. | Simplified acoustic localization by linear arrays for wireless sensor networks | |
Garbuglia et al. | Bayesian active learning for received signal strength-based visible light positioning | |
Ge et al. | An effective source number enumeration approach based on SEMD | |
CN115201753A (zh) | 一种低功耗多频谱分辨的语音定位方法 | |
Lobato et al. | Deconvolution with neural grid compression: A method to accurately and quickly process beamforming results | |
CN111998934B (zh) | 一种声源声功率测试方法 | |
Gershon et al. | Greedy sparse array design for optimal localization under spatially prioritized source distribution | |
CN107729666B (zh) | 一种基于电磁波近场整形的副瓣电平确定方法及装置 | |
CN111965599A (zh) | 二维动态网格压缩波束形成的声源识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |