CN113138365B - 一种基于深度学习的单矢量水听器方位估计方法 - Google Patents

一种基于深度学习的单矢量水听器方位估计方法 Download PDF

Info

Publication number
CN113138365B
CN113138365B CN202010052928.XA CN202010052928A CN113138365B CN 113138365 B CN113138365 B CN 113138365B CN 202010052928 A CN202010052928 A CN 202010052928A CN 113138365 B CN113138365 B CN 113138365B
Authority
CN
China
Prior art keywords
normalized
acceleration
data
layer
sound pressure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010052928.XA
Other languages
English (en)
Other versions
CN113138365A (zh
Inventor
曹怀刚
王文博
倪海燕
苏林
任群言
马力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN202010052928.XA priority Critical patent/CN113138365B/zh
Publication of CN113138365A publication Critical patent/CN113138365A/zh
Application granted granted Critical
Publication of CN113138365B publication Critical patent/CN113138365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明属于水声物理和水听器方位估计技术领域,具体涉及一种基于深度学习的单矢量水听器方位估计方法,该方法包括:对单矢量水听器接收的不带标签的实测数据进行预处理,获得预处理后的数据;将预处理后的数据输入至训练好的深度学习神经网络模型,获得预处理后的数据对应的标签,作为声源的方位角,完成单矢量水听器方位估计。

Description

一种基于深度学习的单矢量水听器方位估计方法
技术领域
本发明属于水声物理和水听器方位估计技术领域,具体涉及一种基于深度学习的单矢量水听器方位估计方法。
背景技术
声源方位估计是声源定位的一个重要方面,以往的声源方位估计方法是基于阵列的波数形成或者时延等方法,阵列在布放和回收时都有较大的难度;而且当声源频率较低时,其不得不增加孔径以获得足够的分辨精度,从而进一步增加了布放的难度;而当声源频率较高时阵列又需要减小孔径以满足空间采样定理;而且存在线阵的方位估计还存在左右舷模糊的问题。
利用单矢量水听器进行声源方位估计,首先在布放和回收时都要比水平阵方便很多,而且矢量水听器的指向性不随频率变化,也不存在左右舷模糊的问题,同时其还可以有效抑制各向同性噪声的干扰。
与传统的阵列相比,基于单矢量水听器的方位估计也是有其局限性的,例如,单矢量水听器的指向性指数最高只能达到6dB,这就意味着传统基于单矢量水听器的方位估计方法的精确度不高;传统的阵列可以通过时延和相移来控制指向性,使其对准感兴趣的目标,从而实现多目标分辨和干扰抑制,而矢量水听器的指向性是固定的,所以现有单矢量水听器方位估计方法抗干扰能力比较差。
目前,深度学习是近年来的研究热点,其可以直接从原始数据中提取有用的特征信息,其在声源定位方面较传统的匹配场方法相比有更高的定位精度和更强的环境适应性,将其应用在单矢量水听器方位估计可进一步提高定位精度。
发明内容
本发明的目的在于,为解决现有的声源方位估计方法存在上述缺陷,本发明提出了一种基于深度学习的单矢量水听器方位估计方法,本方法通过KRAKEN进行数据仿真,获得仿真数据,用仿真数据训练深度学习神经网络,建立深度神经网络模型,将实测数据输入到该深度神经网络模型中,估计声源的方位。
为了实现上述目的,本发明提供了一种基于深度学习的单矢量水听器方位估计方法,该方法包括:
对单矢量水听器接收的不带标签的实测数据进行预处理,获得预处理后的数据;
将预处理后的数据输入至训练好的深度学习神经网络模型,获得预处理后的数据对应的标签,作为声源的方位角,完成单矢量水听器方位估计。
作为上述技术方案的改进之一,所述对单矢量水听器接收的不带标签的实测数据进行预处理,获得预处理后的数据;具体为:
单矢量水听器接收不带标签的实测数据,其中,不带标签的实测数据的频域表示为R(f)=[p(f),ax(f),ay(f),az(f)],将不带标签的实测数据进行归一化处理:
Figure BDA0002371841830000021
其中,p(f)为频点f处的声压;ax(f)为频点f处的x方向的加速度;ay(f)为频点f处的y方向的加速度;az(f)为频点f处的z方向的加速度;
Figure BDA0002371841830000022
为归一化后的不带标签的实测数据,即
Figure BDA0002371841830000023
其中,
Figure BDA0002371841830000024
为归一化后的声压;
Figure BDA0002371841830000025
为归一化后的x方向的加速度;
Figure BDA0002371841830000026
为归一化后的y方向的加速度;
Figure BDA0002371841830000027
为归一化后的z方向的加速度;其中,
Figure BDA0002371841830000028
统称为归一化后的加速度
Figure BDA0002371841830000029
将归一化后的声压
Figure BDA00023718418300000210
和归一化后的加速度
Figure BDA00023718418300000211
求其互谱后,再进行快拍平均:
Figure BDA00023718418300000212
其中,Spai(f)为归一化后的声压
Figure BDA00023718418300000213
和归一化后的加速度
Figure BDA00023718418300000214
在频点f处的互谱后的快拍平均;N为快拍数;
Figure BDA00023718418300000215
为归一化后频点f处归一化后的声压的第s个快拍;
Figure BDA00023718418300000216
为归一化后频点f处归一化后的加速度的第s个快拍,i=x,y,z;H表示复共轭;
归一化后的声压
Figure BDA00023718418300000217
和归一化后的加速度
Figure BDA00023718418300000218
互谱的实部和虚部组成一个3×2F的矩阵,形成不带标签的数据,并将不带标签的数据作为预处理后的数据;其中,F为总的频点个数。
作为上述技术方案的改进之一,所述深度学习神经网络模型为卷积神经网络,其包括:输入层、隐含层和输出层;
其中,所述隐含层进一步包括:三个卷积层、激活函数和四个全连接层;
所述三个卷积层包括:第一卷积层、第二卷积层和第三卷积层;其中,第一卷积层包含64个卷积核,每个卷积核的大小为3×3;第二卷积层包含32个卷积核,每个卷积核的大小为3×3;第三卷积层包含32个卷积核,每个卷积核的大小为3×3;
激活函数为线性整流函数;
在卷积层和全连接层之间增设dropout层,系数为0.2;
在全连接层和输出层之间也增设dropout层,系数为0.3;
所述四个全连接层中,每个全连接层有2048个神经元;
输出层的神经元个数为360;
输入层输入预处理后的数据;输出层输出预处理后的数据对应的的标签。
作为上述技术方案的改进之一,所述深度学习神经网络模型的训练步骤,具体包括:
用KRAKEN仿真的矢量声场数据及其对应的标签,即带标签的仿真数据作为训练集;
其中,单矢量水听器接收带标签的仿真数据,其中,带标签的仿真数据的频域表示为R(f)′=[p(f)′,ax(f)′,ay(f)′,az(f)′],将带标签的仿真数据进行归一化处理:
Figure BDA0002371841830000031
其中,p(f)′为频点f处的带标签声压;ax(f)′为频点f处的x方向的带标签加速度;ay(f)′为频点f处的y方向的带标签加速度;az(f)′为频点f处的z方向的带标签加速度;
Figure BDA0002371841830000032
为归一化后的带标签的仿真数据,即
Figure BDA0002371841830000033
其中,
Figure BDA0002371841830000034
为归一化后的带标签声压;
Figure BDA0002371841830000035
为归一化后的x方向的带标签加速度;
Figure BDA0002371841830000036
为归一化后的y方向的带标签加速度;
Figure BDA0002371841830000037
为归一化后的z方向的带标签加速度;其中,
Figure BDA0002371841830000038
统称为归一化后的带标签加速度
Figure BDA0002371841830000039
将归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure BDA00023718418300000310
求其互谱后,再进行快拍平均:
Figure BDA0002371841830000041
其中,
Figure BDA0002371841830000042
为归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure BDA0002371841830000043
在频点f处的互谱后的快拍平均;N为快拍数;
Figure BDA0002371841830000044
为归一化后频点f处带标签声压的第s个快拍;
Figure BDA0002371841830000045
为为归一化后频点f处带标签加速度的第s个快拍,i=x,y,z;H表示复共轭;
归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure BDA0002371841830000046
互谱的实部和虚部组成一个3×2F的矩阵,形成带标签的数据;其中,F为总的频点个数;
仿真数据标签的预处理具体包括:将声源方位角的估计看作一个回归问题,仿真数据对应的标签用一个以方位角真值为中心的高斯分布来表示:
Figure BDA0002371841830000047
其中,tn为第n个采样点的预处理后的数据的标签;d为所有的取值角度;
d=1°-360°,步长为1°;dnr为真实角度;σ表示方位角的模糊度范围;
利用MATLAB中的trainNetwork函数作为目标函数,对深度学习神经网络模型进行训练;
在深度学习神经网络模型进行训练的过程中,输入层输入带标签的仿真数据,输出层的输出与标签之差称为衰减系数,整个训练的过程就是使该衰减系数趋于零,使深度迁移学习模型的输出与对应的标签无限接近的过程。
本发明还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述方法。
本发明与现有技术相比的有益效果是:
本发明的方法利用仿真数据而非实验数据进行深度神经网络模型的训练,降低了成本,提高了方法的实用性;另外,深度学习的方法是直接从原始数据中提取声源方位角信息,所以无需复杂的信号处理,且深度神经网络模型是预先训练好的,提高了计算的速度;此外,利用深度学习的方法可以实现较高精度的声源方位估计。
附图说明
图1是本发明的一种基于深度学习的单矢量水听器方位估计方法的深度神经网络模型的结构示意图;
图2是本发明的一种基于深度学习的单矢量水听器方位估计方法中利用深度学习方法进行方位估计的流程图;
图3是本发明的一种基于深度学习的单矢量水听器方位估计方法的深度神经网络模型的训练过程中的仿真数据的环境参数设置与深度关系的示意图;
图4是应用实例中声源的GPS航迹和单矢量水听器的坐标的示意图;
图5(a)是实验过程中矢量水听器的航向角变化示意图;
图5(b)是实验过程中矢量水听器的横滚角变化示意图;
图5(c)是实验过程中矢量水听器的俯仰角变化示意图;
图6(a)是实验过程中矢量水听器接收到的声压的时域信号波形示意图;
图6(b)是实验过程中矢量水听器接收到的x方向的加速度的时域信号波形示意图;
图6(c)是实验过程中矢量水听器接收到的y方向的加速度的时域信号波形示意图;
图6(d)是实验过程中矢量水听器接收到的z方向的加速度的时域信号波形示意图;
图7(a)是实验过程中矢量水听器接收到的800s处声压的频域波形示意图;
图7(b)是实验过程中矢量水听器接收到的800s处x方向加速度的频域波形示意图;
图7(c)是实验过程中矢量水听器接收到的800s处y方向加速度的频域波形示意图;
图7(d)是实验过程中矢量水听器接收到的800s处z方向加速度的频域波形示意图;
图8(a)是利用传统复声强法估计到的目标声源的方位角与真实的GPS测得的方位角的比较示意图;
图8(b)是利用仿真数据训练的深度学习神经网络模型网络模型估计到的目标声源的方位角与真实的GPS测得的方位角的比较。
具体实施方式
现结合附图对本发明作进一步的描述。
单矢量水听器包括:声压传感器和加速度传感器;以往将加速度传感器采集的加速度矢量信号转化为振速矢量信号再与声压传感器采集的声压矢量信号整合后进行处理,而本发明直接对声压传感器采集的声压矢量信号和加速度传感器采集的加速度矢量信号进行处理,即利用KRAKEN仿真质点的声压和加速度,作为仿真数据,其中,仿真参数如图3所示,从而使估计结果更加准确。其中csed表示沉积层的声速,取值范围为1550-1650m/s;ρsed表示沉积层密度;αsed表示沉积层的衰减系数;hsed表示沉积层厚度,取值范围为2-14m;cb表示基底层声速;ρb表示基底层密度;αb表示基底层的衰减系数。
如图1所示,本发明提供了一种基于深度学习的单矢量水听器方位估计方法,该方法利用仿真数据而非实验数据进行深度学习神经网络模型的训练,降低了成本;实际应用中不需要任何先验知识,也不需要复杂的信号处理,可实现自主实时的声源方位估计;声源方位估计的精度高。
该方法包括:
对单矢量水听器接收的不带标签的实测数据进行预处理,获得预处理后的数据;
具体地,单矢量水听器接收不带标签的实测数据,其中,不带标签的实测数据的频域表示为R(f)=[p(f),ax(f),ay(f),az(f)],为减少声源谱幅度的影响,将不带标签的实测数据进行归一化处理,去除干扰:
Figure BDA0002371841830000061
其中,p(f)为频点f处的声压;ax(f)为频点f处的x方向的加速度;ay(f)为频点f处的y方向的加速度;az(f)为频点f处的z方向的加速度;
Figure BDA0002371841830000062
为归一化后的不带标签的实测数据,即
Figure BDA0002371841830000063
其中,
Figure BDA0002371841830000064
为归一化后的声压;
Figure BDA0002371841830000071
为归一化后的x方向的加速度;
Figure BDA0002371841830000072
为归一化后的y方向的加速度;
Figure BDA0002371841830000073
为归一化后的z方向的加速度;其中,
Figure BDA0002371841830000074
统称为归一化后的加速度
Figure BDA0002371841830000075
将归一化后的声压
Figure BDA0002371841830000076
和归一化后的加速度
Figure BDA0002371841830000077
求其互谱后,再进行快拍平均:
Figure BDA0002371841830000078
其中,
Figure BDA0002371841830000079
为归一化后的声压
Figure BDA00023718418300000710
和归一化后的加速度
Figure BDA00023718418300000711
在频点f处的互谱后的快拍平均;N为快拍数;
Figure BDA00023718418300000712
为归一化后频点f处归一化后的声压的第s个快拍;
Figure BDA00023718418300000713
为归一化后频点f处归一化后的加速度的第s个快拍,i=x,y,z;H表示复共轭;
归一化后的声压
Figure BDA00023718418300000714
和归一化后的加速度
Figure BDA00023718418300000715
互谱的实部和虚部组成一个3×2F的矩阵,形成不带标签的数据,并将不带标签的数据作为预处理后的数据;其中,F为总的频点个数。
将预处理后的数据输入至训练好的深度学习神经网络模型网络模型,获得预处理后的数据对应的标签,作为声源的方位角,完成单矢量水听器方位估计。
所述深度学习神经网络模型网络模型为卷积神经网络,其包括:输入层、隐含层和输出层;
其中,所述隐含层进一步包括:三个卷积层、激活函数和四个全连接层;
所述三个卷积层包括:第一卷积层、第二卷积层和第三卷积层;其中,第一卷积层包含64个卷积核,每个卷积核的大小为3×3;第二卷积层包含32个卷积核,每个卷积核的大小为3×3;第三卷积层包含32个卷积核,每个卷积核的大小为3×3;
激活函数为线性整流函数;
在卷积层和全连接层之间增设dropout层,系数为0.2;
在全连接层和输出层之间也增设dropout层,系数为0.3;
所述四个全连接层中,每个全连接层有2048个神经元;
输出层的神经元个数为360;
输入层输入预处理后的数据;输出层输出预处理后的数据对应的的标签。
卷积层是主要的特征提取层,其通过对输入数据进行卷积处理后从数据中提取特征,卷积不仅限于对原始输入的卷积,而且还可以将卷积后提取到的特征(神经网络类似于一个黑盒子,内部具体提取的是什么特征并不清楚)进行进一步的卷积,所以隐含层中一般包含多个卷积层,多个卷积的叠加可以将特征不断的提取和压缩,最终得到比较高层次的特征;
所述深度学习神经网络模型的训练步骤,具体包括:
用KRAKEN仿真的矢量声场数据及其对应的标签,即带标签的仿真数据作为训练集,用KRAKEN仿真的矢量声场数据包括:单矢量水听器采集的声压矢量信号和加速度矢量信号;其中,声压为标量,加速度为矢量;
其中,单矢量水听器接收带标签的仿真数据,其中,带标签的仿真数据的频域表示为R(f)′=[p(f)′,ax(f)′,ay(f)′,az(f)′],为减少声源谱的影响,将带标签的仿真数据进行归一化处理,去除干扰:
Figure BDA0002371841830000081
其中,p(f)′为频点f处的带标签声压;ax(f)′为频点f处的x方向的带标签加速度;ay(f)′为频点f处的y方向的带标签加速度;az(f)′为频点f处的z方向的带标签加速度;
Figure BDA0002371841830000082
为归一化后的带标签的仿真数据,即
Figure BDA0002371841830000083
其中,
Figure BDA0002371841830000084
为归一化后的带标签声压;
Figure BDA0002371841830000085
为归一化后的x方向的带标签加速度;
Figure BDA0002371841830000086
为归一化后的y方向的带标签加速度;
Figure BDA0002371841830000087
为归一化后的z方向的带标签加速度;其中,
Figure BDA0002371841830000088
统称为归一化后的带标签加速度
Figure BDA0002371841830000089
将归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure BDA00023718418300000810
求其互谱后,再进行快拍平均:
Figure BDA00023718418300000811
其中,
Figure BDA00023718418300000812
为归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure BDA00023718418300000813
在频点f处的互谱后的快拍平均;N为快拍数;
Figure BDA00023718418300000814
为归一化后频点f处带标签声压的第s个快拍;
Figure BDA00023718418300000815
为为归一化后频点f处带标签加速度的第s个快拍,i=x,y,z;H表示复共轭;
归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure BDA0002371841830000091
互谱的实部和虚部组成一个3×2F的矩阵,形成带标签的数据;其中,F为总的频点个数;
训练集中的仿真数据需要对应的标签作为参照,为增加训练的深度学习神经网络模型的鲁棒性,使其具有一定的误差适应能力,需要对仿真数据对应的标签进行预处理:将声源方位角的估计看作一个回归问题,仿真数据对应的标签用一个以方位角真值为中心的高斯分布来表示,
Figure BDA0002371841830000092
其中,tn为第n个采样点的预处理后的数据的标签;d为所有的取值角度;d=1°-360°,步长为1°;dnr为真实角度;σ表示方位角的模糊度范围;
利用MATLAB中的trainNetwork函数作为目标函数,对深度学习神经网络模型进行训练;
在深度学习神经网络模型进行训练的过程中,输入层输入带标签的仿真数据,输出层的输出与标签之差称为衰减系数,整个训练的过程就是使该衰减系数趋于零,使深度迁移学习模型的输出与对应的标签无限接近的过程。
标签的预处理是专指对训练过程中进行监督的标签进行预处理,这里就是指仿真数据的标签的预处理。神经网络在进行训练的时候需要仿真的矢量声场数据作为输入,还需要对应的方位角作为标签对网络进行监督,标签的预处理很关键,特别是利用实验的实测数据进行训练的时候,因为实验根据GPS测得的方位角也是有误差的,对标签进行预处理就是想把可能存在的误差包含进去,从而使神经网络更鲁棒。
有标签的机器学习的训练过程叫监督学习,标签就是相当于一个参照物,相当于对网络进行监督,让神经网络往我们希望的方向进行调整。所以训练过程中神经网络的输出并不是标签,一开始是随机的一个值,神经网络的训练是进行很多个循环的,每次循环输出一个值,根据这个值与标签值的差值也就是衰减系数的大小对网络进行调整,然后再循环,再输出一个值,再根据衰减系数进行调整,当衰减系数不再变化或者变化不大的时候就认为网络训练好了。
实施例1.
2018年3月份进行了单矢量水听器的被动方位估计海上实验。实验过程中将船的辐射噪声作为声源,作为声源的船只船长60米,船宽26米,以10节的速度围绕矢量水听器做了半径约为1km的类圆周运动,航行轨迹如图4所示。矢量水听器采用锚底布放的形式,海深61米,矢量水听器的深度保持在44米,实验过程中矢量水听器的姿态如图5所示,其中图5(a)为矢量水听器的航向角随时间的变化,可以看到水平航向角有较大的起伏;图5(b)和图5(c)为横滚角和俯仰角,它们代表了矢量水听器的竖直姿态,可以看到实验过程中横滚角和俯仰角变化很小,说明水听器的垂直姿态保持良好。矢量水听器的有效工作频段为20Hz-3kHz。图6为矢量水听器接收得到的信号的时域波形,图6(a)、图6(b)、图6(c)和图6(d)分别为声压通道、x方向的加速度通道、y方向加速度通道和z方向加速度通道的时域波形,由于声源为舰船辐射噪声,所以在时域上无法观察到明显的信号特征。图7为矢量水听器接收到的信号对应时域800s处的频域波形,图7(a)、图7(b)、图7(c)和图7(d)分别为声压通道、x方向的加速度通道、y方向加速度通道和z方向加速度通道的频域波形,声压通道的频域波形符合声场的能量分布规律,即低频段能量整体上要高于高频段;但加速度通道的频域波形并不符合这个规律,这主要是由于加速度通道对不同频率信号的灵敏度响应不一样。
利用KRANKEN进行数据仿真,环境参数选择图3中的参数,标签数据采用高斯分布的形式,将仿真得到的数据经过预处理后输入到图1所示的卷积神经网络中进行训练。按照图2所示流程,利用训练好的深度学习的网络估计图4中GPS航迹对应的方位角,此时得到的结果并非最终的估计结果,因为实验过程中矢量水听器的航向角一直在变化,如图5(a)所示,所以要对估计结果针对航向角的变化进行修正,修正后得到的结果即为最终的估计结果,如图8所示。
采用平均绝对误差(MAE)来衡量估计结果的精度,
Figure BDA0002371841830000101
其中θr表示角度的真实值,θe表示角度的估计值。估计结果误差大于100°的不予考虑。
图8(a)中,传统复声强法的方位估计结果的MAE为8.3°,图8(b)中,深度学习方法估计结果的MAE为6.6°,两者相比,深度学习法具有更高的估计精度。误差的来源主要有以下几个方面:
1、其他船只的干扰。由于实验中声源为舰船的辐射噪声且实验海域有大量的其他船只航行。
2、目标船只体积较大,非点声源。实验中作为声源的船只其长度为60米,宽度为26米,是一个较大体积的辐射声源。在1km的距离上,由于船的体积带来的方位角模糊度在4°左右。
3、矢量水听器本身做工上的误差,例如加速度通道互相不垂直,指示矢量水听器本身航向角变化的罗经存在误差。
综合考虑这些不可避免的误差,实验数据的最终估计结果的精度是比较高的,从而说明本发明方法具有较高的估计精度。
本发明还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述方法。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种基于深度学习的单矢量水听器方位估计方法,其特征在于,该方法包括:
对单矢量水听器接收的不带标签的实测数据进行预处理,获得预处理后的数据;
将预处理后的数据输入至训练好的深度学习神经网络模型,获得预处理后的数据对应的标签,作为声源的方位角,完成单矢量水听器方位估计;
所述对单矢量水听器接收的不带标签的实测数据进行预处理,获得预处理后的数据;具体为:
单矢量水听器接收不带标签的实测数据,其中,不带标签的实测数据的频域表示为R(f)=[p(f),ax(f),ay(f),az(f)],将不带标签的实测数据进行归一化处理:
Figure FDA0003902306790000011
其中,p(f)为频点f处的声压;ax(f)为频点f处的x方向的加速度;ay(f)为频点f处的y方向的加速度;az(f)为频点f处的z方向的加速度;
Figure FDA0003902306790000012
为归一化后的不带标签的实测数据,即
Figure FDA0003902306790000013
其中,
Figure FDA0003902306790000014
为归一化后的声压;
Figure FDA0003902306790000015
为归一化后的x方向的加速度;
Figure FDA0003902306790000016
为归一化后的y方向的加速度;
Figure FDA0003902306790000017
为归一化后的z方向的加速度;其中,
Figure FDA0003902306790000018
统称为归一化后的加速度
Figure FDA0003902306790000019
将归一化后的声压
Figure FDA00039023067900000110
和归一化后的加速度
Figure FDA00039023067900000111
求其互谱后,再进行快拍平均:
Figure FDA00039023067900000112
其中,
Figure FDA00039023067900000113
为归一化后的声压
Figure FDA00039023067900000114
和归一化后的加速度
Figure FDA00039023067900000115
在频点f处的互谱后的快拍平均;N为快拍数;
Figure FDA00039023067900000116
为归一化后频点f处归一化后的声压的第s个快拍;
Figure FDA00039023067900000117
为归一化后频点f处归一化后的加速度的第s个快拍,i=x,y,z;H表示复共轭;
归一化后的声压
Figure FDA00039023067900000118
和归一化后的加速度
Figure FDA00039023067900000119
互谱的实部和虚部组成一个3×2F的矩阵,形成不带标签的数据,并将不带标签的数据作为预处理后的数据;其中,F为总的频点个数;
所述深度学习神经网络模型为卷积神经网络,其包括:输入层、隐含层和输出层;
其中,所述隐含层进一步包括:三个卷积层、激活函数和四个全连接层;
所述三个卷积层包括:第一卷积层、第二卷积层和第三卷积层;其中,第一卷积层包含64个卷积核,每个卷积核的大小为3×3;第二卷积层包含32个卷积核,每个卷积核的大小为3×3;第三卷积层包含32个卷积核,每个卷积核的大小为3×3;
激活函数为线性整流函数;
在卷积层和全连接层之间增设dropout层,系数为0.2;
在全连接层和输出层之间也增设dropout层,系数为0.3;
所述四个全连接层中,每个全连接层有2048个神经元;
输出层的神经元个数为360;
输入层输入预处理后的数据;输出层输出预处理后的数据对应的标签;
所述深度学习神经网络模型的训练步骤,具体包括:
用KRAKEN仿真的矢量声场数据及其对应的标签,即带标签的仿真数据作为训练集;
其中,单矢量水听器接收带标签的仿真数据,其中,带标签的仿真数据的频域表示为R(f)′=[p(f)′,ax(f)′,ay(f)′,az(f)′],将带标签的仿真数据进行归一化处理:
Figure FDA0003902306790000021
其中,p(f)′为频点f处的带标签声压;ax(f)′为频点f处的x方向的带标签加速度;ay(f)′为频点f处的y方向的带标签加速度;az(f)′为频点f处的z方向的带标签加速度;
Figure FDA0003902306790000022
为归一化后的带标签的仿真数据,即
Figure FDA0003902306790000023
其中,
Figure FDA0003902306790000024
为归一化后的带标签声压;
Figure FDA0003902306790000025
为归一化后的x方向的带标签加速度;
Figure FDA0003902306790000026
为归一化后的y方向的带标签加速度;
Figure FDA0003902306790000027
为归一化后的z方向的带标签加速度;其中,
Figure FDA0003902306790000028
统称为归一化后的带标签加速度
Figure FDA0003902306790000029
将归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure FDA00039023067900000210
求其互谱后,再进行快拍平均:
Figure FDA0003902306790000031
其中,Spai(f)′为归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure FDA0003902306790000032
在频点f处的互谱后的快拍平均;N为快拍数;
Figure FDA0003902306790000033
为归一化后频点f处带标签声压的第s个快拍;
Figure FDA0003902306790000034
为归一化后频点f处带标签加速度的第s个快拍,i=x,y,z;H表示复共轭;
归一化后的带标签声压p(f)′和归一化后的带标签加速度
Figure FDA0003902306790000035
互谱的实部和虚部组成一个3×2F的矩阵,形成带标签的数据;其中,F为总的频点个数;
仿真数据标签的预处理具体包括:将声源方位角的估计看作一个回归问题,仿真数据对应的标签用一个以方位角真值为中心的高斯分布来表示:
Figure FDA0003902306790000036
其中, tn为第n个采样点的预处理后的数据的标签;d为所有的取值角度;d=1°-360°,步长为1°;dnr为真实角度;σ表示方位角的模糊度范围;
利用MATLAB中的trainNetwork函数作为目标函数,对深度学习神经网络模型进行训练;
在深度学习神经网络模型进行训练的过程中,输入层输入带标签的仿真数据,输出层的输出与标签之差称为衰减系数,整个训练的过程就是使该衰减系数趋于零,使深度迁移学习模型的输出与对应的标签无限接近的过程。
2.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1所述的方法。
3.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述权利要求1所述的方法。
CN202010052928.XA 2020-01-17 2020-01-17 一种基于深度学习的单矢量水听器方位估计方法 Active CN113138365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010052928.XA CN113138365B (zh) 2020-01-17 2020-01-17 一种基于深度学习的单矢量水听器方位估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010052928.XA CN113138365B (zh) 2020-01-17 2020-01-17 一种基于深度学习的单矢量水听器方位估计方法

Publications (2)

Publication Number Publication Date
CN113138365A CN113138365A (zh) 2021-07-20
CN113138365B true CN113138365B (zh) 2022-12-06

Family

ID=76808610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010052928.XA Active CN113138365B (zh) 2020-01-17 2020-01-17 一种基于深度学习的单矢量水听器方位估计方法

Country Status (1)

Country Link
CN (1) CN113138365B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116699579B (zh) * 2023-05-06 2024-04-05 中国科学院声学研究所 一种基于深海矢量垂直阵的宽带目标三维被动定位方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529428A (zh) * 2016-10-31 2017-03-22 西北工业大学 基于深度学习的水下目标识别方法
CN109100710A (zh) * 2018-06-26 2018-12-28 东南大学 一种基于卷积神经网络的水下目标识别方法
CN109975762A (zh) * 2017-12-28 2019-07-05 中国科学院声学研究所 一种水下声源定位方法
CN109993280A (zh) * 2019-03-27 2019-07-09 东南大学 一种基于深度学习的水下声源定位方法
CN110515034A (zh) * 2019-08-26 2019-11-29 西安电子科技大学 一种声信号方位角测量系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529428A (zh) * 2016-10-31 2017-03-22 西北工业大学 基于深度学习的水下目标识别方法
CN109975762A (zh) * 2017-12-28 2019-07-05 中国科学院声学研究所 一种水下声源定位方法
CN109100710A (zh) * 2018-06-26 2018-12-28 东南大学 一种基于卷积神经网络的水下目标识别方法
CN109993280A (zh) * 2019-03-27 2019-07-09 东南大学 一种基于深度学习的水下声源定位方法
CN110515034A (zh) * 2019-08-26 2019-11-29 西安电子科技大学 一种声信号方位角测量系统及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A DEEP NEURAL NETWORK BASED METHOD OF SOURCE LOCALIZATION IN A SHALLOWWATER ENVIRONMENT;Zhaoqiong Huang 等;《2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)》;20180913;3499-3503 *
CONVOLUTIONAL NEURAL NETWORKS FOR PASSIVE MONITORING OF A SHALLOW WATER ENVIRONMENT USING A SINGLE SENSOR;Eric L. Ferguson 等;《2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)》;20170619;2657-2661 *
Deep Learning for DOA Estimation Using a Vector Hydrophone;Huaigang Cao 等;《OCEANS 2019 MTS/IEEE SEATTLE》;20191031;1-4 *
卷积神经网络单矢量水听器方位估计;曹怀刚 等;《哈尔滨工程大学学报》;20201031;第41卷(第10期);1524-1529 *

Also Published As

Publication number Publication date
CN113138365A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
Goff et al. Stochastic modeling of seafloor morphology: Inversion of sea beam data for second‐order statistics
CN107179535A (zh) 一种基于畸变拖曳阵的保真增强波束形成的方法
Cao et al. Deep transfer learning for underwater direction of arrival using one vector sensor
CN106500671B (zh) 一种基于lm算法分解激光雷达波形确定海水深度的方法
CN113011006B (zh) 一种基于互相关函数脉冲波形匹配的目标深度估计方法
CN110188628A (zh) 一种基于深度学习模型的rd图像舰船目标识别方法
CN104678384B (zh) 一种波束域的声压差互相关谱分析水下目标速度估计方法
CN108845325A (zh) 拖曳线列阵声纳子阵误差失配估计方法
CN113138365B (zh) 一种基于深度学习的单矢量水听器方位估计方法
CN115114949A (zh) 一种基于水声信号的舰船目标智能识别方法及系统
CN113109794B (zh) 一种强噪声环境下基于深度神经网络的深海声源定深方法
Long et al. A comprehensive deep learning-based outlier removal method for multibeam bathymetric point cloud
CN113075645B (zh) 一种基于主成分分析-密度聚类的畸变阵形线谱增强方法
Yao et al. Range estimation of few-shot underwater sound source in shallow water based on transfer learning and residual CNN
Wang et al. Passive tracking of underwater acoustic targets based on multi-beam LOFAR and deep learning
CN113138366B (zh) 一种基于深度迁移学习的单矢量水听器方位估计方法
CN111965601A (zh) 一种基于核极限学习机的水下声源被动定位方法
Tao et al. Inversion of side scan sonar motion and posture in seabed geomorphology
Cao et al. Deep learning for DOA estimation using a vector hydrophone
CN112415595B (zh) 海底节点二次定位的方法及装置
CN113703050B (zh) 一种深海地震垂直缆二次定位方法
CN114460587B (zh) 一种主动声呐全景接触目标快速辨识方法
Guo et al. Classification of inbound and outbound ships using convolutional neural networks
CN113657416B (zh) 一种基于改进的深度神经网络的深海声源测距方法及系统
Hui et al. 2D CNN‐based multi‐feature fusion detection method for the magnetic anomaly generated by submarine wake

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant