CN109975762B

CN109975762B - 一种水下声源定位方法

Info

Publication number: CN109975762B
Application number: CN201711454053.0A
Authority: CN
Inventors: 徐及; 黄兆琼; 颜永红
Original assignee: Institute of Acoustics CAS; Beijing Kexin Technology Co Ltd
Current assignee: Institute of Acoustics CAS; Beijing Kexin Technology Co Ltd
Priority date: 2017-12-28
Filing date: 2017-12-28
Publication date: 2021-05-18
Anticipated expiration: 2037-12-28
Also published as: CN109975762A

Abstract

本发明涉及一种水下声源定位方法，包括以下步骤：将通过水听器阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换；在信号带宽内每个频率上计算数据协方差矩阵，然后通过特征值分解提取能表征信号方位信息的特征向量；在训练阶段，利用时延神经网络学习训练样本，得到特征向量和声源方位的映射关系模型；在测试阶段，输入测试样本的特征向量到训练好的模型，得到声源的距离和深度估计值。本发明利用深度神经网络，实现鲁棒而高效的水下声源定位。

Description

一种水下声源定位方法

技术领域

本发明涉及水下声源定位方法。

背景技术

声源定位包括单声源定位和多声源定位，声源定位技术可以指示声源目标所在的空间方位，为后续的信息采集与处理提供重要的空间信息。

传统方法主要利用现代数字信号处理的技术来估计声源的位置信息，通过格点匹配搜索或解析方式给出声源位置，这些方法往往依赖于环境信息的准确性，环境的扰动会影响定位的准确度和鲁棒性。

在过去十多年中，少部分方法将机器学习引入水下声源定位任务中，浅层神经网络或支持向量机等被当做分类器来构建特征到声源位置的对应关系，然而远场水下声源定位问题中，较浅层神经网络和简单分类器非线性建模能力及泛化能力比较弱，不能准确的定位。

发明内容

针对现有技术水下声源定位精度、鲁棒性差的问题，本发明提出了水下声源定位方法，利用深度神经网络，实现鲁棒而高效的水下声源定位。

本发明一种水下声源定位方法，包括：

步骤1)将通过水听器阵列接收的声源信号转换成数字声音信号；

步骤2)对所述数字声音信号进行做傅里叶变换；

步骤3)在信号带宽内每个频率上计算数据协方差矩阵，然后通过特征值分解提取能表征信号方位信息的特征向量；

步骤4)在训练阶段，利用时延神经网络学习训练样本，得到特征向量和声源位置之间的映射关系模型；

步骤5)在测试阶段，将测试样本通过步骤3)提取特征向量，输入到步骤4)得到的模型，得到声源的距离和深度估计值。

进一步，所述步骤3)包括：

步骤3-1)、计算第f个频点上的数据协方差矩阵：

其中上标+表示求取共轭转置的操作，D代表快拍数，P_d(f)表示第f频点上的观察向量[P_1,f,P_2,f,…,P_K,f]，其中P_k,f表示第k个水听器接收的信号；

步骤3-2)、对协方差矩阵进行特征值分解：

其中Λ_f＝[e_f,1,…,e_f,K]为特征向量，K为水听器的个数，上标(.)⁺代表共轭转置操作，∑_f＝diag[λ₁,…,λ_K]为特征值矩阵；选取特征值较大的M个特征向量，

作为神经网络的输入特征向量。

进一步，所述步骤4)包括：

步骤4-1)、神经网络的输入特征为特征向量的实部与虚部的级联作为神经网络的输入特征：

其中

代表取实部操作，ξ(,)代表取虚部操作，F为一共用到的频率数；

步骤4-2)、神经网络训练的准则为最小均方误差准则：

其中r_l和z_l代表声源距离和深度的估计值，r_l′和z_l′为声源距离和深度的参考值，L为样本个数；通过随机梯度下降反向传播算法最小化代价函数E，得到神经网络的权值矩阵。

本发明的优点在于：

本发明提出的水下声源定位方法，利用了深度神经网络，不依赖于环境参数的先验知识；深度神经网络可以利用多环境联合训练的方法来缓解环境扰动带来的困难，从而实现了鲁棒的水下声源定位方法。

附图说明

图1是本发明的基于深度学习的水下声源定位方法的流程图。

具体实施方式

现结合附图对本发明作进一步的描述。

参考图1，本发明的方法包括以下步骤

将通过水听器阵列接收的声源信号转换成数字声音信号；其中，所述水听器阵列包括有K个麦克风。

步骤2)对数字声音信号做傅里叶变换。

步骤3)在信号带宽内每个频率上计算数据协方差矩阵，然后通过特征值分解提取能表征信号方位信息的特征向量，具体步骤为：

3-1)第f个频点上的数据协方差矩阵：

3-2)对协方差矩阵进行特征值分解：

其中Λ_f＝[e_f,1,…,e_f,K]为特征向量，K为水听器的个数，上标(.)⁺代表共轭转置操作，∑_f＝diag[λ₁,…,λ_K]为特征值矩阵。选取特征值较大的M个特征向量，

作为神经网络的输入特征向量。

步骤4)在训练阶段，利用时延神经网络学习训练样本(训练样本为一组带有声源距离和深度标签的样本)，得到的特征向量和声源位置之间的映射关系，具体步骤为：

由于特征向量是一个复数向量，不能直接被时延神经网络处理，因此将特征向量的实部与虚部级联起来作为神经网络的输入特征：

其中

代表取实部操作，ξ(,)代表取虚部操作，F为一共用到的频率数，神经网络训练的准则为最小均方误差准则：

其中r_l和z_l代表声源距离和深度的估计值，r_l′和z_l′为声源距离和深度的参考值，L为样本个数。通过随机梯度下降反向传播算法最小化代价函数E，得到神经网络的权值矩阵。

另外，我们可以将不同环境下的训练数据混合起来进行神经网络学习，这样能有效对抗一定程度上的环境扰动带来的性能下降。

步骤5)在测试阶段，将测试样本通过步骤3)提取特征向量，输入步骤4)训练得到的模型，得到声源的距离和深度估计值。

我们认为通过上述步骤3)抽取的特征向量能够表征声源的位置信息，并且它和声源的位置(距离、深度)有一一映射的关系，而神经网络具有构建非线性映射关系的能力，而这种映射关系就包含在网络的权重矩阵中，因此通过神经网络对训练集进行学习，得到了这样一组权重矩阵，当一个未知声源位置的声源出现，我们通过同样的方式抽取特征，然后通过神经网络的矩阵运算，即可得到声源位置的估计值，从而实现对声源进行定位。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。