CN110045356A

CN110045356A - 一种双向长短时记忆神经网络水面目标识别方法

Info

Publication number: CN110045356A
Application number: CN201910194814.6A
Authority: CN
Inventors: 李思纯; 杨书钰; 杨德森; 梁静涵; 时胜国; 方尔正; 洪连进; 莫世奇; 张揽月; 胡博; 时洁; 朱中锐; 柳艾飞; 李松; 张昊阳; 田迎泽
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2019-03-14
Filing date: 2019-03-14
Publication date: 2019-07-23
Anticipated expiration: 2039-03-14
Also published as: CN110045356B

Abstract

本发明提供的是一种双向长短时记忆神经网络水面目标识别方法。1：将矢量声纳接收到的矢量信号进行预处理；2：将预处理后的训练样本集输入双向长短时记忆神经网络中，进行网络预训练；3：将预训练的输出结果与输入样本的实际输出进行比较，通过自适应的方法对网络参数进行微调；4：将经过同样预处理后的测试样本集输入参数自适应调整后的双向长短时记忆网络中，对网络进行评估；5：将经过同样预处理后的待分类样本集输入参数最优化的双向长短时记忆网络中，得到分类结果。本发明克服了由于人工提取特征导致信息丢失的问题，避免了人工提取特征步骤的繁琐复杂，也减少了人工提取特征所需的时间。通过多隐层的神经网络可以提高样本正确识别率。

Description

一种双向长短时记忆神经网络水面目标识别方法

技术领域

本发明涉及的是一种水面目标识别方法，具体地说是一种基于矢量声纳的双向长短时记忆神经网络水面目标识别方法。

背景技术

水面目标识别技术有着举足轻重的作用，它是指人或机器，通过对接收到的各类水面目标的辐射噪声信息进行分类识别的技术。现阶段，如何更快更准确的识别出水面目标仍是目标识别技术存在的难点。

目标识别的基本流程是将接收到的数据进行预处理，再将预处理后的数据进行特征提取和选择，最后再经过学习算法和分类器，从而得到目标的识别结果。而人工的提取特征通常会不可避免的丢失一部分关键的信息，如果可以使用原始接收到的信息进行识别，则可以在一定程度上避免由于人工提取特征而造成的信息丢失。

基于深度学习的目标识别方法已然成为现阶段的研究热点，它可以直接将接收到的大量原始数据输入深度神经网络中进行学习和训练，在一定程度上避免由于人工提取特征而造成的信息丢失，从而实现目标的分类和识别。

发明内容

本发明的目的在于提供一种能够克服由于人工提取特征导致信息丢失的问题，避免人工提取特征步骤的繁琐复杂，也减少人工提取特征所需的时间，提高样本正确识别率的双向长短时记忆神经网络水面目标识别方法。

本发明的目的是这样实现的：

步骤1：将矢量声纳接收到的矢量信号进行预处理；

步骤2：将预处理后的训练样本集输入双向长短时记忆神经网络中，进行网络预训练；

步骤3：将预训练的输出结果与输入样本的实际输出进行比较，通过自适应的方法对网络参数进行微调；

步骤4：将经过同样预处理后的测试样本集输入参数自适应调整后的双向长短时记忆网络中，对网络进行评估；

步骤5：将经过同样预处理后的待分类样本集输入参数最优化的双向长短时记忆网络中，得到分类结果。

本发明还可以包括：

1.所述的预处理的步骤为：

步骤1.1：将矢量声纳接收到的矢量信号按照7:3的比例划分为训练集和测试集；

步骤1.2：将训练集的样本按照所需分析的频带进行滤波，再将数据通过降采样函数进行降采样；

步骤1.3：将训练样本集的数据按照公式(1)的形式构造输入特征，

I(t)＝p(t)v(t) (1)

其中，p(t)为矢量声纳接收到的声压值，v(t)为矢量声纳接收到的各方向振速经合成后得到的合成值；

步骤4：按照步骤1.2和步骤1.3的方法处理测试集样本，并构造测试集输入样本；

步骤5：将训练集和测试集的样本进行打标签。

2.所述的网络预训练的步骤为：

步骤2.1：将双向长短时记忆神经网络参数初始化；

步骤2.2：将预处理后的训练集样本输入参数初始化的双向长短时记忆神经网络中，进行预训练。

所述的预训练的具体方法为：

双向长短时记忆网络分为前向网络和后向网络，

(1)在前向网络中，t时刻的第i个输入为t-1时刻的第j个记忆块输出为样本个数为T，每个样本的特征个数为M，隐层神经元个数为H，输出神经元个数为N；

将t时刻的输入与t-1时刻的记忆块输出经过加权求和后，按双曲正切函数进行非线性变换，得到输入挤压单元表达式如下：

其中，为t时刻的输入与输入挤压单元之间的权向量，为t-1时刻的记忆块输出与输入挤压单元之间的权向量，为记忆块的偏置；

输入门单元是将与的加权和按照激活函数激活，并在激活值为0时，切断来自另一个节点的信息流；在激活值为1时，让信息流通过，表达式如下：

其中，为t时刻的输入与输入门单元之间的权向量，为t-1时刻的记忆块输出与输入门单元之间的权向量，为输入门单元的偏置；

输入门控单元为输入门单元与做阿达马积，表达式为

遗忘门单元是将与的加权和按照激活函数激活，表达式如下：

其中，为t时刻的输入与遗忘门单元之间的权向量，为t-1时刻的记忆块输出与遗忘门单元之间的权向量，为遗忘门单元的偏置；

记忆细胞内部状态的更新是通过遗忘门单元与前一时刻的记忆细胞内部状态做阿达马积，再加上输入门控单元，表达式如下：

输出门单元是将与的加权和按照激活函数激活，表达式如下：

其中，为t时刻的输入与输出门单元之间的权向量，为t-1时刻的记忆块输出与输出门单元之间的权向量，为输出门单元的偏置；

输出门控单元是输出门单元与经过激活函数的记忆细胞内部状态做阿达马积，表达式如下：

此时得到的为前向网络的记忆块输出，而双向长短时记忆网络的每一时刻的输出不仅与之前时刻有关，还会与之后时刻有关，因此隐层的输出不仅包含了前向网络的记忆块输出，还包括了反向网络的记忆块输出；

(2)在反向网络中，t时刻的第i个输入为t+1时刻的第j个记忆块输出为样本个数为T，每个样本的特征个数为M，隐层神经元个数为H，输出神经元个数为N；

将t时刻的输入与t+1时刻的记忆块输出经过加权求和后，按双曲正切函数进行非线性变换，得到输入挤压单元表达式如下：

其中，为t时刻的输入与输入挤压单元之间的权向量，为t+1时刻的记忆块输出与输入挤压单元之间的权向量，为记忆块的偏置；

输入门单元是将与的加权和按照激活函数激活，表达式如下：

其中，为t时刻的输入与输入门单元之间的权向量，为t+1时刻的记忆块输出与输入门单元之间的权向量，为输入门单元的偏置；

输入门控单元为输入门单元与做阿达马积，表达式为

其中，为t时刻的输入与遗忘门单元之间的权向量，为t+1时刻的记忆块输出与遗忘门单元之间的权向量，为遗忘门单元的偏置；

其中，为t时刻的输入与输出门单元之间的权向量，为t+1时刻的记忆块输出与输出门单元之间的权向量，为输出门单元的偏置；

此时得到的为反向网络的记忆块输出；

以上即为bi-LSTM层的具体过程，将bi-LSTM层的两个输出和输入全连接层中，将学习到的特征映射到样本标记空间，将全连接层的输出值经过softmax层进行归一化，输出结果为

其中，为前向网络中隐层到输出层的权向量，为反向网络中隐层到输出层的权向量，b_p为前向网络和后向网络中隐层到输出层的偏置之和；

最后将输出结果经过分类层为输入数据打标签，完成整个预训练的过程。

3.所述的微调的步骤为：

步骤3.1：将网络输出结果与输入数据的实际输出进行比较，得到损失函数和训练样本集的正确识别率；

步骤3.2：判断损失函数和训练样本集的正确识别率是否在预期范围内，若是，则保存该网络参数；否则，进行自适应参数调整；重复步骤3.1、步骤3.2，直至损失函数和训练样本集的正确识别率在预期范围内。

自适应参数调整的步骤为：

损失函数L_t的表达式为

其中，d_t为输入样本x_t的期望输出，

接下来计算参数的变化量，在反向网络中，各参数变化量表达式如下：

隐层到输出层的权值w_b和偏置b_b变化量表达式为：

输出门单元的权值和偏置变化量表达式为：

遗忘门单元的权值和偏置变化量表达式为：

输入门单元的权值和偏置变化量表达式为：

输入挤压单元的权值和偏置变化量表达式为：

在前向网络中，各参数变化量表达式如下：

隐层到输出层的权值w_f和偏置b变化量表达式为：

输出门单元的权值和偏置变化量表达式为：

遗忘门单元的权值和偏置变化量表达式为：

输入门单元的权值和偏置变化量表达式为：

输入挤压单元的权值和偏置变化量表达式为：

通过权值和偏置的变化量，对各个权值和偏置进行更新，将所有的权值表示为w，所有的偏置表示为b，更新后的权值和偏置表达式如下：

其中，η为步长，默认值为0.01；β₁和β₂为矩估计的指数衰减速率，β₁为0.9，β₂为0.999；δ为一极小值，用于稳定数值，常用值为10^-8；s和r为初始化一阶和二阶矩变量，初始值设为0。

4.所述的评估的步骤为：

步骤4.1：将预处理后的测试集样本输入参数自适应调整后的双向长短时记忆神经网络中；

步骤4.2：将输出结果与标签进行对比，得到网络的正确识别率，并对网络进行评估；

步骤4.3：判断网络是否符合鲁棒性，若是，则保存网络参数；否则，增加训练样本，对网络进行重新训练。

5.所述的得到分类结构的步骤为：

步骤5.1：将矢量声纳接收到的数据进行预处理；

步骤5.2：将预处理后的待分类样本集输入参数最优化的双向长短时记忆神经网络中，得到分类结果。

本发明中提及的双向长短时记忆神经网络(bi-directional Long Short-TermMemory,bi-LSTM)是一种反馈型神经网络，通过反馈连接的神经网络，能够产生对数据的记忆状态，建立数据间的映射关系，分析信号的时间依赖关系，可以用于对序列数据的处理，还利用记忆模块代替普通的隐层节点，确保梯度在传递跨越很长时间之后仍不会消失或者爆炸。双向长短时记忆神经网络提供给输出层每一个点完整的过去和未来的信息，即此时的预测可能由前面的若干输入和后面的若干输入共同决定，从而提高了目标的识别率。

本发明采用了具有双向记忆特性的双向长短时记忆(bi-LSTM)神经网络，将矢量声纳接收到的矢量信号经过预处理后输入双向长短时记忆神经网络中，通过bi-LSTM层进行特征提取，通过全连接层将学习到的特征映射到样本标记空间，通过softmax层进行归一化，通过分类层为输入数据打标签，从而完成对输入的矢量信号的分类识别。本发明通过双向长短时记忆神经网络可以自主的进行特征提取，克服了由于人工提取特征导致信息丢失的问题，避免了人工提取特征步骤的繁琐复杂，也减少了人工提取特征所需的时间。同时，通过多隐层的神经网络可以提高样本正确识别率。

与现有技术相比，本发明方法具有以下的优点：

(1)本发明采用的信号是矢量声纳接收到的矢量信号，不仅包括声压信号，还包括x、y、z方向的振速；

(2)本发明采用的深度学习方法，可以有效地避免由于人工提取特征步骤的繁琐复杂，以及带来的信息丢失的问题，减少了人工提取特征所需的时间。同时，通过多隐层的神经网络可以提高样本正确识别率；

(3)本发明采用的深度学习模型为双向长短时记忆神经网络。该网络通过输入门、遗忘门、输出门这三个门来控制记忆细胞以及每个隐层的输出，实现了其特殊的记忆功能。同时，双向的网络使得每一时刻的信息预测不仅与之前时刻的信息有关，还会与后面的信息有关。因此，双向长短时记忆神经网络通过记忆块可以记忆数据的长期依赖关系，更适合学习具有前后关联和连续性的数据的特征。矢量信号作为连续的波形数据，与前后相邻一段时间内的数据都有着相关性，因此选用双向长短时记忆神经网络来进行学习具有明显的优势。

附图说明

图1是基于矢量声纳的双向长短时记忆神经网络水面目标识别方法的流程图。

图2是矢量信号特征提取网络中bi-LSTM层的结构示意图。

图3是bi-LSTM层记忆块的结构示意图。

具体实施方式

下面举例对本发明做更详细的描述。

如图1所示为本实施例一种基于矢量声纳的双向长短时记忆神经网络水面目标识别方法的流程图。如图2所示为矢量信号特征提取网络结构示意图中bi-LSTM层的结构示意图，如图3所示为bi-LSTM层记忆块的结构示意图，通过图2和图3的结构实现从输入到输出的计算过程。

一种基于矢量声纳的双向长短时记忆神经网络水面目标识别方法具体步骤如下：

(1)建立输入数据集：选择两类水面目标(不局限于只有两类目标)，通过矢量声纳接受到两类目标的矢量信号，构造输入数据集。每个样本的特征表达式为

I(t)＝p(t)v(t) (1)

其中，p(t)为矢量声纳接收到的声压值，v(t)为矢量声纳接收到的各方向振速经合成后得到的合成值。

(2)对输入数据进行预处理：将矢量声纳接收到的矢量信号按照所需分析的频带进行滤波，再将数据通过降采样函数进行降采样，按照7:3的比例划分为训练集和测试集，并将训练集和测试集的样本进行打标签。

(3)预训练网络：将双向长短时记忆神经网络参数初始化，将预处理后的训练集样本输入参数初始化的双向长短时记忆神经网络中，具体步骤如下：

双向长短时记忆网络可以分为前向网络和后向网络。

1)在前向网络中，t时刻的第i个输入为t-1时刻的第j个记忆块输出为样本个数为T，每个样本的特征个数为M，隐层神经元个数为H，输出神经元个数为N。

其中，为t时刻的输入与输入挤压单元之间的权向量，为t-1时刻的记忆块输出与输入挤压单元之间的权向量，为记忆块的偏置。

其中，为t时刻的输入与输入门单元之间的权向量，为t-1时刻的记忆块输出与输入门单元之间的权向量，为输入门单元的偏置。

输入门控单元为输入门单元与做阿达马积，表达式为

其中，为t时刻的输入与遗忘门单元之间的权向量，为t-1时刻的记忆块输出与遗忘门单元之间的权向量，为遗忘门单元的偏置。

其中，为t时刻的输入与输出门单元之间的权向量，为t-1时刻的记忆块输出与输出门单元之间的权向量，为输出门单元的偏置。

此时得到的为前向网络的记忆块输出。而双向长短时记忆网络的每一时刻的输出不仅与之前时刻有关，还会与之后时刻有关，因此隐层的输出不仅包含了前向网络的记忆块输出，还包括了反向网络的记忆块输出。

2)在反向网络中，t时刻的第i个输入为t+1时刻的第j个记忆块输出为样本个数为T，每个样本的特征个数为M，隐层神经元个数为H，输出神经元个数为N。

其中，为t时刻的输入与输入挤压单元之间的权向量，为t+1时刻的记忆块输出与输入挤压单元之间的权向量，为记忆块的偏置。

其中，为t时刻的输入与输入门单元之间的权向量，为t+1时刻的记忆块输出与输入门单元之间的权向量，为输入门单元的偏置。

输入门控单元为输入门单元与做阿达马积，表达式为

其中，为t时刻的输入与遗忘门单元之间的权向量，为t+1时刻的记忆块输出与遗忘门单元之间的权向量，为遗忘门单元的偏置。

其中，为t时刻的输入与输出门单元之间的权向量，为t+1时刻的记忆块输出与输出门单元之间的权向量，为输出门单元的偏置。

输出门控单元是输出门单元与过激活函数的记忆细胞内部状态做阿达马积，表达式如下：

此时得到的为反向网络的记忆块输出。

以上即为bi-LSTM层的具体过程。将bi-LSTM层的两个输出和输入全连接层中，将学习到的特征映射到样本标记空间，将全连接层的输出值经过softmax层进行归一化，输出结果为

其中，为前向网络中隐层到输出层的权向量，为反向网络中隐层到输出层的权向量，b_p为前向网络和后向网络中隐层到输出层的偏置之和。

(4)网络参数微调：将步骤(3)的输出结果与输入样本的实际输出作比较得到训练样本正确识别率和损失函数，判断损失函数和训练样本集的正确识别率是否在预期范围内，若是，则保存该网络参数；否则，进行自适应参数调整，直至训练样本集的正确识别率和损失函数在预期范围内。参数自适应调整的步骤为：

损失函数L_t的表达式为

其中，d_t为输入样本x_t的期望输出。

接下来计算参数的变化量。在反向网络中，各参数变化量表达式如下：

隐层到输出层的权值w_b和偏置b_b变化量表达式为：

输出门单元的权值和偏置变化量表达式为：

遗忘门单元的权值和偏置变化量表达式为：

输入门单元的权值和偏置变化量表达式为：

输入挤压单元的权值和偏置变化量表达式为：

在前向网络中，各参数变化量表达式如下：

隐层到输出层的权值w_f和偏置b变化量表达式为：

输出门单元的权值和偏置变化量表达式为：

遗忘门单元的权值和偏置变化量表达式为：

输入门单元的权值和偏置变化量表达式为：

输入挤压单元的权值和偏置变化量表达式为：

通过权值和偏置的变化量，对各个权值和偏置进行更新。在这里将所有的权值表示为w，所有的偏置表示为b，更新后的权值和偏置表达式如下：

其中，η为步长，默认值为0.01；β₁和β₂为矩估计的指数衰减速率，通常β₁为0.9，β₂为0.999；δ为一极小值，用于稳定数值，常用值为10^-8；s和r为初始化一阶和二阶矩变量，初始值设为0。

(5)测试样本集测试：将经过预处理的测试集数据输入参数自适应调整后的bi-LSTM网络中，将输出结果与标签进行对比得出样本正确识别率，并对网络做出评估。若网络满足鲁棒性，则将网络的参数保存；若网络不满足鲁棒性，则证明网络未训练好，增加训练样本，重复步骤(3)和步骤(4)，直至网络满足鲁棒性，得到参数最优化的bi-LSTM网络。

(6)实际应用：将矢量声纳接收到的待分类样本数据经过同样的预处理，将预处理后的数据输入参数最优化的bi-LSTM网络中，得到待分类样本的输出分类结果。

本发明提出了一种基于矢量声纳的双向长短时记忆神经网络水面目标识别方法，采用了具有双向记忆特性的双向长短时记忆(bi-LSTM)神经网络，将矢量声纳接收到的矢量信号经过预处理后输入双向长短时记忆神经网络中，通过bi-LSTM层进行特征提取，通过全连接层将学习到的特征映射到样本标记空间，通过softmax层进行归一化，通过分类层为输入数据打标签，从而完成对输入的矢量信号的分类识别。本发明通过双向长短时记忆神经网络可以自主的进行特征提取，克服了由于人工提取特征导致信息丢失的问题，避免了人工提取特征步骤的繁琐复杂，也减少了人工提取特征所需的时间。同时，通过多隐层的神经网络可以提高样本正确识别率。

Claims

1.一种双向长短时记忆神经网络水面目标识别方法，其特征是：

步骤1：将矢量声纳接收到的矢量信号进行预处理；

2.根据权利要求1所述的双向长短时记忆神经网络水面目标识别方法，其特征是所述的预处理的步骤为：

I(t)＝p(t)v(t) (1)

步骤5：将训练集和测试集的样本进行打标签。

3.根据权利要求1所述的双向长短时记忆神经网络水面目标识别方法，其特征是所述的网络预训练的步骤为：

步骤2.1：将双向长短时记忆神经网络参数初始化；

4.根据权利要求3所述的双向长短时记忆神经网络水面目标识别方法，其特征是所述的预训练的具体方法为：

双向长短时记忆网络分为前向网络和后向网络，

输入门控单元为输入门单元与做阿达马积，表达式为

此时得到的为反向网络的记忆块输出；

5.根据权利要求1所述的双向长短时记忆神经网络水面目标识别方法，其特征是所述的微调的步骤为：

6.根据权利要求5所述的双向长短时记忆神经网络水面目标识别方法，其特征是自适应参数调整的步骤为：

损失函数L_t的表达式为

其中，d_t为输入样本x_t的期望输出，

隐层到输出层的权值w_b和偏置b_b变化量表达式为：

输出门单元的权值和偏置变化量表达式为：

遗忘门单元的权值和偏置变化量表达式为：

输入门单元的权值和偏置变化量表达式为：

输入挤压单元的权值和偏置变化量表达式为：

在前向网络中，各参数变化量表达式如下：

隐层到输出层的权值w_f和偏置b变化量表达式为：

输出门单元的权值和偏置变化量表达式为：

遗忘门单元的权值和偏置变化量表达式为：

输入门单元的权值和偏置变化量表达式为：

输入挤压单元的权值和偏置变化量表达式为：

7.根据权利要求1所述的双向长短时记忆神经网络水面目标识别方法，其特征是所述的评估的步骤为：

8.根据权利要求1所述的双向长短时记忆神经网络水面目标识别方法，其特征是所述的得到分类结构的步骤为：

步骤5.1：将矢量声纳接收到的数据进行预处理；