CN112926382A

CN112926382A - 一种改善目标聚类特性的深度学习激光水下目标识别仪

Info

Publication number: CN112926382A
Application number: CN202110025031.2A
Authority: CN
Inventors: 吕以豪; 王文海; 高洁; 卢建刚; 陈金水; 刘兴高
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-01-08
Filing date: 2021-01-08
Publication date: 2021-06-08
Anticipated expiration: 2041-01-08
Also published as: CN112926382B

Abstract

本发明公开了一种改善目标聚类特性的深度学习激光水下目标识别仪。它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成，所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云数据传输至计算装置，将其转化为二维图像数据，再传输进储存装置进行存储，并由显示装置显示。本发明通过加入度量学习损失，可以引导网络减小提取到的同一类别目标的特征向量度量距离，增大不同目标之间特征向量的度量距离，从而改善网络对于激光水下目标数据的聚类效果，提高识别准确率。

Description

一种改善目标聚类特性的深度学习激光水下目标识别仪

技术领域

本发明涉及一种激光水下目标识别技术，具体地，涉及一种改善目标聚类特性的深度学习激光水下目标识别仪。

背景技术

激光水下目标识别技术是一项目前正在发展的先进的探测技术，它集激光技术、通信技术、信号处理与目标识别和电子技术等于一体，并且具有广阔的应用前景。对该技术的研究与开发无论是在理论上还是在实际应用上都具有十分重要的价值。自上世纪九十年代初期，美国"魔灯"系统在海湾战争中的卓越表现，使得激光水下目标识别技术成为各国争相研究的热点，是近二十年来海洋探测与开发的关键技术之一，在我国目前仍然处于实验室研究和实验分析阶段。

卷积神经网络(ConvNets)通常是在固定的资源预算下发展起来的，如果有更多的资源可用的话，则会扩大规模以获得更好的精度，比如可以提高网络深度(depth)、网络宽度(width)和输入图像分辨率(resolution)大小。但是通过人工去调整网络深度，宽度，图像分辨率的放大或缩小的很困难的，在计算量受限时有放大哪个缩小哪个，这些都是很难去确定的，换句话说，这样的组合空间太大，人力无法穷举。EfficientNet提出了一种新的模型缩放方法，它使用一个简单而高效的复合系数来从网络深度，宽度，图像分辨率三个维度放大网络，不会像传统的方法那样任意缩放网络的维度，基于神经结构搜索技术可以获得最优的一组参数。

度量学习主要通过损失函数提高上述特征向量的聚类特性，其中包括对比损失(Contrastive loss)、三元组损失(Triplet Loss)、四元组损失(Quadruplet loss)，难样本三元组损失(TriHard Loss)和边界挖掘损失(MSML)等。上述损失函数主要通过减小每个训练批次中相同类别样本特征向量间的平均距离并增大不同类别样本特征向量间的平均距离，来实现更好的特征向量聚类效果。

发明内容

本发明的目的在于针对现有技术的不足，提供一种改善目标聚类特性的深度学习激光水下目标识别仪。

本发明的目的是通过以下技术方案来实现的：一种改善目标聚类特性的深度学习激光水下目标识别仪，它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成，所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云数据传输至计算装置，将其转化为二维图像数据，再传输进储存装置进行存储，并由显示装置显示。

所述计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型，其识别过程如下：

(1)将激光点云数据处理为三通道的图片数据，输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。

(2)计算难样本三元组损失，其表达式如下：

其中，p_h,n_h分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本，将这两种样本称为最难的正样本与负样本。由式(1)可知，难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α，这会使网络形成对于输入样本集更好的聚类能力。

(3)计算半难样本三元组损失，其表达式如下：

其中，β＝d(a,n_h)是在训练过程中的每个批次里在线计算的，所以β对于每个训练批次来说是常数，对于不同的批次是变量。令L_HTH对O_k,c,h,w求导，可得：

由式(3)可以看出，难的负样本在损失函数的偏导数中的影响已经被消除了，因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。

(4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加，得到可以显式地改善输入样本聚类效果的分类损失函数，其表达式如下：

其中，n为每个批次的样本数，y′_i是一个批次中第i个样本的网络输出值。

本发明的技术构思为将提出的一种改善目标聚类特性的深度学习激光水下目标识别仪，利用结构高度优化的EfficientNet卷积神经网络识别激光水下目标。

本发明的有益效果主要表现在：所述的一种改善目标聚类特性的深度学习激光水下目标识别仪具有很快的推理速度，能够迅速高效准确地完成激光水下目标的识别。

附图说明

图1是改善目标聚类特性的深度学习激光水下目标识别仪的工作流程图。

具体实施方式

下面根据附图具体说明本发明。

图1是改善目标聚类特性的深度学习激光水下目标识别仪的工作流程，其具体实现过程是：

1)水下激光扫描装置在作业区域进行激光扫描，形成点云数据后通过线缆回传计算装置。

2)计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型和，其识别过程如下：

2.1)将激光点云数据处理为三通道的图片数据，输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。

2.2)计算难样本三元组损失，其表达式如下：

其中p_h,n_h分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本，将这两种样本称为最难的正样本与负样本。由式(1)可知，难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α，这会使网络形成对于输入样本集更好的聚类能力。

2.3)计算半难样本三元组损失，其表达式如下：

其中β＝d(a,n_h)是在训练过程中的每个批次里在线计算的，所以β对于每个训练批次来说是常数，对于不同的批次是变量。令L_HTH对O_k,c,h,w求导，可得：

2.4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加，得到可以显式地改善输入样本聚类效果的分类损失函数，其表达式如下：

其中n为每个批次的样本数，y′_i是一个批次中第i个样本的网络输出值。

上述实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。

Claims

1.一种改善目标聚类特性的深度学习激光水下目标识别仪，其特征在于，它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成，所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云数据传输至计算装置，将其转化为二维图像数据，再传输进储存装置进行存储，并由显示装置显示。

2.根据权利要求1所述改善目标聚类特性的深度学习激光水下目标识别仪，其特征在于，所述计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型，其识别过程如下：

(2)计算难样本三元组损失，其表达式如下：

(3)计算半难样本三元组损失，其表达式如下：