CN112926382A - 一种改善目标聚类特性的深度学习激光水下目标识别仪 - Google Patents

一种改善目标聚类特性的深度学习激光水下目标识别仪 Download PDF

Info

Publication number
CN112926382A
CN112926382A CN202110025031.2A CN202110025031A CN112926382A CN 112926382 A CN112926382 A CN 112926382A CN 202110025031 A CN202110025031 A CN 202110025031A CN 112926382 A CN112926382 A CN 112926382A
Authority
CN
China
Prior art keywords
sample
loss
laser
data
underwater
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110025031.2A
Other languages
English (en)
Other versions
CN112926382B (zh
Inventor
吕以豪
王文海
高洁
卢建刚
陈金水
刘兴高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110025031.2A priority Critical patent/CN112926382B/zh
Publication of CN112926382A publication Critical patent/CN112926382A/zh
Application granted granted Critical
Publication of CN112926382B publication Critical patent/CN112926382B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Optical Radar Systems And Details Thereof (AREA)

Abstract

本发明公开了一种改善目标聚类特性的深度学习激光水下目标识别仪。它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成,所述水下激光扫描装置对待检测水下区域进行扫描,将所得激光点云数据传输至计算装置,将其转化为二维图像数据,再传输进储存装置进行存储,并由显示装置显示。本发明通过加入度量学习损失,可以引导网络减小提取到的同一类别目标的特征向量度量距离,增大不同目标之间特征向量的度量距离,从而改善网络对于激光水下目标数据的聚类效果,提高识别准确率。

Description

一种改善目标聚类特性的深度学习激光水下目标识别仪
技术领域
本发明涉及一种激光水下目标识别技术,具体地,涉及一种改善目标聚类特性的深度学习激光水下目标识别仪。
背景技术
激光水下目标识别技术是一项目前正在发展的先进的探测技术,它集激光技术、通信技术、信号处理与目标识别和电子技术等于一体,并且具有广阔的应用前景。对该技术的研究与开发无论是在理论上还是在实际应用上都具有十分重要的价值。自上世纪九十年代初期,美国"魔灯"系统在海湾战争中的卓越表现,使得激光水下目标识别技术成为各国争相研究的热点,是近二十年来海洋探测与开发的关键技术之一,在我国目前仍然处于实验室研究和实验分析阶段。
卷积神经网络(ConvNets)通常是在固定的资源预算下发展起来的,如果有更多的资源可用的话,则会扩大规模以获得更好的精度,比如可以提高网络深度(depth)、网络宽度(width)和输入图像分辨率(resolution)大小。但是通过人工去调整网络深度,宽度,图像分辨率的放大或缩小的很困难的,在计算量受限时有放大哪个缩小哪个,这些都是很难去确定的,换句话说,这样的组合空间太大,人力无法穷举。EfficientNet提出了一种新的模型缩放方法,它使用一个简单而高效的复合系数来从网络深度,宽度,图像分辨率三个维度放大网络,不会像传统的方法那样任意缩放网络的维度,基于神经结构搜索技术可以获得最优的一组参数。
度量学习主要通过损失函数提高上述特征向量的聚类特性,其中包括对比损失(Contrastive loss)、三元组损失(Triplet Loss)、四元组损失(Quadruplet loss),难样本三元组损失(TriHard Loss)和边界挖掘损失(MSML)等。上述损失函数主要通过减小每个训练批次中相同类别样本特征向量间的平均距离并增大不同类别样本特征向量间的平均距离,来实现更好的特征向量聚类效果。
发明内容
本发明的目的在于针对现有技术的不足,提供一种改善目标聚类特性的深度学习激光水下目标识别仪。
本发明的目的是通过以下技术方案来实现的:一种改善目标聚类特性的深度学习激光水下目标识别仪,它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成,所述水下激光扫描装置对待检测水下区域进行扫描,将所得激光点云数据传输至计算装置,将其转化为二维图像数据,再传输进储存装置进行存储,并由显示装置显示。
所述计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型,其识别过程如下:
(1)将激光点云数据处理为三通道的图片数据,输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。
(2)计算难样本三元组损失,其表达式如下:
Figure BDA0002890065110000021
其中,ph,nh分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本,将这两种样本称为最难的正样本与负样本。由式(1)可知,难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α,这会使网络形成对于输入样本集更好的聚类能力。
(3)计算半难样本三元组损失,其表达式如下:
Figure BDA0002890065110000022
其中,β=d(a,nh)是在训练过程中的每个批次里在线计算的,所以β对于每个训练批次来说是常数,对于不同的批次是变量。令LHTH对Ok,c,h,w求导,可得:
Figure BDA0002890065110000023
由式(3)可以看出,难的负样本在损失函数的偏导数中的影响已经被消除了,因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。
(4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加,得到可以显式地改善输入样本聚类效果的分类损失函数,其表达式如下:
Figure BDA0002890065110000024
其中,n为每个批次的样本数,y′i是一个批次中第i个样本的网络输出值。
本发明的技术构思为将提出的一种改善目标聚类特性的深度学习激光水下目标识别仪,利用结构高度优化的EfficientNet卷积神经网络识别激光水下目标。
本发明的有益效果主要表现在:所述的一种改善目标聚类特性的深度学习激光水下目标识别仪具有很快的推理速度,能够迅速高效准确地完成激光水下目标的识别。
附图说明
图1是改善目标聚类特性的深度学习激光水下目标识别仪的工作流程图。
具体实施方式
下面根据附图具体说明本发明。
图1是改善目标聚类特性的深度学习激光水下目标识别仪的工作流程,其具体实现过程是:
1)水下激光扫描装置在作业区域进行激光扫描,形成点云数据后通过线缆回传计算装置。
2)计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型和,其识别过程如下:
2.1)将激光点云数据处理为三通道的图片数据,输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。
2.2)计算难样本三元组损失,其表达式如下:
Figure BDA0002890065110000031
其中ph,nh分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本,将这两种样本称为最难的正样本与负样本。由式(1)可知,难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α,这会使网络形成对于输入样本集更好的聚类能力。
2.3)计算半难样本三元组损失,其表达式如下:
Figure BDA0002890065110000032
其中β=d(a,nh)是在训练过程中的每个批次里在线计算的,所以β对于每个训练批次来说是常数,对于不同的批次是变量。令LHTH对Ok,c,h,w求导,可得:
Figure BDA0002890065110000033
由式(3)可以看出,难的负样本在损失函数的偏导数中的影响已经被消除了,因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。
2.4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加,得到可以显式地改善输入样本聚类效果的分类损失函数,其表达式如下:
Figure BDA0002890065110000041
其中n为每个批次的样本数,y′i是一个批次中第i个样本的网络输出值。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (2)

1.一种改善目标聚类特性的深度学习激光水下目标识别仪,其特征在于,它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成,所述水下激光扫描装置对待检测水下区域进行扫描,将所得激光点云数据传输至计算装置,将其转化为二维图像数据,再传输进储存装置进行存储,并由显示装置显示。
2.根据权利要求1所述改善目标聚类特性的深度学习激光水下目标识别仪,其特征在于,所述计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型,其识别过程如下:
(1)将激光点云数据处理为三通道的图片数据,输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。
(2)计算难样本三元组损失,其表达式如下:
Figure FDA0002890065100000011
其中,ph,nh分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本,将这两种样本称为最难的正样本与负样本。由式(1)可知,难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α,这会使网络形成对于输入样本集更好的聚类能力。
(3)计算半难样本三元组损失,其表达式如下:
Figure FDA0002890065100000012
其中,β=d(a,nh)是在训练过程中的每个批次里在线计算的,所以β对于每个训练批次来说是常数,对于不同的批次是变量。令LHTH对Ok,c,h,w求导,可得:
Figure FDA0002890065100000013
由式(3)可以看出,难的负样本在损失函数的偏导数中的影响已经被消除了,因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。
(4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加,得到可以显式地改善输入样本聚类效果的分类损失函数,其表达式如下:
Figure FDA0002890065100000014
Figure FDA0002890065100000021
其中,n为每个批次的样本数,y′i是一个批次中第i个样本的网络输出值。
CN202110025031.2A 2021-01-08 2021-01-08 一种改善目标聚类特性的深度学习激光水下目标识别仪 Expired - Fee Related CN112926382B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110025031.2A CN112926382B (zh) 2021-01-08 2021-01-08 一种改善目标聚类特性的深度学习激光水下目标识别仪

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110025031.2A CN112926382B (zh) 2021-01-08 2021-01-08 一种改善目标聚类特性的深度学习激光水下目标识别仪

Publications (2)

Publication Number Publication Date
CN112926382A true CN112926382A (zh) 2021-06-08
CN112926382B CN112926382B (zh) 2022-06-24

Family

ID=76162797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110025031.2A Expired - Fee Related CN112926382B (zh) 2021-01-08 2021-01-08 一种改善目标聚类特性的深度学习激光水下目标识别仪

Country Status (1)

Country Link
CN (1) CN112926382B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113628170A (zh) * 2021-07-16 2021-11-09 武汉大学 一种基于深度学习的激光线提取方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140201126A1 (en) * 2012-09-15 2014-07-17 Lotfi A. Zadeh Methods and Systems for Applications for Z-numbers
CN107085733A (zh) * 2017-05-15 2017-08-22 山东工商学院 基于cnn深度学习的近岸红外舰船识别方法
CN108444447A (zh) * 2018-02-28 2018-08-24 哈尔滨工程大学 一种用于水下避障系统中的渔网实时自主检测方法
CN109479088A (zh) * 2017-06-02 2019-03-15 深圳市大疆创新科技有限公司 基于深度机器学习和激光雷达进行多目标跟踪和自动聚焦的系统和方法
CN109766811A (zh) * 2018-12-31 2019-05-17 复旦大学 一种星载sar图像中海面船只的端到端检测与识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140201126A1 (en) * 2012-09-15 2014-07-17 Lotfi A. Zadeh Methods and Systems for Applications for Z-numbers
CN107085733A (zh) * 2017-05-15 2017-08-22 山东工商学院 基于cnn深度学习的近岸红外舰船识别方法
CN109479088A (zh) * 2017-06-02 2019-03-15 深圳市大疆创新科技有限公司 基于深度机器学习和激光雷达进行多目标跟踪和自动聚焦的系统和方法
CN108444447A (zh) * 2018-02-28 2018-08-24 哈尔滨工程大学 一种用于水下避障系统中的渔网实时自主检测方法
CN109766811A (zh) * 2018-12-31 2019-05-17 复旦大学 一种星载sar图像中海面船只的端到端检测与识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
G HUANG ET AL: "Ship detection based on squeeze excitation skip-connection path networks for optical remote sensing images", 《NEUROCOMPUTING》 *
LI Q ET AL: "An application of expert system in recognition of radiated noise of underwater target", 《OCEANS》 *
刘朝晖等: "基于分形特征矢量的水下目标识别", 《系统工程与电子技术》 *
程文青等: "一种基于神经网络的激光水下目标探测方法", 《华中理工大学学报》 *
高丽等: "小波包和统计对消融合的激光水下图像目标识别", 《激光杂志》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113628170A (zh) * 2021-07-16 2021-11-09 武汉大学 一种基于深度学习的激光线提取方法及系统
CN113628170B (zh) * 2021-07-16 2023-08-25 武汉大学 一种基于深度学习的激光线提取方法及系统

Also Published As

Publication number Publication date
CN112926382B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN109871902B (zh) 一种基于超分辨率对抗生成级联网络的sar小样本识别方法
CN110472652B (zh) 基于语义引导的少量样本分类方法
CN110569782A (zh) 一种基于深度学习目标检测方法
Cheng et al. Improved SSD network for fast concealed object detection and recognition in passive terahertz security images
CN110516525A (zh) 基于gan和svm的sar图像目标识别方法
Karim et al. A brief review and challenges of object detection in optical remote sensing imagery
CN115311502A (zh) 基于多尺度双流架构的遥感图像小样本场景分类方法
CN112926382B (zh) 一种改善目标聚类特性的深度学习激光水下目标识别仪
CN113569687B (zh) 基于双流网络的场景分类方法、系统、设备及介质
Ma Improving SAR target recognition performance using multiple preprocessing techniques
Liu et al. A Multi-scale Feature Pyramid SAR Ship Detection Network with Robust Background Interference
Fu et al. Underwater small object detection in side-scan sonar images based on improved YOLOv5
WO2024011873A1 (zh) 目标检测方法、装置、电子设备及存储介质
CN116778341A (zh) 一种雷达图像多视角特征提取与鉴别方法
Zhao et al. A CCD based machine vision system for real-time text detection
Yin et al. Video text localization based on Adaboost
Wang et al. FPA-DNN: a forward propagation acceleration based deep neural network for ship detection
CN115272865A (zh) 一种基于自适应激活函数和注意力机制的目标检测方法
CN115564988A (zh) 基于标签平滑的遥感图像场景分类和语义分割任务的方法
Wang et al. Speed sign recognition in complex scenarios based on deep cascade networks
CN113723482A (zh) 基于多示例孪生网络的高光谱目标检测方法
Long et al. Accurate identification of infrared ship in island-shore background based on visual attention
TW202215367A (zh) 影像辨識方法及影像辨識系統
Yang et al. A multi-channel aggregation framework for object detection in large-scale sar image
Sinha et al. Scene image classification using a wigner-based local binary patterns descriptor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220624