CN112926382A - 一种改善目标聚类特性的深度学习激光水下目标识别仪 - Google Patents
一种改善目标聚类特性的深度学习激光水下目标识别仪 Download PDFInfo
- Publication number
- CN112926382A CN112926382A CN202110025031.2A CN202110025031A CN112926382A CN 112926382 A CN112926382 A CN 112926382A CN 202110025031 A CN202110025031 A CN 202110025031A CN 112926382 A CN112926382 A CN 112926382A
- Authority
- CN
- China
- Prior art keywords
- sample
- loss
- laser
- data
- underwater
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 11
- 230000000694 effects Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 10
- 238000003062 neural network model Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 3
- 238000006116 polymerization reaction Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Optical Radar Systems And Details Thereof (AREA)
Abstract
本发明公开了一种改善目标聚类特性的深度学习激光水下目标识别仪。它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成,所述水下激光扫描装置对待检测水下区域进行扫描,将所得激光点云数据传输至计算装置,将其转化为二维图像数据,再传输进储存装置进行存储,并由显示装置显示。本发明通过加入度量学习损失,可以引导网络减小提取到的同一类别目标的特征向量度量距离,增大不同目标之间特征向量的度量距离,从而改善网络对于激光水下目标数据的聚类效果,提高识别准确率。
Description
技术领域
本发明涉及一种激光水下目标识别技术,具体地,涉及一种改善目标聚类特性的深度学习激光水下目标识别仪。
背景技术
激光水下目标识别技术是一项目前正在发展的先进的探测技术,它集激光技术、通信技术、信号处理与目标识别和电子技术等于一体,并且具有广阔的应用前景。对该技术的研究与开发无论是在理论上还是在实际应用上都具有十分重要的价值。自上世纪九十年代初期,美国"魔灯"系统在海湾战争中的卓越表现,使得激光水下目标识别技术成为各国争相研究的热点,是近二十年来海洋探测与开发的关键技术之一,在我国目前仍然处于实验室研究和实验分析阶段。
卷积神经网络(ConvNets)通常是在固定的资源预算下发展起来的,如果有更多的资源可用的话,则会扩大规模以获得更好的精度,比如可以提高网络深度(depth)、网络宽度(width)和输入图像分辨率(resolution)大小。但是通过人工去调整网络深度,宽度,图像分辨率的放大或缩小的很困难的,在计算量受限时有放大哪个缩小哪个,这些都是很难去确定的,换句话说,这样的组合空间太大,人力无法穷举。EfficientNet提出了一种新的模型缩放方法,它使用一个简单而高效的复合系数来从网络深度,宽度,图像分辨率三个维度放大网络,不会像传统的方法那样任意缩放网络的维度,基于神经结构搜索技术可以获得最优的一组参数。
度量学习主要通过损失函数提高上述特征向量的聚类特性,其中包括对比损失(Contrastive loss)、三元组损失(Triplet Loss)、四元组损失(Quadruplet loss),难样本三元组损失(TriHard Loss)和边界挖掘损失(MSML)等。上述损失函数主要通过减小每个训练批次中相同类别样本特征向量间的平均距离并增大不同类别样本特征向量间的平均距离,来实现更好的特征向量聚类效果。
发明内容
本发明的目的在于针对现有技术的不足,提供一种改善目标聚类特性的深度学习激光水下目标识别仪。
本发明的目的是通过以下技术方案来实现的:一种改善目标聚类特性的深度学习激光水下目标识别仪,它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成,所述水下激光扫描装置对待检测水下区域进行扫描,将所得激光点云数据传输至计算装置,将其转化为二维图像数据,再传输进储存装置进行存储,并由显示装置显示。
所述计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型,其识别过程如下:
(1)将激光点云数据处理为三通道的图片数据,输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。
(2)计算难样本三元组损失,其表达式如下:
其中,ph,nh分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本,将这两种样本称为最难的正样本与负样本。由式(1)可知,难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α,这会使网络形成对于输入样本集更好的聚类能力。
(3)计算半难样本三元组损失,其表达式如下:
其中,β=d(a,nh)是在训练过程中的每个批次里在线计算的,所以β对于每个训练批次来说是常数,对于不同的批次是变量。令LHTH对Ok,c,h,w求导,可得:
由式(3)可以看出,难的负样本在损失函数的偏导数中的影响已经被消除了,因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。
(4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加,得到可以显式地改善输入样本聚类效果的分类损失函数,其表达式如下:
其中,n为每个批次的样本数,y′i是一个批次中第i个样本的网络输出值。
本发明的技术构思为将提出的一种改善目标聚类特性的深度学习激光水下目标识别仪,利用结构高度优化的EfficientNet卷积神经网络识别激光水下目标。
本发明的有益效果主要表现在:所述的一种改善目标聚类特性的深度学习激光水下目标识别仪具有很快的推理速度,能够迅速高效准确地完成激光水下目标的识别。
附图说明
图1是改善目标聚类特性的深度学习激光水下目标识别仪的工作流程图。
具体实施方式
下面根据附图具体说明本发明。
图1是改善目标聚类特性的深度学习激光水下目标识别仪的工作流程,其具体实现过程是:
1)水下激光扫描装置在作业区域进行激光扫描,形成点云数据后通过线缆回传计算装置。
2)计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型和,其识别过程如下:
2.1)将激光点云数据处理为三通道的图片数据,输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。
2.2)计算难样本三元组损失,其表达式如下:
其中ph,nh分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本,将这两种样本称为最难的正样本与负样本。由式(1)可知,难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α,这会使网络形成对于输入样本集更好的聚类能力。
2.3)计算半难样本三元组损失,其表达式如下:
其中β=d(a,nh)是在训练过程中的每个批次里在线计算的,所以β对于每个训练批次来说是常数,对于不同的批次是变量。令LHTH对Ok,c,h,w求导,可得:
由式(3)可以看出,难的负样本在损失函数的偏导数中的影响已经被消除了,因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。
2.4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加,得到可以显式地改善输入样本聚类效果的分类损失函数,其表达式如下:
其中n为每个批次的样本数,y′i是一个批次中第i个样本的网络输出值。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (2)
1.一种改善目标聚类特性的深度学习激光水下目标识别仪,其特征在于,它由依次相连的水下激光扫描装置、计算装置、储存装置、显示装置组成,所述水下激光扫描装置对待检测水下区域进行扫描,将所得激光点云数据传输至计算装置,将其转化为二维图像数据,再传输进储存装置进行存储,并由显示装置显示。
2.根据权利要求1所述改善目标聚类特性的深度学习激光水下目标识别仪,其特征在于,所述计算装置中集成了结合改进的度量学习损失函数的EfficientNet卷积神经网络模型,其识别过程如下:
(1)将激光点云数据处理为三通道的图片数据,输入储存在数据存储装置中的结合改进的度量学习损失函数的EfficientNet卷积神经网络模型。
(2)计算难样本三元组损失,其表达式如下:
其中,ph,nh分别表示一个批次中相对于锚样本特征向量度量距离最远的正样本与最近的负样本,将这两种样本称为最难的正样本与负样本。由式(1)可知,难样本三元组损失进一步提高了对于类内聚合与类间分离程度的要求。即要求每个训练批次中与锚样本距离最远的正样本特征向量的度量距离比与锚样本距离最近的负样本的特征向量的度量距离小至少α,这会使网络形成对于输入样本集更好的聚类能力。
(3)计算半难样本三元组损失,其表达式如下:
其中,β=d(a,nh)是在训练过程中的每个批次里在线计算的,所以β对于每个训练批次来说是常数,对于不同的批次是变量。令LHTH对Ok,c,h,w求导,可得:
由式(3)可以看出,难的负样本在损失函数的偏导数中的影响已经被消除了,因此网络可以将注意力集中于学习同类输入数据中的相似特征从而更好地实现特征向量的内部聚合。式(3)中仍然有一个阈值α。半难样本三元组损失可以很好地改善输入数据的聚类情况。
(4)将上文中的难样本三元组损失、半难样本三元组损失与分类网络常用的交叉熵损失相加,得到可以显式地改善输入样本聚类效果的分类损失函数,其表达式如下:
其中,n为每个批次的样本数,y′i是一个批次中第i个样本的网络输出值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110025031.2A CN112926382B (zh) | 2021-01-08 | 2021-01-08 | 一种改善目标聚类特性的深度学习激光水下目标识别仪 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110025031.2A CN112926382B (zh) | 2021-01-08 | 2021-01-08 | 一种改善目标聚类特性的深度学习激光水下目标识别仪 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926382A true CN112926382A (zh) | 2021-06-08 |
CN112926382B CN112926382B (zh) | 2022-06-24 |
Family
ID=76162797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110025031.2A Expired - Fee Related CN112926382B (zh) | 2021-01-08 | 2021-01-08 | 一种改善目标聚类特性的深度学习激光水下目标识别仪 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926382B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113628170A (zh) * | 2021-07-16 | 2021-11-09 | 武汉大学 | 一种基于深度学习的激光线提取方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140201126A1 (en) * | 2012-09-15 | 2014-07-17 | Lotfi A. Zadeh | Methods and Systems for Applications for Z-numbers |
CN107085733A (zh) * | 2017-05-15 | 2017-08-22 | 山东工商学院 | 基于cnn深度学习的近岸红外舰船识别方法 |
CN108444447A (zh) * | 2018-02-28 | 2018-08-24 | 哈尔滨工程大学 | 一种用于水下避障系统中的渔网实时自主检测方法 |
CN109479088A (zh) * | 2017-06-02 | 2019-03-15 | 深圳市大疆创新科技有限公司 | 基于深度机器学习和激光雷达进行多目标跟踪和自动聚焦的系统和方法 |
CN109766811A (zh) * | 2018-12-31 | 2019-05-17 | 复旦大学 | 一种星载sar图像中海面船只的端到端检测与识别方法 |
-
2021
- 2021-01-08 CN CN202110025031.2A patent/CN112926382B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140201126A1 (en) * | 2012-09-15 | 2014-07-17 | Lotfi A. Zadeh | Methods and Systems for Applications for Z-numbers |
CN107085733A (zh) * | 2017-05-15 | 2017-08-22 | 山东工商学院 | 基于cnn深度学习的近岸红外舰船识别方法 |
CN109479088A (zh) * | 2017-06-02 | 2019-03-15 | 深圳市大疆创新科技有限公司 | 基于深度机器学习和激光雷达进行多目标跟踪和自动聚焦的系统和方法 |
CN108444447A (zh) * | 2018-02-28 | 2018-08-24 | 哈尔滨工程大学 | 一种用于水下避障系统中的渔网实时自主检测方法 |
CN109766811A (zh) * | 2018-12-31 | 2019-05-17 | 复旦大学 | 一种星载sar图像中海面船只的端到端检测与识别方法 |
Non-Patent Citations (5)
Title |
---|
G HUANG ET AL: "Ship detection based on squeeze excitation skip-connection path networks for optical remote sensing images", 《NEUROCOMPUTING》 * |
LI Q ET AL: "An application of expert system in recognition of radiated noise of underwater target", 《OCEANS》 * |
刘朝晖等: "基于分形特征矢量的水下目标识别", 《系统工程与电子技术》 * |
程文青等: "一种基于神经网络的激光水下目标探测方法", 《华中理工大学学报》 * |
高丽等: "小波包和统计对消融合的激光水下图像目标识别", 《激光杂志》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113628170A (zh) * | 2021-07-16 | 2021-11-09 | 武汉大学 | 一种基于深度学习的激光线提取方法及系统 |
CN113628170B (zh) * | 2021-07-16 | 2023-08-25 | 武汉大学 | 一种基于深度学习的激光线提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112926382B (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109871902B (zh) | 一种基于超分辨率对抗生成级联网络的sar小样本识别方法 | |
CN110472652B (zh) | 基于语义引导的少量样本分类方法 | |
CN110569782A (zh) | 一种基于深度学习目标检测方法 | |
Cheng et al. | Improved SSD network for fast concealed object detection and recognition in passive terahertz security images | |
CN110516525A (zh) | 基于gan和svm的sar图像目标识别方法 | |
Karim et al. | A brief review and challenges of object detection in optical remote sensing imagery | |
CN115311502A (zh) | 基于多尺度双流架构的遥感图像小样本场景分类方法 | |
CN112926382B (zh) | 一种改善目标聚类特性的深度学习激光水下目标识别仪 | |
CN113569687B (zh) | 基于双流网络的场景分类方法、系统、设备及介质 | |
Ma | Improving SAR target recognition performance using multiple preprocessing techniques | |
Liu et al. | A Multi-scale Feature Pyramid SAR Ship Detection Network with Robust Background Interference | |
Fu et al. | Underwater small object detection in side-scan sonar images based on improved YOLOv5 | |
WO2024011873A1 (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN116778341A (zh) | 一种雷达图像多视角特征提取与鉴别方法 | |
Zhao et al. | A CCD based machine vision system for real-time text detection | |
Yin et al. | Video text localization based on Adaboost | |
Wang et al. | FPA-DNN: a forward propagation acceleration based deep neural network for ship detection | |
CN115272865A (zh) | 一种基于自适应激活函数和注意力机制的目标检测方法 | |
CN115564988A (zh) | 基于标签平滑的遥感图像场景分类和语义分割任务的方法 | |
Wang et al. | Speed sign recognition in complex scenarios based on deep cascade networks | |
CN113723482A (zh) | 基于多示例孪生网络的高光谱目标检测方法 | |
Long et al. | Accurate identification of infrared ship in island-shore background based on visual attention | |
TW202215367A (zh) | 影像辨識方法及影像辨識系統 | |
Yang et al. | A multi-channel aggregation framework for object detection in large-scale sar image | |
Sinha et al. | Scene image classification using a wigner-based local binary patterns descriptor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220624 |