CN109655815B - 基于ssd的声呐目标检测方法 - Google Patents

基于ssd的声呐目标检测方法 Download PDF

Info

Publication number
CN109655815B
CN109655815B CN201811407252.0A CN201811407252A CN109655815B CN 109655815 B CN109655815 B CN 109655815B CN 201811407252 A CN201811407252 A CN 201811407252A CN 109655815 B CN109655815 B CN 109655815B
Authority
CN
China
Prior art keywords
layer
target
sonar
frame
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811407252.0A
Other languages
English (en)
Other versions
CN109655815A (zh
Inventor
孔万增
洪吉晨
贾明洋
陈威
于金帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Weiyi Mingda Information Technology Co ltd
Yunnan Poly Tiantong Underwater Equipment Technology Co ltd
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201811407252.0A priority Critical patent/CN109655815B/zh
Publication of CN109655815A publication Critical patent/CN109655815A/zh
Application granted granted Critical
Publication of CN109655815B publication Critical patent/CN109655815B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/52Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00
    • G01S7/523Details of pulse systems
    • G01S7/526Receivers
    • G01S7/527Extracting wanted echo signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • G01S15/89Sonar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/52Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00
    • G01S7/523Details of pulse systems
    • G01S7/526Receivers
    • G01S7/53Means for transforming coordinates or for evaluating data, e.g. using computers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/52Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00
    • G01S7/534Details of non-pulse systems
    • G01S7/536Extracting wanted echo signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了基于SSD的声呐目标检测方法。当下的水下目标检测识别方法难以精准的同步识别多个目标。本发明如下:一、建立SSD神经网络模型。二、用需要被识别的声呐数据生成n张被测声呐图像。三、将被测声呐图像送入SSD神经网络模型,获取特征图。四、对特征图设置检测框。五、将检测框输入两个卷积核,获取检测框针对各个目标类别的类别分数以及形状偏移量。六、确定被测声呐图像含有的目标类型,并框选出所有目标。本发明将深度学习技术融入到声呐目标检测中,将声呐数据生成的声呐图像输入SSD神经网络模型中,在模型中一次性完成特征提取、目标检测、目标分类,从而大大提高检测速度。

Description

基于SSD的声呐目标检测方法
技术领域
本发明属于人工智能与水声电子信息的交叉技术领域,具体涉及一种基于深度学习的三维成像声呐目标检测方法。
背景技术
随着科技信息技术的不断迭代与发展,近年来水下探测技术得到了极大的促进,有着广泛的应用领域,如军事方面的小目标防御、危险目标排查、目标跟踪等;在其他领域还有海底资源勘探测量,濒危生物的跟踪与保护,海床建模等重大作用。
水下目标检测识别是现代声呐系统和水声对抗的重要部分,是每个国家海上安防的研究重点,一直受到学者,技术人员和军事部门的广泛关注,也是我国海军目前急需解决的关键技术之一。水下目标检测识别是基于声呐,信息科学,计算机科学,人工智能等领域的一项不断发展的重要技术。为了提高海底不同大小,形状目标检测的精度和效率,谋求军事和民用优势,声呐目标检测识别方法在不断创新。近年来,水下目标检测识别方法主要如下:
1)基于经验论断的目标识别
2)基于信号分析专家系统的目标识别
3)基于模板匹配的目标识别
4)基于浅层神经网络的目标识别
由于水下环境复杂,声呐设备的非线性成像,采集到的水下三维成像声呐
对比度和信噪比较低,受噪声影响大,当下的水下目标检测识别方法在这种情况下仍然有着许多瓶颈,如声呐图像目标特征提取不彻底或提取速度慢、水下小目标因对比度和信噪比低被误检或漏检,无法取得高精度,强鲁棒性,系统实时性的同时兼顾,针对其他传统深度学习目标检测网络模型过大,参数庞大,运行内存较高,速度较慢,应用范围狭隘的问题,本设计以mobilenet网络为特征提取的基础网络,采用一种流线型结构使用深度可分离卷积(,Depthwise Separable convolutions)来构造轻型权重深度神经网络,在保证精度的前提下,有效减少了模型参数量,加快了检测速度,满足移动端应用的要求。
2006年,Geoffrey Hinton提出了深度学习。之后深度学习在诸多领域取得了巨大成功,受到广泛关注。2012年,Hinton的研究小组采用深度学习赢得了ImageNet图像分类的比赛,把错误率大幅降到15.315%,遥遥领先于传统图像处理方法,完成了深度学习在计算机领域最具影响力的突破。同时,深度学习在目标识别领域的应用不断取得发展,在ILSVRC2014比赛中,获胜者GooLeNet将top5错误率降到6.656%。时至2017年7月,深度学习算法SE-ResNeXt-152的该数据集的Top-5错误率仅为2.251%,已经远远超越了人工标注的错误率(5%)。不光在图像分类领域,深度学习在人脸识别、物体检测、视频分析等多个领域均取得令人惊叹的效果。现如今,Google、微软、百度等知名的拥有大数据的高科技公司争相投入资源,占领深度学习的技术制高点,应用于各种领域取得了许多优秀的成果。以上种种证明了深度学习技术有着巨大的潜力和优越性。通过对前沿深度学习方法的调研分析,为了解决近年来水下目标检测识别的瓶颈问题,本发明提出基于深度学习技术的三维成像声呐图像目标检测方法,并在普通深度学习目标检测方法上对特征提取网络进行了改进,选取速度较快,参数较小的轻量级网络mobilenet,有效减小了检测时间。
发明内容
本发明的目的在于提供基于Single Shot MultiBox Detector mobilenet的声呐图像小目标检测识别方法。
本发明具体如下:
步骤一、建立SSD神经网络模型,SSD神经网络模型包括共享卷积层、卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17和全连接层。将大于1000张训练用的声呐图像输入SSD神经网络模型进行训练。训练用的声呐图像中共包含有a种类别的目标。
步骤二、用需要被识别的声呐数据生成n张被测声呐图像,并将n张被测声呐图像缩放至相同大小。i=1,2,…,n,依次执行步骤三至七。
步骤三、将第i张被测声呐图像送入SSD的共享卷积层,得到第一层特征图。
步骤四、将步骤二所得的第一层特征图依次通入卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17。卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17分别输出第二层特征图、第三层特征图、第四层特征图、第五层特征图、第六层特征图。
步骤五、对第一层特征图、第二层特征图、第三层特征图、第四层特征图、第五层特征图、第六层特征图上的每个像素点均设置六个检测框。第k层特征图内所有像素点对应的前五个检测框的大小均为Sk;Sk的表达式如下:
Figure BDA0001877666150000031
其中,Smin的取值为0.2;Smax的取值为0.9;Sk为四舍五入所得值。
第k层特征图内所有像素点对应的第六个检测框的大小均为
Figure BDA0001877666150000032
Figure BDA0001877666150000033
其中,S7=312。
前五个检测框的长宽比分别为1、2、3、1/2、1/3。第六个检测框的长宽比分别为1。
步骤六、j=1,2,…,6,依次执行步骤七。
步骤七、将步骤五所得的第j层特征图内所有的检测框分别通入第一卷积核和第二卷积核。第一卷积核的尺寸为3×3×pj×2,pj为被第j层特征图的层数;第二卷积核的尺寸为3×3×pj×4,pj为被第j层特征图的层数。每个检测框均输出一个特征向量。特征向量包括对应检测框针对各个目标类别的类别分数以及形状偏移量。形状偏移量包括横坐标偏移量、纵坐标偏移量、长度偏移量和宽度偏移量。
步骤八、将步骤六和七所得的所有特征向量均送入全连接层。全连接层将所有特征向量内的类别分数归一化,得到各检测框中获得针对a个目标类别的a个概率。保留各检测框的a个概率中的最大值,将其余a-1个概率均置为0。
步骤九、将1赋值给j。
步骤十、若存在一个或多个检测框针对第j个目标类别的概率大于阈值s,则判断第i张被测声呐图像中存在属于第j个目标类别的目标,针对第j个目标类别的概率大于阈值s的检测框作为特征检测框,进入步骤十一。s的值取0.8~0.97。否则直接进入步骤十四。
步骤十一、将步骤十获得的多个特征检测框分为bj个特征框群。互相之间相交的特征检测框组成一个特征框群。将1赋值给l进入步骤十二。
步骤十二、通过非极大值抑制算法选取第l个特征框群中针对第j个目标类别的概率最大的特征检测框作为第l个目标检测框。在第i张被测声呐图像上框选出几何中心位于第
Figure BDA0001877666150000041
行第
Figure BDA0001877666150000042
列,长度为gw,宽度为gw的目标框。之后进入步骤十三。
其中,
Figure BDA0001877666150000043
Figure BDA0001877666150000044
为第l个目标检测框的横坐标偏移量;
Figure BDA0001877666150000045
为第l个目标检测框的纵坐标偏移量;
Figure BDA0001877666150000046
为第l个目标检测框的长度偏移量;
Figure BDA0001877666150000047
为第l个目标检测框的宽度偏移量;
Figure BDA0001877666150000048
均在步骤七中计算得到。
Figure BDA0001877666150000049
为特征检测框集合中心的横坐标;
Figure BDA00018776661500000410
为特征检测框几何中心的纵坐标;
Figure BDA00018776661500000411
为特征检测框的长度;
Figure BDA00018776661500000412
为特征检测框的宽度。
步骤十三、若l<bj,则将l增大1,并重复执行步骤十二;否则,进入步骤十四。
步骤十四、若j<a,则将j增大1,并重复执行步骤十至十三;否则,识别结束。
进一步地,所述的共享卷积层选用MobileNet。
进一步地,所述训练用的声呐图像中目标的类别和位置已知。
进一步地,步骤一中,将训练用的声呐图像导入SSD神经网络模型进行训练的步骤具体如下:将训练用的声呐图像输入共享卷积层,依次传输经过卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17、全连接层,得到概率和偏置数值,从而完成目标分类和边框回归;通过与训练用的声呐图像的真实类别和边框位置计算损失值;再用反向传播算法和梯度下降算法对SSD神经网络模型内所有的权值进行更新。
本发明具有的有益效果是:
1、本发明将深度学习技术融入到声呐目标检测中,将声呐数据生成的声呐图像输入SSD神经网络模型中,在模型中一次性完成特征提取、目标检测、目标分类,从而大大提高检测速度。
2、本发明使用的SSD神经网络模型对声呐图像进行多次卷积、池化,相比于传统方法和浅层神经网络,可以提取到更多的深层次特征,从根本上优化了目标分类,回归。
3、本发明选取的MobileNet网络,运用深度可分离卷积,在保证精度的前提下,具有计算量小,速度快,效率高的特点。
4、本发明从不同层抽取抽取不同尺度特征图进行多尺度预测,在不增加额外计算量的同时,大大增加小目标的检测概率。
5、本发明将水下目标检测识别一体化,通过一个深度网络模型完成水下目标检测识别,相较于需要在多个处理流程分开处理来进行目标识别的传统方法,大大简化水下目标检测的流程。
附图说明
图1为本发明针对单张声呐图像的识别流程图;
图2为本发明总体损失曲线图;
图3(a)-3(h)为中船重工715研究所在南海实验做采集的海底线状及柱状目标声呐图,其中包括油管,掩埋雷以及海底现状威胁设施。
图4(a)-4(h)分别为通过本发明对图3(a)-3(h)进行目标识别定位的效果图。
具体实施方式
以下结合附图对本发明作进一步说明。
如图1所示,基于SSD的声呐目标检测方法具体如下:
步骤一、如图1所示,建立SSD神经网络模型(Single Shot MultiBox Detector),SSD神经网络模型包括共享卷积层(base network网络)、卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17和全连接层。共享卷积层选用MobileNet。用2000张训练用的声呐图像输入SSD神经网络模型进行150000轮训练,完成SSD神经网络模型的训练。2000张训练用的声呐图像中共包含有a种类别的目标。训练用的声呐图像中目标的类别和位置已知。从图2可以看出,本发明的SSD网络模型在训练过程中,总体损失随着训练迭代次数的增加不断下降,说明模型参数不断被修正。
将训练用的声呐图像导入SSD神经网络模型进行训练的步骤具体如下:将训练用的声呐图像输入共享卷积层,依次传输经过卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17、全连接层,得到概率(Softmax)和偏置数值,从而完成目标分类和边框回归;通过与训练用的声呐图像的真实类别和边框位置计算损失值loss;再用反向传播算法(Back-Propagation,BP)和梯度下降算法(StochasticGradient descent,SGD)对SSD神经网络模型内所有的权值进行更新。
步骤二、三维成像声呐数据预处理。针对三维成像声呐采集到的声呐数据,通过指定协议格式,使用MATLAB软件编写的解析数程序,生成n张被测声呐图像。从原始声呐数据中解析出声呐图像属于现有成熟技术,故不详解。并将n张被测声呐图像缩放至相同大小。i=1,2,…,n,依次执行步骤三至七。
步骤三、将第i张被测声呐图像送入SSD的共享卷积层,得到第一层特征图。共享卷积层对第i张被测声呐图像进行了多次卷积、池化操作。
步骤四、将步骤二所得的第一层特征图依次通入卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17分别得到第二层特征图、第三层特征图(卷积层conv14_2输出)、第四层特征图(卷积层conv15_2输出)、第五层特征图(卷积层conv16_2输出)、第六层特征图(卷积层conv17_2输出)。
步骤五、对第一层特征图、第二层特征图、第三层特征图、第四层特征图、第五层特征图、第六层特征图上的每个像素点分别设置六个检测框。第k层特征图内所有像素点对应的前五个检测框的大小(即分辨率,单位为像素)均为Sk;Sk的表达式如下:
Figure BDA0001877666150000061
其中,Smin的取值为0.2;Smax的取值为0.9;Sk为四舍五入所得值。
第k层特征图内所有像素点对应的第六个检测框的大小均为
Figure BDA0001877666150000062
Figure BDA0001877666150000063
其中,
Figure BDA0001877666150000064
前五个检测框的长宽比分别为1、2、3、1/2、1/3。第六个检测框的长宽比分别为1。
步骤六、j=1,2,…,6,依次执行步骤七。
步骤七、将步骤五所得的第j层特征图内所有的检测框分别通入第一卷积核和第二卷积核。第一卷积核的尺寸为3×3×pj×2,pj为被第j层特征图的层数(即通道数);第二卷积核的尺寸为3×3×pj×4,pj为被第j层特征图的层数(即通道数)。第一卷积核用于输出分类用的置信度(confidence);第二卷积核用于输出回归用的边框定位(localization)。每个检测框均输出一个特征向量。特征向量包括对应检测框针对各个目标类别的类别分数score(即置信度,若训练时输入了十个不同类别的目标,则每个检测框输出与十个类别分别对应的十个分数)以及形状偏移量offset。形状偏移量offset包括横坐标偏移量、纵坐标偏移量、长度偏移量和宽度偏移量。
步骤八、将步骤六和七所得的所有特征向量均送入用于分类和回归的全连接层。全连接层通过归一化指数函数(Softmax函数)将所有特征向量内的类别分数score归一化,得到各检测框中获得针对a个目标类别的a个概率(一个检测框具有分别针对a个目标类别的a个概率)。保留各检测框的a个概率中的最大值,以及其对应的目标类别,将其余a-1个概率均置为0。
步骤九、将1赋值给j。确定出第i张被测声呐图像内所含目标的类别并框选出各个目标。
步骤十、若存在一个或多个检测框针对第j个目标类别的概率大于阈值s,则判断第i张被测声呐图像中存在属于第j个目标类别的目标,针对第j个目标类别的概率大于阈值s的检测框作为特征检测框,进入步骤十一。s的值取0.95。否则直接进入步骤十四。
步骤十一、将步骤十获得的多个特征检测框分为bj个特征框群。互相之间相交的特征检测框组成一个特征框群(即两个特征框群内的特征检测框互不相交)。将1赋值给l进入步骤十二。
步骤十二、通过非极大值抑制算法(NMS)选取第l个特征框群中针对第j个目标类别的概率最大的特征检测框作为第l个目标检测框。在第i张被测声呐图像上框选出几何中心位于第
Figure BDA0001877666150000071
行第
Figure BDA0001877666150000072
列(即坐标为
Figure BDA0001877666150000073
),长度为gw,宽度为gw的目标框。目标框对应第j个目标类别的目标。之后进入步骤十三。
其中,
Figure BDA0001877666150000081
Figure BDA0001877666150000082
为第l个目标检测框的横坐标偏移量;
Figure BDA0001877666150000083
为第l个目标检测框的纵坐标偏移量;
Figure BDA0001877666150000084
为第l个目标检测框的长度偏移量;
Figure BDA0001877666150000085
为第l个目标检测框的宽度偏移量;
Figure BDA0001877666150000086
均在步骤七中计算得到。
Figure BDA0001877666150000087
为特征检测框集合中心的横坐标;
Figure BDA0001877666150000088
为特征检测框几何中心的纵坐标;
Figure BDA0001877666150000089
为特征检测框的长度;
Figure BDA00018776661500000810
为特征检测框的宽度。
步骤十三、若l<bj,则将l增大1,并重复执行步骤十二;否则,进入步骤十四。
步骤十四、若j<a,则将j增大1,并重复执行步骤十至十三;否则,识别结束。

Claims (4)

1.基于SSD的声呐目标检测方法,其特征在于:步骤一、建立SSD神经网络模型,SSD神经网络模型包括共享卷积层、卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17和全连接层;将大于1000张训练用的声呐图像输入SSD神经网络模型进行训练;训练用的声呐图像中共包含有a种类别的目标;
步骤二、用需要被识别的声呐数据生成n张被测声呐图像,并将n张被测声呐图像缩放至相同大小;i=1,2,…,n,依次执行步骤三至七;
步骤三、将第i张被测声呐图像送入SSD的共享卷积层,得到第一层特征图;
步骤四、将步骤三所得的第一层特征图依次通入卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17;卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17分别输出第二层特征图、第三层特征图、第四层特征图、第五层特征图、第六层特征图;
步骤五、对第一层特征图、第二层特征图、第三层特征图、第四层特征图、第五层特征图、第六层特征图上的每个像素点均设置六个检测框;第k层特征图内所有像素点对应的前五个检测框的大小均为Sk;Sk的表达式如下:
Figure FDA0002456915750000011
其中,Smin的取值为0.2;Smax的取值为0.9;Sk为四舍五入所得值;
第k层特征图内所有像素点对应的第六个检测框的大小均为
Figure FDA0002456915750000012
k=1,2…,6,其中,S7=312;
前五个检测框的长宽比分别为1、2、3、1/2、1/3;第六个检测框的长宽比分别为1;
步骤六、j=1,2,…,6,依次执行步骤七;
步骤七、将步骤五所得的第j层特征图内所有的检测框分别通入第一卷积核和第二卷积核;第一卷积核的尺寸为3×3×pj×2,pj为被第j层特征图的通道数;第二卷积核的尺寸为3×3×pj×4,pj为被第j层特征图的通道数;每个检测框均输出一个特征向量;特征向量包括对应检测框针对各个目标类别的类别分数以及形状偏移量;形状偏移量包括横坐标偏移量、纵坐标偏移量、长度偏移量和宽度偏移量;
步骤八、将步骤六和七所得的所有特征向量均送入全连接层;全连接层将所有特征向量内的类别分数归一化,得到各检测框中获得针对a个目标类别的a个概率;保留各检测框的a个概率中的最大值,将其余a-1个概率均置为0;
步骤九、将1赋值给j;
步骤十、若存在一个或多个检测框针对第j个目标类别的概率大于阈值s,则判断第i张被测声呐图像中存在属于第j个目标类别的目标,针对第j个目标类别的概率大于阈值s的检测框作为特征检测框,进入步骤十一;s的值取0.8~0.97;否则直接进入步骤十四;
步骤十一、将步骤十获得的多个特征检测框分为bj个特征框群;互相之间相交的特征检测框组成一个特征框群;将1赋值给l进入步骤十二;
步骤十二、通过非极大值抑制算法选取第l个特征框群中针对第j个目标类别的概率最大的特征检测框作为第l个目标检测框;在第i张被测声呐图像上框选出几何中心位于第
Figure FDA0002456915750000021
行第
Figure FDA0002456915750000022
列,长度为gw,宽度为gw的目标框;之后进入步骤十三;
其中,
Figure FDA0002456915750000023
Figure FDA0002456915750000024
为第l个目标检测框的横坐标偏移量;
Figure FDA0002456915750000025
为第l个目标检测框的纵坐标偏移量;
Figure FDA0002456915750000026
为第l个目标检测框的长度偏移量;
Figure FDA0002456915750000027
为第l个目标检测框的宽度偏移量;
Figure FDA0002456915750000028
均在步骤七中计算得到;
Figure FDA0002456915750000029
为特征检测框集合中心的横坐标;
Figure FDA00024569157500000210
为特征检测框几何中心的纵坐标;
Figure FDA00024569157500000211
为特征检测框的长度;
Figure FDA00024569157500000212
为特征检测框的宽度;
步骤十三、若l<bj,则将l增大1,并重复执行步骤十二;否则,进入步骤十四;
步骤十四、若j<a,则将j增大1,并重复执行步骤十至十三;否则,识别结束。
2.根据权利要求1所述的基于SSD的声呐目标检测方法,其特征在于:所述的共享卷积层选用MobileNet。
3.根据权利要求1所述的基于SSD的声呐目标检测方法,其特征在于:所述训练用的声呐图像中目标的类别和位置已知。
4.根据权利要求1所述的基于SSD的声呐目标检测方法,其特征在于:步骤一中,将训练用的声呐图像导入SSD神经网络模型进行训练的步骤具体如下:将训练用的声呐图像输入共享卷积层,依次传输经过卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、卷积层conv17、全连接层,得到概率和偏置数值,从而完成目标分类和边框回归;通过与训练用的声呐图像的真实类别和边框位置计算损失值;再用反向传播算法和梯度下降算法对SSD神经网络模型内所有的权值进行更新。
CN201811407252.0A 2018-11-23 2018-11-23 基于ssd的声呐目标检测方法 Active CN109655815B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811407252.0A CN109655815B (zh) 2018-11-23 2018-11-23 基于ssd的声呐目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811407252.0A CN109655815B (zh) 2018-11-23 2018-11-23 基于ssd的声呐目标检测方法

Publications (2)

Publication Number Publication Date
CN109655815A CN109655815A (zh) 2019-04-19
CN109655815B true CN109655815B (zh) 2020-07-07

Family

ID=66112262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811407252.0A Active CN109655815B (zh) 2018-11-23 2018-11-23 基于ssd的声呐目标检测方法

Country Status (1)

Country Link
CN (1) CN109655815B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163108B (zh) * 2019-04-23 2020-12-08 杭州电子科技大学 基于双路径特征融合网络的鲁棒声呐目标检测方法
CN111967287A (zh) * 2019-05-20 2020-11-20 江苏金鑫信息技术有限公司 一种基于深度学习的行人检测方法
CN110263819A (zh) * 2019-05-28 2019-09-20 中国农业大学 一种用于贝类图像的目标检测方法及装置
CN110471048B (zh) * 2019-07-25 2022-04-15 南京信息工程大学 基于声呐三维图像置信度的自适应变尺度卷积核计算方法
CN112308105B (zh) * 2019-08-02 2024-04-12 北京图森智途科技有限公司 目标检测方法、目标检测器及相关设备
CN113052200B (zh) * 2020-12-09 2024-03-19 江苏科技大学 一种基于yolov3网络的声呐图像目标检测方法
EP4327323A1 (en) * 2021-04-21 2024-02-28 Microsoft Technology Licensing, LLC Synthetic speech detection

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529428A (zh) * 2016-10-31 2017-03-22 西北工业大学 基于深度学习的水下目标识别方法
DE112017006136T5 (de) * 2016-12-05 2019-08-22 Avigilon Corporation System und Verfahren zur CNN-Schichtenteilung
CN107909082B (zh) * 2017-10-30 2020-07-31 东南大学 基于深度学习技术的声呐图像目标识别方法
CN108038459A (zh) * 2017-12-20 2018-05-15 深圳先进技术研究院 一种水下生物的检测识别方法、终端设备及存储介质
CN108596030A (zh) * 2018-03-20 2018-09-28 杭州电子科技大学 基于Faster R-CNN的声呐目标检测方法
CN108846323A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 一种面向水下目标识别的卷积神经网络优化方法

Also Published As

Publication number Publication date
CN109655815A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
CN109655815B (zh) 基于ssd的声呐目标检测方法
CN110163108B (zh) 基于双路径特征融合网络的鲁棒声呐目标检测方法
CN109919108B (zh) 基于深度哈希辅助网络的遥感图像快速目标检测方法
CN112750140B (zh) 基于信息挖掘的伪装目标图像分割方法
CN110084234B (zh) 一种基于实例分割的声呐图像目标识别方法
CN111738124A (zh) 基于Gabor变换和注意力的遥感图像云检测方法
CN110598029A (zh) 基于注意力转移机制的细粒度图像分类方法
CN111126134B (zh) 基于非指纹信号消除器的雷达辐射源深度学习识别方法
CN110569738A (zh) 基于密集连接网络的自然场景文本检测方法、设备和介质
CN111310622A (zh) 一种面向水下机器人智能作业的鱼群目标识别方法
CN111145145B (zh) 一种基于MobileNets的图像表面缺陷检测方法
JP2020119524A (ja) 核心性能指数を満たすことができるハードウェア最適化が行われるように、cnnで複数のブロック内の入力イメージから特徴を抽出する学習方法及び学習装置、それを利用したテスト方法及びテスト装置
CN113011509A (zh) 肺部支气管的分类方法、装置、电子设备和存储介质
CN111582091A (zh) 基于多分支卷积神经网络的行人识别方法
CN116468995A (zh) 一种联合slic超像素和图注意力网络的声呐图像分类方法
Yang et al. Foreground enhancement network for object detection in sonar images
CN108985385A (zh) 基于生成对抗学习的快速弱监督目标检测方法
CN116562341A (zh) 一种用于交通信号灯检测的改进型YOLOv5n模型
CN116343016A (zh) 一种基于轻量型卷积网络的多角度声呐图像目标分类方法
CN115909086A (zh) 基于多级增强网络的sar目标检测识别方法
CN114913485A (zh) 一种多层级特征融合的弱监督检测方法
CN114694042A (zh) 一种基于改进Scaled-YOLOv4的伪装人员目标检测方法
CN114463650A (zh) 一种基于胶囊神经网络的船舶目标检测方法
Liu et al. Tiny electronic component detection based on deep learning
CN109635738A (zh) 一种图像特征提取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220519

Address after: 200000 No. 33, Lane 159, Taiye Road, Fengxian District, Shanghai

Patentee after: Shanghai Weiyi Mingda Information Technology Co.,Ltd.

Address before: 310018 No. 2 street, Xiasha Higher Education Zone, Hangzhou, Zhejiang

Patentee before: HANGZHOU DIANZI University

Effective date of registration: 20220519

Address after: 650000 room 211, No.8, Tai'an Road, taipingxincheng Street office, Anning City, Kunming City, Yunnan Province

Patentee after: Yunnan poly Tiantong underwater equipment Technology Co.,Ltd.

Address before: 200000 No. 33, Lane 159, Taiye Road, Fengxian District, Shanghai

Patentee before: Shanghai Weiyi Mingda Information Technology Co.,Ltd.