CN112651376A - 一种船只检测方法和装置 - Google Patents

一种船只检测方法和装置 Download PDF

Info

Publication number
CN112651376A
CN112651376A CN202110009522.8A CN202110009522A CN112651376A CN 112651376 A CN112651376 A CN 112651376A CN 202110009522 A CN202110009522 A CN 202110009522A CN 112651376 A CN112651376 A CN 112651376A
Authority
CN
China
Prior art keywords
layer
yolo
detection
size
ship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110009522.8A
Other languages
English (en)
Inventor
邓练兵
李皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Dahengqin Technology Development Co Ltd
Original Assignee
Zhuhai Dahengqin Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Dahengqin Technology Development Co Ltd filed Critical Zhuhai Dahengqin Technology Development Co Ltd
Priority to CN202110009522.8A priority Critical patent/CN112651376A/zh
Publication of CN112651376A publication Critical patent/CN112651376A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种船只检测方法和装置,所述方法包括:构造改进的YOLO v3 tiny检测模型;改进的YOLO v3 tiny检测模型包括输入层、主干网络和检测网络;主干网络包括多个卷积层;检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;获取船只图像;根据改进的YOLO v3 tiny检测模型输出船只图像的船只检测结果。相比于原始的YOLO v3 tiny检测模型,改进的YOLO v3 tiny检测模型可以使用卷积层代替池化层,同时调整网络通道数,可以提升针对小尺寸船只的检测效果。

Description

一种船只检测方法和装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种船只检测方法和一种船只检测装置。
背景技术
船舶遥感图像检测在渔业管理、船舶交通服务和海战等领域有着广泛的应用。特别是近年来,随着世界渔业资源的不断减少,对船舶进行有效、高效的监测,及时禁止非法捕鱼活动,船舶检测变得越来越重要。
随着深度学习理论的日益发展,深度神经网络被广泛的应用在船只检测中。然而目前用于检测船只的深度神经网络,在实时性要求较高的船只检测场景时,存在着实时性较差的问题,以及检测性能较差的问题。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种船只检测方法和相应的一种船只检测装置。
本发明实施例公开了一种船只检测方法,包括:
构造改进的YOLO v3 tiny检测模型;所述改进的YOLO v3 tiny检测模型包括输入层、主干网络和检测网络;所述主干网络包括多个卷积层;所述检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;所述第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,所述第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;所述第一路由层连接所述检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;所述第二路由层连接所述主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;
获取船只图像;
根据所述改进的YOLO v3 tiny检测模型输出所述船只图像的船只检测结果。
可选地,所述构造改进的YOLO v3 tiny检测模型,包括:
对所述主干网络设置十三个的卷积层,分别为第一卷积层至第十三卷积层;
分别对所述第一卷积层至所述第十三卷积层,设置过滤器数量、卷积核尺寸、步长、输出尺寸中的至少一种。
可选地,所述构造改进的YOLO v3 tiny检测模型,还包括:
对所述检测网络设置六个卷积层,分别为第十四卷积层至第十九卷积层;
分别对所述第十四卷积层至所述第十九卷积层,设置过滤器数量、卷积核尺寸、输出尺寸中的至少一种。
可选地,所述构造改进的YOLO v3 tiny检测模型,还包括:
将所述第一路由层连接所述第十四卷积层,以使所述第一路由层生成用于检测第一尺寸类型船只的第一特征图;
对所述第一路由层设置过滤器数量、输出尺寸;
将所述第二路由层连接第八卷积层,以使所述第二路由层生成用于检测第二尺寸类型船只的第二特征图;
对所述第二路由层设置过滤器数量、输出尺寸。
可选地,所述构造改进的YOLO v3 tiny检测模型,包括:
对所述检测网络设置针对于检测第一尺寸类型船只的注意力层,所述注意力层包括通道注意力层和空间注意力层;
将通道注意力层和所述空间注意力层串联连接,并置于所述第一YOLO层之前。
可选地,所述检测网络还包括采样层,所述构造改进的YOLO v3 tiny检测模型,还包括:
根据所述第十四卷积层的输出尺寸,对所述采样层设置步长和输出尺寸。
可选地,所述构造改进的YOLO v3 tiny检测模型,包括:
获取船只数据集;
根据k-means算法和所述船只数据集,生成针对第一尺寸类型船只的多个锚框和针对第二尺寸类型船只的多个锚框。
本发明实施例还公开了一种船只检测装置,包括:
模型构造模块,用于构造改进的YOLO v3 tiny检测模型;所述改进的YOLO v3tiny检测模型包括输入层、主干网络和检测网络;所述主干网络包括多个卷积层;所述检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;所述第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,所述第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;所述第一路由层连接所述检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;所述第二路由层连接所述主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;
图像获取模块,用于获取船只图像;
检测模块,用于根据所述改进的YOLO v3 tiny检测模型输出所述船只图像的船只检测结果。
可选地,所述模型构造模块包括:
第一网络设置子模块,用于对所述主干网络设置十三个的卷积层,分别为第一卷积层至第十三卷积层;
第一参数设置子模块,用于分别对所述第一卷积层至所述第十三卷积层,设置过滤器数量、卷积核尺寸、步长、输出尺寸中的至少一种。
可选地,所述模型构造模块还包括:
第二网络设置子模块,用于对所述检测网络设置六个卷积层,分别为第十四卷积层至第十九卷积层;
第二参数设置子模块,用于分别对所述第十四卷积层至所述第十九卷积层,设置过滤器数量、卷积核尺寸、输出尺寸中的至少一种。
可选地,所述模型构造模块还包括:
第一连接子模块,用于将所述第一路由层连接所述第十四卷积层,以使所述第一路由层生成用于检测第一尺寸类型船只的第一特征图;
第三参数设置子模块,用于对所述第一路由层设置过滤器数量、输出尺寸;
第二连接子模块,用于将所述第二路由层连接第八卷积层,以使所述第二路由层生成用于检测第二尺寸类型船只的第二特征图;
第四参数设置子模块,用于对所述第二路由层设置过滤器数量、输出尺寸。
可选地,所述模型构造模块包括:
第三网络设置子模块,用于对所述检测网络设置针对于检测第一尺寸类型船只的注意力层,所述注意力层包括通道注意力层和空间注意力层;
第三连接子模块,用于将通道注意力层和所述空间注意力层串联连接,并置于所述第一YOLO层之前。
可选地,所述检测网络还包括采样层,所述模型构造模块还包括:
第五参数设置子模块,用于根据所述第十四卷积层的输出尺寸,对所述采样层设置步长和输出尺寸。
可选地,所述模型构造模块包括:
船只数据集获取子模块,用于获取船只数据集;
锚框生成子模块,用于根据k-means算法和所述船只数据集,生成针对第一尺寸类型船只的多个锚框和针对第二尺寸类型船只的多个锚框。
本发明实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的船只检测方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的船只检测方法的步骤。
本发明实施例包括以下优点:
本发明实施例中,可以构造改进的YOLO v3 tiny检测模型;改进的YOLO v3 tiny检测模型可以包括输入层、主干网络和检测网络;主干网络包括多个卷积层;检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;第一路由层连接检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;第二路由层连接主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;获取船只图像;根据改进的YOLO v3 tiny检测模型输出船只图像的船只检测结果。相比于原始的YOLO v3 tiny检测模型,改进的YOLO v3 tiny检测模型可以使用卷积层代替池化层,同时调整网络通道数,可以提升针对小尺寸船只的检测效果。
进一步的,针对大目标船只检测问题,可以在检测网络引入注意力层,使得模型能够更加专注于检测目标本身,减少外界环境的干扰。
进一步的,还可以使用船只数据集训练YOLO v3 tiny检测模型所需要的6个锚框,是的模型训练更加容易,效果更好。
附图说明
图1是本发明实施例的一种船只检测方法的步骤流程图;
图2是一种原始的YOLO v3 tiny的网络结构的示意图;
图3是本发明实施例的一种改进的YOLO v3 tiny检测模型的示意图;
图4是本发明实施例中锚框尺寸的示意图;
图5是本发明实施例的一种船只检测装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
YOLO v3是YOLO(You Only Look Once)系列目标检测算法中的第三版,相比之前的算法,尤其是针对小目标,精度有显著提升。
原始版本的YOLO v3网络应用在实时性要求较高的船只检测场景时,存在着实时性较差的问题。
YOLO v3 tiny网络虽然有了较理想的实时性,但是在小型船只即小目标检测时存在召回率较低,检测性能较差的问题;同时,在大型船只即大目标检测时容易受到外界环境,比如岸上建筑,水中浮物的影响。
对此,本发明实施例提供一种船只检测方法,对原始YOLO v3 tiny的网络结构进行了调整,基于改进的YOLO v3 tiny检测模型进行船只检测,从而解决如上至少一种问题。
参照图1,示出了本发明实施例的一种船只检测方法的步骤流程图,所述方法具体可以包括如下步骤:
步骤101,构造改进的YOLO v3 tiny检测模型;所述改进的YOLO v3tiny检测模型包括输入层、主干网络和检测网络;所述主干网络包括多个卷积层;所述检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;所述第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,所述第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;所述第一路由层连接所述检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;所述第二路由层连接所述主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图。
参照图2所示为一种原始的YOLO v3 tiny的网络结构的示意图。原始的YOLO v3tiny的网络结构包括输入层、主干网络和检测网络。其中,主干网络包括卷积层(Convolutional)和池化层(maxpool)。具体的包括7个卷积层,分别为第一卷积层至第七卷积层和6个池化层,分别为第一池化层至第六池化层。不同的卷积层可以设置不同的参数,例如,第一卷积层对应的过滤器(filters)数量为16,卷积核尺寸(size)为3*3,输出尺寸(output)为416*416*16。不同的池化层可以设置不同的参数,例如,第一池化层的卷积核尺寸为2*2,步长(stride)为2,输出尺寸为208*208*16。检测网络包括6个卷积层,分别为第八卷积层至第十三卷积层。检测网络还可以包括第一YOLO层、第二YOLO层、第一路由层和第二路由层。
参照图3所示为本发明实施例的一种改进的YOLO v3 tiny检测模型的示意图。改进的YOLO v3 tiny检测模型包括输入层、主干网络和检测网络;其中,主干网络包括多个卷积层。
现有YOLO v3 tiny的网络结构的主干网络中包括卷积层(Convolutional)和池化层(maxpool)。本发明实施例中,在主干网络中,可以使用尺寸为3*3,步长为2的卷积层代,替原始YOLO v3 tiny的网络结构中的池化层,虽然略微增加了参数,但增强了网络得学习能力,用于存储更多的小目标信息。
具体的,主干网络可以包括十三个卷积层,分别为第一卷积层至第十三卷积层。所述步骤101可以包括:对所述主干网络设置十三个的卷积层,分别为第一卷积层至第十三卷积层;分别对所述第一卷积层至所述第十三卷积层,设置过滤器数量、卷积核尺寸、步长、输出尺寸中的至少一种。
具体的,可以将所述第一卷积层的过滤器数量设为32个,卷积核尺寸设为3*3,输出尺寸设为416*416*32;将所述第二卷积层的过滤器数量设为64个,卷积核尺寸设为3*3,步长设为2,输出尺寸设为208*208*64;将所述第三卷积层的过滤器数量设为64个,卷积核尺寸设为3*3,输出尺寸设为208*208*64;将所述第四卷积层的过滤器数量设为128个,卷积核尺寸设为3*3,步长设为2,输出尺寸设为104*104*128;将所述第五卷积层的过滤器数量设为128个,卷积核尺寸设为3*3,输出尺寸设为104*104*128;将所述第六卷积层的过滤器数量设为256个,卷积核尺寸设为3*3,步长设为2,输出尺寸设为52*52*256;将所述第七卷积层的过滤器数量设为256个,卷积核尺寸设为3*3,输出尺寸设为52*52*256;将所述第八卷积层的过滤器数量设为512个,卷积核尺寸设为3*3,步长设为2,输出尺寸设为26*26*512;将所述第九卷积层的过滤器数量设为512个,卷积核尺寸设为3*3,输出尺寸设为26*26*512;将所述第十卷积层的过滤器数量设为1024个,卷积核尺寸设为3*3,步长设为2,输出尺寸设为13*13*1024;将所述第十一卷积层的过滤器数量设为1024个,卷积核尺寸设为3*3,输出尺寸设为13*13*1024;将所述第十二卷积层的过滤器数量设为512个,卷积核尺寸设为1*1,输出尺寸设为13*13*512;将所述第十三卷积层的过滤器数量设为1024个,卷积核尺寸设为3*3,输出尺寸设为13*13*1024。
在本发明实施例中,所述步骤101还可以包括:对所述检测网络设置六个卷积层,分别为第十四卷积层至第十九卷积层;分别对所述第十四卷积层至所述第十九卷积层,设置过滤器数量、卷积核尺寸、输出尺寸中的至少一种。
具体的,可以将所述第十四卷积层的过滤器数量设为512个,卷积核尺寸设为1*1,输出尺寸设为13*13*512;将所述第十五卷积层的过滤器数量设为256个,卷积核尺寸设为3*3,输出尺寸设为13*13*256;将所述第十六卷积层的过滤器数量设为33个,卷积核尺寸设为1*1,输出尺寸设为13*13*33;将所述第十七卷积层的过滤器数量设为512个,卷积核尺寸设为1*1,输出尺寸设为13*13*512;将所述第十八卷积层的过滤器数量设为256个,卷积核尺寸设为3*3,输出尺寸设为26*26*256;将所述第十九卷积层的过滤器数量设为33个,卷积核尺寸设为1*1,输出尺寸设为26*26*33。
在本发明实施例中,改进的YOLO v3 tiny检测模型总共包含19个卷积层,相比于原始的YOLO v3 tiny检测模型的13个卷积层有更深的网络。主干网络有相同的层数(13层),主干网络的跳过了过滤器个数为16的两层网络,直接进入过滤器个数为32的网络。通过使用卷积核尺寸为3*3,步长为2的卷积层代替了池化层,改进的YOLO v3 tiny检测模型的卷积层深度并没有减少,在减少计算量的同时,也没有造成太大的预测质量损失。与原始的YOLO v3 tiny检测模型一样,改进的YOLO v3 tiny检测模型输出尺寸为13*13*1024的特征图。
在本发明实施例中,所述步骤101还可以包括:
将所述第一路由层连接所述第十四卷积层,以使所述第一路由层生成用于检测第一尺寸类型船只的第一特征图;对所述第一路由层设置过滤器数量、输出尺寸;将所述第二路由层连接第八卷积层,以使所述第二路由层生成用于检测第二尺寸类型船只的第二特征图;对所述第二路由层设置过滤器数量、输出尺寸。
具体的,可以将所述第一路由层的过滤器数量设为-6,输出尺寸设为13*13*512;将所述第二路由层的过滤器数量设为-1和8,输出尺寸设为26*26*512。
在本发明实施例中,所述检测网络还包括采样层,所述步骤101还可以包括:根据所述第十四卷积层的输出尺寸,对所述采样层设置步长和输出尺寸。具体的,第十四卷积层的输出尺寸可以为13*13*512,采样层的步长可以设为2,输出尺寸可以设为26*26*512。
在本发明实施例中,所述步骤101还可以包括:对所述检测网络设置针对于检测第一尺寸类型船只的注意力层,所述注意力层包括通道注意力层和空间注意力层;将通道注意力层和所述空间注意力层串联连接,并置于所述第一YOLO层之前。
对于检测网络,改进的YOLO v3 tiny检测模型包含两个YOLO层分别用于大目标和小目标物体的检测。
针对用于对大目标检测的第一YOLO层,引入注意力层CBAM(Convolutional BlockAttention Module),注意力层可以包括通道注意力模块(Channel Attention Module)和空间注意力模块(Spatial Attention Module)通过串联的形式连接,然后作为整体置于用于大目标检测的第一YOLO层之前,这一改进可以减少复杂的岸上环境和水文环境对大型船只目标检测的影响。
针对小目标检测存在的检测能力较差,召回率较低的问题,本发明实施例采用加深网络的思路。可以将第一路由层中连接第十四卷积层,由于注意力层包含两层,因此可以将第一路由层的过滤器数量设为-6。
相比于原始的YOLO v3 tiny检测模型输出的尺寸为13*13*256的特征图,第十四卷积层输出的尺寸为13*13*512的特征图,拥有更多的通道,包含更多的细节信息,经过上采样得到26*26*512的特征图。
在本发明实施例中,所述步骤101还可以包括:获取船只数据集;根据k-means算法和所述船只数据集,生成针对第一尺寸类型船只的多个锚框和针对第二尺寸类型船只的多个锚框(anchors box)。
具体的,可以在船只数据集上执行k-means算法获得适宜于船只检测的预设锚框。由于YOLO v3 tiny模型需要6个锚框,因此k=6。假设某一标签中锚框的长和宽为:boxlabel=(wl,hl),某个聚类种子点的锚框为boxcluster=(wc,hc),则有两个锚框的交并比IoU(Intersection-over-Union)为:
Figure BDA0002884487350000101
因为使用欧式距离会让大的锚框比小的锚框产生更多的错误,可以重新定义距离的计算公式为:d(box1,box2)=1-IoU(box1,box2)。
最终,6个锚框的尺寸可以分别为[0.1583,0.0630],[0.0750,0.0352],[0.3745,0.1991],[0.2828,0.1019],[0.7328,0.2509],[0.5354,0.1343],对应宽高比分别为[2.51,2.13,1.88,2.78,2.92,3.99]。如图4所示为本发明实施例中锚框尺寸的示意图,重新定义的锚框在尺寸和形状上与船只的形状更加接近,作为更有效的先验知识,帮助模型完成更快、更好的训练。
步骤102,获取船只图像。
得益于数字摄像头性能的高速提升,越来越多的视频监控系统被部署在近海和离岸实现视觉内的船只分类和行为检测。视频监控系统可以采集海上的船只图像。
步骤103,根据所述改进的YOLO v3 tiny检测模型输出所述船只图像的船只检测结果。
船只检测结果可以包括检测的第一尺寸类型船只和第二尺寸类型船只。
本发明实施例中,可以构造改进的YOLO v3 tiny检测模型;改进的YOLO v3 tiny检测模型可以包括输入层、主干网络和检测网络;主干网络包括多个卷积层;检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;第一路由层连接检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;第二路由层连接主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;获取船只图像;根据改进的YOLO v3 tiny检测模型输出船只图像的船只检测结果。相比于原始的YOLO v3 tiny检测模型,改进的YOLO v3 tiny检测模型可以使用卷积层代替池化层,同时调整网络通道数,可以提升针对小尺寸船只的检测效果。
进一步的,针对大目标船只检测问题,可以在检测网络引入注意力层,使得模型能够更加专注于检测目标本身,减少外界环境的干扰。
进一步的,还可以使用船只数据集训练YOLO v3 tiny检测模型所需要的6个锚框,是的模型训练更加容易,效果更好。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图5,示出了本发明实施例的一种船只检测装置的结构框图,具体可以包括如下模块:
模型构造模块501,用于构造改进的YOLO v3 tiny检测模型;所述改进的YOLO v3tiny检测模型包括输入层、主干网络和检测网络;所述主干网络包括多个卷积层;所述检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;所述第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,所述第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;所述第一路由层连接所述检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;所述第二路由层连接所述主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;
图像获取模块502,用于获取船只图像;
检测模块503,用于根据所述改进的YOLO v3 tiny检测模型输出所述船只图像的船只检测结果。
在本发明实施例中,所述模型构造模块501可以包括:
第一网络设置子模块,用于对所述主干网络设置十三个的卷积层,分别为第一卷积层至第十三卷积层;
第一参数设置子模块,用于分别对所述第一卷积层至所述第十三卷积层,设置过滤器数量、卷积核尺寸、步长、输出尺寸中的至少一种。
在本发明实施例中,所述模型构造模块501还可以包括:
第二网络设置子模块,用于对所述检测网络设置六个卷积层,分别为第十四卷积层至第十九卷积层;
第二参数设置子模块,用于分别对所述第十四卷积层至所述第十九卷积层,设置过滤器数量、卷积核尺寸、输出尺寸中的至少一种。
在本发明实施例中,所述模型构造模块501还可以包括:
第一连接子模块,用于将所述第一路由层连接所述第十四卷积层,以使所述第一路由层生成用于检测第一尺寸类型船只的第一特征图;
第三参数设置子模块,用于对所述第一路由层设置过滤器数量、输出尺寸;
第二连接子模块,用于将所述第二路由层连接第八卷积层,以使所述第二路由层生成用于检测第二尺寸类型船只的第二特征图;
第四参数设置子模块,用于对所述第二路由层设置过滤器数量、输出尺寸。
在本发明实施例中,所述模型构造模块501可以包括:
第三网络设置子模块,用于对所述检测网络设置针对于检测第一尺寸类型船只的注意力层,所述注意力层包括通道注意力层和空间注意力层;
第三连接子模块,用于将通道注意力层和所述空间注意力层串联连接,并置于所述第一YOLO层之前。
在本发明实施例中,所述检测网络还包括采样层,所述模型构造模块501还可以包括:
第五参数设置子模块,用于根据所述第十四卷积层的输出尺寸,对所述采样层设置步长和输出尺寸。
在本发明实施例中,所述模型构造模块501可以包括:
船只数据集获取子模块,用于获取船只数据集;
锚框生成子模块,用于根据k-means算法和所述船只数据集,生成针对第一尺寸类型船只的多个锚框和针对第二尺寸类型船只的多个锚框。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种车辆,包括:
包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述船只检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述船只检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种船只检测方法和一种船只检测装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种船只检测方法,其特征在于,包括:
构造改进的YOLO v3 tiny检测模型;所述改进的YOLO v3 tiny检测模型包括输入层、主干网络和检测网络;所述主干网络包括多个卷积层;所述检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;所述第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,所述第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;所述第一路由层连接所述检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;所述第二路由层连接所述主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;
获取船只图像;
根据所述改进的YOLO v3 tiny检测模型输出所述船只图像的船只检测结果。
2.根据权利要求1所述的方法,其特征在于,所述构造改进的YOLO v3 tiny检测模型,包括:
对所述主干网络设置十三个的卷积层,分别为第一卷积层至第十三卷积层;
分别对所述第一卷积层至所述第十三卷积层,设置过滤器数量、卷积核尺寸、步长、输出尺寸中的至少一种。
3.根据权利要求2所述的方法,其特征在于,所述构造改进的YOLO v3 tiny检测模型,还包括:
对所述检测网络设置六个卷积层,分别为第十四卷积层至第十九卷积层;
分别对所述第十四卷积层至所述第十九卷积层,设置过滤器数量、卷积核尺寸、输出尺寸中的至少一种。
4.根据权利要求3所述的方法,其特征在于,所述构造改进的YOLO v3 tiny检测模型,还包括:
将所述第一路由层连接所述第十四卷积层,以使所述第一路由层生成用于检测第一尺寸类型船只的第一特征图;
对所述第一路由层设置过滤器数量、输出尺寸;
将所述第二路由层连接第八卷积层,以使所述第二路由层生成用于检测第二尺寸类型船只的第二特征图;
对所述第二路由层设置过滤器数量、输出尺寸。
5.根据权利要求1所述的方法,其特征在于,所述构造改进的YOLO v3 tiny检测模型,包括:
对所述检测网络设置针对于检测第一尺寸类型船只的注意力层,所述注意力层包括通道注意力层和空间注意力层;
将通道注意力层和所述空间注意力层串联连接,并置于所述第一YOLO层之前。
6.根据权利要求4所述的方法,其特征在于,所述检测网络还包括采样层,所述构造改进的YOLO v3 tiny检测模型,还包括:
根据所述第十四卷积层的输出尺寸,对所述采样层设置步长和输出尺寸。
7.根据权利要求1所述的方法,其特征在于,所述构造改进的YOLO v3 tiny检测模型,包括:
获取船只数据集;
根据k-means算法和所述船只数据集,生成针对第一尺寸类型船只的多个锚框和针对第二尺寸类型船只的多个锚框。
8.一种船只检测装置,其特征在于,包括:
模型构造模块,用于构造改进的YOLO v3 tiny检测模型;所述改进的YOLO v3 tiny检测模型包括输入层、主干网络和检测网络;所述主干网络包括多个卷积层;所述检测网络包括多个卷积层、第一YOLO层、第二YOLO层、第一路由层和第二路由层;所述第一YOLO层使用针对第一尺寸类型船只的多个锚框检测第一尺寸类型船只,所述第二YOLO层使用针对第二尺寸类型船只的多个锚框检测第二尺寸类型船只;所述第一路由层连接所述检测网络中的卷积层,生成用于检测第一尺寸类型船只的第一特征图;所述第二路由层连接所述主干网络中的卷积层,生成用于检测第二尺寸类型船只的第二特征图;
图像获取模块,用于获取船只图像;
检测模块,用于根据所述改进的YOLO v3 tiny检测模型输出所述船只图像的船只检测结果。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的船只检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的船只检测方法的步骤。
CN202110009522.8A 2021-01-05 2021-01-05 一种船只检测方法和装置 Pending CN112651376A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110009522.8A CN112651376A (zh) 2021-01-05 2021-01-05 一种船只检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110009522.8A CN112651376A (zh) 2021-01-05 2021-01-05 一种船只检测方法和装置

Publications (1)

Publication Number Publication Date
CN112651376A true CN112651376A (zh) 2021-04-13

Family

ID=75367391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110009522.8A Pending CN112651376A (zh) 2021-01-05 2021-01-05 一种船只检测方法和装置

Country Status (1)

Country Link
CN (1) CN112651376A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496253A (zh) * 2021-04-22 2021-10-12 南京工程学院 一种船舶目标检测方法及系统
CN114677596A (zh) * 2022-05-26 2022-06-28 之江实验室 一种基于注意力模型的遥感图像船舶检测方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647977A (zh) * 2019-08-26 2020-01-03 北京空间机电研究所 一种用于星上对舰船目标检测的Tiny-YOLO网络的优化方法
CN110689118A (zh) * 2019-09-29 2020-01-14 华南理工大学 一种基于YOLO V3-tiny改进的目标检测方法
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111898651A (zh) * 2020-07-10 2020-11-06 江苏科技大学 一种基于Tiny YOLOV3算法的树木检测方法
CN112101434A (zh) * 2020-09-04 2020-12-18 河南大学 基于改进YOLO v3的红外图像弱小目标检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647977A (zh) * 2019-08-26 2020-01-03 北京空间机电研究所 一种用于星上对舰船目标检测的Tiny-YOLO网络的优化方法
CN110689118A (zh) * 2019-09-29 2020-01-14 华南理工大学 一种基于YOLO V3-tiny改进的目标检测方法
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111898651A (zh) * 2020-07-10 2020-11-06 江苏科技大学 一种基于Tiny YOLOV3算法的树木检测方法
CN112101434A (zh) * 2020-09-04 2020-12-18 河南大学 基于改进YOLO v3的红外图像弱小目标检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496253A (zh) * 2021-04-22 2021-10-12 南京工程学院 一种船舶目标检测方法及系统
CN114677596A (zh) * 2022-05-26 2022-06-28 之江实验室 一种基于注意力模型的遥感图像船舶检测方法和装置

Similar Documents

Publication Publication Date Title
WO2021179820A1 (zh) 图像处理方法、装置、存储介质及电子设备
CN112651376A (zh) 一种船只检测方法和装置
CN108876813B (zh) 用于视频中物体检测的图像处理方法、装置及设备
TWI770432B (zh) 圖像復原方法、電子設備、儲存介質
JP2014527210A (ja) オプティカルフローを決定するためのコンテンツ適応型システム、方法、及び装置
CN109919110A (zh) 视频关注区域检测方法、装置及设备
Yasir et al. Multi-scale ship target detection using SAR images based on improved Yolov5
CN113642673A (zh) 图像生成方法、装置、设备及存储介质
CN116803082A (zh) 一种用于点云处理的装置和方法
Gašparović et al. Deep learning approach for objects detection in underwater pipeline images
CN114926726A (zh) 基于多任务网络的无人船感知方法及相关设备
CN111753729B (zh) 一种假脸检测方法、装置、电子设备及存储介质
CN113850783A (zh) 一种海面船舶检测方法及系统
Chen et al. Real-time image enhancement for vision-based autonomous underwater vehicle navigation in murky waters
CN111882585B (zh) 被动声呐多目标方位迹提取方法、电子设备及计算机可读存储介质
CN113762266B (zh) 目标检测方法、装置、电子设备和计算机可读介质
CN112800932B (zh) 海上背景下显著船舶目标的检测方法及电子设备
CN112487911B (zh) 智能监控环境下基于改进yolov3的实时行人检测方法及装置
US11223815B2 (en) Method and device for processing video
CN116310959B (zh) 一种复杂场景下低质量摄像机画面识别方法及系统
Lee et al. Extrapolative-interpolative cycle-consistency learning for video frame extrapolation
Mehla et al. Object Detection in Autonomous Maritime Vehicles: Comparison Between YOLO V8 and EfficientDet
CN112347218B (zh) 无人船艇的环境地图生成方法及无人船艇感知系统
CN114218438B (zh) 视频数据处理方法、装置、电子设备和计算机存储介质
CN114373121A (zh) 一种改进yolov5网络的小目标检测的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination