CN112419227A - 基于小目标搜索缩放技术的水下目标检测方法和系统 - Google Patents

基于小目标搜索缩放技术的水下目标检测方法和系统 Download PDF

Info

Publication number
CN112419227A
CN112419227A CN202011096905.5A CN202011096905A CN112419227A CN 112419227 A CN112419227 A CN 112419227A CN 202011096905 A CN202011096905 A CN 202011096905A CN 112419227 A CN112419227 A CN 112419227A
Authority
CN
China
Prior art keywords
detection
detection result
fpn
thermodynamic diagram
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011096905.5A
Other languages
English (en)
Other versions
CN112419227B (zh
Inventor
刘宏
宋品皓
丁润伟
戴林辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Shenzhen Graduate School
Peng Cheng Laboratory
Original Assignee
Peking University Shenzhen Graduate School
Peng Cheng Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Shenzhen Graduate School, Peng Cheng Laboratory filed Critical Peking University Shenzhen Graduate School
Priority to CN202011096905.5A priority Critical patent/CN112419227B/zh
Publication of CN112419227A publication Critical patent/CN112419227A/zh
Application granted granted Critical
Publication of CN112419227B publication Critical patent/CN112419227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/403Edge-driven scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Abstract

本发明涉及一种基于小目标搜索缩放技术的水下目标检测方法和系统。该方法的步骤为:将待检测图片输入至目标检测网络Faster‑RCNN+FPN,得到第一检测结果;提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。本发明通过分析FPN激活值对原图进行缩放,关注密集小目标部分,从而进行多尺度推断,能够提高模型对小目标的检测能力。

Description

基于小目标搜索缩放技术的水下目标检测方法和系统
技术领域
本发明属于机器视觉的目标检测和智能机器人领域,具体涉及一种小目标搜索缩放技术的多尺度融合目标检测方法和系统。
背景技术
自2013年Faster-RCNN被提出,并在ImageNet数据集中取得显著效果以来,目标检测任务便引起了广大研究者的兴趣。其在智能安保监控、交通流量监控、人体跟踪等方面有着广泛应用。配备了视觉系统的水下机器人,可以使用目标检测模型进行一系列水下任务,例如海洋生物多样性检测、海洋生物迁徙分析、海产捕捞等。目标检测技术应用于水下环境具有众多的难点:1)水生生物的体积小,且在模糊的水质的影响下,要识别出来非常困难;2)水生生物例如海胆、海参、扇贝等的聚集特点,导致图像中目标密集地分布,使得目标检测任务更加困难;3)基于深度学习的目标检测模型需要大量的数据集。因为获取困难且标注需要专业人士,目前公开的水下目标识别数据集非常少,这使得目标检测模型缺乏鲁棒性。
目前的目标检测方法分为两大类:一阶段识别法和二阶段识别法。一阶段识别法即是模型可以直接端到端地从图片直接预测出目标的位置、目标存在的置信度以及目标的类别。一阶段识别方法因为其参数量、计算量少,有非常好的实时性。但因为模型内部没有因果关系限制,导致模型容易产生过拟合。二阶段的目标检测方法是先识别目标的位置以及该位置存在目标的置信度,再根据不同的位置判断该位置的目标属于哪一类。因为考虑了模型预测的逻辑关系,二阶段方法相比一阶段方法的鲁棒性更强,但是识别速度并不高。
用于提高目标检测模型在密集小目标任务上鲁棒性的方法主要有三种:(1)多尺度的模型融合,例如FPN(Feature Pyramid Networks,特征金字塔网络);(2)使用数据增强技术,增加数据中小目标的数量,提高模型对小目标的检测能力;(3)多尺度训练和多尺度推断。
发明内容
本发明的内容是使用基于Faster-RCNN+FPN模型和多尺度推断的方法来强化目标检测模型对小目标的识别能力。本发明通过分析FPN激活值对原图进行缩放,关注密集小目标部分,从而进行多尺度推断,提高模型对小目标的检测能力。
本发明的一种基于小目标搜索缩放技术的水下目标检测方法,其步骤包括:
将待检测图片输入至由Faster-RCNN网络和FPN网络构成的目标检测网络(即Faster-RCNN+FPN),得到第一检测结果(result1);
提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;
在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果(result2);
将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。
进一步地,所述的提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图,包括:
提取FPN尺寸最大的两张特征图,即F1、F2,F1的长宽尺寸均为F2的两倍大小,通道数相同;
分别计算两张特征图的二维热力图,得到H1,H2,H1除了拥有和H2一样的大目标特征,还有更丰富的细节特征如小目标特征;
将H2放大至H1的大小,计算H=max(H1-H2,0)。H为小目标热力图,max是像素级的操作,其目的为保证热力图的像素都为正值;
对H1进行边缘检测得到二维边缘图edge;
将edge和H加起来得到综合热力图combined_map。
进一步地,所述的在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果(result2),包括:
创建大小为combined_map的k倍的窗口,在combined_map上进行滑窗分析,找到激活值之和最大的窗口。其中k=log10(a/sqrt_area+b),a和b为可调节参数,sqrt_area表示输入图像大小/原图大小的开方。在Faster-RCNN中,处理的图像大小(输入图像大小)往往和原图大小不一致,若原图比输入图像大很多,缩放比k越小,当原图没有比输入图像大多少甚至小于输入图像的时候,缩放比k越大。K也可以是一个定值。
然后,将此窗口按比例缩放至和原图一样大小,提取原图中该窗口内的图片为截块chip,作为输入再次输入给目标检测网络,得到检测结果result2。
进一步地,热力图的计算公式为:
weights1×1×C=sumByChannel(FH×W×C)
weightedFH×W×C=weights1×1×C·FH×W×C
heatmapH×W=sumAcrossChannel(weightedFH×W×C)
其中,F为FPN的特征图,weights1×1×C表示特征图各通道的权重;H、W、C分别表示特征图的三个维度,即高、宽、通道;sumByChannel表示对宽高两个轴做求和操作,留下通道轴;weightedFH×W×C表示加权后的特征图;heatmapH×W表示热力图;sumAcrossChannel表示每个像素的各个通道值进行求和。
进一步地,边缘检测方法使用的是sobel算子检测法或者拉普拉斯边缘检测方法等。
进一步地,决策融合所使用的方法是:对result2的每一个检测框,都找到一个与result1中交并比(IOU)最大的检测框。多个result2的检测框会对应一个result1的检测框,最后将这些对应起来的检测框即多个result2的检测框和result1的一个检测框全部做加权平均,权重为检测框本身的置信度,将加权平均的结果更新到原来result1的检测框中。更新后的result1的检测框的置信度为做加权平均的一系列检测框中的置信度最大的值。
基于同一发明构思,本发明还提供一种采用上述方法的基于小目标搜索缩放技术的水下目标检测系统,其包括:
第一检测结果获取模块,用于将待检测图片输入至由Faster-RCNN网络和FPN网络构成的目标检测网络,得到第一检测结果;
第二检测结果获取模块,用于提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;
决策融合模块,用于将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。
本发明的有益效果:
本发明实现了水下图像小目标检测的方法和系统,即利用FPN特征图的特性,寻找缩放的子图像,再输入到模型中进行第二次检测,得到的结果和原结果做决策融合,增强了模型对于小目标检测的结果。
附图说明
图1是本发明的基于小目标搜索缩放技术的水下目标检测方法流程图。其中,1表示输入的待检测图片,2表示Faster-RCNN+FPN模型,3表示H2,4表示H1,5表示H1的边缘检测结果,6表示综合热力图combined_maps,7表示相减操作,具体为H1-H2,8表示相加操作。
图2(a)为实施例中的二维热力图H1,图2(b)为实施例中的二维热力图H2。
图3(a)~图3(c)是本发明的检测结果对比图。图3(a)是result1,图3(b)是result2,图3(c)是result1和result2的决策融合,也就是最终的检测结果。其中灰色的小方框表示检测模型检测出的目标的边框,黑色大边框表示截块chip。边框上显示的是目标的种类(海胆echinus、海星starfish、海参holothurian和扇贝scallop)以及置信度。在图3(a)中,原本黑色边框中漏识别的海胆在搜索缩放之后被识别了出来(图3(b)),因此最终检测结果图3(c)也能够识别出最开始漏识别的小目标海胆。
具体实施方式
下面将结合本发明实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整地描述,可以理解的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明使用基于Faster-RCNN+FPN模型和多尺度推断的方法来强化目标检测模型对小目标的识别能力。Faster-RCNN的描述参照”Faster R-CNN:Towards Real-TimeObject Detection with Region Proposal Networks”(2015),S.Ren,K.He,R.Girshick,and J.Sun,Advances in Neural Information Processing Systems 28,pages 91–99.Curran Associates,Inc.,2015。FPN的描述参考”Feature Pyramid Networks forObject Detection”(2017),T.-Y.Lin,P.Dollar,R.Girshick,K.He,B.Hariharan,and′S.Belongie,IEEE Conference on Computer Vision and Pattern Recognition。
如图1所示,本实施例的基于小目标缩放搜索缩放技术的水下目标检测方法的步骤如下:
(1)目标检测模型的构建。基本检测框架使用文献”T.-Y.Lin,P.Dollar,R.Girshick,K.He,B.Hariharan,and′S.Belongie,Feature Pyramid Networks forObject Detection”,IEEE Conference on Computer Vision and Pattern Recognition,2017中提到的Faster-RCNN+FPN的方法。将待检测图片输入至Faster-RCNN+FPN,得到result1。
(2)提取热力图。热力图的提取方法借鉴论文B.Zhou,A.Khosla,L.A.,A.Oliva,and A.Torralba.Learning Deep Features for Discriminative Localization.InCVPR,2016.2,3,5,6,20中的Class Activation Mapping方法。将FPN最后两层的热力图H1、H2计算max(H1-H2,0),得到小目标热力图H。具体包括以下步骤:
(a)提取FPN尺寸最大的两张特征图,即F1、F2,F1的长宽尺寸均为F2的两倍大小,通道数相同。
(b)分别计算两张特征图的二维热力图,得到H1(如图2(a)),H2(如图2(b)),H1除了拥有和H2一样的大目标特征,还有更丰富的细节特征如小目标特征。
(c)将H2放大至H1的大小,计算H=max(H1-H2,0)。H为小目标热力图,max是像素级的操作,其目的为保证热力图的像素都为正值。
(3)提取边缘:对H1进行边缘检测得到二维边缘图edge。具体方法使用sobel边缘检测算法。
(4)将小目标热力图H和sobel边缘图加和,得到综合热力图combined_map。
(5)在综合热力图上进行搜索,找到激活值之和最大的窗口,窗口对应原图的部分为chip。
创建大小为combined_map的k倍的窗口,在combined_map上进行滑窗分析,找到激活值之和最大的窗口。其中k=log10(a/sqrt(输入图像大小/原图大小)+b),a和b为可调节参数。在Faster-RCNN中,处理的图像大小(输入图像大小)往往和原图大小不一致,若原图比输入图像大很多,缩放比k越小,当原图没有比输入图像大多少甚至小于输入图像的时候,缩放比k越大。将此窗口按比例缩放至和原图一样大小,提取原图中该窗口内的图片为截块chip,作为输入再次输入给目标检测网络,得到检测结果result2。
(6)将result1和result2做决策融合,得到最终的检测结果result。
决策融合所使用的方法是:对result2的每一个检测框,都找到一个与result1中交并比(IOU)最大的检测框。多个result2的检测框会对应一个result1的检测框,最后将这些对应起来的检测框即多个result2的检测框和result1的一个检测框全部做加权平均,权重为检测框本身的置信度,将加权平均的结果更新到原来result1的检测框中。更新后的result1的检测框的置信度为做加权平均的一系列检测框中的置信度最大的值。
实验所用数据库为UODAC2020,包含“海胆(echinus)”、“海参(holothurian)”、“海星(starfish)”、“扇贝(scallop)”四个类。其训练集包括4157张图片,验证集上包括1094张图片。检测结果如图3所示,在图3中,本方法(图3(c))相比单尺度检测(图3(a)),能够识别出更多的小型海胆。在验证集的测试上,单尺度的测试结果为48.8%mAP
(IOU=0.5:0.05:0.95),而使用我们的方法得到的检测结果为49.1%mAP(IOU=0.5:0.05:0.95),本方法得到了0.3%的识别率提升。
本发明的其他实施例中,边缘检测计算可以使用拉普拉斯边缘检测方法;得到综合热力图的时,小目标热力图和边缘检测图可以是加权相加;缩放比k可以是一个定值;在搜索时,窗口的可以是其他比例的形状,并非一定需要严格按照综合热力图的k倍来搜索;决策融合可以直接使用NMS、softNMS、WBF等方法进行。
基于同一发明构思,本发明的另一个实施例提供一种采用上述方法的基于小目标搜索缩放技术的水下目标检测系统,其包括:
第一检测结果获取模块,用于将待检测图片输入至由Faster-RCNN网络和FPN网络构成的目标检测网络,得到第一检测结果;
第二检测结果获取模块,用于提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;
决策融合模块,用于将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。
基于同一发明构思,本发明的另一个实施例提供一种电子装置(计算机、服务器、智能手机等),其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明方法中各步骤的指令。
基于同一发明构思,本发明的另一个实施例提供一种计算机可读存储介质(如ROM/RAM、磁盘、光盘),所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明方法的各个步骤。
上述实例只是本发明的举例,尽管为说明目的公开了本发明的最佳实施例和附图,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于最佳实施例和附图所公开的内容。

Claims (10)

1.一种基于小目标搜索缩放技术的水下目标检测方法,其步骤包括:
将待检测图片输入至由Faster-RCNN网络和FPN网络构成的目标检测网络,得到第一检测结果;
提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;
在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;
将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。
2.如权利要求1所述的方法,其特征在于,所述的提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图,包括:
提取FPN中尺寸最大的两张特征图F1、F2,F1的长宽尺寸均为F2的两倍,通道数相同;
分别计算两张特征图F1、F2的二维热力图H1、H2;
将H2放大至H1的大小,计算H=max(H1-H2,0),其中H为小目标热力图,max是像素级的操作;
对H1进行边缘检测得到二维边缘图;
将二维边缘图和H结合得到综合热力图。
3.如权利要求2所述的方法,其特征在于,所述将二维边缘图和H结合,是将二维边缘图和H加和,或者将二维边缘图和H加权相加。
4.如权利要求2所述的方法,其特征在于,所述热力图的计算公式为:
weights1×1×C=sumByChannel(FH×W×C)
weightedFH×W×C=weights1×1×C·FH×W×C
heatmapH×W=sumAcrossChannel(weightedFH×W×C)
其中,F为FPN的特征图,weights1×1×C表示特征图各通道的权重;H、W、C分别表示特征图的三个维度,即高、宽、通道;sumByChannel表示对宽高两个轴做求和操作,留下通道轴;weightedFH×W×C表示加权后的特征图;heatmapH×W表示热力图;sumAcrossChannel表示每个像素的各个通道值进行求和。
5.如权利要求2所述的方法,其特征在于,使用sobel边缘检测算法或者拉普拉斯边缘检测方法进行所述边缘检测。
6.如权利要求1所述的方法,其特征在于,所述在综合热力图上进行搜索,找到激活值之和最大的窗口,包括:创建大小为综合热力图的k倍的窗口,在综合热力图上进行滑窗分析,找到激活值之和最大的窗口,其中k为缩放比。
7.如权利要求1所述的方法,其特征在于,所述决策融合包括:
对第二检测结果的每一个检测框,都找到一个与第一检测结果中交并比最大的检测框;
多个第二检测结果的检测框对应一个第一检测结果的检测框,将对应起来的多个第二检测结果的检测框和第一检测结果的一个检测框全部做加权平均,权重为检测框本身的置信度,将加权平均的结果更新到原来第一检测结果的检测框中;
更新后的第一检测结果的检测框的置信度为做加权平均的一系列检测框中的置信度最大的值。
8.一种采用权利要求1~7中任一权利要求所述方法的基于小目标搜索缩放技术的水下目标检测系统,其特征在于,包括:
第一检测结果获取模块,用于将待检测图片输入至由Faster-RCNN网络和FPN网络构成的目标检测网络,得到第一检测结果;
第二检测结果获取模块,用于提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;
决策融合模块,用于将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。
9.一种电子装置,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~7中任一权利要求所述方法的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~7中任一权利要求所述的方法。
CN202011096905.5A 2020-10-14 2020-10-14 基于小目标搜索缩放技术的水下目标检测方法和系统 Active CN112419227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011096905.5A CN112419227B (zh) 2020-10-14 2020-10-14 基于小目标搜索缩放技术的水下目标检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011096905.5A CN112419227B (zh) 2020-10-14 2020-10-14 基于小目标搜索缩放技术的水下目标检测方法和系统

Publications (2)

Publication Number Publication Date
CN112419227A true CN112419227A (zh) 2021-02-26
CN112419227B CN112419227B (zh) 2024-02-20

Family

ID=74855366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011096905.5A Active CN112419227B (zh) 2020-10-14 2020-10-14 基于小目标搜索缩放技术的水下目标检测方法和系统

Country Status (1)

Country Link
CN (1) CN112419227B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961019A (zh) * 2019-02-28 2019-07-02 华中科技大学 一种时空行为检测方法
WO2020073310A1 (en) * 2018-10-12 2020-04-16 Nokia Technologies Oy Method and apparatus for context-embedding and region-based object detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073310A1 (en) * 2018-10-12 2020-04-16 Nokia Technologies Oy Method and apparatus for context-embedding and region-based object detection
CN109961019A (zh) * 2019-02-28 2019-07-02 华中科技大学 一种时空行为检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HONG LIU 等: ""WQT and DG-YOLO: towards domain generalization in underwater object detection"", 《ARXIV》 *
刘唐波 等: ""基于姿态估计的驾驶员手部动作检测方法研究"", 《信号处理》, vol. 35, no. 12 *
徐成琪 等: ""基于功能保持的特征金字塔目标检测网络"", 《模式识别与人工智能》, vol. 33, no. 6 *
杨烁今: ""基于深度卷积神经网络的遥感图像目标检测"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Also Published As

Publication number Publication date
CN112419227B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN111415316B (zh) 基于生成对抗网络的缺陷数据合成方法
CN109766830B (zh) 一种基于人工智能图像处理的舰船目标识别系统及方法
CN108665481B (zh) 多层深度特征融合的自适应抗遮挡红外目标跟踪方法
CN112598713A (zh) 一种基于深度学习的近岸海底鱼类检测、跟踪统计方法
CN111046880A (zh) 一种红外目标图像分割方法、系统、电子设备及存储介质
Shahab et al. How salient is scene text?
CN110647802A (zh) 基于深度学习的遥感影像舰船目标检测方法
CN110929593A (zh) 一种基于细节辨别区别的实时显著性行人检测方法
CN109165658B (zh) 一种基于Faster-RCNN的强负样本水下目标检测方法
Wang et al. An overview of 3d object detection
CN113963032A (zh) 一种融合目标重识别的孪生网络结构目标跟踪方法
CN113888461A (zh) 基于深度学习的小五金件缺陷检测方法、系统及设备
CN112651381A (zh) 基于卷积神经网络的视频图像中家畜识别方法及装置
CN112396036A (zh) 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法
CN110135435B (zh) 一种基于广度学习系统的显著性检测方法及装置
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
CN114170686A (zh) 一种基于人体关键点的屈肘行为检测方法
CN112926667A (zh) 深度融合边缘与高层特征的显著性目标检测方法及装置
CN110334703B (zh) 一种昼夜图像中的船舶检测和识别方法
Kezia et al. A color-texture based segmentation method to extract object from background
Li et al. A new algorithm of vehicle license plate location based on convolutional neural network
CN116912670A (zh) 基于改进yolo模型的深海鱼类识别方法
CN114037737B (zh) 一种基于神经网络的近岸海底鱼类检测及跟踪统计方法
CN113284221B (zh) 一种目标物检测方法、装置及电子设备
CN112419227B (zh) 基于小目标搜索缩放技术的水下目标检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant