CN112434672A - 一种基于改进YOLOv3的海上人体目标检测方法 - Google Patents

一种基于改进YOLOv3的海上人体目标检测方法 Download PDF

Info

Publication number
CN112434672A
CN112434672A CN202011506015.7A CN202011506015A CN112434672A CN 112434672 A CN112434672 A CN 112434672A CN 202011506015 A CN202011506015 A CN 202011506015A CN 112434672 A CN112434672 A CN 112434672A
Authority
CN
China
Prior art keywords
feature
improved
loss
human body
yolov3
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011506015.7A
Other languages
English (en)
Other versions
CN112434672B (zh
Inventor
李东锦
牛福
刘昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202011506015.7A priority Critical patent/CN112434672B/zh
Publication of CN112434672A publication Critical patent/CN112434672A/zh
Application granted granted Critical
Publication of CN112434672B publication Critical patent/CN112434672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进YOLOv3的海上人体目标检测方法,构建改进YOLOv3的特征提取网络,并从不同层提取得到三个不同尺度的特征图,送入特征金字塔网络进行特征融合,构建改进的YOLOv3的损失函数,采用聚类算法对制作的数据集中的目标框的高和宽进行聚类,获得预测需要的锚框;将训练集数据送入到改进后的模型中进行训练,得到最终的检测模型;将待检测的图像送入到训练好的模型中,模型将检测出来的海上人体目标用矩形框显示出来。与现有技术相比,本发明所实现的改进后的模型比YOLOv3模型的检测精度提升了7.79个百分点,具有显著的提升。将其应用于海上人体目标搜寻领域,能够提高搜寻的效率。

Description

一种基于改进YOLOv3的海上人体目标检测方法
技术领域
本发明涉及计算机视觉和海上人体目标搜寻技术领域,特别是涉及一种海上人体目标检测方法。
背景技术
目前,对海上事故中落水人员的搜寻主要是依靠搜救人员目视搜寻,具有很大的局限性。为了最大程度的减少落水人员的伤亡,需要一种快速准确的海上人体目标搜寻技术,以提高海上的搜寻效率。近年来,基于深度学习的目标检测技术取得了很大的成功,广泛应用于生活中。该技术能够通过深层卷积神经网络能得到图片中目标的种类和位置信息,在复杂的环境下也不容易受到影响,而且该技术还具有很快的处理速度。利用该技术的这些优势,将该技术应用到海上人体目标搜寻领域,具有重大的意义。
发明内容
基于上述技术背景,本发明提出了一种基于改进YOLOv3的海上人体目标检测方法,实现对大范围的海上环境中的人体目标快速且准确的搜寻。
本发明的一种基于改进YOLOv3的海上人体目标检测方法,具体包括如下步骤:
步骤1:制作包含海上人体目标的图像集;
步骤2:用标注软件对图像集中的海上人体目标进行标注,将其位置信息和类别信息保存起来,获得图像集和标注集合并成的数据集;
步骤3:构建改进YOLOv3的特征提取网络,并从网络的不同层提取得到三个不同尺度的特征图;
步骤4:将改进YOLOv3的特征提取网络的输出所得到的三个不同尺度的特征图送入特征金字塔网络进行特征融合;
步骤5:构建改进的YOLOv3的损失函数,表达式如下;
Loss=Lossconf+Lossclasses+LossCIoU
其中,Lossconf为置信度误差,Lossclasses为类别损失,LossCIoU为CIoU损失函数。
步骤6:采用K-means聚类算法的改进算法对制作的数据集中的目标框的高和宽进行聚类,获得预测需要的锚框;
步骤7:将训练集数据送入到改进后的模型中进行训练,得到最终的检测模型;
步骤8:将待检测的图像送入到训练好的模型中,模型将检测出来的海上人体目标用矩形框显示出来。
与现有技术相比,本发明所提出的基于改进YOLOv3的海上人体目标检测方法具有以下有益效果:
通过改进YOLOv3的特征提取网络,提取到更有效的特征,提高了检测精度,减少了检测时间;针对海上人体目标尺度小,特征弱的特点,对YOLOv3损失函数进行了优化,更适用于海上人体目标的检测;使用了K-means++聚类算法,得到更适合的锚框。改进后的模型比YOLOv3模型的检测精度提升了7.79个百分点,具有显著的提升。将其应用于海上人体目标搜寻领域,提高了搜寻的效率。
附图说明
图1为本发明的一种基于改进YOLOv3的海上人体目标检测方法整体流程图;
图2为利用Effi-Res残差块构建改进YOLOv3的特征提取网络的具体过程示意图;
图3为改进YOLOv3的特征提取网络整体结构图;
图4为检测效果示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案进行详细说明。
如图1所示,该图为本发明的一种基于改进YOLOv3的海上人体目标检测方法整体流程图。该流程具体包括以下步骤:
步骤1:制作包含海上人体目标的图像集,具体操作为:图像通过摄像头拍摄视频再对其进行按帧截取,图像应具有以下特点:图像画面应保持清晰;图像画面内应包含大量所要检测的海上人体目标;图像画面应包含多个不同的场景变换。将所得的图像按一定的命名规则保存在一个文件夹中,制得图像集,图像集共包含6079张图片;
步骤2:用标注软件对图像集中的海上人体目标进行标注,将其位置信息和类别信息保存起来以获得数据集,具体操作为:使用Label me或者其他图像标注软件对图像集进行标注,将图像中的海上人体目标用矩形框标注出来,并将标注软件输出的包含目标框位置及类别信息的xml文件保存在另一个文件夹中,命名与图片的名称对应相同。图像集和标注集合构成数据集;
步骤3:构建改进YOLOv3的特征提取网络,使用EfficientNet中的残差块组成的特征提取网络代替YOLOv3中的DarkNet-53,并从网络的不同层提取得到三个不同尺度的特征图;
改进的特征提取网络是由15个残差块构成的,这些残差块结构按1,2,2,3,3,4的重复次数组成新的特征提取网络,并选择第二个重复次数为2的残差块的输出、第二个重复次数为3的残差块的输出和重复次数为4的残差块的输出为后续特征融合网络的输入。如图2所示,为Effi-Res残差块的具体结构,具体构成如下:
3-1、将输入通过1×1的卷积进行通道变换,通道变换得到的维度与使用卷积的个数有关,此处将通道数变为原来的二倍,之后对得到的特征图进行批量归一化操作,使输出数据的分布与原来数据的分布保持一致,可以防止学习过程中梯度消失,最后使用swish激活函数对特征图进行处理;
3-2、使用一个3×3的深度可分离卷积块对3-1得到的特征图进行卷积,深度可分离卷积,能够在保证检测精度的情况下,极大的降低运算成本。之后将得到的特征图进行批量归一化操作,最后使用swish激活函数对特征图进行处理;
3-3、将3-2得到的特征图通过通道注意力机制模块,该模块能够学习到不同通道的权重,进而得到各个通道的贡献程度。其具体过程为:首先经过全局平均池化和尺度变换,之后通过1×1的卷积块进行升维,得到通道的全局信息,接着又通过1×1的卷积块进行降维至与该模块的输入通道数相同的值,最后通过残差边将通道注意力模块的输入与输出相乘得到最终特征;
3-4、对3-3得到的特征图使用1×1的卷积块进行维度变换,使得该结果的通道数与残差模块的输入通道数相同,并进行归一化操作,并通过一个跨连接将残差模块的输入与输出进行融合。
步骤4:将通过改进YOLOv3的特征提取网络的输出所得到的三个不同尺度的特征图送入特征金字塔网络再次进行特征融合,融合的具体过程为:
4-1、特征提取网络的输入均被裁剪到416×416,得到的最后三个特征图C1、C2、C3,大小分别为52×52×256、26×26×512、13×13×1024,其中13,26,52表示特征图的尺寸,256,512,1024表示特征图的通道数,可通过卷积核的个数来调整。
4-2、特征图C3经过横向连接后,得到特征图P3,大小为13×13×512;
4-3、特征图P3经过上采样,大小变为13×13×256,与特征图C2经过横向连接后,大小为26×26×256,进行通道连接,之后经过卷积整合得到特征图P2,大小为26×26×256;
4-4、特征图P2经过上采样,大小变为52×52×128,与特征图C1经过横向连接后,大小变为52×52×128,进行通道连接,之后经过卷积整合得到P1,大小为52×52×128。
其中横向连接是通过1×1、3×3和1×1三种卷积操作级联实现的。最后的卷积整合是通过1×1、3×3、1×1、3×3和1×1五种卷积操作级联实现的;
如图3所示,为改进YOLOv3的特征提取网络整体结构图。在该结构中,将特征提取网络的第二个重复次数为2的残差块的输出、第二个重复次数为3的残差块的输出和重复次数为4的残差块的输出,即特征图C1,C2,C3,送入特征金字塔,通过自上而下和横向连接的结构,融合得到特征图P1,P2,P3。
步骤5:构建改进YOLOv3的损失函数,原有的损失函数Loss的表达式为:
Loss=Lossconf+Lossclasses+Lossbox
其中,Lossconf为置信度误差,Lossclasses为类别损失,Lossbox为目标框损失;
Lossbox的表达式为:
Figure BDA0002844968390000051
其中,(xi,yi)为预测的矩形框的中心坐标,
Figure BDA0002844968390000052
为真实物体矩形框的中心坐标,
Figure BDA0002844968390000053
用来表示该矩形框是否负责预测一个目标物体,如果该矩形框负责预测一个目标则为1,否则等于0,λcoord为一个在不同大小矩形框对误差函数贡献不一致时设置的比例系数,大小为
Figure BDA0002844968390000054
其中
Figure BDA0002844968390000055
为真实框的宽与高,
Figure BDA0002844968390000056
为预测框的宽与高。
由于海上人体目标尺寸比较小,使用LossCIoU代替Lossbox更适合于海上人体目标的检测,即使用CIoU损失函数代替YOLOv3中目标框的损失:
LossCIoU的表达式为:
Figure BDA0002844968390000057
其中,c、cgt分别为预测框和真实框的中心点位置,ρ为两个中心点之间的欧氏距离,d为同时包含两个矩形框的最小闭包区域的对角线距离;
用α、v将目标框的宽和高考虑进去,表达式如下:
Figure BDA0002844968390000058
Figure BDA0002844968390000059
其中wgt和hgt为真实框的宽和高,w、h为预测框的宽和高。
改进后的损失函数表达式如下:
Loss=Lossconf+Lossclasses+LossCIoU
步骤6:采用K-means聚类算法的改进算法对制作的数据集中的目标框的高和宽进行聚类,获得需要的先验锚框。
在YOLOv3中,使用K-means算法对自制数据集聚类生成锚框。然而K-means算法由于初始点是随机选取的,这样会导致分类结果会因初始点选取的不同而有所区别。因此,选用针对此进行优化的K-means++算法进行聚类。
使用K-means++算法对海上人体目标数据集进行聚类,得到的9个锚框为:(3,7),(5,10),(4,19),(6,15),(9,17),(7,25),(11,25),(8,39),(11,49)。
步骤7:将训练集数据送入到改进后的模型中进行训练,得到最终的检测模型。训练的具体过程为:
7-1、将自制的海上人体目标数据集按9:1的比例划分为训练集和测试集;
7-2、将训练集数据送入模型中训练;
7-3、初始学习率设为0.001,采用固定步长衰减的学习率调整方式,每隔1个迭代,学习率衰减0.05;
7-4、训练迭代到损失值下降于设定的阈值后停止训练,保存模型。
步骤8:将实时拍摄的海上一定搜寻范围的视频按帧提取得到待检测的图像,将图像送入到训练好的模型中,模型将检测出来的海上人体目标用矩形框显示出来。
为了验证改进模型的检测效果,将改进模型的检测精度与YOLOv3的检测精度做了对比,提升了7.79个百分点,并且改进的模型大小为63M,相比于YOLOv3算法模型246.8M的大小,减少了近3倍,具有更快的检测速度。最后为检测效果,如图4。从图可以看出,将其应用于海上人体目标搜寻领域,具有一定的有效性。

Claims (3)

1.一种基于改进YOLOv3的海上人体目标检测方法,其特征在于,该方法具体包括如下步骤:
步骤1:制作包含海上人体目标的图像集;
步骤2:用标注软件对图像集中的海上人体目标进行标注,将其位置信息和类别信息保存起来,获得图像集和标注集合并成的数据集;
步骤3:构建改进YOLOv3的特征提取网络,并从网络的不同层提取得到三个不同尺度的特征图;
步骤4:将改进YOLOv3的特征提取网络的输出所得到的三个不同尺度的特征图送入特征金字塔网络进行特征融合;
步骤5:构建改进的YOLOv3的损失函数,表达式如下;
Loss=Lossconf+Lossclasses+LossCIoU
其中,Lossconf为置信度误差,Lossclasses为类别损失,LossCIoU为CIoU损失函数;
步骤6:采用K-means聚类算法的改进算法对制作的数据集中的目标框的高和宽进行聚类,获得预测需要的锚框;
步骤7:将训练集数据送入到改进后的模型中进行训练,得到最终的检测模型;
步骤8:将待检测的图像送入到训练好的模型中,模型将检测出来的海上人体目标用矩形框显示出来。
2.如权利要求1所述的一种基于改进YOLOv3的海上人体目标检测方法,其特征在于,所述步骤3的具体处理包括:
改进的特征提取网络是由15个残差块构成的,这些残差块结构按1,2,2,3,3,4的重复次数组成新的特征提取网络,并选择第二个重复次数为2的残差块的输出、第二个重复次数为3的残差块的输出和重复次数为4的残差块的输出为后续特征融合网络的输入。每个残差块的具体构成如下:
3-1、将输入通过1×1的卷积进行通道变换,通道变换得到的维度与使用卷积的个数有关,此处将通道数变为原来的二倍,之后对得到的特征图进行批量归一化操作,再使用swish激活函数对特征图进行处理;
3-2、使用一个3×3的深度可分离卷积块对3-1得到的特征图进行卷积,之后将得到的特征图进行批量归一化操作,再采用swish激活函数增加卷积神经网络的非线性表示能力;
3-3、将3-2得到的特征图通过通道注意力机制模块,该模块的具体过程为:首先经过全局平均池化和尺度变换,之后通过1×1的卷积块进行升维,得到通道的全局信息,接着又通过1×1的卷积块进行降维至与该模块的输入通道数相同的值;再通过残差边将通道注意力模块的输入与输出相乘得到最终特征;
3-4、对3-3得到的特征图使用1×1的卷积块进行维度变换,使得该结果的通道数与残差模块的输入通道数相同,并进行归一化操作,并通过一个跨连接将残差模块的输入与输出进行融合。
3.如权利要求1所述的一种基于改进YOLOv3的海上人体目标检测方法,其特征在于,所述特征融合的具体过程如下:
4-1、特征提取网络的输入均被裁剪到416×416,得到的最后三个特征图C1、C2、C3;
4-2、特征图C3经过横向连接后,得到特征图P3;
4-3、特征图P3经过上采样,与特征图C2经过横向连接后的特征图进行通道连接,之后经过卷积整合得到特征图P2;
4-4、特征图P2经过上采样,与特征图C1经过横向连接,进行通道连接,之后经过卷积整合得到特征图P1。
CN202011506015.7A 2020-12-18 2020-12-18 一种基于改进YOLOv3的海上人体目标检测方法 Active CN112434672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011506015.7A CN112434672B (zh) 2020-12-18 2020-12-18 一种基于改进YOLOv3的海上人体目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011506015.7A CN112434672B (zh) 2020-12-18 2020-12-18 一种基于改进YOLOv3的海上人体目标检测方法

Publications (2)

Publication Number Publication Date
CN112434672A true CN112434672A (zh) 2021-03-02
CN112434672B CN112434672B (zh) 2023-06-27

Family

ID=74696768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011506015.7A Active CN112434672B (zh) 2020-12-18 2020-12-18 一种基于改进YOLOv3的海上人体目标检测方法

Country Status (1)

Country Link
CN (1) CN112434672B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949500A (zh) * 2021-03-04 2021-06-11 北京联合大学 一种基于空间特征编码改进的YOLOv3车道线检测方法
CN113052834A (zh) * 2021-04-20 2021-06-29 河南大学 一种基于卷积神经网络多尺度特征的管道缺陷检测方法
CN113362032A (zh) * 2021-06-08 2021-09-07 贵州开拓未来计算机技术有限公司 一种基于人工智能图像识别的校验审批方法
CN113435269A (zh) * 2021-06-10 2021-09-24 华东师范大学 一种基于YOLOv3改进的水面漂浮物检测与识别方法及系统
CN113487550A (zh) * 2021-06-30 2021-10-08 佛山市南海区广工大数控装备协同创新研究院 一种基于改进激活函数的目标检测方法及装置
CN113537226A (zh) * 2021-05-18 2021-10-22 哈尔滨理工大学 一种基于深度学习的烟雾检测方法
CN113553979A (zh) * 2021-07-30 2021-10-26 国电汉川发电有限公司 一种基于改进yolo v5的安全服检测方法和系统
CN113837275A (zh) * 2021-09-24 2021-12-24 南京邮电大学 基于扩张坐标注意力的改进YOLOv3目标检测方法
CN113962282A (zh) * 2021-08-19 2022-01-21 大连海事大学 一种基于改进YOLOv5L+DeepSort的船舶机舱火灾实时检测系统及方法
CN114445695A (zh) * 2022-01-05 2022-05-06 集美大学 海上航标识别方法、系统、装置和存储介质
CN114587416A (zh) * 2022-03-10 2022-06-07 山东大学齐鲁医院 基于深度学习多目标检测的胃肠道粘膜下肿瘤诊断系统
CN114926527A (zh) * 2022-06-08 2022-08-19 哈尔滨理工大学 一种复杂背景下的机械臂抓取位姿检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815886A (zh) * 2019-01-21 2019-05-28 南京邮电大学 一种基于改进YOLOv3的行人和车辆检测方法及系统
CN110991362A (zh) * 2019-12-06 2020-04-10 西安电子科技大学 一种基于注意力机制的行人检测模型
CN111079584A (zh) * 2019-12-03 2020-04-28 东华大学 基于改进YOLOv3的快速车辆检测方法
CN111401148A (zh) * 2020-02-27 2020-07-10 江苏大学 一种基于改进的多级YOLOv3的道路多目标检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815886A (zh) * 2019-01-21 2019-05-28 南京邮电大学 一种基于改进YOLOv3的行人和车辆检测方法及系统
CN111079584A (zh) * 2019-12-03 2020-04-28 东华大学 基于改进YOLOv3的快速车辆检测方法
CN110991362A (zh) * 2019-12-06 2020-04-10 西安电子科技大学 一种基于注意力机制的行人检测模型
CN111401148A (zh) * 2020-02-27 2020-07-10 江苏大学 一种基于改进的多级YOLOv3的道路多目标检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIE HU: "Squeeze-and-Excitation Networks", 《ARXIV》 *
ZHAOHUI ZHENG: "Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression", 《ARXIV》 *
涂岩: "一种双网融合的分阶段烟雾检测算法", 《西安电子科技大学学报》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949500A (zh) * 2021-03-04 2021-06-11 北京联合大学 一种基于空间特征编码改进的YOLOv3车道线检测方法
CN113052834B (zh) * 2021-04-20 2023-04-18 河南大学 一种基于卷积神经网络多尺度特征的管道缺陷检测方法
CN113052834A (zh) * 2021-04-20 2021-06-29 河南大学 一种基于卷积神经网络多尺度特征的管道缺陷检测方法
CN113537226A (zh) * 2021-05-18 2021-10-22 哈尔滨理工大学 一种基于深度学习的烟雾检测方法
CN113362032A (zh) * 2021-06-08 2021-09-07 贵州开拓未来计算机技术有限公司 一种基于人工智能图像识别的校验审批方法
CN113435269A (zh) * 2021-06-10 2021-09-24 华东师范大学 一种基于YOLOv3改进的水面漂浮物检测与识别方法及系统
CN113487550A (zh) * 2021-06-30 2021-10-08 佛山市南海区广工大数控装备协同创新研究院 一种基于改进激活函数的目标检测方法及装置
CN113487550B (zh) * 2021-06-30 2024-01-16 佛山市南海区广工大数控装备协同创新研究院 一种基于改进激活函数的目标检测方法及装置
CN113553979A (zh) * 2021-07-30 2021-10-26 国电汉川发电有限公司 一种基于改进yolo v5的安全服检测方法和系统
CN113553979B (zh) * 2021-07-30 2023-08-08 国电汉川发电有限公司 一种基于改进yolo v5的安全服检测方法和系统
CN113962282A (zh) * 2021-08-19 2022-01-21 大连海事大学 一种基于改进YOLOv5L+DeepSort的船舶机舱火灾实时检测系统及方法
CN113962282B (zh) * 2021-08-19 2024-04-16 大连海事大学 一种基于改进YOLOv5L+DeepSort的船舶机舱火灾实时检测系统及方法
CN113837275A (zh) * 2021-09-24 2021-12-24 南京邮电大学 基于扩张坐标注意力的改进YOLOv3目标检测方法
CN113837275B (zh) * 2021-09-24 2023-10-17 南京邮电大学 基于扩张坐标注意力的改进YOLOv3目标检测方法
CN114445695A (zh) * 2022-01-05 2022-05-06 集美大学 海上航标识别方法、系统、装置和存储介质
CN114587416A (zh) * 2022-03-10 2022-06-07 山东大学齐鲁医院 基于深度学习多目标检测的胃肠道粘膜下肿瘤诊断系统
CN114926527A (zh) * 2022-06-08 2022-08-19 哈尔滨理工大学 一种复杂背景下的机械臂抓取位姿检测方法

Also Published As

Publication number Publication date
CN112434672B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN112434672A (zh) 一种基于改进YOLOv3的海上人体目标检测方法
CN109902677B (zh) 一种基于深度学习的车辆检测方法
CN113569667B (zh) 基于轻量级神经网络模型的内河船舶目标识别方法及系统
CN114202672A (zh) 一种基于注意力机制的小目标检测方法
CN110929578A (zh) 一种基于注意力机制的抗遮挡行人检测方法
CN108549893A (zh) 一种任意形状的场景文本端到端识别方法
CN110782420A (zh) 一种基于深度学习的小目标特征表示增强方法
CN110348384B (zh) 一种基于特征融合的小目标车辆属性识别方法
CN111079739B (zh) 一种多尺度注意力特征检测方法
CN112529090B (zh) 一种基于改进YOLOv3的小目标检测方法
CN111898432B (zh) 一种基于改进YOLOv3算法的行人检测系统及方法
CN110647802A (zh) 基于深度学习的遥感影像舰船目标检测方法
CN109359661B (zh) 一种基于卷积神经网络的Sentinel-1雷达图像分类方法
CN109785344A (zh) 基于特征重标定的双通路残差网络的遥感图像分割方法
CN110569738A (zh) 基于密集连接网络的自然场景文本检测方法、设备和介质
CN111461213A (zh) 一种目标检测模型的训练方法、目标快速检测方法
CN116385958A (zh) 一种用于电网巡检和监控的边缘智能检测方法
CN111598155A (zh) 一种基于深度学习的细粒度图像弱监督目标定位方法
CN112149526A (zh) 一种基于长距离信息融合的车道线检测方法及系统
CN112084897A (zh) 一种gs-ssd的交通大场景车辆目标快速检测方法
CN112270285B (zh) 一种基于稀疏表示和胶囊网络的sar图像变化检测方法
CN109284752A (zh) 一种车辆的快速检测方法
CN117253043A (zh) 基于空间信息增强transformer的遥感图像语义分割方法
CN117409358A (zh) 一种融合BiFPN的轻量化火焰检测方法
CN115861595B (zh) 一种基于深度学习的多尺度域自适应异源图像匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant