CN112418020A - 一种基于注意力机制的YOLOv3违法广告牌智能检测方法 - Google Patents

一种基于注意力机制的YOLOv3违法广告牌智能检测方法 Download PDF

Info

Publication number
CN112418020A
CN112418020A CN202011243239.3A CN202011243239A CN112418020A CN 112418020 A CN112418020 A CN 112418020A CN 202011243239 A CN202011243239 A CN 202011243239A CN 112418020 A CN112418020 A CN 112418020A
Authority
CN
China
Prior art keywords
billboard
attention
feature
module
illegal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011243239.3A
Other languages
English (en)
Inventor
邓壮壮
张茜茜
王方召
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202011243239.3A priority Critical patent/CN112418020A/zh
Publication of CN112418020A publication Critical patent/CN112418020A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • G06V20/38Outdoor scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于注意力机制的YOLOv3违法广告牌智能检测方法,包括采集广告牌图像,获取由违法和合法广告牌图像组成的广告牌数据集;将广告牌数据集划分为独立不重复的验证集和测试集;对验证集和测试集中每个广告牌图像的特征提取,获得各广告牌图像的特征;基于Darknet53网络模型增加由通道注意力模块和空间注意力模块构成的CBAM模块,得到广告牌检测模型;将验证集内广告牌图像的特征作为输入模型参数;将测试集内广告牌图像的特征输入,获得检测结果。本发明可实现准确的定位和分类违法广告,缓解对于大量人力的依赖,提高了对违法广告的检测。

Description

一种基于注意力机制的YOLOv3违法广告牌智能检测方法
技术领域
本发明涉及一种基于注意力机制的YOLOv3违法广告牌智能检测方法,属于智能检测的技术领域。
背景技术
随着经济社会的快速发展,人民生活水平得到了提高,各色各样的商铺广告出现在我们的生活中,不仅在城市有很多商铺广告,在城镇也有很多商铺广告;而城市中可以得到有效地管理,但在缺乏管理的城镇,广告设施杂乱,影响城市乡镇的视觉环境。
为了规范城镇户外广告设施和店招标牌设施的设置行为,确保广告设施的安全可靠,创造健康、有序的城市视觉环境,城市管理部门需对违法广告设施做定期肃清。但目前执法依赖执法人员在街道拍照取证,由于涉及街道范围较广,需要耗费大量人力,而且效率也较低。
发明内容
本发明所要解决的技术问题在于克服现有技术的不足,提供一种基于注意力机制的YOLOv3违法广告牌智能检测方法,该智能检测算法定位和分类准确,在一定程度上缓解了对于人力资源的依赖,有助于创造健康、有序的城市视觉环境。
本发明具体采用以下技术方案解决上述技术问题:
一种基于注意力机制的YOLOv3违法广告牌智能检测方法,包括以下步骤:
步骤1、采集广告牌图像,获取由违法和合法广告牌图像组成的广告牌数据集;
步骤2、将获取的广告牌数据集划分为独立不重复的验证集和测试集;
步骤3、对所划分的验证集和测试集中每个广告牌图像的特征提取,分别获得验证集和测试集内各广告牌图像的特征;
步骤4、基于Darknet53网络模型增加由通道注意力模块和空间注意力模块构成的CBAM模块,并进行训练得到广告牌检测模型;将验证集内广告牌图像的特征输入基于Darknet53网络模型训练得到的广告牌检测模型中,得到验证集内广告牌图像的中间特征映射,将中间特征映射输入CBAM模块得到空间注意力特征,并通过对广告牌检测模型验证,获取得到广告牌检测模型的参数;将测试集内广告牌图像的特征输入带参数的广告牌检测模型中,获得检测结果。
进一步地,作为本发明的一种优选技术方案,所述步骤1中利用目标检测标注工具对广告牌图像进行标注,将标注的广告牌图像格式化为设定尺寸,以采集得到广告牌图像。
进一步地,作为本发明的一种优选技术方案,所述步骤2中采用随机抽样法对广告牌数据集划分。
进一步地,作为本发明的一种优选技术方案,所述步骤4将验证集内广告牌图像的特征输入广告牌检测模型得到验证集内广告牌图像的中间特征映射,包括以下步骤:
将验证集内广告牌图像的特征输入广告牌检测模型中,得到中间特征映射;
将中间特征映射先输入CBAM模块的通道注意力模块,分别经过基于并行的两个通道进行最大池化层和平均池化层操作,获取基于最大池化层处理的特征和基于平均池化层处理的特征,再将该两个特征分别经过共享网络多层感知器MLP输出得到两个特征;将共享网络多层感知器MLP分别输出的两个特征进行相乘,再同基于最大池化层处理的特征和基于平均池化层处理的特征进行加和操作,最后采用sigmoid激活函数,生成权重通道注意力特征;将权重通道注意力特征和输入的中间特征映射进行乘法操作,生成最终的输出通道注意力特征;
将最终的输出通道注意力特征输入空间注意力模块,分别经过基于并行的两个通道最大池化层和平均池化层的操作,获取基于最大池化层处理的特征和基于平均池化层处理的特征,再将这两个特征基于通道做拼接操作后经过一个卷积操作降维,采用sigmoid激活函数,生成权重空间注意力特征;
将生成的权重通道注意力特征与权重空间注意力特征进行乘法操作,得到最终的输出空间注意力特征。
本发明采用上述技术方案,能产生如下技术效果:
本发明的基于注意力机制的YOLOv3违法广告牌智能检测方法,聚焦违法广告的智能检测,可以提升违法广告检验的准确度,降低对大量人工的依赖,同时提升违法广告检测的效果。该发明既可以检测场景中是否包含违法广告,又可以给出违法广告具体的位置和类别。该发明不仅可以考察违法广告的检出能力、也考察违法广告定位和分类能力。在一定程度上提高了违法广告检测的效率,降低了对人力的消耗,实现智能化检测。与现有技术相比,本发明的优点有:
(1)由Darknet网络模型对数据集进行训练,得到一个高效的训练结果,由此可以对违法广告的快速定位,比起以往的方法更高效,节省了大量的时间和人工成本;(2)加入CBAM模块,可以更好的倾向于关注图像中辅助判断的部分信息,并忽略不相关的信息,从而实现准确的定位和分类违法广告;(3)加入CBAM模块,使得输出不同层的特征图更精确,优化了输出数据,提高定位和分类的准确性。
因此,本发明方法可以有效地规范城镇户外广告设施和店招标牌设施的设置行为,创造健康、有序的城市视觉环境。
附图说明
图1为本发明实施违法广告检测的训练流程图。
图2为本发明改进Darknet53网络结构的简易图。
图3为本发明增加注意力机制CBAM模块的简易图。
图4为本发明注意力机制CBAM与卷积层融合的示意图。
图5(a)和图5(b)分别为本发明未增加与增加CBAM模块的测试效果对比图。
图6(a)和图6(b)分别为本发明未增加与增加CBAM模块的实验数据分析对比图。
具体实施方式
下面结合说明书附图对本发明的实施方式进行描述。
如图1所示,本发明涉及了一种基于注意力机制的YOLOv3违法广告牌智能检测方法,该方法具体包括以下步骤:
步骤1、采集广告牌图像,获取由违法和合法广告牌图像组成的广告牌数据集。
本发明方法的广告牌数据集是通过网络收集得到,所收集的数据集图片均来自于现实生活中的场景,然后利用目标检测标注工具对广告牌图像进行标注,将标注的广告牌图像格式化为设定的尺寸,以采集得到广告牌图像,数据集由违法广告牌和合法广告牌组成。
步骤2、将获取的广告牌数据集划分为独立不重复的验证集和测试集。
本发明方法对于广告牌图像样本的划分,采用随机抽样法将广告牌图像数据按验证集80%、测试集20%的比例划分为独立不重复的验证集和测试集。
步骤3、对所划分的验证集和测试集中每个广告牌图像的特征提取,分别获得验证集和测试集内各广告牌图像的特征。
步骤4、基于Darknet53网络模型增加由通道注意力模块和空间注意力模块构成的CBAM模块,并进行训练得到广告牌检测模型;将验证集内广告牌图像的特征输入基于Darknet53网络模型训练得到的广告牌检测模型中,得到验证集内广告牌图像的中间特征映射,将中间特征映射输入CBAM模块得到空间注意力特征,并通过对广告牌检测模型验证,获取得到广告牌检测模型的参数;将测试集内广告牌图像的特征输入带参数的广告牌检测模型中,获得检测结果。具体如下:
首先,获取Darknet53网络模型。所述Darknet53网络模型一共包含53层卷积,除去最后一个全连接层,总共52个卷积用于当做主体网络。Darknet53网络模型共降维5次,通过上采样和下采样,可以达到多尺度融合预测;如图2所示是本发明的改进后网络层,将第26层后的CBAM模块去掉,就是原始的Darknet53网络,Type为层的类别,Convolutional为卷积层,Residual为残差模块,共有三个输出头。其中,主体网络的52层卷积层,是由5组重复的残差单元组成,每个单元由1个单独的卷积层与一组重复执行的卷积层构成,重复执行的卷积层分别重复1次、2次、8次、8次和4次,一共是52层,1+1+(1+1)×1+1+(1+1)×2+1+(1+1)×8+1+(1+1)×8+1+(1+1)×4=52,再加上最后一层全连接层。
本发明在此基础上引进了即插即用的CBAM模块(Convolutional BlockAttention Module),CBAM模块的简易图如图3所示,CBAM表示卷积模块的注意力机制,主要是一种结合了通道(channel)和空间(spatial)的注意力机制模块,学习了通道之间的相关性,筛选出了针对通道的注意力,稍微增加了一点计算量。此外,通过了解要强调或抑制的信息有助于网络内的信息流动。主要网络架构简单,包含一个是通道注意力模块,另一个是空间注意力模块,CBAM模块就是先后集成了通道注意力模块和空间注意力模块。在共用主体网络结束前,也就是第26层卷积层后,添加CBAM模块。
然后,将验证集内广告牌图像的特征输入由Darknet53网络模型训练得到的广告牌检测模型中,得到验证集内广告牌图像的中间特征映射;
再将验证集内广告牌图像的中间特征映射输入CBAM模块,CBAM模块的大致工作流程如下:
给出了一个验证集内广告牌图像的中间特征映射
Figure BDA0002767814030000041
其中F是输入特征,C是通道数,H是特征高,W是特征宽;模块按照两个独立的维度,通道和空间顺序推断出注意力映射,其中,一维权重通道注意力特征
Figure BDA0002767814030000042
二维权重空间注意力特征
Figure BDA0002767814030000051
将中间特征映射先输入CBAM模块的通道注意力模块,分别经过基于并行的两个通道进行最大池化层和平均池化层操作,获取基于最大池化层处理的特征和基于平均池化层处理的特征,通过此操作,对某个区域内的网络特征仅保留最大值或平均值,使得在保证不影响图像原本信息的前提下,极大地减少了网络的参数量。再将该两个特征分别经过共享网络多层感知器MLP(Multi-Layer Perception)输出得到两个特征;然后将共享网络多层感知器MLP分别输出的两个特征进行相乘,再同基于最大池化层处理的特征和基于平均池化层处理的特征进行加和操作,最后采用sigmoid激活函数,生成权重通道注意力特征MC(F),数学化过程表示为:MC(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F))),其中σ为sigmoid激活函数。
然后,将权重通道注意力特征和输入的中间特征映射进行乘法操作,生成最终的输出通道注意力特征,同时也是空间注意力模块需要的输入特征F',数学化过程表示为,
Figure BDA0002767814030000052
对于二维权重空间注意力特征
Figure BDA0002767814030000053
将最终的输出通道注意力特征输入空间注意力模块,分别经过基于并行的两个通道最大池化层和平均池化层的操作,获取基于最大池化层处理的特征和基于平均池化层处理的特征,再将这两个特征基于通道做拼接操作后,经过一个卷积操作降维,输出层采用sigmoid激活函数,生成权重空间注意力特征MS(F'),将其数学化的过程可以表示为:
MS(F')=σ(f7×7([AvgPool(F);MaxPool(F)]))
其中,σ同上。最终,将生成的权重通道注意力特征F'与权重空间注意力特征MS(F')进行乘法操作,得到最终的输出空间注意力特征F”,数学化过程表示为
Figure BDA0002767814030000057
将通道注意力模块和空间注意力模块整合在一起,如图4所示,数学化过程的表示为:
Figure BDA0002767814030000055
其中
Figure BDA0002767814030000056
表示逐元素乘法,F"为最终输出的空间注意力特征。
将验证集内广告牌图像的特征作为输入,进行训练广告牌检测模型,然后通过对广告牌检测模型验证后,获取得到广告牌检测模型的参数,其中,主要参数有:初始学习率设置为0.01,当验证集的损失不再下降时,进行学习率调整,最终学习率调整为0.0005;动量参数设置为0.937,权重系数设置为0.0005;广告牌相对来说是属于大目标,在YOLOv3中的选择大图片输入尺寸为608×608进行训练;训练阈值设置为0.5,以确保有足够的正负样本;epoch为400等。
最后,将测试集内广告牌图像的特征输入带参数的广告牌检测模型中,获得检测结果,利用测试集来检测识别效果,验证模型性能。
如图5(a)和图5(b)所示,展示了采用本发明方法测试前后的效果对比图,左侧是未加入CBAM模块的测试效果图,右侧是本发明方法加入CBAM模块的测试效果图。对于图5(a)组来说,可以看出未添加之前是存在漏检的项目,但检测精度也很可观,添加后的模型可以缓解漏检的缺陷;对于图5(b)组来说,在一定程度上可以提高检测的精度,总的来说,本发明加入CBAM模块对检测准确性能起到了一定的提升作用。
如图6(a)和图6(b)所示,分别是本发明未增加与增加CBAM模块的实验数据分析对比图,展示了该模型的精度和各个指标,是在参数epoch为400,batchsize为16,imagesize为608×608情况下训练得到的;GIoU(Generalized Intersection over Union)表示任意两个边框的度量,此发明中的GIoU作为一种损失度量,其中GIoU和IoU计算公式如下:
Figure BDA0002767814030000061
Figure BDA0002767814030000062
其中,A、B代表任意的两个框,C代表能够包住它们的最小方框。
Objectness以具象化理解为“置信度”,Objectness对应的是布尔值类型的二分类标签,理解成对应的真实和错误的逻辑值;其他分别是,分类模型的性能评价指标、精准率、回归率、平均精度,mAP@0.5是指IoU=0.5时测得模型的精度,F1是指P-R的调和平均,F1由精准率和回归率两个因素决定,计算公式为:
Figure BDA0002767814030000063
其中,Recall为召回率,Precision为精准率。
鉴于计算机硬件,本发明只验证了400个epoch就可以得到明显的提升。实验数据分析:实验采取epoch为0和epoch为399对比,如下表所示:
表1:epoch为0和epoch为399时的对比
Figure BDA0002767814030000064
Figure BDA0002767814030000071
分析表1中几个主要参数,在epoch为0时,未加入CBAM时,精准率为0.0686,加入CBAM之后,精准率为0.08061,提高了0.01201;未加入CBAM时,召回率为0.0806,加入CBAM之后,召回率为0.0877,提高了0.0071;未加入CBAM时,map@0.5为0.0377,加入CBAM之后,map@0.5为0.0436,提高了0.0059;未加入CBAM时,F1为0.0742,加入CBAM之后,F1为0.0874,提高了0.0132;在epoch为399时,未加入CBAM时,精准率为0.308,加入CBAM之后,精准率为0.313,提高了0.005;未加入CBAM时,召回率为0.299,加入CBAM之后,召回率为0.34,提高了0.041;未加入CBAM时,map@0.5为0.277,加入CBAM之后,map@0.5为0.271,下降了0.006,纵观其他参数指标,总体还是提升的;未加入CBAM时,F1为0.302,加入CBAM之后,F1为0.324,提高了0.022;由实验数据知,加入该机制是有效的。
表2:综合对比
Figure BDA0002767814030000072
由实验数据分析,加入CBAM模块后,精度有略微的提升,而测试的时候,也证实了这一点,如图4所示。此外,本发明只验证了Darknet53网络模型的第26层,在添加了CBAM模块达到了可观的效果。
因此,本发明方法采用Darknet53进行广告牌检测模型的构建,在此基础上再加入CBAM模块,可以更好的倾向于关注图像中辅助判断的部分信息,并忽略不相关的信息,从而实现准确的定位和分类违法广告,缓解对于大量人力的依赖,提高了对违法广告的检测。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本设计不受上述实施例的限制,上述实施案例和说明书中描述的只是说明本设计的原理,在不脱离本设计精神和范围的前提下,本设计还会有各种变化和改进,这些变化和改进都落入要求保护的本设计范围内。本设计要求保护范围由所附的权利要求书及其等效物界定。

Claims (4)

1.一种基于注意力机制的YOLOv3违法广告牌智能检测方法,其特征在于,包括以下步骤:
步骤1、采集广告牌图像,获取由违法和合法广告牌图像组成的广告牌数据集;
步骤2、将获取的广告牌数据集划分为独立不重复的验证集和测试集;
步骤3、对所划分的验证集和测试集中每个广告牌图像的特征提取,分别获得验证集和测试集内各广告牌图像的特征;
步骤4、基于Darknet53网络模型增加由通道注意力模块和空间注意力模块构成的CBAM模块,并进行训练得到广告牌检测模型;将验证集内广告牌图像的特征输入基于Darknet53网络模型训练得到的广告牌检测模型中,得到验证集内广告牌图像的中间特征映射,将中间特征映射输入CBAM模块得到空间注意力特征,并通过对广告牌检测模型验证,获取广告牌检测模型的参数;将测试集内广告牌图像的特征输入带参数的广告牌检测模型中,获得检测结果。
2.根据权利要求1所述基于注意力机制的YOLOv3违法广告牌智能检测方法,其特征在于,所述步骤1中利用目标检测标注工具对广告牌图像进行标注,将标注的广告牌图像格式化为设定尺寸,以采集得到广告牌图像。
3.根据权利要求1所述基于注意力机制的YOLOv3违法广告牌智能检测方法,其特征在于:所述步骤2中采用随机抽样法对广告牌数据集划分。
4.根据权利要求1所述基于注意力机制的YOLOv3违法广告牌智能检测方法,其特征在于,所述步骤4将验证集内广告牌图像的特征输入广告牌检测模型得到验证集内广告牌图像的中间特征映射,包括以下步骤:
将验证集内广告牌图像的特征输入广告牌检测模型中,得到中间特征映射;
将中间特征映射先输入CBAM模块的通道注意力模块,分别经过基于并行的两个通道进行最大池化层和平均池化层操作,获取基于最大池化层处理的特征和基于平均池化层处理的特征,再将该两个特征分别经过共享网络多层感知器MLP输出得到两个特征;将共享网络多层感知器MLP分别输出的两个特征进行相乘,再同基于最大池化层处理的特征和基于平均池化层处理的特征进行加和操作,最后采用sigmoid激活函数,生成权重通道注意力特征;将权重通道注意力特征和输入的中间特征映射进行乘法操作,生成最终的输出通道注意力特征;
将最终的输出通道注意力特征输入空间注意力模块,分别经过基于并行的两个通道最大池化层和平均池化层的操作,获取基于最大池化层处理的特征和基于平均池化层处理的特征,再将这两个特征基于通道做拼接操作后经过一个卷积操作降维,采用sigmoid激活函数,生成权重空间注意力特征;
将生成的权重通道注意力特征与权重空间注意力特征进行乘法操作,得到最终的输出空间注意力特征。
CN202011243239.3A 2020-11-09 2020-11-09 一种基于注意力机制的YOLOv3违法广告牌智能检测方法 Pending CN112418020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011243239.3A CN112418020A (zh) 2020-11-09 2020-11-09 一种基于注意力机制的YOLOv3违法广告牌智能检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011243239.3A CN112418020A (zh) 2020-11-09 2020-11-09 一种基于注意力机制的YOLOv3违法广告牌智能检测方法

Publications (1)

Publication Number Publication Date
CN112418020A true CN112418020A (zh) 2021-02-26

Family

ID=74782281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011243239.3A Pending CN112418020A (zh) 2020-11-09 2020-11-09 一种基于注意力机制的YOLOv3违法广告牌智能检测方法

Country Status (1)

Country Link
CN (1) CN112418020A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113344138A (zh) * 2021-07-06 2021-09-03 南京信息工程大学 一种基于注意力机制的图像检测方法
CN117894002B (zh) * 2024-03-18 2024-06-07 杭州像素元科技有限公司 一种危险物小目标检测模型的构建方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886269A (zh) * 2019-02-27 2019-06-14 南京中设航空科技发展有限公司 一种基于注意力机制的交通广告牌识别方法
CN111222562A (zh) * 2020-01-02 2020-06-02 南京邮电大学 空间自注意力机制及目标检测方法
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111597901A (zh) * 2020-04-16 2020-08-28 浙江工业大学 非法广告牌监控方法
CN111797717A (zh) * 2020-06-17 2020-10-20 电子科技大学 一种高速高精度的sar图像船只检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886269A (zh) * 2019-02-27 2019-06-14 南京中设航空科技发展有限公司 一种基于注意力机制的交通广告牌识别方法
CN111222562A (zh) * 2020-01-02 2020-06-02 南京邮电大学 空间自注意力机制及目标检测方法
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111597901A (zh) * 2020-04-16 2020-08-28 浙江工业大学 非法广告牌监控方法
CN111797717A (zh) * 2020-06-17 2020-10-20 电子科技大学 一种高速高精度的sar图像船只检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SANGHYUN WOO 等: "CBAM Convolutional Block Attention Module", 《ARXIV:1807.06521》, pages 1 - 17 *
扬德明: "车联网背景下基于深度学习的目标检测方法研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》, pages 034 - 502 *
王生霄: "嵌入CBAM结构的改进YOLOV3超宽带雷达生命信号检测算法", 《国外电子测量技术》, vol. 39, no. 03, pages 1 - 6 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113344138A (zh) * 2021-07-06 2021-09-03 南京信息工程大学 一种基于注意力机制的图像检测方法
CN117894002B (zh) * 2024-03-18 2024-06-07 杭州像素元科技有限公司 一种危险物小目标检测模型的构建方法及装置

Similar Documents

Publication Publication Date Title
CN111461083A (zh) 基于深度学习的快速车辆检测方法
CN108830254B (zh) 一种基于数据均衡策略和密集注意网络的细粒度车型检测与识别方法
CN115830399B (zh) 分类模型训练方法、装置、设备、存储介质和程序产品
CN112541532A (zh) 基于密集连接结构的目标检测方法
CN110991523A (zh) 一种面向无人驾驶车辆检测算法性能的可解释性评估方法
CN114255403A (zh) 基于深度学习的光学遥感图像数据处理方法及系统
CN111639697B (zh) 基于非重复采样与原型网络的高光谱图像分类方法
CN112507860A (zh) 一种视频标注方法、装置、设备及存储介质
Lu et al. Multi-scale feature progressive fusion network for remote sensing image change detection
CN113628297A (zh) 一种基于注意力机制和迁移学习的covid-19深度学习诊断系统
CN117197763A (zh) 基于交叉注意引导特征对齐网络的道路裂缝检测方法和系统
CN116524356A (zh) 一种矿石图像小样本目标检测方法及系统
CN112418020A (zh) 一种基于注意力机制的YOLOv3违法广告牌智能检测方法
CN115456957B (zh) 一种全尺度特征聚合的遥感影像变化检测的方法
CN116665153A (zh) 一种基于改进型Deeplabv3+网络模型的道路场景分割方法
CN116434203A (zh) 考虑驾驶人语言因素的愤怒驾驶状态识别方法
CN114998866A (zh) 一种基于改进YOLOv4的交通标志识别方法
CN115410047A (zh) 基于改进YOLO v5s的红外图像电动自行车目标检测方法
CN115439933A (zh) 一种基于多重模型识别策略的垃圾分类投放站点检测方法
CN112348011B (zh) 一种车辆定损方法、装置及存储介质
Nag et al. CNN based approach for post disaster damage assessment
CN114596435A (zh) 语义分割标签的生成方法、装置、设备及存储介质
CN114332715A (zh) 气象自动观测积雪识别方法、装置、设备及存储介质
Sun et al. SES-YOLOv8n: automatic driving object detection algorithm based on improved YOLOv8
CN113344138A (zh) 一种基于注意力机制的图像检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination