CN113239825A - 一种复杂场景下高精度烟草甲虫检测方法 - Google Patents

一种复杂场景下高精度烟草甲虫检测方法 Download PDF

Info

Publication number
CN113239825A
CN113239825A CN202110545421.2A CN202110545421A CN113239825A CN 113239825 A CN113239825 A CN 113239825A CN 202110545421 A CN202110545421 A CN 202110545421A CN 113239825 A CN113239825 A CN 113239825A
Authority
CN
China
Prior art keywords
tobacco
feature
dca
feature map
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110545421.2A
Other languages
English (en)
Other versions
CN113239825B (zh
Inventor
张宝
张婧
徐庆
魏东梅
李小霞
卓亮
张东
韩翔雨
何林洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tobacco Sichuan Industrial Co Ltd
Southwest University of Science and Technology
Original Assignee
China Tobacco Sichuan Industrial Co Ltd
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tobacco Sichuan Industrial Co Ltd, Southwest University of Science and Technology filed Critical China Tobacco Sichuan Industrial Co Ltd
Priority to CN202110545421.2A priority Critical patent/CN113239825B/zh
Publication of CN113239825A publication Critical patent/CN113239825A/zh
Application granted granted Critical
Publication of CN113239825B publication Critical patent/CN113239825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/06Recognition of objects for industrial automation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种复杂场景下高精度烟草甲虫检测方法,包括构建拟合复杂环境和多分布场景的烟草甲虫数据集;搭建结合多尺度可变形卷积和双重注意力的DCA模块;搭建基于DCA模块的特征金字塔网络,以及由特征提取网络Resnet50、特征金字塔网络DCA‑FPN和目标检测框架FasterR‑CNN构成的复杂场景烟草甲虫小目标检测网络;在自建数据集上对提出的网络模型进行训练和测试。本发明使用多尺度可变形卷积能够拟合多场景下烟草甲虫空间几何形变特征,获取烟草甲虫的多种形状和姿态等有效特征,针对性地减少了复杂环境的背景内容或前景区域的无效信息的影响。还利用双重注意力DCA模块进行冗余特征的消除,实现局部跨通道和空间的信息交互,提高烟草甲虫检测在复杂场境下的分类性能。

Description

一种复杂场景下高精度烟草甲虫检测方法
技术领域
本发明涉及计算机视觉的图像处理技术领域,尤其涉及一种复杂场景下高精度烟草甲虫检测方法。
背景技术
卷烟生产车间空间面积大,环境常年恒温恒湿,设备内有积存的烟末烟丝,这为烟草甲虫提供了良好的生存环境。烟草甲虫会严重影响卷烟质量,虫情监控是烟草甲防治最重要的环节。传统的烟草甲虫检测方法主要依靠人工计数,其人力成本高、效率低、实时性差。因此,基于计算机视觉技术实现烟草甲图像自动采集和目标检测具有重要意义。
小目标由于特征缺失很容易造成漏检。因此,特征金字塔网络(Feature PyramidNetworks,FPN)构建了多尺度金字塔结构,通过引入具有侧向连接的自上而下的途径,将低分辨率、大感受野特征与高分辨率、小感受野特征相结合,检测不同尺度的目标。CARAFE利用一种全新的上采样方式融入特征金字塔中,以此获得更大的感受野,ASPP将具有不同空洞率的空洞卷积下采样来扩大感受野,并行地应用到输入特征图上,以多个尺度捕捉图像的上下文信息。PANet提出了自顶向下的二次融合对自底向上的FPN路径进行增强,减短了信息传播路径,同时更好地利用了低层特征的精确定位信息。NAS-FPN使用神经架构搜索自动学习到更好的目标检测网络架构。
然而,以上方法在增加感受野的同时未考虑信息的有效融合,而且大部分网络是在获得高低层次融合信息后继续增加路径,在增加网络复杂度的代价下提升了网络的性能,但在本质上并没有扩大网络高层的感受野,高层特征图语义信息仍显不足;另外经过多次下采样的高层特征一般会忽略较多的细节信息,导致对于小目标的检测效果不佳,难以实现高精度烟草甲虫检测。
发明内容
本发明提供了一种复杂场景下高精度烟草甲虫检测方法,以解决上述技术问题。
本发明采用的技术方案是:一种复杂场景下高精度烟草甲虫检测方法,包括如下步骤:
步骤1、构建一个拟合复杂环境和多分布场景的烟草甲虫数据集;
步骤2、搭建一个结合多尺度可变形卷积和双重注意力的DCA模块;
步骤3、搭建基于DCA模块的特征金字塔网络,即DCA-FPN,以及由特征提取网络Resnet50、特征金字塔网络DCA-FPN和目标检测框架Faster R-CNN构成的复杂场景烟草甲虫小目标检测网络;
步骤4、在自建数据集上对提出的网络模型进行训练和测试。
进一步的,所述步骤1包括:
使用图像采集终端,实地采集若干烟草甲虫的图像并且进行人工标注,建立烟草甲虫数据集。
进一步的,将采集到的烟草甲虫的图像根据图像背景情况分为无烟丝、少烟丝和多烟丝,根据烟草甲虫聚集情况分为无聚集和有聚集,根据光线情况分为光线正常和光线过暗。
进一步的,所述步骤2中的DCA模块是由两个并行的不同尺度的可变形卷积和双重注意力组成的。
进一步的,搭建所述DCA模块包括:
特征提取网络Resnet50第五个卷积块的最后一个卷积层表示为C5,将C5生成的特征图表示为FC5∈RH×W×C,H和W是特征图FC5的高和宽,单位是像素,C是通道数,通过可变形卷积输出特征图Fdcn3×3和Fdcn5×5∈RH×W×C为:
Figure BDA0003073337390000031
Figure BDA0003073337390000032
式(1)和式(2)中,3×3和5×5表示卷积核的大小,Deformconv3×3(f)和Deformconv5×5(f)表示对特征图f进行3×3和5×5的可变形卷积;
通道注意力权重为Fcaf3×3和Fcaf5×5∈R1×1×C,通道注意力特征图为F'caf3×3和F'caf5×5∈RH×W×C
Figure BDA0003073337390000033
Figure BDA0003073337390000034
Figure BDA0003073337390000035
Figure BDA0003073337390000036
式(3)-(6)中,
Figure BDA0003073337390000037
表示对应元素相乘操作,3×3和5×5表示两种尺度,Maxpool(f)和Avgpool(f)表示对特征图f的最大池化和平均池化操作,MLP(f)表示求特征图f的共享多层感知机模型输出,Sigmoid(f)表示对特征图f求Sigmoid函数值;
空间注意力特征图为Fsaf3×3和Fsaf5×5∈RH×W×1
Figure BDA0003073337390000038
Figure BDA0003073337390000039
Concat(f1,f2)表示把两个特征图f1和f2进行按通道维度拼接操作,Conv7×7(f)表示对特征图f进行7×7的卷积操作,将空间注意力特征图Fsaf与通道注意力特征图F'caf对应元素相乘得到经过双重注意力调整的特征块输出Fdaf3×3和Fdaf5×5∈RH×W×C
Figure BDA00030733373900000310
Figure BDA0003073337390000041
最后对两个支路的特征进行融合,得到DCA模块的输出特征图Fout∈RH×W×C
Figure BDA0003073337390000042
Conv3×3(f)表示对特征图f进行3×3的卷积操作,“+”表示对应元素相加。DCA模块利用不同尺度的可变形卷积获得了有效特征,而且使用双重注意力实现特征增强和特征融合,提取了更丰富的细节信息,增强特征语义表达能力。
进一步的,所述搭建基于DCA模块的特征金字塔网络的方法包括:
通过融合低层的细节信息和高层的语义信息实现更准确的目标分类及定位,并在网络最高层添加DCA模块。
进一步的,所述复杂场景烟草甲虫小目标检测网络包括特征提取网络Resnet50、基于DCA模块的特征金字塔网络DCA-FPN和目标检测框架Faster R-CNN这三个部分。
进一步的,所述步骤4中的训练方法包括:
将建立的烟草甲虫数据集按一定比例随机分成训练集、验证集以及测试集,在训练过程中用ImageNet预训练模型作为初始权重,设置训练参数,并使用SGD优化器优化网络参数。
进一步的,所述一定比例为6:2:2,所述设置训练参数包括:学习率初始化为0.001,批量大小设置为3,一共训练50轮,学习率每25轮衰减为原来的1/3。
本发明的有益效果是:
1)本发明方法使用多尺度可变形卷积能够拟合多场景下烟草甲虫空间几何形变特征,获取烟草甲虫的多种形状和姿态等有效特征,针对性地减少了复杂环境的背景内容或前景区域的无效信息的影响。
2)本发明方法利用双重注意力DCA模块进行冗余特征的消除,实现局部跨通道和空间的信息交互,提高烟草甲虫小目标检测在复杂场境下的分类性能。
3)本发明方法提出的复杂场景烟草甲虫小目标检测网络相比于基础模型和其他先进模型,能以更高的置信度检测出烟草甲虫,而且在越复杂的场景,交并比越高的情况下性能表现越优,能更好地担任复杂场景下的烟草甲虫小目标检测任务。
附图说明
图1为本发明的DCA模块结构图;
图2为本发明的特征金字塔网络DCA-FPN结构图;
图3为本发明的复杂场景烟草甲虫小目标检测网络结构图;
图4为本发明在4种场景下的检测结果图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步详细描述,但本发明的实施方式不限于此。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
实施例1:
一种复杂场景下高精度烟草甲虫检测方法,包括以下步骤:
步骤1、构建一个拟合复杂环境和多分布场景的烟草甲虫数据集。先使用图像采集终端实地采集大量烟草甲虫图像,然后进行人工标注。选用的图像分辨率为1920×1080,标注工具使用的是LabelImg软件,图像标注格式为PASCAL VOC数据集标注格式。本实施例中,自建数据集中烟草甲虫图像一共2074张,每张图像上烟草甲虫的数量不一,图像采集考虑到多种实际情况:根据图像背景情况分为简单背景(无烟丝、少烟丝)和复杂背景(多烟丝),根据烟草甲虫聚集情况分为无聚集和有聚集,根据光线情况分为光线正常和光线过暗,具体各种情况数据分布见表1。
表1烟草甲虫图像情况分布
Figure BDA0003073337390000061
步骤2、搭建一个结合多尺度可变形卷积和双重注意力的双路径(DCA)模块。DCA模块是由两条支路并联组成:3×3/5×5的可变形卷积和一个特征双重注意力块级联,如图1所示。DCA模块先利用两个并行的可变形卷积进行特征增强,进一步获取目标的有效特征,更好地拟合烟草甲虫的形状和姿态,减少背景内容或前景区域的无效信息的影响,提高目标检测的分类性能。将特征提取网络Resnet50第二到第五个卷积块的最后一个卷积层分别表示为{C2,C3,C4,C5}。将C5生成的特征图表示为FC5∈RH×W×C,H和W是特征图FC5的高和宽,单位是像素,C是通道数,首先通过两个并行的3×3和5×5的可变形卷积进行特征增强,输出特征图Fdcn3×3和Fdcn5×5∈RH×W×C如式(1)和式(2)所示:
Figure BDA0003073337390000062
Figure BDA0003073337390000063
式(1)和式(2)中,3×3和5×5表示卷积核的大小,Deformconv3×3(f)和Deformconv5×5(f)表示对特征图f进行3×3和5×5的可变形卷积。
本发明设计双重注意力块来指导特征融合,在消除冗余特征的同时,从通道和空间上分别捕捉与目标相关度高的特征进行融合。
将可变形卷积生成的特征图Fdcn3×3和Fdcn5×5作为特征注意力块的输入。首先经过通道注意力模块,分别经过最大池化Maxpool来降维,保留目标特征的最大的值(即特征最显著的部分);同时经过平均池化Avgpool可保留更多的图像的背景信息,同时获得空间信息的融合特征。平均池化特征和最大池化特征被转发到一个共享多层感知机(Multi-LayerPerceptron,MLP)模型中,再将两个通道注意力图进行对应元素相加、激活,得到两个1×1×C的通道注意力权重Fcaf3×3和Fcaf5×5,C表示通道数,用以分配各个特征通道的权重,每一维的权重表示该维对应的特征图层对于关键信息的重要程度和关联程度,这个权重越大则表示相关度越高,也就是越需要去注意的通道。最后,得到特征通道的权重之后,Fcaf3×3和Fcaf5×5与Fdcn3×3和Fdcn5×5进行对应元素相乘得到最终的通道注意力特征图F'caf3×3和F'caf5×5∈RH×W×C,完成在通道维度上的原始特征重标定,提高特定语义的特征表示。整个过程可以描述为:
Fcaf3×3=Sigmoid(MLP(Avgpool(Fdcn3×3))+MLP(Maxpool(Fdcn3×3))) (3)
Figure BDA0003073337390000071
Figure BDA0003073337390000072
Figure BDA0003073337390000073
式(3)-(6)中,
Figure BDA0003073337390000074
表示对应元素相乘操作,3×3和5×5表示两种尺度,Maxpool(f)和Avgpool(f)表示对特征图f的最大池化和平均池化操作,MLP(f)表示求特征图f的共享多层感知机模型输出,Sigmoid(f)表示对特征图f求Sigmoid函数值。
为了更好地表征特征图局部区域,本发明利用特征间的关系生成空间注意力图。把经过通道注意力图细化后的特征图F'caf送入空间注意力模块,沿着通道方向依次通过平均池化Avgpool和最大池化Maxpool,得到两个1维的细节特征描述符,将其按通道维度拼接(Concat)在一起得到拼接后的特征图,之后使用一个包含单个卷积核的隐藏层对其进行卷积操作,保证最后得到的特征在空间维度上与输入的特征图一致。然后应用7×7的卷积层Conv7×7和Sigmoid函数生成大小为H×W×1的空间注意力特征图Fsaf3×3和Fsaf5×5,该图编码了需要关注目标的颜色和纹理等细节信息,抑制了噪声,使图像局部的重要信息能够提取出来,空间注意力特征图为:
Figure BDA0003073337390000081
Figure BDA0003073337390000082
Concat(f1,f2)表示把两个特征图f1和f2进行按通道维度拼接操作,Conv7×7(f)表示对特征图f进行7×7的卷积操作,将空间注意力特征图Fsaf与通道注意力特征图F'caf对应元素相乘得到经过双重注意力调整的特征块输出Fdaf3×3和Fdaf5×5∈RH×W×C
Figure BDA0003073337390000083
Figure BDA0003073337390000084
最后对两个支路的特征进行融合,为了消除特征融合中的混叠效应,本发明采用3×3的卷积核,得到DCA模块的输出特征图Fout∈RH×W×C
Figure BDA0003073337390000085
Conv3×3(f)表示对特征图f进行3×3的卷积操作,“+”表示对应元素相加。
综上所述,DCA模块利用不同尺度的可变形卷积获得了有效特征,而且使用双重注意力实现特征增强和特征融合,提取了更丰富的细节信息,增强了特征语义表达能力。
步骤3、搭建基于DCA模块的特征金字塔网络(DCA-FPN)。DCA-FPN网络如图2所示。本发明基于FPN的连接方式,将特征提取网络Resnet50第二到第五个卷积块的最后一个卷积层分别表示为{C2,C3,C4,C5},自上而下的路径和DCA输出的横向连接分别表示为{P2,P3,P4,P5}。将C5送入DCA模块,通过DCA模块增强特征语义表达能力。将C2-C4与C5经由DCA模块的输出特征层通过P2-P5的方式送入FPN,实现低层的细节信息和高层的丰富语义信息的有效特征融合,进一步增强了特征表达能力。其中DCA模块两边的箭头表示C2-C4和P2-P5间均可添加DCA模块,实验结果表明DCA模块添加在C5和P5间效果最好,连线用实线表示,其余用虚线表示。然后由特征提取网络Resnet50、特征金字塔网络DCA-FPN和目标检测框架Faster R-CNN构成复杂场景烟草甲虫小目标检测网络,如图3所示。
步骤4、在自建数据集上对提出的网络模型进行训练和测试。本发明方法的训练具体过程如下:
自建数据集图像总共有2074张,将图像按6:2:2随机分成训练集、验证集以及测试集,即1244张图像用来训练,414张图像用于验证,416张图像用于测试,并根据图像宽高比将图像缩放至1344×768像素。在训练过程中用ImageNet预训练模型作为初始权重。学习率初始化为0.001,批量大小设置为3,一共训练50轮,学习率每25轮衰减为原来的1/3,并使用SGD优化器优化网络参数。
将本发明方法的检测结果与目前先进的小目标检测方法进行比较分析。实验平台是:CPU型号为Inter(R)Core(TM)i7-7700K、GPU型号为GeForce GTX 1080Ti、显存为11G、内存为32G的台式电脑;所用深度学习框架为Pytorch1.2.0、Cuda10.1以及CuDNN7.6.4。本发明使用平均精度(meanAverage Precision,mAP)作为评价指标。
本发明在进行测试时设置了两种不同大小的IoU进行测试,IoU为预测框与真实框的交集与并集的比值。mAP0.6、mAP0.7分别对应IoU=0.6、0.7时的平均精度。
本发明选用两种目标检测框架进行实验,分别是:Faster R-CNN以及Cascade R-CNN,使用的骨干网络均为Resnet50。首先进行消融实验,即在特征金字塔的每一层分别加入DCA模块进行结果对比,实验结果如表2。
表2消融实验结果
Figure BDA0003073337390000101
从表2可以看出,在两种目标检测框架下,DCA模块添加在特征金字塔的C5~P5层时平均精度最高。
为了验明DCA-FPN的性能,在Faster R-CNN的算法框架下将本发明算法与目前主流的特征金字塔网络进行对比,对比的特征金字塔网络包括使用神经架构搜索的NAS_FPN,融合ASPP的特征金字塔网络形成ASPP_FPN,将上采样的CARAFE方法嵌入传统FPN中形成的CARAFE_FPN,实验结果如表3。
表3不同特征金字塔网络的性能比较
Figure BDA0003073337390000102
从表3中可以看出,在Faster R-CNN框架下本发明提出算法的平均精度分别为:88.1%(IoU=0.6)、61.3%(IoU=0.7),在上述两种IoU下平均精度分别比ASPP_FPN和CARAFE_FPN分别提高了1.2%和2.6%。实验结果表明,DCA-FPN的性能优于目前主流的算法。
为了进一步验证DCA_FPN的性能,本发明分别在以Resnet50和Resnet101为骨干网络的FasterR-CNN上进行试验,实验结果如表4。
表4不同骨干网络下的DCA-FPN性能实验
Figure BDA0003073337390000111
从表4中可以看出,基本模型Faster R-CNN中加入了DCA-FPN后检测精度都有大幅提升,在IoU为0.7时提升最大,在骨干网络Resnet50和Resnet101上分别提高了32%和33.4%。
图4显示了4种场景下以Resnet50为骨干网络的Faster R-CNN和本发明方法的检测结果可视化图,IoU为0.6。其中,白色、黑色和灰色矩形分别代表真阳性、假阴性和假阳性,数字代表置信度。对于每一对图,显示了基本模型(左)和本发明方法(右)的结果。基本模型在各种情况下都有漏检或误检的情况,特别是漏检的情况非常严重,这对烟草甲虫的防治非常不利。与基本模型相比,本发明方法能够以更高的置信度更好地检测出烟草甲虫,而且在越复杂的场景,交并比越高的情况下性能表现越优。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种复杂场景下高精度烟草甲虫检测方法,其特征在于,包括如下步骤:
步骤1、构建一个拟合复杂环境和多分布场景的烟草甲虫数据集;
步骤2、搭建一个结合多尺度可变形卷积和双重注意力的DCA模块;
步骤3、搭建基于DCA模块的特征金字塔网络,即DCA-FPN,以及由特征提取网络Resnet50、特征金字塔网络DCA-FPN和目标检测框架Faster R-CNN构成的复杂场景烟草甲虫小目标检测网络;
步骤4、在自建数据集上对提出的网络模型进行训练和测试。
2.根据权利要求1所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,所述步骤1包括:
使用图像采集终端,实地采集若干烟草甲虫的图像并且进行人工标注,建立烟草甲虫数据集。
3.根据权利要求2所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,将采集到的烟草甲虫的图像根据图像背景情况分为无烟丝、少烟丝和多烟丝,根据烟草甲虫聚集情况分为无聚集和有聚集,根据光线情况分为光线正常和光线过暗。
4.根据权利要求1所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,所述步骤2中的DCA模块是由两个并行的不同尺度的可变形卷积和双重注意力组成的。
5.根据权利要求4所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,搭建所述DCA模块包括:
特征提取网络Resnet50第五个卷积块的最后一个卷积层表示为C5,将C5生成的特征图表示为FC5∈RH×W×C,H和W是特征图FC5的高和宽,单位是像素,C是通道数,通过可变形卷积输出特征图Fdcn3×3和Fdcn5×5∈RH×W×C为:
Figure FDA0003073337380000021
Figure FDA0003073337380000022
式(1)和式(2)中,3×3和5×5表示卷积核的大小,Deformconv3×3(f)和Deformconv5×5(f)表示对特征图f进行3×3和5×5的可变形卷积;
通道注意力权重为Fcaf3×3和Fcaf5×5∈R1×1×C,通道注意力特征图为F'caf3×3和F'caf5×5∈RH ×W×C
Figure FDA0003073337380000023
Figure FDA0003073337380000024
Figure FDA0003073337380000025
Figure FDA0003073337380000026
式(3)-(6)中,
Figure FDA0003073337380000027
表示对应元素相乘操作,3×3和5×5表示两种尺度,Maxpool(f)和Avgpool(f)表示对特征图f的最大池化和平均池化操作,MLP(f)表示求特征图f的共享多层感知机模型输出,Sigmoid(f)表示对特征图f求Sigmoid函数值;
空间注意力特征图为Fsaf3×3和Fsaf5×5∈RH×W×1
Figure FDA0003073337380000028
Figure FDA0003073337380000029
Concat(f1,f2)表示把两个特征图f1和f2进行按通道维度拼接操作,Conv7×7(f)表示对特征图f进行7×7的卷积操作,将空间注意力特征图Fsaf与通道注意力特征图F'caf对应元素相乘得到经过双重注意力调整的特征块输出Fdaf3×3和Fdaf5×5∈RH×W×C
Figure FDA00030733373800000210
Figure FDA00030733373800000211
最后对两个支路的特征进行融合,得到DCA模块的输出特征图Fout∈RH×W×C
Figure FDA0003073337380000031
Conv3×3(f)表示对特征图f进行3×3的卷积操作,“+”表示对应元素相加。DCA模块利用不同尺度的可变形卷积获得了有效特征,而且使用双重注意力实现特征增强和特征融合,提取了更丰富的细节信息,增强特征语义表达能力。
6.根据权利要求5所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,所述搭建基于DCA模块的特征金字塔网络的方法包括:
通过融合低层的细节信息和高层的语义信息实现更准确的目标分类及定位,并在网络最高层添加DCA模块。
7.根据权利要求6所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,
所述复杂场景烟草甲虫小目标检测网络包括特征提取网络Resnet50、基于DCA模块的特征金字塔网络DCA-FPN和目标检测框架Faster R-CNN这三个部分。
8.根据权利要求7所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,所述步骤4中的训练方法包括:
将建立的烟草甲虫数据集按一定比例随机分成训练集、验证集以及测试集,在训练过程中用ImageNet预训练模型作为初始权重,设置训练参数,并使用SGD优化器优化网络参数。
9.根据权利要求8所述的复杂场景下高精度烟草甲虫检测方法,其特征在于,所述一定比例为6:2:2,所述设置训练参数包括:学习率初始化为0.001,批量大小设置为3,一共训练50轮,学习率每25轮衰减为原来的1/3。
CN202110545421.2A 2021-05-19 2021-05-19 一种复杂场景下高精度烟草甲虫检测方法 Active CN113239825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110545421.2A CN113239825B (zh) 2021-05-19 2021-05-19 一种复杂场景下高精度烟草甲虫检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110545421.2A CN113239825B (zh) 2021-05-19 2021-05-19 一种复杂场景下高精度烟草甲虫检测方法

Publications (2)

Publication Number Publication Date
CN113239825A true CN113239825A (zh) 2021-08-10
CN113239825B CN113239825B (zh) 2022-08-19

Family

ID=77137656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110545421.2A Active CN113239825B (zh) 2021-05-19 2021-05-19 一种复杂场景下高精度烟草甲虫检测方法

Country Status (1)

Country Link
CN (1) CN113239825B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113808122A (zh) * 2021-09-26 2021-12-17 四川中烟工业有限责任公司 一种基于椭圆特征金字塔的烟草甲虫识别方法
CN113963206A (zh) * 2021-10-20 2022-01-21 中国石油大学(华东) 一种基于姿态指引的速滑运动员目标检测方法
CN115115925A (zh) * 2022-08-29 2022-09-27 福建(泉州)哈工大工程技术研究院 一种基于多尺度特征信息融合的MS-YOLOv3工业仪表读数检测方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399419A (zh) * 2018-01-25 2018-08-14 华南理工大学 基于二维递归网络的自然场景图像中中文文本识别方法
CN110321893A (zh) * 2019-06-27 2019-10-11 电子科技大学 一种聚焦增强的场景文本识别网络
CN110705457A (zh) * 2019-09-29 2020-01-17 核工业北京地质研究院 一种遥感影像建筑物变化检测方法
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111222580A (zh) * 2020-01-13 2020-06-02 西南科技大学 一种高精度的裂缝检测方法
CN111652247A (zh) * 2020-05-28 2020-09-11 大连海事大学 一种基于深度卷积神经网络的双翅目昆虫识别方法
CN111860171A (zh) * 2020-06-19 2020-10-30 中国科学院空天信息创新研究院 一种大规模遥感图像中不规则形状目标的检测方法及系统
CN111860398A (zh) * 2020-07-28 2020-10-30 河北师范大学 遥感图像目标检测方法、系统及终端设备
CN112270280A (zh) * 2020-11-02 2021-01-26 重庆邮电大学 一种基于深度学习的遥感图像中的露天矿场检测方法
CN112364691A (zh) * 2020-10-10 2021-02-12 广东省科学院生态环境与土壤研究所 一种烟草病虫害识别方法
CN112381097A (zh) * 2020-11-16 2021-02-19 西南石油大学 一种基于深度学习的场景语义分割方法
KR20210046512A (ko) * 2019-10-18 2021-04-28 고려대학교 산학협력단 주의 기반 뉴럴네트워크를 이용한 지진 이벤트 분류 방법, 이를 수행하기 위한 기록 매체 및 장치
CN112801117A (zh) * 2021-02-03 2021-05-14 四川中烟工业有限责任公司 多路感受野引导的特征金字塔小目标检测网络及检测方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399419A (zh) * 2018-01-25 2018-08-14 华南理工大学 基于二维递归网络的自然场景图像中中文文本识别方法
CN110321893A (zh) * 2019-06-27 2019-10-11 电子科技大学 一种聚焦增强的场景文本识别网络
CN110705457A (zh) * 2019-09-29 2020-01-17 核工业北京地质研究院 一种遥感影像建筑物变化检测方法
KR20210046512A (ko) * 2019-10-18 2021-04-28 고려대학교 산학협력단 주의 기반 뉴럴네트워크를 이용한 지진 이벤트 분류 방법, 이를 수행하기 위한 기록 매체 및 장치
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111222580A (zh) * 2020-01-13 2020-06-02 西南科技大学 一种高精度的裂缝检测方法
CN111652247A (zh) * 2020-05-28 2020-09-11 大连海事大学 一种基于深度卷积神经网络的双翅目昆虫识别方法
CN111860171A (zh) * 2020-06-19 2020-10-30 中国科学院空天信息创新研究院 一种大规模遥感图像中不规则形状目标的检测方法及系统
CN111860398A (zh) * 2020-07-28 2020-10-30 河北师范大学 遥感图像目标检测方法、系统及终端设备
CN112364691A (zh) * 2020-10-10 2021-02-12 广东省科学院生态环境与土壤研究所 一种烟草病虫害识别方法
CN112270280A (zh) * 2020-11-02 2021-01-26 重庆邮电大学 一种基于深度学习的遥感图像中的露天矿场检测方法
CN112381097A (zh) * 2020-11-16 2021-02-19 西南石油大学 一种基于深度学习的场景语义分割方法
CN112801117A (zh) * 2021-02-03 2021-05-14 四川中烟工业有限责任公司 多路感受野引导的特征金字塔小目标检测网络及检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
庞海通 等: "基于深度学习的害虫识别技术综述", 《农业工程》 *
汪亚妮 等: "基于注意力和特征融合的遥感图像目标检测模型", 《激光与光电子学进展》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113808122A (zh) * 2021-09-26 2021-12-17 四川中烟工业有限责任公司 一种基于椭圆特征金字塔的烟草甲虫识别方法
CN113808122B (zh) * 2021-09-26 2024-03-12 四川中烟工业有限责任公司 一种基于椭圆特征金字塔的烟草甲虫识别方法
CN113963206A (zh) * 2021-10-20 2022-01-21 中国石油大学(华东) 一种基于姿态指引的速滑运动员目标检测方法
CN115115925A (zh) * 2022-08-29 2022-09-27 福建(泉州)哈工大工程技术研究院 一种基于多尺度特征信息融合的MS-YOLOv3工业仪表读数检测方法

Also Published As

Publication number Publication date
CN113239825B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN113239825B (zh) 一种复杂场景下高精度烟草甲虫检测方法
CN109241982B (zh) 基于深浅层卷积神经网络的目标检测方法
EP4105877A1 (en) Image enhancement method and image enhancement apparatus
CN110175986B (zh) 一种基于卷积神经网络的立体图像视觉显著性检测方法
CN110210608B (zh) 基于注意力机制和多层次特征融合的低照度图像增强方法
CN110751649B (zh) 视频质量评估方法、装置、电子设备及存储介质
CN110059728B (zh) 基于注意力模型的rgb-d图像视觉显著性检测方法
CN114419449B (zh) 一种自注意力多尺度特征融合的遥感图像语义分割方法
CN113468996A (zh) 一种基于边缘细化的伪装物体检测方法
CN114612832A (zh) 一种实时手势检测方法及装置
CN115311186B (zh) 一种红外与可见光图像跨尺度注意力对抗融合方法及终端
CN115115540A (zh) 基于光照信息引导的无监督低光图像增强方法及装置
CN116757986A (zh) 一种红外与可见光图像融合方法及装置
CN115601820A (zh) 一种人脸伪造图像检测方法、装置、终端及存储介质
CN113806564B (zh) 多模态信息性推文检测方法及系统
CN114926826A (zh) 场景文本检测系统
CN113850182A (zh) 基于DAMR_3DNet的动作识别方法
CN113901928A (zh) 一种基于动态超分辨率的目标检测方法、输电线路部件检测方法及系统
CN113554653A (zh) 基于互信息校准点云数据长尾分布的语义分割方法
CN116740078A (zh) 图像分割处理方法、装置、设备以及介质
CN116563606A (zh) 一种基于双分支空谱全局特征提取网络的高光谱图像分类方法
CN113343953B (zh) 一种用于遥感场景识别的fgr-am方法和系统
CN115457015A (zh) 一种基于视觉交互感知双流网络的图像无参考质量评估方法及装置
CN112818818B (zh) 一种基于affpn的新型超高清遥感图像变化检测方法
CN115331081A (zh) 图像目标检测方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant