CN112163580B - 一种基于注意力机制的小目标检测算法 - Google Patents

一种基于注意力机制的小目标检测算法 Download PDF

Info

Publication number
CN112163580B
CN112163580B CN202011083094.5A CN202011083094A CN112163580B CN 112163580 B CN112163580 B CN 112163580B CN 202011083094 A CN202011083094 A CN 202011083094A CN 112163580 B CN112163580 B CN 112163580B
Authority
CN
China
Prior art keywords
attention mechanism
channels
inputting
algorithm based
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011083094.5A
Other languages
English (en)
Other versions
CN112163580A (zh
Inventor
禹发
张卫山
张友彩
顾伶俐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202011083094.5A priority Critical patent/CN112163580B/zh
Publication of CN112163580A publication Critical patent/CN112163580A/zh
Application granted granted Critical
Publication of CN112163580B publication Critical patent/CN112163580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于注意力机制的小目标检测算法,在检测过程中加入了注意力机制,从而将注意力机制应用到不同通道的特征图上,增强对于识别有利的通道,抑制对于识别无用的通道。在检测时,先将图像输入RPN中,得到预选区域,而后经过FPN网络提取各个尺度的特征,将其输入注意力模块,得到新的特征图,最后对这些特征进行分类与边框回归,得到检测结果。

Description

一种基于注意力机制的小目标检测算法
技术领域
本发明涉及深度学习、目标检测、注意力机制,具体涉及到一种基于注意力机制的小目标检测算法。
背景技术
近年来,目标检测取得了长足的发展。尽管有了这些改进,但在检测小目标和大目标之间的性近年来,物体检测取得了令人瞩目的进展。尽管有这些改进,但在检测小物体和大物体之间的性能仍然存在显着差距。小目标问题在物体检测和语义分割等视觉任务中一直是存在的一个难点,小目标的检测精度通常只有大目标的一半。最接近本发明的技术有:
(1)、YOLO:YOLO将物体检测作为回归问题求解。基于一个单独的End-To-End网络,完成从原始图像的输入到物体位置和类别的输出,输入图像经过一次Inference,便能得到图像中所有物体的位置和其所属类别及相应的置信概率。检测速度非常快,但是准确率较低,误检率高,并无法满足实际需求。
(2)、SSD:SSD结合了YOLO中的回归思想和Faster-RCNN中的Anchor机制,使用全图各个位置的多尺度区域特征进行回归,既保持了YOLO速度快的特性,也保证了窗口预测的跟Faster-RCNN 一样比较精准。但是SSD需要人工设置网络层参数,优化比较依赖于经验,同时在小目标检测上并没有比较好的表现。
发明内容
为解决现有技术中的缺点和不足,本发明提出了基于注意力机制的小目标检测算法。
本发明的技术方案为:
一种基于注意力机制的小目标检测算法,在检测过程中加入了注意力机制,从而将注意力机制应用到不同通道的特征图上,增强对于识别有利的通道,抑制对于识别无用的通道。包括以下步骤:
步骤(1)、将图像输入RPN网络,提取预选区域;
步骤(2)、将步骤(1)中获取的区域输入FPN,提取多尺度的特征;
步骤(3)、将多尺度的特征输入注意力机制模块;
步骤(4)、在注意力机制模块中,通过两个全连接层和一个 Sigmod函数来计算特征通道的权值;
步骤(5)、将步骤(4)中获得的特征图输入ROI Align层;
步骤(6)、根据步骤(5)中得到的特征图,进行分类和回归,得到检测结果;
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于注意力机制的小目标检测算法的流程图。
图2为网络中的注意力机制模块示意图。

Claims (1)

1.一种基于注意力机制的小目标检测算法,在检测过程中加入了注意力机制,从而将注意力机制应用到不同通道的特征图上,增强对于识别有利的通道,抑制对于识别无用的通道, 包括以下步骤:
步骤(1)、将图像输入RPN网络,提取预选区域;
步骤(2)、将步骤(1)中获取的区域输入FPN,提取多尺度的特征;
步骤(3)、将多尺度的特征输入注意力机制模块;
步骤(4)、在注意力机制模块中,通过两个全连接层和一个Sigmod函数来计算特征通道的权值;
步骤(5)、将步骤(4)中获得的特征图输入ROI Align层;
步骤(6)、根据步骤(5)中得到的特征图,进行分类和回归,得到检测结果。
CN202011083094.5A 2020-10-12 2020-10-12 一种基于注意力机制的小目标检测算法 Active CN112163580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011083094.5A CN112163580B (zh) 2020-10-12 2020-10-12 一种基于注意力机制的小目标检测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011083094.5A CN112163580B (zh) 2020-10-12 2020-10-12 一种基于注意力机制的小目标检测算法

Publications (2)

Publication Number Publication Date
CN112163580A CN112163580A (zh) 2021-01-01
CN112163580B true CN112163580B (zh) 2022-05-03

Family

ID=73866434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011083094.5A Active CN112163580B (zh) 2020-10-12 2020-10-12 一种基于注意力机制的小目标检测算法

Country Status (1)

Country Link
CN (1) CN112163580B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749677A (zh) * 2021-01-21 2021-05-04 高新兴科技集团股份有限公司 玩手机行为识别方法、装置和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734705A (zh) * 2018-05-17 2018-11-02 杭州电子科技大学 基于深度学习的数字乳腺断层影像钙化簇自动检测方法
CN110084210A (zh) * 2019-04-30 2019-08-02 电子科技大学 基于注意力金字塔网络的sar图像多尺度舰船检测方法
CN110135243A (zh) * 2019-04-02 2019-08-16 上海交通大学 一种基于两级注意力机制的行人检测方法及系统
CN110378242A (zh) * 2019-06-26 2019-10-25 南京信息工程大学 一种双重注意力机制的遥感目标检测方法
CN110533084A (zh) * 2019-08-12 2019-12-03 长安大学 一种基于自注意力机制的多尺度目标检测方法
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111401201A (zh) * 2020-03-10 2020-07-10 南京信息工程大学 一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法
CN111539428A (zh) * 2020-05-06 2020-08-14 中国科学院自动化研究所 基于多尺度特征整合和注意力机制的旋转目标检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734705A (zh) * 2018-05-17 2018-11-02 杭州电子科技大学 基于深度学习的数字乳腺断层影像钙化簇自动检测方法
CN110135243A (zh) * 2019-04-02 2019-08-16 上海交通大学 一种基于两级注意力机制的行人检测方法及系统
CN110084210A (zh) * 2019-04-30 2019-08-02 电子科技大学 基于注意力金字塔网络的sar图像多尺度舰船检测方法
CN110378242A (zh) * 2019-06-26 2019-10-25 南京信息工程大学 一种双重注意力机制的遥感目标检测方法
CN110533084A (zh) * 2019-08-12 2019-12-03 长安大学 一种基于自注意力机制的多尺度目标检测方法
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111401201A (zh) * 2020-03-10 2020-07-10 南京信息工程大学 一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法
CN111539428A (zh) * 2020-05-06 2020-08-14 中国科学院自动化研究所 基于多尺度特征整合和注意力机制的旋转目标检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FEATURE-ATTENTIONED OBJECT DETECTION IN REMOTE SENSING IMAGERY;Chengzheng Li,et al;《2019 IEEE International Conference on Image Processing》;20190826;全文 *
Multi-Scale Feature Integrated Attention-Based Rotation Network for Object Detection in VHR Aerial Images;Feng Yang,et al;《sensors》;20200318;全文 *
一种可变锚框候选区域网络的目标检测方法;李承昊等;《北京航空航天大学学报》;20191119(第08期);全文 *
一种基于注意力机制RetinaNet的小目标检测方法;庞立新等;《制导与引信》;20191215(第04期);全文 *

Also Published As

Publication number Publication date
CN112163580A (zh) 2021-01-01

Similar Documents

Publication Publication Date Title
CN107609525B (zh) 基于剪枝策略构建卷积神经网络的遥感图像目标检测方法
CN109615016B (zh) 一种基于金字塔输入增益的卷积神经网络的目标检测方法
CN109214349B (zh) 一种基于语义分割增强的物体检测方法
CN111160407B (zh) 一种深度学习目标检测方法及系统
CN113344089B (zh) 模型训练方法、装置及电子设备
CN111462140B (zh) 一种基于区块拼接的实时图像实例分割方法
CN113705628B (zh) 预训练模型的确定方法、装置、电子设备以及存储介质
CN117252904B (zh) 基于长程空间感知与通道增强的目标跟踪方法与系统
CN112163580B (zh) 一种基于注意力机制的小目标检测算法
CN115147380A (zh) 一种基于YOLOv5的小型透明塑料制品缺陷检测方法
CN116030396A (zh) 一种用于视频结构化提取的精确分割方法
CN117975267A (zh) 一种基于孪生多尺度交叉注意的遥感影像变化检测方法
CN108573238A (zh) 一种基于双网络结构的车辆检测方法
CN117635628B (zh) 一种基于上下文注意力和边界感知引导的海陆分割方法
CN112200831A (zh) 一种基于动态模板的密集连接孪生神经网络目标跟踪方法
CN117576648A (zh) 自动驾驶的场景挖掘方法、装置、电子设备及存储介质
CN117689932A (zh) 一种基于改进YOLOv7的InSAR大气相位和地表形变的检测方法、装置及计算机存储介质
CN112348102B (zh) 一种基于查询的自底向上视频定位方法和系统
CN113920311A (zh) 一种基于边缘辅助信息的遥感图像分割方法及系统
CN114612971A (zh) 人脸检测方法、模型训练方法、电子设备及程序产品
CN111724409A (zh) 一种基于密集连接孪生神经网络的目标跟踪方法
CN113591734A (zh) 一种基于改进nms算法的目标检测方法
CN111950545A (zh) 一种基于MSDNet和空间划分的场景文本检测方法
CN113343979B (zh) 用于训练模型的方法、装置、设备、介质和程序产品
CN111382761B (zh) 一种基于cnn的检测器、图像检测方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant