CN111709397A - 一种基于多头自注意力机制的无人机变尺寸目标检测方法 - Google Patents

一种基于多头自注意力机制的无人机变尺寸目标检测方法 Download PDF

Info

Publication number
CN111709397A
CN111709397A CN202010659641.3A CN202010659641A CN111709397A CN 111709397 A CN111709397 A CN 111709397A CN 202010659641 A CN202010659641 A CN 202010659641A CN 111709397 A CN111709397 A CN 111709397A
Authority
CN
China
Prior art keywords
attention
head
self
network
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010659641.3A
Other languages
English (en)
Other versions
CN111709397B (zh
Inventor
李湛
莫文昊
杨学博
孙维超
高会军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202010659641.3A priority Critical patent/CN111709397B/zh
Publication of CN111709397A publication Critical patent/CN111709397A/zh
Application granted granted Critical
Publication of CN111709397B publication Critical patent/CN111709397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

一种基于多头自注意力机制的无人机变尺寸目标检测方法,属于目标检测技术领域,本发明为解决现有无人机目标检测算法对于小目标检测性能差的问题。本发明包括:建立数据集;建立网络结构:采用多头自注意力机制建立多头自注意力目标检测头网络,所述多头自注意力目标检测头网络的后端采用Faster Rcnn基本框架,在多头自注意力目标检测头网络的回归层再次引入自注意力机制;分步骤进行网络训练;对目标物体进行检测:对图像进行预处理后输入多头自注意力目标检测头网络,多头自注意力目标检测头网络输出检测结果。本发明用于对大小变化目标无人机的目标检测。

Description

一种基于多头自注意力机制的无人机变尺寸目标检测方法
技术领域
本发明涉及一种基于多头自注意力机制的无人机变尺寸目标检测方法,属于目标检测技术领域。
背景技术
随着无人机技术的迅速成熟和发展,消费级无人机价格不断降低,操作智能性和便利性不断提升,无人机的使用门槛不断降低,在包括军事用途、城市管理、地理测绘、日常出行等众多领域取得了大量的应用和进步,因此,无人机在日常生活中的使用逐渐增多。
随着无人机数量和使用的不断增加,通过无人机机载摄像头拍摄的图片和视频数量也在逐步提升,通过无人机,能够快速获得大量包括地理信息、车辆行人信息、城市建设情况等多种信息的数据样本。但由于无人机图像的覆盖区域大,信息一般难以被有效提取,传统的统计方式需要依靠大量的人工手动计数,严重影响了无人机影像的应用。
近年来,深度学习技术的突破发展提出了大量目标检测网络,一定程度上解决了图像视频目标检测与跟踪的任务。诸如:Yolo V3、SSD、Faster RCNN、Retina Net等网络在已有公开数据集和实际引用中均取得了较好的性能,广泛应用于监控影像等近平视高度图像的目标检测中。但由于受到飞行高度、俯视角度、物体小而密集、背景干扰大、物体大小变化等因素的影响,这些算法在无人机图像中效果并不理想。
注意力机制最早在自然语言处理领域中被提出,用于解决语言翻译、对话生成问题等中的连接权重分配问题,近两年开始用于图像领域,通过在特定层的使用,提高网络对区域信息的判断和使用,取得了一定的效果。但是,大量采用注意力机制代替卷积网络的应用仍较少。
发明内容
本发明目的是为了解决现有无人机目标检测算法对于小目标检测性能差的问题,提供了一种基于多头自注意力机制的无人机变尺寸目标检测方法。
本发明所述一种基于多头自注意力机制的无人机变尺寸目标检测方法,它包括:
S1、建立数据集:
采用无人机的机载摄像头采集一组包含目标物体的图片,获取一组数据,结合开源数据集制作标签,建立数据集;
S2、建立网络结构:
根据S1获取的数据集,采用多头自注意力机制建立多头自注意力目标检测头网络,所述多头自注意力目标检测头网络的后端采用Faster Rcnn基本框架,在多头自注意力目标检测头网络的回归层再次引入自注意力机制;
S3、分步骤进行网络训练,获得训练好的多头自注意力目标检测头网络;
S4、对目标物体进行检测:
无人机的机载摄像头采集目标物体的图像,对图像进行预处理后输入S3获取的多头自注意力目标检测头网络,多头自注意力目标检测头网络输出检测结果。
优选的,S1所述采集一组包含目标物体的图片获取一组数据集的过程包括:
对图片进行去噪、数据归一化和图片数据降采样。
优选的,S2所述建立多头自注意力目标检测头网络的方法包括:
S2-1、将数据集依次输入两个标准残差块中,数据在每个标准残差块中依次经过卷积层、合并层和激活层,然后向高维度特征空间映射,获得上层网络计算结果;
S2-2、将上层网络计算结果输入自注意力层,获得自注意力层的输出结果;
S2-3、将自注意力层的输出结果输入回归层,选择目标物体候选框与特征图合并,作为多头自注意力目标检测头网络的输出结果;
S2-4、将多头自注意力目标检测头网络的输出结果输入到后端Faster Rcnn基本框架的分类检测网络中,获得目标物体的最终位置和所述类别。
优选的,S3所述进行网络训练的具体方法包括:
S3-1、在ImageNet数据集上对S2建立的多头自注意力目标检测头网络和回归层进行预训练,将训练好的模型合并到多头自注意力目标检测头网络中;
S3-2、将S1获取的数据集划分为训练集和测试集两部分;
S3-3、利用S1获取的数据集对多头自注意力目标检测头网络进行端到端的训练,同时利用测试集进行性能检测;
S3-4、根据性能检测调整训练结果,返回执行S3-3,直至获取最终训练好的多头自注意力目标检测头网络。
优选的,S4所述对图像进行预处理包括:
空间域滤波图像去噪和数据标准化处理。
本发明的优点:本发明提出的一种基于多头自注意力机制的无人机变尺寸目标检测方法解决了当前无人机目标检测算法存在的对于小目标物体检测性能差的问题,解决了由于网络层数不断增加小目标在特征图上小的问题。采用多头自注意力网络代替部分卷积层,并减少了神经网络的使用,能够在保证精度的情况下提高运行效率。对于大小变化的物体具有较好的鲁棒性和适应性,可以应对无人机在不同飞行高度下同一物体在图像上大小变化过大的问题。
附图说明
图1是一种基于多头自注意力机制的无人机变尺寸目标检测方法的流程框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
具体实施方式一:下面结合图1说明本实施方式,本实施方式所述一种基于多头自注意力机制的无人机变尺寸目标检测方法,它包括:
S1、建立数据集:
采用无人机的机载摄像头采集一组包含目标物体的图片,获取一组数据,结合开源数据集制作标签,建立数据集;
S2、建立网络结构:
根据S1获取的数据集,采用多头自注意力机制建立多头自注意力目标检测头网络,所述多头自注意力目标检测头网络的后端采用Faster Rcnn基本框架,在多头自注意力目标检测头网络的回归层再次引入自注意力机制;
S3、分步骤进行网络训练,获得训练好的多头自注意力目标检测头网络;
S4、对目标物体进行检测:
无人机的机载摄像头采集目标物体的图像,对图像进行预处理后输入S3获取的多头自注意力目标检测头网络,多头自注意力目标检测头网络输出检测结果。
本实施方式中,S1所述一组数据集结合开源数据集采用数据集制作软件Labelme制作标签。
进一步的,S1所述采集一组包含目标物体的图片获取一组数据集的过程包括:
对图片进行去噪、数据归一化和图片数据降采样。
本实施方式中,获得的数据集为符合网络输入格式的数据[3,Win,Hin]。
再进一步的,S3所述进行网络训练的具体方法包括:
S3-1、在ImageNet数据集上对S2建立的多头自注意力目标检测头网络和回归层进行预训练,将训练好的模型合并到多头自注意力目标检测头网络中;
S3-2、将S1获取的数据集划分为训练集和测试集两部分;
S3-3、利用S1获取的数据集对多头自注意力目标检测头网络进行端到端的训练,同时利用测试集进行性能检测;
S3-4、根据性能检测调整训练结果,返回执行S3-3,直至获取最终训练好的多头自注意力目标检测头网络。
再进一步的,S4所述对图像进行预处理包括:
空间域滤波图像去噪和数据标准化处理。
具体实施方式二:本实施方式对具体实施方式一作进一步说明,S2所述建立多头自注意力目标检测头网络的方法包括:
S2-1、将数据集依次输入两个标准残差块中,数据在每个标准残差块中依次经过卷积层、合并层和激活层,然后向高维度特征空间映射,获得上层网络计算结果;
S2-2、将上层网络计算结果输入自注意力层;
S2-3、自注意力层的输出结果输入回归层,选择目标物体候选框与特征图合并,作为多头自注意力目标检测头网络的输出结果;
S2-4、将多头自注意力目标检测头网络的输出结果输入到后端Faster Rcnn基本框架的分类检测网络中,获得目标物体的最终位置和所述类别。
本实施方式中,S2-2将上层网络计算结果输入自注意力层中,定义
Figure BDA0002575449360000041
则自注意力层的输出结果是:Self-Attention(X)t,i=softmax(At,:)XWval
本实施方式中,对于S2-3的输出结果,根据默认候选框的评价分数,对输出结果的特征图进行注意力网络权重平衡:
α=softmax(fatt(x));
Figure BDA0002575449360000051
本实施方式中,将S2-4获得的结果进行存储,并将回归框标记在图片中,便于工作人员查看检测情况。
具体实施方式三:本实施方式对具体实施方式二作进一步说明,S2-2所述自注意力层的输出结果的计算方法包括:
输入矩阵
Figure BDA0002575449360000052
将输入特征层转化为序列化的像素层,包括T个Din维度的序列化像素;
通过序列化像素层的查询矩阵Wqry、关键词矩阵Wkey和其值矩阵Wval得到每个输入序列的注意力分数
Figure BDA0002575449360000053
将注意力分数A:转化为自注意力权重,获得输出结果:
Self-Attention(X):=softmax(A:)XWval
进一步的,S2-3所述多头自注意力目标检测头网络的输出结果的获取方法包括:
提取自注意力层的输出结果的特征信息,通过映射矩阵Wout和偏置Bout与各层结果合并,获得最终输出:
Figure BDA0002575449360000054
其中:Nh表示多头自注意力目标检测头网络的特征空间,h表示Nh中的特征层。
本实施方式中,所述映射矩阵
Figure BDA0002575449360000055
Figure BDA0002575449360000056
Dh表示多头自注意力目标检测头网络的空间分辨率,Dout表示输出特征的分辨率。
具体实施方式四:本实施方式对具体实施方式三作进一步说明,与具体实施方式三不同,在计算自注意力分数A:时,加入位置信息向量
Figure BDA0002575449360000057
Figure BDA0002575449360000058
位置信息向量P中,位置编码包括绝对位置编码和相对位置编码。
进一步的,位置信息向量P采用绝对位置编码,能够覆盖全局空间信息。
采用绝对位置编码,给每个像素赋予固定的一个位置向量Pp,自注意力分数A:转化为:
Figure BDA0002575449360000061
再进一步的,位置信息向量P采用相对位置编码,能够反应输入序列信息与目标图片中心位置的映射关系。
采用相对位置编码,自注意力分数A:转化为:
Figure BDA0002575449360000062
基于本发明提出的一种基于多头自注意力机制的无人机变尺寸目标检测方法,在VHR-10、RSOD和VisDrone2019航拍图像数据集上进行模型训练和检测,并将本专利方法和其他常用的目标检测算法精度进行比较,其结果如表1所示:
表1
RetinaNet SSD Faster R-CNN Mask R-CNN AttFasterR-CNN
VHR-10 0.869 0.848 0.865 0.884 0.893
RSOD 0.947 0.922 0.963 0.977 0.979
VisDrone 0.235 0.203 0.262 0.281 0.279
由表1实验数据显示,本发明提出的方法在VHR-10和RSOD数据集上都取得了更好的效果,在VisDrone上相比FasterR-CNN有较大的提升。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。

Claims (8)

1.一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,它包括:
S1、建立数据集:
采用无人机的机载摄像头采集一组包含目标物体的图片,获取一组数据,结合开源数据集制作标签,建立数据集;
S2、建立网络结构:
根据S1获取的数据集,采用多头自注意力机制建立多头自注意力目标检测头网络,所述多头自注意力目标检测头网络的后端采用Faster Rcnn基本框架,在多头自注意力目标检测头网络的回归层再次引入自注意力机制;
S3、分步骤进行网络训练,获得训练好的多头自注意力目标检测头网络;
S4、对目标物体进行检测:
无人机的机载摄像头采集目标物体的图像,对图像进行预处理后输入S3获取的多头自注意力目标检测头网络,多头自注意力目标检测头网络输出检测结果。
2.根据权利要求1所述的一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,S1所述采集一组包含目标物体的图片获取一组数据集的过程包括:
对图片进行去噪、数据归一化和图片数据降采样。
3.根据权利要求1所述的一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,S2所述建立多头自注意力目标检测头网络的方法包括:
S2-1、将数据集依次输入两个标准残差块中,数据在每个标准残差块中依次经过卷积层、合并层和激活层,然后向高维度特征空间映射,获得上层网络计算结果;
S2-2、将上层网络计算结果输入自注意力层,获得自注意力层的输出结果;
S2-3、将自注意力层的输出结果输入回归层,选择目标物体候选框与特征图合并,作为多头自注意力目标检测头网络的输出结果;
S2-4、将多头自注意力目标检测头网络的输出结果输入到后端Faster Rcnn基本框架的分类检测网络中,获得目标物体的最终位置和所述类别。
4.根据权利要求3所述一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,S2-2所述自注意力层的输出结果的计算方法包括:
输入矩阵
Figure FDA0002575449350000011
将输入特征层转化为序列化的像素层,包括T个Din维度的序列化像素;
通过序列化像素层的查询矩阵Wqry、关键词矩阵Wkey和其值矩阵Wval得到每个输入序列的注意力分数
Figure FDA0002575449350000021
将注意力分数A:转化为自注意力权重,获得输出结果:
Self-Attention(X):=softmax(A:)XWval
5.根据权利要求4所述一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,S2-3所述多头自注意力目标检测头网络的输出结果的获取方法包括:
提取自注意力层的输出结果的特征信息,通过映射矩阵Wout和偏置Bout与各层结果合并,获得最终输出:
Figure FDA0002575449350000022
其中:Nh表示多头自注意力目标检测头网络的特征空间,h表示Nh中的特征层。
6.根据权利要求4所述一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,在计算自注意力分数A:时,加入位置信息向量
Figure FDA0002575449350000023
Figure FDA0002575449350000024
位置信息向量P中,位置编码包括绝对位置编码和相对位置编码。
7.根据权利要求6所述的一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,S3所述进行网络训练的具体方法包括:
S3-1、在ImageNet数据集上对S2建立的多头自注意力目标检测头网络和回归层进行预训练,将训练好的模型合并到多头自注意力目标检测头网络中;
S3-2、将S1获取的数据集划分为训练集和测试集两部分;
S3-3、利用S1获取的数据集对多头自注意力目标检测头网络进行端到端的训练,同时利用测试集进行性能检测;
S3-4、根据性能检测调整训练结果,返回执行S3-3,直至获取最终训练好的多头自注意力目标检测头网络。
8.根据2-7权利要求中任一项所述的一种基于多头自注意力机制的无人机变尺寸目标检测方法,其特征在于,S4所述对图像进行预处理包括:
空间域滤波图像去噪和数据标准化处理。
CN202010659641.3A 2020-07-08 2020-07-08 一种基于多头自注意力机制的无人机变尺寸目标检测方法 Active CN111709397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010659641.3A CN111709397B (zh) 2020-07-08 2020-07-08 一种基于多头自注意力机制的无人机变尺寸目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010659641.3A CN111709397B (zh) 2020-07-08 2020-07-08 一种基于多头自注意力机制的无人机变尺寸目标检测方法

Publications (2)

Publication Number Publication Date
CN111709397A true CN111709397A (zh) 2020-09-25
CN111709397B CN111709397B (zh) 2022-07-05

Family

ID=72545143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010659641.3A Active CN111709397B (zh) 2020-07-08 2020-07-08 一种基于多头自注意力机制的无人机变尺寸目标检测方法

Country Status (1)

Country Link
CN (1) CN111709397B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283475A (zh) * 2021-04-27 2021-08-20 南方电网数字电网研究院有限公司 目标检测方法、装置、设备和存储介质
CN113298789A (zh) * 2021-05-28 2021-08-24 国网陕西省电力公司电力科学研究院 绝缘子缺陷检测方法、系统、电子设备及可读存储介质
CN113326845A (zh) * 2021-06-30 2021-08-31 上海云从汇临人工智能科技有限公司 基于自注意力机制的目标检测方法、系统和存储介质
CN113554125A (zh) * 2021-09-18 2021-10-26 四川翼飞视科技有限公司 结合全局与局部特征的目标检测装置、方法和存储介质
CN113744310A (zh) * 2021-08-24 2021-12-03 北京百度网讯科技有限公司 目标跟踪方法、装置、电子设备及可读存储介质
CN115546617A (zh) * 2022-10-13 2022-12-30 哈尔滨市科佳通用机电股份有限公司 基于改进fct网络的车门锁闭装置配件丢失检测方法及装置
CN116645523A (zh) * 2023-07-24 2023-08-25 济南大学 一种基于改进RetinaNet的快速目标检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829893A (zh) * 2019-01-03 2019-05-31 武汉精测电子集团股份有限公司 一种基于注意力机制的缺陷目标检测方法
CN110084299A (zh) * 2019-04-24 2019-08-02 中国人民解放军国防科技大学 基于多头融合注意力的目标检测方法和装置
CN110827251A (zh) * 2019-10-30 2020-02-21 江苏方天电力技术有限公司 一种基于航拍图像的输电线路锁紧销缺陷检测方法
CN111160343A (zh) * 2019-12-31 2020-05-15 华南理工大学 一种基于Self-Attention的离线数学公式符号识别方法
CN111178213A (zh) * 2019-12-23 2020-05-19 大连理工大学 一种基于深度学习的航拍车辆检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829893A (zh) * 2019-01-03 2019-05-31 武汉精测电子集团股份有限公司 一种基于注意力机制的缺陷目标检测方法
CN110084299A (zh) * 2019-04-24 2019-08-02 中国人民解放军国防科技大学 基于多头融合注意力的目标检测方法和装置
CN110827251A (zh) * 2019-10-30 2020-02-21 江苏方天电力技术有限公司 一种基于航拍图像的输电线路锁紧销缺陷检测方法
CN111178213A (zh) * 2019-12-23 2020-05-19 大连理工大学 一种基于深度学习的航拍车辆检测方法
CN111160343A (zh) * 2019-12-31 2020-05-15 华南理工大学 一种基于Self-Attention的离线数学公式符号识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JEAN-BAPTISTE CORDONNIER等: "ON THE RELATIONSHIP BETWEEN SELF-ATTENTION AND CONVOLUTIONAL LAYERS", 《ARXIV》 *
ZHAOWEI CAI等: "Cascade R-CNN: High Quality Object Detection", 《ARXIV》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283475A (zh) * 2021-04-27 2021-08-20 南方电网数字电网研究院有限公司 目标检测方法、装置、设备和存储介质
CN113298789A (zh) * 2021-05-28 2021-08-24 国网陕西省电力公司电力科学研究院 绝缘子缺陷检测方法、系统、电子设备及可读存储介质
CN113326845A (zh) * 2021-06-30 2021-08-31 上海云从汇临人工智能科技有限公司 基于自注意力机制的目标检测方法、系统和存储介质
CN113744310A (zh) * 2021-08-24 2021-12-03 北京百度网讯科技有限公司 目标跟踪方法、装置、电子设备及可读存储介质
CN113554125A (zh) * 2021-09-18 2021-10-26 四川翼飞视科技有限公司 结合全局与局部特征的目标检测装置、方法和存储介质
CN113554125B (zh) * 2021-09-18 2021-12-17 四川翼飞视科技有限公司 结合全局与局部特征的目标检测装置、方法和存储介质
CN115546617A (zh) * 2022-10-13 2022-12-30 哈尔滨市科佳通用机电股份有限公司 基于改进fct网络的车门锁闭装置配件丢失检测方法及装置
CN116645523A (zh) * 2023-07-24 2023-08-25 济南大学 一种基于改进RetinaNet的快速目标检测方法
CN116645523B (zh) * 2023-07-24 2023-12-01 江西蓝瑞存储科技有限公司 一种基于改进RetinaNet的快速目标检测方法

Also Published As

Publication number Publication date
CN111709397B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN111709397B (zh) 一种基于多头自注意力机制的无人机变尺寸目标检测方法
CN108961235B (zh) 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
CN104992223B (zh) 基于深度学习的密集人数估计方法
CN110889449A (zh) 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法
CN113449594B (zh) 一种多层网络组合的遥感影像地类语义分割与面积计算方法
CN107423760A (zh) 基于预分割和回归的深度学习目标检测方法
CN110135354B (zh) 一种基于实景三维模型的变化检测方法
CN105224937B (zh) 基于人体部件位置约束的细粒度语义色彩行人重识别方法
CN103605972A (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN109886159B (zh) 一种非限定条件下的人脸检测方法
CN113379771B (zh) 带有边缘约束的层次化人体解析语义分割方法
CN114092832A (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN114694038A (zh) 基于深度学习的高分辨率遥感影像分类方法及系统
CN109635726B (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
CN113221956B (zh) 基于改进的多尺度深度模型的目标识别方法及装置
CN111723667A (zh) 基于人体关节点坐标的智慧灯杆人群行为识别方法和装置
Guo et al. Using multi-scale and hierarchical deep convolutional features for 3D semantic classification of TLS point clouds
CN111738164B (zh) 一种基于深度学习的行人检测方法
CN110334584A (zh) 一种基于区域全卷积网络的手势识别方法
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN111598854A (zh) 基于丰富鲁棒卷积特征模型的复杂纹理小缺陷的分割方法
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant