CN111368754B - 一种基于全局上下文信息的机场跑道异物检测方法 - Google Patents
一种基于全局上下文信息的机场跑道异物检测方法 Download PDFInfo
- Publication number
- CN111368754B CN111368754B CN202010154681.2A CN202010154681A CN111368754B CN 111368754 B CN111368754 B CN 111368754B CN 202010154681 A CN202010154681 A CN 202010154681A CN 111368754 B CN111368754 B CN 111368754B
- Authority
- CN
- China
- Prior art keywords
- global context
- network
- convolution
- resnext
- airport runway
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 25
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims abstract description 4
- 238000010586 diagram Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 25
- 238000011156 evaluation Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 238000001125 extrusion Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
- G06V10/464—Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于全局上下文信息的机场跑道异物检测方法,包括:将图片输入到所设计的卷积网络中,主干网络采用ResNeXt,通过多个并行路径来增加残差块的宽度,提高网络对小目标检测的准确率;在此过程中,加入全局上下文模块(GC block),通过自注意力机制捕捉图像的全局上下文信息;采用级联网络结构,设置三个不同的IoU阈值来进行训练,提高网络的泛化能力,进一步提高检测的准确率;最后输出检测的结果。在FOD(Foreign object debris)数据集上的实验结果表明,本发明的检测性能优于其他的算法。
Description
技术领域
本发明属于计算机视觉中的目标检测领域,涉及机场跑道异物检测的问题,针对机场跑道异物的特点设计网络结构,是一种基于全局上下文信息的目标检测方法,相对于目前主流的目标检测方法,在准确率上得到了一定提升。
背景技术
机场跑道异物给飞机的起飞和降落带来了巨大的影响,许多案例都证明,机场跑道异物可以很容易被吸入到飞机发动机,导致发动机失效,碎片也会堆积在机械装置中,影响起落架、机翼等设备的正常运行。在机场跑道异物中,一些目标偏小,检测难度较大。机场跑道异物中小目标的检测是亟待解决的问题。
随着深度学习的发展,基于深度学习的目标检测算法越来越成熟,在一些领域也得到了很好的应用。目前,现有的目标检测算法可以分为一阶段和两阶段两类。两阶段的算法需要分两步完成,首先需要获取候选区域,然后进行分类;一阶段的算法可以理解为一步到位,不需要单独寻找候选区域。两阶段算法的检测准确率通常比一阶段高,但是检测速率偏慢。目前,检测准确率比较高的两阶段算法有Faster R-CNN、Mask R-CNN、Cascade R-CNN等。对于机场跑道异物检测的问题,直接使用现有的目标检测算法进行检测准确率比较低。
发明内容
本发明针对机场跑道异物中小目标物体难以检测的问题,设计了一种基于全局上下文信息的卷积神经网络,所设计的网络对于小目标的检测具有较高的检测准确率。
本发明采用如下技术方案:一种基于全局上下文信息的机场跑道异物检测方法,该方法使用ResNeXt作为主干网络,通过多个并行路径来增加残差块的宽度,提高网络对小目标检测的准确率;在网络中加入全局上下文模块(GC block),通过自注意力机制捕捉图像的全局上下文信息;使用级联网络结构,设置三个不同的IoU阈值来进行训练,提高网络的泛化能力,进一步提高检测的准确率。
该方法的具体步骤如下:
步骤一:对FOD3(Foreign object debris Detection Dataset
即FODDD)数据集中的机场跑道异物数据进行预处理,图1为FOD3数据集的图片样例。
步骤二:将预处理后的机场跑道异物数据送入到主干网络ResNeXt中,获取机场跑道异物图像的特征图。ResNeXt的基本模块示意图如图2所示。首先将图片输入到网络中,然后进行卷积操作,卷积核大小为1×1,输出的特征图通道数为128;接着将这128个通道平均分成32等份,每份再进行卷积操作,卷积核大小为3×3,然后将这些卷积后的结果串联起来,输出一个128通道的特征图;再将特征图进行卷积操作,卷积核大小为1×1,最后输出通道数为256的特征图。针对机场跑道异物中小目标检测难的问题,在此过程中,加入两层全局上下文模块(GC block),分别是在ResNeXt的第三层和第四层后面,更好地获取远程依赖项,最后得到包含图像全局上下文信息的特征图,图3为全局上下文模块(GC block)的主要结构示意图。
步骤三:将提取到的特征图输入到后面的级联网络中,这部分是三个不同IoU阈值的级联,三个IoU阈值分别为0.5,0.6,0.7,然后进行模型训练。
步骤四:完成模型训练后,加载模型参数,输入任意一张FOD3数据集中的图片进行测试,得到预测结果和预测准确率。预测效果图如图4所示。步骤二中的卷积神经网络是在ResNeXt中添加了两层全局上下文模块,添加后的示意图如图5所示,ResNeXt的基本结构如图2所示。
所述步骤二中,在卷积过程中采用分组卷积的方法。在这一部分,进行分组卷积前,输入和输出通道数为128。使用分组卷积,分组数设置为16,每组的输入与输出通道数为8,将每组输出的特征图进行组合得到分组卷积后的输出。
所述步骤二中,采用多尺度特征融合的方式,使用不同特征层特征融合之后的结果来做预测。在训练过程中,每次将图片输入卷积层时都输出一张特征图,将各个卷积层所输出的特征图进行融合。在融合后的特征图上利用滑动卷积核的方式进行预测打分。
所述步骤二中,在主干网络ResNeXt中加入两层全局上下文模块(GC block),分别加在主干网络ResNeXt的第三层和第四层后面,通过这种方式来提取图片中的全局上下文信息。
本发明提出的方法的整体流程图如图5所示。
(1)基于ResNeXt的主干网络:ResNeXt提出了用一种平行堆叠相同拓扑结构的模块代替原来ResNet的三层卷积模块。这样只需要设计一个模板模块就确定一个网络中的所有模块。这样一来便可以极大的缩小计算空间。ResNeXt把Inception的优点与ResNet的优点进行了结合。残差结构使得模型便于训练,Inception对特征层进行了很好的融合。
(2)全局上下文信息的获取
原版的非局部模块(non-local block)针对每个查询位置,重要联系的区域是同一块区域,也就是每个位置的关注位置几乎是相同的,所以把这些重要的区域特征加在每个位置之后,网络的准确率几乎没有下降,但是计算量却减少了很多。然而单独的非局部(non-local)结构运算量太大了,单独的挤压激励模块(SE block)全局上下文建模不够有效。针对这一问题,本发明融合了非局部模块(non-local block)和挤压激励模块(SEblock)的优点,使用非局部模块(non-local block),计算量相对来说较小,也很好的融合了全局信息,这样可以提升网络对于小目标检测的准确率。
(3)IoU阈值的级联
在训练过程中一般通过IoU阈值来判定正负样本,因此IoU阈值的选取对训练结果的影响十分重要。如果IoU阈值选取的比较高,则得到的正样本更接近目标,因此训练出来的检测器会更加准确。但是如果盲目的提高IoU阈值会带来另一些问题:一是正样本数量过少会导致训练的过拟合,二是训练和测试使用不一样的阈值导致评估性能的下降。如果将IoU阈值取得偏低,得到的正样本会更为丰富,这样有利于检测器的训练,但会造成测试时出现大量的虚检。根据以上分析,结合机场跑道数据集中小目标的问题,这里采用级联思想,将检测器的部分堆叠成几个级联的模块,采用不同的IoU阈值训练,以此来提高网络对于小目标检测的准确率。
本方法的评价指标为平均精度值(mAP)。在FOD3数据集上进行实验,本发明方法取得了不错的实验结果。对于机场跑道异物的检测,本发明方法的检测准确率高于现有的目标检测算法。本发明使用ResNeXt作为主干网络,通过添加全局上下模块捕捉FOD3数据集图像中的上下文信息。此外,级联三个不同的IoU阈值进行训练,提高对于小目标检测的准确率。
附图说明
图1为FOD3数据集的图片样例。
图2为ResNeXt的基本模块示意图。
图3为全局上下文模块(GC block)主要结构示意图。
图4为本发明在FOD3数据集上实验的预测效果图。
图5为本发明提出方法的整体流程示意图。
具体实施方式
以下结合说明书附图,对本发明的算法进行详细说明:
本发明是一种基于全局上下文信息的目标检测算法。如图5所示,算法检测流程为:将图片输入到所设计的卷积网络中,主干网络为ResNeXt,经过主干网络的一系列卷积操作提取目标特征图;在此过程中,加入全局上下文模块(GC block),通过自注意力机制捕捉图像的全局上下文信息;之后通过级联网络结构,设置三个不同的IoU阈值来进行训练,对候选框进行打分,判定正负样本,进行目标的检测;最后输出分类结果和预测准确率。
具体算法介绍如下:
(1)基于ResNeXt的主干网络
将图片输入到ResNeXt主干网络中,进行卷积等操作来提取目标特征图。在此过程中,采用分组卷积的方法进行卷积。采用多尺度特征融合的方式,使用不同特征层特征融合之后的结果来做预测。在目标检测网络中,加深或者加宽网络结构是提高检测准确率的有效途径,但是随着网络参数量的增加,网络的复杂度也会增加,计算成本也会变大。而ResNeXt能够在几乎不增加运算量的前提下,通过并行路径增加残差块的宽度。该网络采用VGG/ResNet重复相同网络层的策略,以一种简单的可扩展的方式延续分离-变形-合并(split-transform-merge)策略,整个网络的构建模块都是一样的,不用在每个阶段里对每个构建模块的超参数进行调整,只用一个结构相同的构建模块,重复堆叠即可形成整个网络。
ResNeXt提出了用一种平行堆叠相同拓扑结构的模块代替原来ResNet的三层卷积模块。这样只需要设计一个模板模块就可以确定一个网络中的所有模块,这样一来便可以极大的缩小计算空间。
(2)全局上下文信息的获取
在ResNeXt主干网络中加入全局上下文模块(GC block)来获取图片的全局上下文信息。原版的非局部模块(non-local block)针对每个查询位置,重要联系的区域是同一块区域,也就是每个位置的关注位置几乎是相同的,所以把这些重要的区域特征加在每个位置之后,网络的准确率几乎没有下降,但是计算量却减少了很多。然而单独的非局部(non-local)结构运算量太大了,单独的挤压激励模块(SE block)全局上下文建模不够有效。针对这一问题,本发明融合了非局部模块(non-local block)和挤压激励模块(SE block)的优点,使用全局上下文模块(GC block),计算量相对来说较小,也很好的融合了全局信息,这样可以提升网络对于小目标检测的准确率。(3)IoU阈值的级联
将前面主干网络的输出结果输入到级联网络结构中,通过级联三个不同的IoU阈值来进行训练。在目标检测的训练过程中IoU的阈值选取是一个比较大的问题。目标检测分为分类和回归两个过程,因此检测问题的本质就是一个分类问题,但是检测问题和分类问题又有很大区别,因为在检测问题中是对图像中的所有候选框进行打分,在训练过程中通过IoU阈值来判定正负样本。因此,IoU阈值的选取是一个很重要的问题。如果IoU阈值选取的比较高,则得到的正样本更接近目标,因此训练出来的检测器会更加准确。但是如果盲目的提高IoU阈值会带来另一些问题:一是正样本数量过少会导致训练的过拟合,二是训练和测试使用不一样的阈值导致评估性能的下降。如果将IoU阈值取得偏低,得到的正样本会更为丰富,这样有利于检测器的训练,但会造成测试时出现大量的虚检。根据以上分析,结合机场跑道异物数据集中小目标的问题,这里采用级联思想,将检测器的部分堆叠成几个级联的模块,级联三个不同的IoU阈值来进行训练。
算法的评价指标为平均精度值(mAP)。为验证算法性能,本方法在自建的FOD3数据集上对算法性能进行了测试分析,该数据集建立了高仿真的机场跑道环境,构建了包含4000张多属性结构化标签的机场跑道异物图像数据集,涵盖了多种路面情况、多种光照环境等。这些图片大约一共有一万一千多个目标。所建立的数据集包含结构化的四种标签,分别是机场跑道异物目标的边界框标签、12种类别标签、4种材质标签和3种危险等级标签。在训练过程中,我们使用sigmoid来进行分类,优化算法使用的是随机梯度下降算法(SGD)。在FOD3数据集上进行实验,本发明方法取得了不错的实验结果。相比较于其他的算法,本发明算法对于机场跑道异物检测的准确率更高。为了进行对比,选择了其他算法进行实验,表1为实验对比结果。
表1本发明提出的方法检测性能对比结果
如表1所示,在FOD3数据集上,验证了本算法的检测性能,本算法的mAP指标可以达到0.803,相比较于其他的算法都有一定提升。
Claims (1)
1.一种基于全局上下文信息的机场跑道异物检测方法,其特征在于:该方法使用ResNeXt作为主干网络,通过多个并行路径来增加残差块的宽度;在网络中加入全局上下文模块,通过自注意力机制捕捉图像的全局上下文信息;使用级联网络结构,设置三个不同的IoU阈值来进行训练;
该方法的具体步骤如下:
步骤一:对FOD3数据集中的机场跑道异物数据进行预处理;
步骤二:将预处理后的机场跑道异物数据送入到主干网络ResNeXt中,获取机场跑道异物图像的特征图;首先将图片输入到网络中,然后进行卷积操作,卷积核大小为1×1,输出的特征图通道数为128;接着将这128个通道平均分成32等份,每份再进行卷积操作,卷积核大小为3×3,然后将这些卷积后的结果串联起来,输出一个128通道的特征图;再将特征图进行卷积操作,卷积核大小为1×1,最后输出通道数为256的特征图;针对机场跑道异物中小目标检测难的问题,在此过程中,加入两层全局上下文模块,分别是在ResNeXt的第三层和第四层后面,更好地获取远程依赖项,最后得到包含图像全局上下文信息的特征图;
步骤三:将提取到的特征图输入到后面的级联网络中,这部分是三个不同IoU阈值的级联,三个IoU阈值分别为0.5,0.6,0.7,然后进行模型训练;
步骤四:完成模型训练后,加载模型参数,输入任意一张FOD3数据集中的图片进行测试,得到预测结果和预测准确率;步骤二中的卷积神经网络是在ResNeXt中添加了两层全局上下文模块;
所述步骤二中,在卷积过程中采用分组卷积的方法;在这一部分,进行分组卷积前,输入和输出通道数为128;使用分组卷积,分组数设置为16,每组的输入与输出通道数为8,将每组输出的特征图进行组合得到分组卷积后的输出;
所述步骤二中,采用多尺度特征融合的方式,使用不同特征层特征融合之后的结果来做预测;在训练过程中,每次将图片输入卷积层时都输出一张特征图,将各个卷积层所输出的特征图进行融合;在融合后的特征图上利用滑动卷积核的方式进行预测打分;
所述步骤二中,在主干网络ResNeXt中加入两层全局上下文模块分别加在主干网络ResNeXt的第三层和第四层后面,通过这种方式来提取图片中的全局上下文信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010154681.2A CN111368754B (zh) | 2020-03-08 | 2020-03-08 | 一种基于全局上下文信息的机场跑道异物检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010154681.2A CN111368754B (zh) | 2020-03-08 | 2020-03-08 | 一种基于全局上下文信息的机场跑道异物检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111368754A CN111368754A (zh) | 2020-07-03 |
CN111368754B true CN111368754B (zh) | 2023-11-28 |
Family
ID=71208535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010154681.2A Active CN111368754B (zh) | 2020-03-08 | 2020-03-08 | 一种基于全局上下文信息的机场跑道异物检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368754B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898479B (zh) * | 2020-07-14 | 2023-09-26 | 中国矿业大学 | 一种基于全卷积单步目标检测算法的口罩佩戴识别方法和装置 |
CN112464851A (zh) * | 2020-12-08 | 2021-03-09 | 国网陕西省电力公司电力科学研究院 | 一种基于视觉感知的智能电网异物入侵检测方法及系统 |
CN113159171B (zh) * | 2021-04-20 | 2022-07-22 | 复旦大学 | 一种基于对抗学习的植物叶片图像细分类方法 |
CN113420669B (zh) * | 2021-06-24 | 2022-05-10 | 武汉工程大学 | 基于多尺度训练和级联检测的文档版面分析方法和系统 |
CN113255601B (zh) * | 2021-06-29 | 2021-11-12 | 深圳市安软科技股份有限公司 | 一种车辆重识别模型的训练方法、系统及相关设备 |
CN113850284B (zh) * | 2021-07-04 | 2023-06-23 | 天津大学 | 一种基于多尺度特征融合和多分支预测的多操作检测方法 |
CN113813053A (zh) * | 2021-09-18 | 2021-12-21 | 长春理工大学 | 一种基于腹腔镜内窥影像的手术进程分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657538A (zh) * | 2018-11-05 | 2019-04-19 | 中国科学院计算技术研究所 | 基于上下文信息指导的场景分割方法和系统 |
CN109766884A (zh) * | 2018-12-26 | 2019-05-17 | 哈尔滨工程大学 | 一种基于Faster-RCNN的机场跑道异物检测方法 |
CN109902602A (zh) * | 2019-02-16 | 2019-06-18 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN110135296A (zh) * | 2019-04-30 | 2019-08-16 | 上海交通大学 | 基于卷积神经网络的机场跑道fod检测方法 |
-
2020
- 2020-03-08 CN CN202010154681.2A patent/CN111368754B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657538A (zh) * | 2018-11-05 | 2019-04-19 | 中国科学院计算技术研究所 | 基于上下文信息指导的场景分割方法和系统 |
CN109766884A (zh) * | 2018-12-26 | 2019-05-17 | 哈尔滨工程大学 | 一种基于Faster-RCNN的机场跑道异物检测方法 |
CN109902602A (zh) * | 2019-02-16 | 2019-06-18 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN110135296A (zh) * | 2019-04-30 | 2019-08-16 | 上海交通大学 | 基于卷积神经网络的机场跑道fod检测方法 |
Non-Patent Citations (2)
Title |
---|
Xhaowei Tai 等.Cascade R-CNN: Delving into High Quality Object Detection.《IEEE》.2018,第1-9页. * |
Yue Cao 等.GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond.《IEEE》.2020,第1-10页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111368754A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368754B (zh) | 一种基于全局上下文信息的机场跑道异物检测方法 | |
CN110084292B (zh) | 基于DenseNet和多尺度特征融合的目标检测方法 | |
CN113052210B (zh) | 一种基于卷积神经网络的快速低光照目标检测方法 | |
CN109241982B (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN112101221B (zh) | 一种用于交通信号灯实时检测与识别的方法 | |
CN113420607A (zh) | 无人机多尺度目标检测识别方法 | |
CN111460980A (zh) | 基于多语义特征融合的小目标行人的多尺度检测方法 | |
Quan et al. | Improved Deeplabv3 for better road segmentation in remote sensing images | |
CN111738300A (zh) | 一种交通标志及信号灯检测和识别的优化算法 | |
CN116071668A (zh) | 基于多尺度特征融合的无人机航拍图像目标检测方法 | |
CN117037004A (zh) | 基于多尺度特征融合和上下文增强的无人机影像检测方法 | |
Wei et al. | Lightweight multimodal feature graph convolutional network for dangerous driving behavior detection | |
CN113361475A (zh) | 一种基于多阶段特征融合信息复用的多光谱行人检测方法 | |
Li et al. | Incremental learning of infrared vehicle detection method based on SSD | |
CN116665036B (zh) | 一种基于单模态辅助监督和YOLOv5的RGB-红外多源图像目标检测方法 | |
CN116935249A (zh) | 一种无人机场景下三维特征增强的小目标检测方法 | |
CN117132910A (zh) | 一种用于无人机的车辆检测方法、装置及存储介质 | |
Xiao et al. | Traffic sign detection in complex environment based on improved YOLOv3 | |
CN116129152A (zh) | 一种基于自相似性的双分支特征融合的伪装目标检测方法 | |
CN115731517A (zh) | 一种基于Crowd-RetinaNet网络的拥挤人群检测方法 | |
CN114494827A (zh) | 一种用于检测航拍图片的小目标检测方法 | |
CN113065434A (zh) | 基于双一致性约束的行人再识别技术 | |
CN114049582A (zh) | 基于网络结构搜索和背景-动作增强的弱监督行为检测方法和装置 | |
Min et al. | Vehicle detection method based on deep learning and multi-layer feature fusion | |
Shi et al. | Smoke Video Detection Algorithm Based On 3D Convolutional Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |