CN109543672A - 基于稠密特征金字塔网络的物体检测方法 - Google Patents

基于稠密特征金字塔网络的物体检测方法 Download PDF

Info

Publication number
CN109543672A
CN109543672A CN201811197745.6A CN201811197745A CN109543672A CN 109543672 A CN109543672 A CN 109543672A CN 201811197745 A CN201811197745 A CN 201811197745A CN 109543672 A CN109543672 A CN 109543672A
Authority
CN
China
Prior art keywords
characteristic pattern
network
different
characteristic
dense
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811197745.6A
Other languages
English (en)
Other versions
CN109543672B (zh
Inventor
庞彦伟
曹家乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201811197745.6A priority Critical patent/CN109543672B/zh
Publication of CN109543672A publication Critical patent/CN109543672A/zh
Application granted granted Critical
Publication of CN109543672B publication Critical patent/CN109543672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于稠密特征金字塔网络的物体检测方法,包括下列步骤:确定基础网络架构,用于从输入图像中提取不同语义级别的深度特征,不同卷积块输出的特征图分辨率从下到上由逐渐降低。设计稠密连接网络部分,利用自上而下的跨层连接稠密地生成具有高级语义的特征图,将基础网络中最后输出的低分率特征图逐渐双线性差值上采样,使其与基础网络中所有卷积块中所有卷积层一一对用,并将其与基础网络中对应的特征图进行相加,最终得到若干高级语义且分辨率不同的特征图。设计细尺度预测部分,利用具有不同感受野的特征图分别提取不同尺度的候选检测窗口。输出物体检测结果。

Description

基于稠密特征金字塔网络的物体检测方法
技术领域
本发明涉及计算机视觉领域中鲁棒有效的物体检测方法,特别是涉及基于深度卷积神经网络进行物体检测的方法。
背景技术
物体检测是指识别图像或视频序列中存在物体(如行人、车辆等)的类别,并定位物体的位置。物体检测可以广泛应用于许多计算机视觉任务中,如自动驾驶、辅助驾驶、人机交互、身份认证、智能视频监控等。图1给出了物体检测在自动驾驶和身份认证等两个领域的应用示例。在图1(a)中,为了更好地进行驾驶决策、避免交通事故的发生,汽车的自动驾驶系统需要能够及时准确地检测汽车前方的行人、骑车人等。在图1(b)中,为了能够识别图像中具体人的身份信息,身份识别系统需要先检测出图像中存在的人脸。
近年来,随着深度学习技术的发展,基于深度学习的方法开始在计算机视觉任务(如图像分类、物体检测、超分辨率重建、图像分割)中取得巨大的成功。具体到物体检测领域,基于深度卷积神经网络的方法取得了巨大的成功。在基于卷积神经网络的物体检测方法中,最具有代表性的物体检测方法为Faster RCNN[1]。Faster RCNN进行物体检测的主要过程分为两步:候选检测窗口的生成和候选检测窗口的分类。候选窗口的生成旨在提取图像中可能存在物体的所有候选检测窗口,而候选检测窗口的分类旨在分类这些候选窗口(即识别候选窗口的具体物体类别)。为了减少网络的计算消耗量、加快物体检测的速度,Faster RCNN 的上述两个过程(即候选窗口的生成和候选窗口的分类)共享同一个基础网络。换而言之,基于基础网络的输出特征图,Faster RCNN进行候选窗口的生成和候选窗口的分类。一般而言,基础网络可以采用图像分类中常用的模型(如VGG[2]、ResNet[3]),包括若干的卷积层、激活层(ReLU)以及池化层等。因而,基础网络输出的特征图具有相对较小的空间分辨率和相对较大的感受野。由于相对较小的空间分辨率,小尺度物体的空间信息将会大量丢失。同时,相对较大的感受野也不能够很好地匹配所有尺度的物体,特别是小尺度物体。基于以上分析,Faster RCNN不能够很好地解决物体检测中的尺度变化问题,仍然存在很大的提升空间。
为了能够更好地应对物体尺度变化的问题,近些年研究人员提出了许多的多尺度物体检测方法。这些多尺度方法主要分为两类:基于图像金字塔的方法[1][4]和基于特征金字塔的方法[5][6][7][8][9]。基于图像金字塔的方法首先将输入图像缩放成一系列不同尺度的图像,然后分别将每个尺度的图像送入神经网络中进行检测,最后合并各个尺度下的物体检测结果。该方法在一定程度上克服了物体尺度变化的影响,提升了物体检测的性能。但是,由于该方法需要将不同尺度的图像分别送入神经网络中,因而该方法在检测过程中十分耗时。基于特征金字塔的方法主要利用神经网络中不同卷积层输出的不同分辨率特征图分别检测不同尺度的物体。相比于基于图像金字塔的方法,基于特征金字塔的方法在提升物体检测性能的同时具有更高的检测效率。因而,基于特征金字塔的方法受到更好研究人员的青睐,在物体检测中具有更广泛的应用。
在基于特征金字塔的方法中,多尺度神经网络(简称为MSCNN[5])和特征金字塔网络(简称为FPN[6])是两种代表性的方法。图2给出了两种方法(MSCNN和FPN)的示意图。MSCNN首先使用基础网络中不同卷积层输出的特征图提取不同尺度的候选检测窗口,然后对这些候选检测进行进一步分类和回归。如图2(a)所示,MSCNN利用神经网络中靠前的分辨率相对较大的特征图提取小尺度物体的候选检测窗口,利用神经网络中靠后的分辨率相对较小的特征图提取大尺度物体的候选检测窗口。同样,类似的思想被用于典型的单阶段物体检测方法SSD[7]中。尽管该方法取得了一定的成功,但是它仍然存在输出特征图语义不一致的问题。具体地,靠前的特征图语义级别相对较低,靠后的特征图语义级别相对较高。为了提升输出特征图的语义级别,FPN利用自上而下的跨层连接将不同卷积层输出的特征图进行融合。具体地,FPN将高语义级别低分辨率的特征图进行上采样同低语义级别高分辨率的特征图进行融合(点对点的像素相加),用于提升低语义级别高分辨率特征图的语义级别。因而,在FPN结构中所有输出特征图都具有较高级语义特征。在物体检测过程中, FPN具有更好的检测性能,特别是小尺度物体检测。同样,该跨层连接操作同样被用于RON [8]和DSSD[9]中。
参考文献:
[1]S.Ren,K.He,R.Girshick,and J.Sun,Faster R-CNN:Towards Real-TimeObject Detection with Region Proposal Networks,IEEE Trans.Pattern Analysisand Machine Intelligence, vol.39,no.6,pp.1137-1149,2017.
[2]K.Simonyan and A.Zisserman,Very Deep Convolutional Networks forLarge-Scale Image Recognition,Proc.International Conference on LearningRepresentations,2015.
[3]K.He,X.Zhang,S.Ren,and J.Sun,Deep Residual Learning for ImageRecognition, Proc.IEEE Computer Vision and Pattern Recognition,2016.
[4]B.Singh and L.S.Davis,An Analysis of Scale Invariance in ObjectDetection-SNIP, Proc.IEEE Computer Vision and Pattern Recognition,2018.
[5]Z.Cai,Q.Fan,R.S.Feris,and N.Vasconcelos,A Unified Multi-scale DeepConvolutional Neural Network for Fast Object Detection,Proc.EuropeanConference on Computer Vision,2016.
[6]T.Lin,P.Dollar,R.Girshick,K.He,B.Hariharan,and S.Belongie,FeaturePyramid Networks for Object Detection,Proc.IEEE Computer Vision and PatternRecognition,2017.
[7]W.Liu,D.Anguelov,D.Erhan,C.Szegedy,S.Reed,C.-Y.Fu,A.C.Berg,SSD:Single Shot Multibox Detector,Proc.European Conference on Computer Vision,2016.
[8]T.Kong,F.Sun,A.Yao,H.Liu,M.Lu,and Y.Chen,RON:Reverse Connectionwith Objectness Prior Networks for Object Detection,Proc.IEEE Computer Visionand Pattern Recognition,2017.
[9]C.-Y.Fu,W.Liu,A.Ranga,A.Tyagi,A.C.Berg,DSSD:Deconvolutional SingleShot Detector,CoRR abs/1701.06659,2017.
发明内容
本发明提出一种稠密特征金字塔网络,并将其用于物体检测上。采用本发明所提出的稠密特征金字塔网络进行物体检测,能够更好地解决物体的尺度变化问题,进而提升物体检测的性能,通过自上而下的稠密连接和细尺度的预测,所提出的方法能够更好地匹配物体的尺度变化,提升对尺度变化的鲁棒性。技术方案如下:
一种基于稠密特征金字塔网络的物体检测方法,包括下列步骤:
(1)确定基础网络架构,用于从输入图像中提取不同语义级别的深度特征,该基础网络包括多个卷积块,每个卷积块由多个卷积层构成,不同卷积块之间由池化层连接,在该基础网络中不同卷积块输出的特征图分辨率从下到上由逐渐降低。
(2)设计稠密连接网络部分,利用自上而下的跨层连接稠密地生成具有高级语义的特征图,将基础网络中最后输出的低分率特征图逐渐双线性差值上采样,使其与基础网络中所有卷积块中所有卷积层一一对用,并将其与基础网络中对应的特征图进行相加,最终得到若干高级语义且分辨率不同的特征图。
(3)设计细尺度预测部分,利用具有不同感受野的特征图分别提取不同尺度的候选检测窗口:经过稠密连接部分后,输出的特征分别具有不同的感受野。为进一步将上下文信息引入到每一个输出特征图中,在细尺度预测中每个输出特征由稠密连接部分的相邻三个输出特征图进行串接并经过1x1卷积层降低通道数得到。
(4)输出物体检测结果:分别将细尺度预测部分的特征图接检测子网络用于预测特征图不同位置为物体的概率和位置偏移量,根据相关概率和位置偏移量可以得到最终的物体检测结果。
附图说明
图1物体检测的应用示例
图2两种基于特征金字塔的物体检测方法
图3本发明提出的稠密特征金字塔网络(DFPN)
图4本发明所提出方法的流程图
具体实施方式
在本章节中,我们首先介绍所提出的稠密特征金字塔网络,然后介绍如何将所提出的稠密金字塔网络用于物体检测。
(1)稠密特征金字塔网络(DFPN)
图3给出了稠密特征金字塔网络(简称为DFPN)的基本架构。DFPN主要包括三个部分:基础网络,稠密连接,细尺度预测等。
基础网络部分主要用于从输入图像中提取不同语义级别的深度特征。一些著名的神经网络神经网络模型(如VGG16[2]、ResNet[3])可以用于构建基础网络。这些模型一般由若干个卷积块构成。每个卷积块由若干个卷积层和激活层等组成。不同卷积块之间存在一个池化层。因而,同一个卷积块内不同卷积层输出的特征图存在相同的空间分辨率,而不同卷积块输出的特征图具有不同的空间分辨率。与此同时,靠前卷积块内卷积层输出的特征图具有相对较低的语义级别,靠后卷积块内卷积层输出的特征图具有相对较高的语义级别。
稠密连接部分旨在利用自上而下的跨层连接稠密地生成具有高级语义的特征图。所谓的稠密连接是指不仅融合同一卷积块内不同卷积层的特征,而且融合不同卷积块间卷积层的特征。特征图f6 3经过一个3x3的卷积层生成特征图基于特征图和特征图f6 2,我们可以计算得到特征图具体地,特征图由特征图f6 2经过一个3x3的卷积层生成特征图和特征图进行点对点的相加得到。同样的方式,我们可以由特征图f6 1和特征图计算得到特征图在融合不同卷积块间不同卷积层的不同分辨率特征图时,我们将低分辨率的特征图进行上采样操作,然后同高分辨率的特征图进行融合(即点对点的像素相加)。例如,特征图由特征图f5 3和特征图计算得到。具体地,特征图f5 3经过一个3x3的卷积层生成一个新的特征图;特征图经过一个上采样操作(如双线性差值操作)生成一个新的特征图;最后将上述两个新生成的特征图进行点对点的相加得到特征图依据上述两种不同的跨层连接方法,我们可以依次得到高级语义的输出特征图自上而下看,不同输出特征图具有相似的高级语义,同时具有不同的感受。靠上的输出特征图具有相对最大的感受野,靠下的输出特征图具有相对最小的感受野。
细尺度预测部分旨在利用具有不同感受野的特征图分别提取不同尺度的候选检测窗口。为了进一步将上下文信息引入到每一个输出特征图中,在细尺度预测中每个输出特征由稠密连接部分的相邻三个输出特征图进行串接并经过1x1卷积层降低通道数得到。如果串接的特征图存在分辨率不一致时,我们将相邻的特征图上采样(双线性差值)或下采样(池化操作) 成同中间特征图相同大小的特征图。例如,特征图由特征图和特征图串接并经过1x1 卷积层得到;特征图由特征图特征图特征图串接并经过1x1卷积层得到;特征图由特征图特征图下采样的特征图串接并经过1x1卷积层得到。类似的方法,我们可以得到输出特征图基于细尺度预测,输出特征图能够更好地匹配不同尺度的物体。因而,它对物体的尺度变化更加鲁棒。
(2)将DFPN应用到物体检测
在物体检测中,我们首先利用DFPN网络提出图像中可能存在物体的候选检测窗口,然后利用Fast RCNN头网络(包括ROI池化层、两个全连接层、softmax层、检测窗口回归层等)对这些候选检测窗口进行分类。假设行人的最大尺度为smax,行人的最小尺度为smin,则行人的尺度区间为[smin,smax]。则我们将尺度在对数空间中均匀的分成9份。每份的中间尺度分别对应DFPN的一个输出特征图。即最大的尺度对应最靠上的输出特征,最小的尺度对应最靠下的输出特征图。
为了将DFPN网络应用到物体检测中,我们需要经过训练阶段和测试阶段等两个步骤。训练阶段的目的是针对给定的训练数据库学习所提出DFPN的网络参数。基于训练得到的 DFPN参数,测试阶段能够检测图像中存在物体的类别和位置。
首先,我们介绍一下具体的训练过程:
步骤1:准备训练图像集,给出训练集对应图像的物体标注信息,包括物体所属的类别和物体的标注框信息。
步骤2:设置训练阶段的相关超参数,包括迭代次数,学习率的变化情况,每次训练的图像块和ROI中正负例的数量等。
步骤3:初始化DFPN网络和Fast RCNN头网络的卷积层权重,可以利用ImageNet预训练模型初始化相关的卷积权重。设定训练阶段的损失函数,该损失函数包括候选窗口提取的损失函数(包括分类损失和回归损失)和候选窗口分类的损失函数(包括分类损失和回归损失)。
步骤4:根据深度卷积网络中常用的反向传播算法,不断更新网络的权重参数。当迭代次数结束时,所学习的权重参数为最终的网络参数。
然后,我们介绍一下具体的测试过程:
步骤1:给定测试图像,利用训练得到的DFPN提取图像中可能存在物体的候选检测窗口。其中,DFPN每一个输出特征图都能够生成一定数量的候选检测窗口。对这些检测窗口,我们利用非极大值抑制对这些候选检测窗口进行合并。
步骤2:基于合并的候选检测窗口,我们利用Fast RCNN对这些候选检测窗口进行分类和进一步位置回归。
步骤3:分别对每类物体的检测窗口进行进一步的非极大值抑制得到最终的物体检测结果。
图4给出了本发明所提出方法的流程图,主要步骤如下:
步骤1:准备训练图像集,以及训练集对应图像的物体标注信息,包括物体的具体类别和物体的标注框信息。
步骤2:设置训练阶段的相关超参数,包括迭代次数,学习率变化情况,每次训练的图像块和ROI中正负例样本的数量等。
步骤3:初始化DFPN网络和Fast RCNN头网络的卷积层权重。设定训练的损失函数,该损失函数包括候选窗口提取的损失函数和候选窗口分类的损失函数。
步骤4:根据反向传播算法,不断更新网络的权重参数。当迭代次数结束时,所学习的权重参数为最终的网络参数。
步骤5:给定测试图像,利用训练得到的DFPN提取图像中可能存在物体的候选检测窗口。DFPN中每个输出特征图都能够生成一定数量的候选检测窗口。对这些检测窗口,我们利用非极大值抑制对这些检测窗口进行合并。
步骤6:基于合并的候选检测窗口,我们利用Fast RCNN头网络对这些候选检测窗口进行分类和进一步位置回归。
步骤7:分别对每类物体的检测窗口进行进一步的非极大值抑制得到最终的物体检测结果。

Claims (1)

1.一种基于稠密特征金字塔网络的物体检测方法,包括下列步骤:
(1)确定基础网络架构,用于从输入图像中提取不同语义级别的深度特征,该基础网络包括多个卷积块,每个卷积块由多个卷积层构成,不同卷积块之间由池化层连接,在该基础网络中不同卷积块输出的特征图分辨率从下到上由逐渐降低。
(2)设计稠密连接网络部分,利用自上而下的跨层连接稠密地生成具有高级语义的特征图,将基础网络中最后输出的低分率特征图逐渐双线性差值上采样,使其与基础网络中所有卷积块中所有卷积层一一对用,并将其与基础网络中对应的特征图进行相加,最终得到若干高级语义且分辨率不同的特征图。
(3)设计细尺度预测部分,利用具有不同感受野的特征图分别提取不同尺度的候选检测窗口:经过稠密连接部分后,输出的特征分别具有不同的感受野。为进一步将上下文信息引入到每一个输出特征图中,在细尺度预测中每个输出特征由稠密连接部分的相邻三个输出特征图进行串接并经过1x1卷积层降低通道数得到。
(4)输出物体检测结果:分别将细尺度预测部分的特征图接检测子网络用于预测特征图不同位置为物体的概率和位置偏移量,根据相关概率和位置偏移量可以得到最终的物体检测结果。
CN201811197745.6A 2018-10-15 2018-10-15 基于稠密特征金字塔网络的物体检测方法 Active CN109543672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811197745.6A CN109543672B (zh) 2018-10-15 2018-10-15 基于稠密特征金字塔网络的物体检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811197745.6A CN109543672B (zh) 2018-10-15 2018-10-15 基于稠密特征金字塔网络的物体检测方法

Publications (2)

Publication Number Publication Date
CN109543672A true CN109543672A (zh) 2019-03-29
CN109543672B CN109543672B (zh) 2023-08-11

Family

ID=65843956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811197745.6A Active CN109543672B (zh) 2018-10-15 2018-10-15 基于稠密特征金字塔网络的物体检测方法

Country Status (1)

Country Link
CN (1) CN109543672B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738113A (zh) * 2019-09-12 2020-01-31 天津大学 一种基于邻近尺度特征滤除与转移的物体检测方法
CN111506759A (zh) * 2020-03-04 2020-08-07 中国人民解放军战略支援部队信息工程大学 一种基于深度特征的影像匹配方法及装置
CN111652288A (zh) * 2020-05-11 2020-09-11 北京航天自动控制研究所 一种基于稠密特征金字塔的改进型ssd小目标检测方法
CN112884818A (zh) * 2019-11-29 2021-06-01 中移物联网有限公司 稠密光流计算方法、装置、电子设备以及存储介质
CN113392960A (zh) * 2021-06-10 2021-09-14 电子科技大学 一种基于混合空洞卷积金字塔的目标检测网络及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160104058A1 (en) * 2014-10-09 2016-04-14 Microsoft Technology Licensing, Llc Generic object detection in images
US20170351941A1 (en) * 2016-06-03 2017-12-07 Miovision Technologies Incorporated System and Method for Performing Saliency Detection Using Deep Active Contours
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法
CN108062753A (zh) * 2017-12-29 2018-05-22 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160104058A1 (en) * 2014-10-09 2016-04-14 Microsoft Technology Licensing, Llc Generic object detection in images
US20170351941A1 (en) * 2016-06-03 2017-12-07 Miovision Technologies Incorporated System and Method for Performing Saliency Detection Using Deep Active Contours
CN108062753A (zh) * 2017-12-29 2018-05-22 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QIAO ZHANG ET AL.: "Image Segmentation with Pyramid Dilated" *
庞彦伟等: "基于尺度不变特征和位置先验的行人检测算法" *
王慧玲等: "基于深度卷积神经网络的目标检测技术的研究进展" *
蒋应锋等: "一种新的多尺度深度学习图像语义理解方法研究" *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738113A (zh) * 2019-09-12 2020-01-31 天津大学 一种基于邻近尺度特征滤除与转移的物体检测方法
CN112884818A (zh) * 2019-11-29 2021-06-01 中移物联网有限公司 稠密光流计算方法、装置、电子设备以及存储介质
CN112884818B (zh) * 2019-11-29 2023-04-14 中移物联网有限公司 稠密光流计算方法、装置、电子设备以及存储介质
CN111506759A (zh) * 2020-03-04 2020-08-07 中国人民解放军战略支援部队信息工程大学 一种基于深度特征的影像匹配方法及装置
CN111506759B (zh) * 2020-03-04 2023-10-24 中国人民解放军战略支援部队信息工程大学 一种基于深度特征的影像匹配方法及装置
CN111652288A (zh) * 2020-05-11 2020-09-11 北京航天自动控制研究所 一种基于稠密特征金字塔的改进型ssd小目标检测方法
CN111652288B (zh) * 2020-05-11 2023-08-01 北京航天自动控制研究所 一种基于稠密特征金字塔的改进型ssd小目标检测方法
CN113392960A (zh) * 2021-06-10 2021-09-14 电子科技大学 一种基于混合空洞卷积金字塔的目标检测网络及方法
CN113392960B (zh) * 2021-06-10 2022-08-30 电子科技大学 一种基于混合空洞卷积金字塔的目标检测网络及方法

Also Published As

Publication number Publication date
CN109543672B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN109543672A (zh) 基于稠密特征金字塔网络的物体检测方法
CN110033000B (zh) 一种票据图像的文本检测与识别方法
CN104809443B (zh) 基于卷积神经网络的车牌检测方法及系统
CN110033002B (zh) 基于多任务级联卷积神经网络的车牌检测方法
Hanmandlu et al. Fuzzy model based recognition of handwritten numerals
CN108875595A (zh) 一种基于深度学习和多层特征融合的驾驶场景目标检测方法
CN109522966A (zh) 一种基于密集连接卷积神经网络的目标检测方法
CN111611874B (zh) 基于ResNet和Canny的人脸口罩佩戴检测方法
CN108009518A (zh) 一种基于快速二分卷积神经网络的层次化交通标识识别方法
CN107945153A (zh) 一种基于深度学习的路面裂缝检测方法
CN108346159A (zh) 一种基于跟踪-学习-检测的视觉目标跟踪方法
CN106650721A (zh) 一种基于卷积神经网络的工业字符识别方法
Kim et al. Multi-task convolutional neural network system for license plate recognition
CN107103317A (zh) 基于图像融合和盲反卷积的模糊车牌图像识别算法
CN106407903A (zh) 基于多尺度卷积神经网络的实时人体异常行为识别方法
CN104616032A (zh) 基于深度卷积神经网络的多摄像机系统目标匹配方法
CN109840483B (zh) 一种滑坡裂缝检测与识别的方法及装置
CN112488025B (zh) 基于多模态特征融合的双时相遥感影像语义变化检测方法
CN107239730A (zh) 智能汽车交通标志识别的四元数深度神经网络模型方法
CN106408030A (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN107092884A (zh) 一种快速粗精级联行人检测方法
CN108647682A (zh) 一种基于区域卷积神经网络模型的品牌Logo检测与识别方法
CN110082821A (zh) 一种无标签框微地震信号检测方法及装置
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN109977968A (zh) 一种深度学习分类后比较的sar变化检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant