CN110717527B - 结合空洞空间金字塔结构的目标检测模型确定方法 - Google Patents

结合空洞空间金字塔结构的目标检测模型确定方法 Download PDF

Info

Publication number
CN110717527B
CN110717527B CN201910903123.9A CN201910903123A CN110717527B CN 110717527 B CN110717527 B CN 110717527B CN 201910903123 A CN201910903123 A CN 201910903123A CN 110717527 B CN110717527 B CN 110717527B
Authority
CN
China
Prior art keywords
cavity
convolution layer
feature map
pyramid structure
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910903123.9A
Other languages
English (en)
Other versions
CN110717527A (zh
Inventor
张小国
高烨
王慧青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910903123.9A priority Critical patent/CN110717527B/zh
Publication of CN110717527A publication Critical patent/CN110717527A/zh
Application granted granted Critical
Publication of CN110717527B publication Critical patent/CN110717527B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明公开了一种结合空洞空间金字塔结构的目标检测模型确定方法,通过将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个输出特征图,以将输入特征图与k个输出特征图进行融合,构造空洞空间金字塔结构,并将空洞空间金字塔结构融入基于卷积网络的目标检测模型,上述空洞空间金字塔结构通过利用具体不同扩张率的空洞卷积对输入特征图进行重采样,得到具有不同感受野的输出特征图,再通过将输入与输出进行特征融合以获取多尺度信息,将空洞空间金字塔结构融入基于深度学习的目标检测模型中,能够提高基于深度学习的目标检测模型对多尺度目标的检测能力。

Description

结合空洞空间金字塔结构的目标检测模型确定方法
技术领域
本发明涉及基于深度学习的目标检测技术领域,尤其涉及一种结合空洞空间金字塔结构的目标检测模型确定方法。
背景技术
实时多尺度目标检测是计算机视觉中最具挑战性的任务之一。传统的目标检测算法一般分为三个阶段:在给定的图像上选择候选区域,从这些区域中提取特征,最后用训练好的分类器对每个区域进行分类。这类算法的性能一般取决于设计者提取特征的表达能力。
近年来,随着大数据技术的发展和计算性能的提高,深度卷积神经网络(DCNN)在目标检测方面取得了显著的进展。现有的基于DCNN的目标检测算法大致可以分为两类:(1)两阶段方法,主要包括R-CNN、Fast R-CNN、Faster R-CNN和R-FCN;(2)单阶段方法,主要包括YOLO(You only look once)和SSD(Single Shot MultiBox Detector)。
两阶段方法首先生成一系列区域建议,然后利用CNN进行特征提取,进行分类和边界盒回归。两阶段方法虽然取得了较好的性能,但由于计算量大,在实时应用中速度较慢。单阶段方法将目标检测看作一个单一的回归问题,具有较高的计算效率,能够实现实时检测,但其精度往往低于两阶段方法。
目前,在目标检测领域,研究者们常通过构建图像金字塔或者构建特征金字塔以近似替代图像金字塔来获取多尺度信息,以应对多目标检测问题,虽然目标检测性能在一定程度上有所提高,但对多尺度目标的检测仍是有待进一步解决的难点。
发明内容
针对以上问题,本发明提出一种结合空洞空间金字塔结构的目标检测模型确定方法。
为实现本发明的目的,提供一种结合空洞空间金字塔结构的目标检测模型确定方法,包括如下步骤:
S10,将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图;其中,所述k个空洞卷积层分支为并行的,且各个空洞卷积层分支具有不同扩张率;
S20,将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构;
S30,将所述空洞空间金字塔结构融入基于卷积网络的目标检测模型。
在一个实施例中,所述将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图包括:
向k个空洞卷积层分支分别输入的输入特征图的信息包括:n×W×H×C;其中,n表示批量处理的图的个数,W表示输入特征图的宽,H表示输入特征图的高,C表示批量处理的图的通道数;
分别在各个空洞卷积层分支对各个输入特征图进行空洞卷积操作;
获取各个空洞卷积层分支的输出特征图。
作为一个实施例,第i个空洞卷积层分支的输出特征图为:n×Wi×Hi×m,其中i=1,2,...,k,Wi表示第i个空洞卷积层分支中输出图的宽度参数,Hi表示第i个空洞卷积层分支中输出图的高度参数,m表示各个空洞卷积层分支的卷积核数。
作为一个实施例,在分别在各个空洞卷积层分支对各个输入特征图进行空洞卷积操作之前,还包括:
分别在各个输入图片的宽方向上补充Pw个0,分别在各个输入图片的高方向上补充Ph个0,使得Wi=W,Hi=H;其中,
Figure BDA0002212444610000021
在一个实施例中,所述将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构包括:
将输入特征图和k个空洞卷积层分支的输出特征图在通道的维度上进行拼接,得到拼接数据:n×W×H×(C+k×m);其中,n表示批量处理的图的个数,W表示输入特征图的宽,H表示输入特征图的高,C表示输入图的通道数,m表示各个空洞卷积层分支的卷积核数;
采用具有p个1×1卷积核的卷积层运算所述拼接数据,以降低拼接数据的维度,再采用Batch Normalization层和Relu激活函数对降低维度后的拼接数据进行处理,得到融合后的包含多尺度信息的拼接特征图,构建空洞空间金字塔结构。
作为一个实施例,p的取值为m。
在一个实施例中,所述将空洞空间金字塔结构融入基于卷积网络的目标检测模型包括:
将所述空洞空间金字塔结构置于目标检测网络的基础特征提取网络之后,并置于目标检测层之前,得到结合空洞空间金字塔结构的目标检测模型。
上述结合空洞空间金字塔结构的目标检测模型确定方法,通过将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图,以将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构,并将空洞空间金字塔结构融入基于卷积网络的目标检测模型,上述空洞空间金字塔结构通过利用具体不同扩张率的空洞卷积对输入特征图进行重采样,得到具有不同感受野的输出特征图,再通过将输入与输出进行特征融合以获取多尺度信息,将空洞空间金字塔结构融入基于深度学习的目标检测模型中,能够提高基于深度学习的目标检测模型对多尺度目标的检测能力。
附图说明
图1是一个实施例的结合空洞空间金字塔结构的目标检测模型确定方法流程图;
图2是一个实施例的空洞空间金字塔结构示意图;
图3是一个实施例中空洞空间金字塔结构融入基于卷积网络的目标检测模型的过程示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参考图1所示,图1为一个实施例的结合空洞空间金字塔结构的目标检测模型确定方法流程图,包括如下步骤:
S10,将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图;其中,所述k个空洞卷积层分支为并行的,且各个空洞卷积层分支具有不同扩张率;
上述k个空洞卷积层分支为深度卷积神经网络的分支,k可以取4等值。
在一个实施例中,所述将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图包括:
向k个空洞卷积层分支分别输入的输入特征图的信息包括:n×W×H×C;其中,n表示批量处理的图的个数,W表示输入特征图的宽,H表示输入特征图的高,C表示输入图(即批量处理的图)的通道数;
分别在各个空洞卷积层分支对各个输入特征图进行空洞卷积操作;
获取各个空洞卷积层分支的输出特征图。
具体地,上述特征图(如输入特征图,输出特征图)定义包括:图片是C维的,W×H×C表示每一维W×H为一个特征图,n×W×H×C表示n张图(如批量处理的图和输出图),每张图大小是W×H×C,每张图有C个特征图。因而n×W×H×C表示有n x C个特征图。
作为一个实施例,第i个空洞卷积层分支的输出特征图信息包括:n×Wi×Hi×m,其中i=1,2,...,k,Wi表示第i个空洞卷积层分支输出图的宽度参数,,Hi表示第i个空洞卷积层分支输出图的高度参数,m表示各个空洞卷积层分支的卷积核数。
具体地,第i个空洞卷积层分支的输出特征图中,n表示输出图的个数,输出图是m维的,Wi×Hi×m表示每一维Wi×Hi为一个特征图,n×Wi×Hi×m表示n张图,每张图大小是Wi×Hi×m,每张图有m个特征图。因而n×Wi×Hi×m表示有n×m个特征图。
作为一个实施例,在分别在各个空洞卷积层分支对各个输入特征图进行空洞卷积操作之前,还包括:
分别在各个输入图片的宽方向上补充Pw个0,分别在各个输入图片的高方向上补充Ph个0,使得Wi=W,Hi=H;其中,
Figure BDA0002212444610000041
具体地,向k个空洞卷积层分支分别输入的输入特征图的信息包括:n×W×H×C,输入特征图应的感受野为RF=s×s,其中n为batch size(取值为正整数),即批量处理图片的张数,W、H、C分别为图片对应的宽、高、通道数,取k(建议取4)个并行的分支,每个分支包含一个具有m(m建议取C)个卷积核为n×n(建议取3)的空洞卷积层、Batch Normalization层和Relu激活函数,其中第i个空洞卷积层分支的空洞卷积层对应的扩张率为i,分别将输入输送到各个分支进行计算,第i个分支输出为n×Wi×Hi×m,特征图对应的感受野为RF1=s1×s1:
s1=s+i(n-1)
不同的分支得到具有不同感受野的特征图。
例如,第k个分支(空洞卷积层分支)的空洞卷积层对应的扩张率为k,分别将输入输送到各个分支进行计算,第k个分支输出为n×Wk×Hk×m,特征图对应的感受野为RF1=s1×s1,s1=s+k(n-1)。
进行空洞卷积操作之前,对于每个分支,分别在输入特征图的宽、高方向上补充Pw,Ph个0,
Figure BDA0002212444610000051
即卷积神经网络中常见的padding参数,使得Wk=W,Hk=H,可以实现在增大感受野的同时保持输入特征图的分辨率,避免信息丢失,
S20,将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构;
在一个实施例中,所述将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构包括:
将输入特征图和k个空洞卷积层分支的输出特征图在通道的维度上进行拼接,得到拼接数据:n×W×H×(C+k×m);其中,n表示批量处理的图的个数,W表示输入特征图的宽,H表示输入特征图的高,C表示输入图的通道数,m表示各个空洞卷积层分支的卷积核数;
采用具有p个1×1卷积核的卷积层运算所述拼接数据,以降低拼接数据的维度,再采用Batch Normalization层和Relu激活函数对降低维度后的拼接数据进行处理,得到融合后的包含多尺度信息的拼接特征图,构建空洞空间金字塔结构。
作为一个实施例,p的取值为m。
具体地,将输入特征图和k个分支的输出特征图在通道的维度上直接堆积实现拼接,即卷积神经网络中的concatenation操作,输入特征图的信息包括:n×W×H×C,各分支输出特征图的信息包括:n×W×H×m,则拼接后的拼接数据包括:n×W×H×(C+k×m)。
经过具有p(建议取m)个1×1卷积核的卷积层运算拼接数据,以降低输出特征图的维度,并减小其中运算量,再经过Batch Normalization层和Relu激活函数,得到融合后的包含多尺度信息的拼接特征图:n×W×H×p。
进一步地,可以依据k个并行分支、concatenation操作层与1×1标准卷积层共同构建空洞空间金字塔结构。
S30,将空洞空间金字塔结构融入基于卷积网络的目标检测模型。
在一个实施例中,所述将空洞空间金字塔结构融入基于卷积网络的目标检测模型包括:
将所述空洞空间金字塔结构置于目标检测网络的基础特征提取网络之后,并置于目标检测层之前,得到结合空洞空间金字塔结构的目标检测模型。
本实施例将空洞空间金字塔结构置于目标检测网络的基础特征提取网络之后,目标检测层之前,可以提高基于卷积网络的目标检测模型捕获多尺度信息的能力。
上述结合空洞空间金字塔结构的目标检测模型确定方法,通过将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图,以将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构,并将空洞空间金字塔结构融入基于卷积网络的目标检测模型,上述空洞空间金字塔结构通过利用具体不同扩张率的空洞卷积对输入特征图进行重采样,得到具有不同感受野的输出特征图,再通过将输入与输出进行特征融合以获取多尺度信息,将空洞空间金字塔结构融入基于深度学习的目标检测模型中,能够提高基于深度学习的目标检测模型对多尺度目标的检测能力。
在一个实施例中,以目标检测模型YOLOv3(You Only Look Once v3)为例,将提出的空洞空间金字塔结构融入YOLOv3。此时,可以将k的值设为4,上述结合空洞空间金字塔结构的目标检测模型确定方法包括以下步骤:
(1)采用4个并行的、具有不同扩张率的空洞卷积层的分支;
(2)将输入与4个分支的输出特征图进行融合构造空洞空间金字塔结构;
(3)将空洞空间金字塔结构融入基于卷积网络的目标检测模型。
具体地,上述步骤(1)包括:
假设输入为n×W×H×C,特征图对应的感受野为RF=s×s,其中n为batch size,即批量处理图片的张数,W、H、C分别为图片对应的宽、高、通道数,取4个并行的分支,每个分支包含一个具有C个卷积核为3×3的空洞卷积层、Batch Normalization层和Relu激活函数,其中第k个分支的空洞卷积层对应的扩张率为k,分别将输入输送到各个分支进行计算,第k个分支输出为n×Wk×Hk×C,特征图对应的感受野为RF1=s1×s1:
s1=s+k(n-1)
不同的分支得到具有不同感受野的特征图。
对于每个分支,为了在增大感受野的同时保持输入特征图的分辨率,避免信息丢失,进行空洞卷积操作之前,分别在输入特征图的宽、高方向上补充Pw,Ph个0,
Figure BDA0002212444610000071
即卷积神经网络中常见的padding参数,使得Wk=W,Hk=H。
步骤(2)包括:
将输入特征图和k个分支的输出特征图在通道的维度上进行拼接,即卷积神经网络中的concatenation操作,输入为n×W×H×C,各分支输出为n×W×H×C,则拼接后的输出为n×W×H×((k+1)×C)。再经过具有C个1×1卷积核的卷积层运算降低输出特征图的维度以减小运算量,再经过Batch Normalization层和Relu激活函数,得到融合后的包含多尺度信息的拼接特征图,拼接特征图的相关信息包括:n×W×H×C,可以依据拼接特征图,k个并行分支、concatenation操作层与1×1标准卷积层共同构建空洞空间金字塔结构。在一个示例中,空洞空间金字塔结构如图2所示。
在步骤(3)中,可以将空洞空间金字塔结构置于YOLOv3的基础特征提取网络之后,第一个检测层之前的第三个和第四个卷积层之间,提高模型捕获多尺度信息的能力。
在一个示例中,将空洞空间金字塔结构融入基于卷积网络的目标检测模型的过程可以参考图3所示。
在PASCAL VOC2007数据集上进行测试,融合空洞空间金字塔结构的YOLOv3模型在320×320分辨率的图像输入下,精度提高了4.2%,提高了YOLOv3处理多尺度目标的检测性能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本申请实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种结合空洞空间金字塔结构的目标检测模型确定方法,其特征在于,包括如下步骤:
S10,将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图;其中,所述k个空洞卷积层分支为并行的,且各个空洞卷积层分支具有不同扩张率;
S20,将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构;
S30,将所述空洞空间金字塔结构融入基于卷积网络的目标检测模型;
所述将输入特征图与k个空洞卷积层分支输出的输出特征图进行融合,构造空洞空间金字塔结构包括:
将输入特征图和k个空洞卷积层分支的输出特征图在通道的维度上进行拼接,得到拼接数据:n×W×H×(C+k×m);其中,n表示批量处理的图的个数,W表示输入特征图的宽,H表示输入特征图的高,C表示批量处理的图的通道数,m表示各个空洞卷积层分支的卷积核数;
采用具有p个1×1卷积核的卷积层运算所述拼接数据,以降低拼接数据的维度,再采用Batch Normalization层和Relu激活函数对降低维度后的拼接数据进行处理,得到融合后的包含多尺度信息的拼接特征图,构建空洞空间金字塔结构;
所述将所述空洞空间金字塔结构融入基于卷积网络的目标检测模型包括:
将所述空洞空间金字塔结构置于目标检测网络的基础特征提取网络之后,并置于目标检测层之前的第三个和第四个卷积层之间,得到结合空洞空间金字塔的目标检测模型。
2.根据权利要求1所述的结合空洞空间金字塔结构的目标检测模型确定方法,其特征在于,所述将输入特征图分别输入k个空洞卷积层分支,分别在各个空洞卷积层分支对输入特征图进行空洞卷积操作,得到各个空洞卷积层分支输出的输出特征图包括:
向k个空洞卷积层分支分别输入的输入特征图的信息包括:n×W×H×C;其中,n表示批量处理的图的个数,W表示输入特征图的宽,H表示输入特征图的高,C表示批量处理的图的通道数;
分别在各个空洞卷积层分支对各个输入特征图进行空洞卷积操作;
获取各个空洞卷积层分支的输出特征图。
3.根据权利要求2所述的结合空洞空间金字塔结构的目标检测模型确定方法,其特征在于,第i个空洞卷积层分支的输出特征图信息包括:n×Wi×Hi×m,其中i=1,2,…,k,Wi表示第i个空洞卷积层分支输出图的宽度参数,Hi表示第i个空洞卷积层分支输出图的高度参数,m表示各个空洞卷积层分支的卷积核数。
4.根据权利要求2所述的结合空洞空间金字塔结构的目标检测模型确定方法,其特征在于,在分别在各个空洞卷积层分支对各个输入特征图进行空洞卷积操作之前,还包括:
分别在各个输入图片的宽方向上补充Pw个0,分别在各个输入图片的的高方向上补充Ph个0,使得Wi=W,Hi=H;其中,
Figure FDA0004230141100000021
5.根据权利要求1所述的结合空洞空间金字塔结构的目标检测模型确定方法,其特征在于,p的取值为m。
CN201910903123.9A 2019-09-24 2019-09-24 结合空洞空间金字塔结构的目标检测模型确定方法 Active CN110717527B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910903123.9A CN110717527B (zh) 2019-09-24 2019-09-24 结合空洞空间金字塔结构的目标检测模型确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910903123.9A CN110717527B (zh) 2019-09-24 2019-09-24 结合空洞空间金字塔结构的目标检测模型确定方法

Publications (2)

Publication Number Publication Date
CN110717527A CN110717527A (zh) 2020-01-21
CN110717527B true CN110717527B (zh) 2023-06-27

Family

ID=69210054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910903123.9A Active CN110717527B (zh) 2019-09-24 2019-09-24 结合空洞空间金字塔结构的目标检测模型确定方法

Country Status (1)

Country Link
CN (1) CN110717527B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496150B (zh) * 2020-03-20 2023-03-21 长沙智能驾驶研究院有限公司 密集目标检测方法、装置、存储介质及计算机设备
CN111666822A (zh) * 2020-05-13 2020-09-15 飒铂智能科技有限责任公司 一种基于深度学习的低空无人机目标检测方法及系统
CN111767799A (zh) * 2020-06-01 2020-10-13 重庆大学 一种改进的Faster R-CNN隧道环境下行人目标检测算法
CN111738111B (zh) * 2020-06-10 2023-08-29 杭州电子科技大学 基于多分支级联空洞空间金字塔的高分辨遥感图像的道路提取方法
CN111898539A (zh) * 2020-07-30 2020-11-06 国汽(北京)智能网联汽车研究院有限公司 一种多目标检测方法、装置、系统、设备及可读存储介质
CN111967401A (zh) * 2020-08-19 2020-11-20 上海眼控科技股份有限公司 目标检测方法、设备及存储介质
CN112163478A (zh) * 2020-09-16 2021-01-01 北京三快在线科技有限公司 一种目标检测的方法及装置
CN112329861A (zh) * 2020-11-06 2021-02-05 北京工业大学 一种面向移动机器人多目标检测的分层特征融合方法
CN113205501B (zh) * 2021-05-10 2022-06-17 华中科技大学 一种焊缝缺陷多尺度特征提取装置及方法
CN113361528B (zh) * 2021-08-10 2021-10-29 北京电信易通信息技术股份有限公司 一种多尺度目标检测方法及系统
CN113762476B (zh) * 2021-09-08 2023-12-19 中科院成都信息技术股份有限公司 一种用于文字检测的神经网络模型及其文字检测方法
CN114627435B (zh) * 2022-04-04 2022-11-18 富华智能(深圳)有限公司 基于图像识别的智能灯光调节方法、装置、设备及介质
CN114494891B (zh) * 2022-04-15 2022-07-22 中国科学院微电子研究所 一种基于多尺度并行检测的危险品识别装置和方法
CN115272992B (zh) * 2022-09-30 2023-01-03 松立控股集团股份有限公司 一种车辆姿态估计方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784654B (zh) * 2016-08-26 2020-09-25 杭州海康威视数字技术股份有限公司 图像分割方法、装置及全卷积网络系统
CN110232394B (zh) * 2018-03-06 2021-08-10 华南理工大学 一种多尺度图像语义分割方法
CN109034210B (zh) * 2018-07-04 2021-10-12 国家新闻出版广电总局广播科学研究院 基于超特征融合与多尺度金字塔网络的目标检测方法
CN109978032B (zh) * 2019-03-15 2022-12-06 西安电子科技大学 基于空间金字塔空洞卷积网络的桥梁裂缝检测方法

Also Published As

Publication number Publication date
CN110717527A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110717527B (zh) 结合空洞空间金字塔结构的目标检测模型确定方法
Kim et al. Deep monocular depth estimation via integration of global and local predictions
US11630972B2 (en) Assembly body change detection method, device and medium based on attention mechanism
CN114202672A (zh) 一种基于注意力机制的小目标检测方法
CN108961327A (zh) 一种单目深度估计方法及其装置、设备和存储介质
CN111461083A (zh) 基于深度学习的快速车辆检测方法
CN112446380A (zh) 图像处理方法和装置
US20230169677A1 (en) Pose Estimation Method and Apparatus
CN111680678B (zh) 目标区域识别方法、装置、设备及可读存储介质
WO2021027692A1 (zh) 视觉特征库的构建方法、视觉定位方法、装置和存储介质
US11227145B2 (en) Convolution neural network based landmark tracker
CN111738344A (zh) 一种基于多尺度融合的快速目标检测方法
US20230067934A1 (en) Action Recognition Method, Apparatus and Device, Storage Medium and Computer Program Product
WO2022052782A1 (zh) 图像的处理方法及相关设备
CN110222718A (zh) 图像处理的方法及装置
CN115512251A (zh) 基于双分支渐进式特征增强的无人机低照度目标跟踪方法
CN106952304A (zh) 一种利用视频序列帧间相关性的深度图像计算方法
CN113177432A (zh) 基于多尺度轻量化网络的头部姿态估计方法、系统、设备及介质
CN107948586A (zh) 基于视频拼接的跨区域运动目标检测方法和装置
CN113378864B (zh) 一种锚框参数的确定方法、装置、设备及可读存储介质
CN114612758A (zh) 一种基于深度分组可分离卷积的目标检测方法
CN115115698A (zh) 设备的位姿估计方法及相关设备
US20240135632A1 (en) Method and appratus with neural rendering based on view augmentation
EP4350632A2 (en) Method and appratus with neural rendering based on view augmentation
CN115984583B (zh) 数据处理方法、装置、计算机设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant