CN111444865A - 一种基于逐步求精的多尺度目标检测方法 - Google Patents

一种基于逐步求精的多尺度目标检测方法 Download PDF

Info

Publication number
CN111444865A
CN111444865A CN202010241591.7A CN202010241591A CN111444865A CN 111444865 A CN111444865 A CN 111444865A CN 202010241591 A CN202010241591 A CN 202010241591A CN 111444865 A CN111444865 A CN 111444865A
Authority
CN
China
Prior art keywords
refinement
classification
softmax
scale
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010241591.7A
Other languages
English (en)
Other versions
CN111444865B (zh
Inventor
张争
李东辉
赵雪专
裴利沈
丁肖摇
王宇
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Breus Technology Co ltd
Original Assignee
Yancheng Chantu Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yancheng Chantu Intelligent Technology Co ltd filed Critical Yancheng Chantu Intelligent Technology Co ltd
Priority to CN202010241591.7A priority Critical patent/CN111444865B/zh
Publication of CN111444865A publication Critical patent/CN111444865A/zh
Application granted granted Critical
Publication of CN111444865B publication Critical patent/CN111444865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于逐步求精的多尺度目标检测方法,该发明融入从高层上下文中获得残差到基本预测中,在上下文聚合的过程施加分类的监督信号,并对所有阶段进行整合,获取最终检测。该发明避免了对高层信息的过度依赖,并对低层特征进行了充分的优化,同时,由于本发明采用的是逐步分数求精,而不是多次重复预测分数,因此通过自适应地逐步增加预测的残差,可以得到歧义性较小的分类分布。另外,为了得到最终分数,对求精的各阶段,我们的整合方式也有助于稳定分类分布,减少求精错误的副作用。

Description

一种基于逐步求精的多尺度目标检测方法
技术领域
本发明属于图像处理领域技术领域,具体涉及一种基于逐步求精的多尺度目标检测方法。
背景技术
基于图像或视频的目标检测是计算机视觉领域近几十年以及以后相当长一段时间内的研究热点,是视觉理解的基础。该技术能广泛的适应于目标跟踪、物体检测和识别、信息安全、自主驾驶、图像检索、机器人、人机交互、医学图像分析、物联网等学科和工程应用领域。
对于难样本,特别是小尺度目标的目标检测的鲁棒性一直是计算机视觉研究领域的难题。尽管深度卷积神经网络(CNN)强大的表示能力推动了图像分类的成功,但是目标检测任务还远远没有解决。一个主要原因是卷积检测器在处理难样本特别是小目标在分类的高歧义方面仍然存在困难。当前,针对这个问题,主要包括基于特征金字塔(多尺度特征融合)和级联检测器的方案:其中,基于特征金字塔(多尺度特征融合)最早是由Lin等人提出了特征金字塔网络(FPN),该网络通过迭代上采样和元素级加法,将较高层次的判别特征融合到较低层次上。在此基础上,提出了TDM,将融合操作由元素级加法改为元素级联。除了这两项基本工作外,最近提出了一些更为复杂的特征金字塔融合方法,如FSSD、深度特征金字塔再组合、并行特征金字塔网络等。基于特征金字塔融合的方法普遍存在的问题是必须先获取融合后的特征图,然后在特征图上对其进行目标检测,而不需要直接对底层进行监督。由于更高级的特性更容易区分,因此很容易引起对更高级的信息的过度依赖,从而使准确级别上的特征没有得到充分的学习;级联方法是通过多次预测优化目标检测是获得更精确结果的另一种方法。目前,级联方法主要是两级检测器,如CRC、cascade R-CNN。CRC引入级联拒绝分类器,逐级拒绝容易的错误样本,从而减少候选区域的数量。但是一旦样品被错误地拒绝,它就不能被重新优化。级联R-CNN等方法通过在进一步转换的特征上优化迭代定位来实现级联。分类是沿级联级段重新预测,不需要显式优化机制。在测试时,多个阶段的预测被视为一个整体。虽然级联R-CNN具有较高的准确性,但其效率较低,因为它使头网络更加复杂,并且有一个整体操作来覆盖多个阶段的预测。
为了解决以上两种方法存在的诸多缺点,申请号为CN201710317066.7的中国发明专利公开了一种基于R-FCN的小目标检测方法,该发明主要包括:将待测图像导入卷积网络,按照从M个网络层的最顶层至最底层的顺序以及按照从M个网络层的最底层至最顶层的顺序通过M个网络层依次对待测图像进行特征提取,生成尺度不同的特征映射图,选取N层特征映射图导入RPN进行前后景分类,确定前景区域的坐标,将前景区域的坐标对应的特征映射块处理为特征向量;将各个特征向量输入分类器中进行二次分类,检测特征向量所属的类别是否对应待检测的小目标并输出检测结果,该发明采用top-down特征金字塔和down-top特征金字塔相结合的方式,虽然可以在不同尺度的特征映射图上进行小目标检测,可以减少对小目标的漏报,提高检测精度,但是,该发明仅仅是利用了融入了多尺度的特征映射图,在分类中融入了多尺度特征,却忽略了聚合过程中监督信号的使用,未在当前尺度上进行充分学习。
发明内容
为了避免对高阶特征的过度依赖,减少小目标分类处理过程中的歧义性,本发明提供一种基于逐步求精的多尺度目标检测方法,其通过上下文聚合的过程保留分类的监督信号,避免了对高层信息的过度依赖,并对低层特征进行了充分的优化,并通过自适应地逐步增加预测的残差,可以得到歧义性较小的分类分布。
为了达到上述目的,本发明所采用的技术方案是:一种基于逐步求精的多尺度目标检测方法,包括以下步骤:
S1、获取待测图像;
S2、将获取的待测图像输入神经网络中,然后从神经网络中的主干网上提取多个特征图x1,x2,...,xn,每一个特征图上均分布着具有不同尺度的目标;
S3、将1×1卷积依次应用到特征图x2,x3,...,xn上,生成一组新的并用于求精的特征图集合
Figure BDA0002432725760000031
S4、对主干网上的特征图xi进行二次卷积,得到softmax的输入;
S5、对softmax的输入进行多次迭代求精并在求精的每个阶段用特定的权重直接保留分类的监督信号;
S6、在测试时重用所述特定的权重来整合在所有求精阶段softmax的输入,接着再使用另一个softmax来生成最终的分类分数。
进一步的,所述的步骤S5具体包括以下步骤:
S51、在每一个特征图中均预先设定一个目标候选框;
S52、将目标候选框中所包含的所有单元锚点的基本分类分布记作
Figure BDA0002432725760000041
Figure BDA0002432725760000042
是一个Hi×Wi×(K+1)Ai形状的张量,Hi×Wi是其中一个特征图xi的空间大小,K+1是类的数量,Ai表示在其中一个特征图xi中每个网格单元的锚点数量;
S53、从特征图集合
Figure BDA0002432725760000043
中提取k个特征图,分别为hi+1,hi+2,...,hi+k,然后利用高层上下文特征hi+1
Figure BDA0002432725760000044
的一阶残差进行回归,该回归过程执行k次迭代,产生的每个阶段的求精softmax输入为:
Figure BDA0002432725760000045
其中,
Figure BDA0002432725760000046
Figure BDA0002432725760000047
的一阶残差;
S54、分别对
Figure BDA0002432725760000048
Figure BDA0002432725760000049
应用softmax后,得到基本分类分数
Figure BDA00024327257600000410
和k分类分数
Figure BDA00024327257600000411
S55、每个分类分数预测
Figure BDA00024327257600000412
的交叉损失通过加权因子λj进行计算,0≤λj≤1,然后将分类监督信号施加在j阶段:
Figure BDA00024327257600000413
S56、对跨阶段j的所有组件求和后,得到对于在xi的目标分布的总的分类损失:
Figure BDA00024327257600000414
其中,λj控制在每一个阶段的监督信号的强度且
Figure BDA0002432725760000051
Figure BDA0002432725760000052
S57、对在xi的目标分布的总的分类损失进行优化后得到:
Figure BDA0002432725760000053
其中,sum(·)表示张量所有元素的和。
进一步的,所述的步骤S6具体包括:
首先对所有阶段的权重因子群
Figure BDA0002432725760000054
进行权重求和,然后利用另一个softmax获得在尺度i的最终的分类分数:
Figure BDA0002432725760000055
进一步的,所述二次卷积采用3×3卷积。
与现有技术相比,本发明的有益效果是:本发明通过上下文聚合的过程保留分类的监督信号,避免了对高层信息的过度依赖,并对低层特征进行了充分的优化,同时,由于本发明采用的是逐步分数求精,而不是多次重复预测分数,因此通过自适应地逐步增加预测的残差,可以得到歧义性较小的分类分布。为了得到最终分数,对求精的各阶段,我们的整合方式也有助于稳定分类分布,减少求精错误的副作用。
附图说明
图1是本发明的流程示意图;
图2是本发明在某一尺度水平上目标的分类过程;
图3是本发明提出的PRN在SSD网络上的整体框架图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了避免对高阶特征的过度依赖,减少小目标分类处理过程中的歧义性,本发明提出了一种基于逐步求精的多尺度目标检测方法及实现该方法的一种增强尺度鲁棒性的新型网络,即逐步求精网络(PRN),如图2所示,对于提出的PRN,其对分类分数(softmax分类器的输入)进行多次求精即通过逐步增加上层上下文回归残差,并在求精的每个阶段用特定的权重直接保留分类的监督信号。然后在测试时重用这组权重来整合在所有求精阶段softmax的输入,接着再使用另一个softmax来生成最终的分类分数。在本发明中,定位是致力于当前的特征级,或者从更高级别特征解耦出来的。
PRN通过上下文聚合的过程保留分类的监督信号,避免了对高层信息的过度依赖,并对低层特征进行了充分的优化,同时,由于采用的是逐步分数求精,而不是多次重复预测分数,因此通过自适应地逐步增加预测的残差,可以得到歧义性较小的分类分布。为了得到最终分数,对求精的各阶段,我们的整合方式也有助于稳定分类分布,减少求精错误的副作用。最后,与高层特征解耦,在小尺度上定位时引入具有更多空间信息的特征。
基于此,本发明提出了一种基于逐步求精的多尺度目标检测方法,该方法沿着上下文聚合自适应地添加多个残差,逐步求精分类分数,并控制阶段监督。
PSR(Progressive Refinemen)是本发明的关键部分。总得来说,其主要目标是减少难样本(多为小目标)预测分类分布的歧义性。为此,我们将残差逐步添加到基本分类预测的softmax输入中,得到几个分类预测,并在此过程中逐步求精。在每个阶段用于优化分布的残差是从一些高层上下文中获得的。与特征金字塔融合不同的是,在低层次的特征上并不直接保留监督信号(它们将整个监督施加到已经融合的表示上),它在每个阶段使用一个权重因子对优化的输出施加分类监督信号。
一、本发明所采用的方案具体如下:
如图1所示,假设有n个通过主干网提取的特征图x1,x2,...,xn,这些特征图上分布着不同尺度的目标;
第一步,将1×1卷积依次应用到主干网的特征图x2,x3,...,xn上,生成一组新的特征图集合h2,h3,...,hn,通道数量减少了一半,生成的
Figure BDA0002432725760000071
被认为是用于求精的特征图,特征图集合一旦获得,它们通常是用于任何尺度和任何阶段的分类求精,接下来,对于某一个特定i尺度,我们对主干网上的特征图xi进行3×3卷积,这就得到了softmax的输入,将第i层所有单元锚点(预先设定的目标候选框)的基本分类分布记作
Figure BDA0002432725760000081
Figure BDA0002432725760000082
是一个Hi×Wi×(K+1)Ai形状的张量,Hi×Wi是xi的空间大小,K+1是类的数量,Ai表示在xi每个网格单元的锚点数量。
然后从集合
Figure BDA0002432725760000083
中提取k个特征图,即hi+1,hi+2,...,hi+k。在优化的第一阶段,利用高层上下文特征hi+1
Figure BDA0002432725760000084
的一阶残差进行回归。我们将
Figure BDA0002432725760000085
的一阶残差表示为
Figure BDA0002432725760000086
然后将其加入到前一阶段求精的softmax输入中,得到求精的softmax输入
Figure BDA0002432725760000087
这个过程执行k次迭代。对于j阶段优化(1≤j≤k),第j阶残差
Figure BDA0002432725760000088
是从上层上下文hi+j通过对于xi的尺寸的双线性差值的升采样获得hi+j,即在Hi×Wi内进行双线性差值的升采样和应用膨胀率j的3×3卷积。通过逐步聚合过程,产生每个阶段的求精softmax输入:
Figure BDA0002432725760000089
得到
Figure BDA00024327257600000810
及其k优化后的
Figure BDA00024327257600000811
我们分别对它们中的每一个应用softmax,得到
Figure BDA00024327257600000812
(基本分类分数)和
Figure BDA00024327257600000813
(k分类分数),对于每个分类分数预测
Figure BDA00024327257600000814
的交叉损失通过加权因子λj进行计算,0≤λj≤1,然后将分类监督信号施加在j阶段
Figure BDA00024327257600000815
Figure BDA00024327257600000816
对跨阶段j的所有组件求和,此处的0≤j≤k,得到对于在xi的目标分布的总的分类损失:
Figure BDA0002432725760000091
其中λj控制在每一个阶段的监督信号的强度且
Figure BDA0002432725760000092
进一步简化的损失形式如下:
Figure BDA0002432725760000093
其中sum(·)表示张量所有元素的和,这是为了避免由log(·)乘积引起的一些数值问题。
为了得到在尺度i上分类的最终预测,我们首先对所有阶段softmax利用作为控制监督信号强度的相同权重因子群
Figure BDA0002432725760000094
进行权重求和(包括0阶段对应的基础检测器),然后利用另一个softmax获得在尺度i的最终的分类分数,在i的最终预测形式如下所示:
Figure BDA0002432725760000095
本发明建立了分类的显式模型,通过保留各阶段的监督信号来手动控制上下文聚合过程。这有助于检测器在不同语义层次的优化之间找到一个平衡点,并允许对较低层次的特征进行更充分的优化,从而避免了模型过分依赖于较高层次的信息。预测残差的迭代叠加可以自适应地调整分类分布,在一定的尺度上降低了预测的歧义性。此外,多阶段细化的加权积分得到最终的分类分数,是稳定最终预测的有效方法并减轻了错误求精的副作用。
二、从高层特征去耦定位
从骨干网的低层特征到高层特征,进行多次池化、大跨步卷积等欠采样。这使得许多空间细节逐渐减少。因此,在需要更多位置敏感信息的情况下,更高级的特征在更小的级别上促进对象定位的可能性更小。
本发明中只使用每个尺度级别的原始主干特征图来定位目标,因此,更高级的特性只用于分类求精,并且与定位解耦,根据本发明建模,使用更高级别的特征也很容易形成类似的逐步定位求精(PLR)过程。
三、基于SSD的PRN整体架构
采用SSD作为PRN的基线框架,以验证本发明的有效性。
其采用的主干网为VGGNet,与原来的SSD完全相同。输入大小300×300,如图3所示,为了在不同尺度下检测目标,利用SSD提取6个尺度特征图,提取的特征图依次为是conv4_3,conv7,conv8_2,conv9_2,conv10_2,和conv11_2。对应的空间尺度是38,19,10,5,3,1和通道数是512,1024,512,256,256,256,对应的,进一步表示6个特征图为x1,x2,...,x6。由于小目标通常分布在较低的级别,我们对尺度1、2、3级进行逐步的分数优化。针对优化k的阶段数目设定为2,利用权重控制在每个阶段的分类监督信号的强度,λ0=λ1=0.25,λ2=0.5,因为本发明中做的PSR的最高等级是3级,因此本实施例中做2个阶段的PSR,hi最高的等级是h5。所以,我们在x2到x5输出减半,利用1×1的卷积,得到在h2到h5作为用于优化的特征图,h6是被忽略的。对于水平4,5和6,分类模型与原始的SSD保持一致。定位只需要主干特征图x1,x2,...,x6
对于在第7级通过基本的SSD提取的大小512×512的输入,对于尺度1,2,3和4,我们利用2阶段的PSR。其他设定与300×300输入尺寸设定是一样的。我们得到的两种输入尺寸下的模型分别表示为PRN300和PRN512。
训练的目标函数:对于PRN,总的训练目标函数由两部分组成:
L=Lcls+αLloc (6)
分类损失Lcls表示为:
Figure BDA0002432725760000111
第一部分对应于在PSR应用于第1级到m级。对于这些级别,分类损失的定义如上面逐步求精部分所示。第二部分对应于不执行PSR的其他级别。对于这些级别,分类损失与基准SSD相同。在PRN300设置下,m=3,n=6。在PRN512设置下,m=4,n=7。边框回归Lloc的定位损失与原始SSD中的定义相同。使用因子α来平衡定位和分类,本实施例中根据经验设置为2.5。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种基于逐步求精的多尺度目标检测方法,其特征在于,包括以下步骤:
S1、获取待测图像;
S2、将获取的待测图像输入神经网络中,然后从神经网络中的主干网上提取多个特征图x1,x2,...,xn,每一个特征图上均分布着具有不同尺度的目标;
S3、将1×1卷积依次应用到特征图x2,x3,...,xn上,生成一组新的并用于求精的特征图集合
Figure FDA0002432725750000011
S4、对主干网上的特征图xi进行二次卷积,得到softmax的输入;
S5、对softmax的输入进行多次迭代求精并在求精的每个阶段用特定的权重直接保留分类的监督信号;
S6、在测试时重用所述特定的权重来整合在所有求精阶段softmax的输入,接着再使用另一个softmax来生成最终的分类分数。
2.根据权利要求1所述的一种基于逐步求精的多尺度目标检测方法,其特征在于:所述的步骤S5具体包括以下步骤:
S51、在每一个特征图中均预先设定一个目标候选框;
S52、将目标候选框中所包含的所有单元锚点的基本分类分布记作
Figure FDA0002432725750000012
Figure FDA0002432725750000013
是一个Hi×Wi×(K+1)Ai形状的张量,Hi×Wi是其中一个特征图xi的空间大小,K+1是类的数量,Ai表示在其中一个特征图xi中每个网格单元的锚点数量;
S53、从特征图集合
Figure FDA0002432725750000014
中提取k个特征图,分别为hi+1,hi+2,...,hi+k,然后利用高层上下文特征hi+1
Figure FDA0002432725750000015
的一阶残差进行回归,该回归过程执行k次迭代,产生的每个阶段的求精softmax输入为:
Figure FDA0002432725750000021
其中,
Figure FDA0002432725750000022
Figure FDA0002432725750000023
的一阶残差;
S54、分别对
Figure FDA0002432725750000024
Figure FDA0002432725750000025
应用softmax后,得到基本分类分数
Figure FDA0002432725750000026
和k分类分数
Figure FDA0002432725750000027
S55、每个分类分数预测
Figure FDA00024327257500000213
的交叉损失通过加权因子λj进行计算,0≤λj≤1,然后将分类监督信号施加在j阶段:
Figure FDA0002432725750000028
S56、对跨阶段j的所有组件求和后,得到对于在xi的目标分布的总的分类损失:
Figure FDA0002432725750000029
其中,λj控制在每一个阶段的监督信号的强度且
Figure FDA00024327257500000210
Figure FDA00024327257500000211
S57、对在xi的目标分布的总的分类损失进行优化后得到:
Figure FDA00024327257500000212
其中,sum(·)表示张量所有元素的和。
3.根据权利要求2所述的一种基于逐步求精的多尺度目标检测方法,其特征在于:所述的步骤S6具体包括:
首先对所有阶段的权重因子群
Figure FDA0002432725750000031
进行权重求和,然后利用另一个softmax获得在尺度i的最终的分类分数:
Figure FDA0002432725750000032
4.根据权利要求1所述的一种基于逐步求精的多尺度目标检测方法,其特征在于:所述二次卷积采用3×3卷积。
CN202010241591.7A 2020-03-31 2020-03-31 一种基于逐步求精的多尺度目标检测方法 Active CN111444865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010241591.7A CN111444865B (zh) 2020-03-31 2020-03-31 一种基于逐步求精的多尺度目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010241591.7A CN111444865B (zh) 2020-03-31 2020-03-31 一种基于逐步求精的多尺度目标检测方法

Publications (2)

Publication Number Publication Date
CN111444865A true CN111444865A (zh) 2020-07-24
CN111444865B CN111444865B (zh) 2023-07-25

Family

ID=71652604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010241591.7A Active CN111444865B (zh) 2020-03-31 2020-03-31 一种基于逐步求精的多尺度目标检测方法

Country Status (1)

Country Link
CN (1) CN111444865B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580585A (zh) * 2020-12-28 2021-03-30 深圳职业技术学院 一种基于堆叠稠密网络的挖掘机目标检测方法及装置
CN113420725A (zh) * 2021-08-20 2021-09-21 天津所托瑞安汽车科技有限公司 Bsd产品的漏报场景识别方法、设备、系统和存储介质
CN113627269A (zh) * 2021-07-16 2021-11-09 中国科学院合肥物质科学研究院 基于解耦分类和回归特征最优层技术的害虫目标检测方法
CN113799124A (zh) * 2021-08-30 2021-12-17 贵州大学 一种非结构化环境的机器人灵活抓取检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510012A (zh) * 2018-05-04 2018-09-07 四川大学 一种基于多尺度特征图的目标快速检测方法
CN109344821A (zh) * 2018-08-30 2019-02-15 西安电子科技大学 基于特征融合和深度学习的小目标检测方法
CN109816012A (zh) * 2019-01-22 2019-05-28 南京邮电大学 一种融合上下文信息的多尺度目标检测方法
CN110555446A (zh) * 2019-08-19 2019-12-10 北京工业大学 基于多尺度深度特征融合和迁移学习的遥感影像场景分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510012A (zh) * 2018-05-04 2018-09-07 四川大学 一种基于多尺度特征图的目标快速检测方法
CN109344821A (zh) * 2018-08-30 2019-02-15 西安电子科技大学 基于特征融合和深度学习的小目标检测方法
CN109816012A (zh) * 2019-01-22 2019-05-28 南京邮电大学 一种融合上下文信息的多尺度目标检测方法
CN110555446A (zh) * 2019-08-19 2019-12-10 北京工业大学 基于多尺度深度特征融合和迁移学习的遥感影像场景分类方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580585A (zh) * 2020-12-28 2021-03-30 深圳职业技术学院 一种基于堆叠稠密网络的挖掘机目标检测方法及装置
CN113627269A (zh) * 2021-07-16 2021-11-09 中国科学院合肥物质科学研究院 基于解耦分类和回归特征最优层技术的害虫目标检测方法
CN113627269B (zh) * 2021-07-16 2023-04-28 中国科学院合肥物质科学研究院 基于解耦分类和回归特征最优层技术的害虫目标检测方法
CN113420725A (zh) * 2021-08-20 2021-09-21 天津所托瑞安汽车科技有限公司 Bsd产品的漏报场景识别方法、设备、系统和存储介质
CN113799124A (zh) * 2021-08-30 2021-12-17 贵州大学 一种非结构化环境的机器人灵活抓取检测方法
CN113799124B (zh) * 2021-08-30 2022-07-15 贵州大学 一种非结构化环境的机器人灵活抓取检测方法

Also Published As

Publication number Publication date
CN111444865B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN111444865A (zh) 一种基于逐步求精的多尺度目标检测方法
CN110059554B (zh) 一种基于交通场景的多支路目标检测方法
CN112101430B (zh) 用于图像目标检测处理的锚框生成方法及轻量级目标检测方法
CN111666836A (zh) M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法
CN110929577A (zh) 一种基于YOLOv3的轻量级框架改进的目标识别方法
CN111626128A (zh) 一种基于改进YOLOv3的果园环境下行人检测方法
CN112541532B (zh) 基于密集连接结构的目标检测方法
CN112784756B (zh) 人体识别跟踪方法
CN112990222B (zh) 一种基于图像边界知识迁移的引导语义分割方法
CN110288017B (zh) 基于动态结构优化的高精度级联目标检测方法与装置
CN110751209A (zh) 一种融合深度图像分类和检索的智能台风定强方法
CN113592825A (zh) 一种基于yolo算法的煤矸实时检测方法
CN111985325A (zh) 特高压环境评价中的航拍小目标快速识别方法
CN115187786A (zh) 一种基于旋转的CenterNet2目标检测方法
CN114511710A (zh) 一种基于卷积神经网络的图像目标检测方法
De Rita et al. CNN-based object detection on low precision hardware: Racing car case study
CN115063664A (zh) 用于工业视觉检测的模型学习方法、训练方法及系统
Fan et al. Covered vehicle detection in autonomous driving based on faster rcnn
CN114120045B (zh) 一种基于多门控混合专家模型的目标检测方法和装置
CN113888538B (zh) 一种基于内存分块模型的工业异常检测方法
Zhao et al. Recognition and Classification of Concrete Cracks under Strong Interference Based on Convolutional Neural Network.
CN115240052A (zh) 一种目标检测模型的构建方法及装置
Long et al. Cascaded feature enhancement network model for real-time video monitoring of power system
Shang et al. Real-time Accurate Object Counting for Smart Farms
CN113343918A (zh) 一种电力设备识别方法、系统、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230628

Address after: 450000 Longzihu University Park, Wenyuan North Road, Zhengdong New District, Zhengzhou City, Henan Province

Applicant after: ZHENGZHOU VOCATIONAL University OF INFORMATION AND TECHNOLOGY

Address before: 224000 North 22nd floor, Kechuang building, landscape Avenue, Xindu street, Chengnan New District, Yancheng City, Jiangsu Province (CND)

Applicant before: YANCHENG CHANTU INTELLIGENT TECHNOLOGY CO.,LTD.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240104

Address after: Room 601-6, 6th Floor, Building B8, Building 5, Northwest, Intersection of Century Avenue and Baocai Road, Yandu District, Yancheng City, Jiangsu Province, 224000

Patentee after: Jiangsu Breus Technology Co.,Ltd.

Address before: 450000 Longzihu University Park, Wenyuan North Road, Zhengdong New District, Zhengzhou City, Henan Province

Patentee before: ZHENGZHOU VOCATIONAL University OF INFORMATION AND TECHNOLOGY