CN111611925A - 一种建筑物检测与识别方法及装置 - Google Patents

一种建筑物检测与识别方法及装置 Download PDF

Info

Publication number
CN111611925A
CN111611925A CN202010438235.4A CN202010438235A CN111611925A CN 111611925 A CN111611925 A CN 111611925A CN 202010438235 A CN202010438235 A CN 202010438235A CN 111611925 A CN111611925 A CN 111611925A
Authority
CN
China
Prior art keywords
network
block diagram
residual
input
resnet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010438235.4A
Other languages
English (en)
Inventor
吴军
谢厚礼
黄祁聪
谭海燕
唐颖
王红
李显著
雷华娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Modern Construction Industry Development Research Institute
Original Assignee
Chongqing Modern Construction Industry Development Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Modern Construction Industry Development Research Institute filed Critical Chongqing Modern Construction Industry Development Research Institute
Priority to CN202010438235.4A priority Critical patent/CN111611925A/zh
Publication of CN111611925A publication Critical patent/CN111611925A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/176Urban or other man-made structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种建筑物检测与识别方法,包括:通过Faster R‑ResNet网络对输入图像进行特征提取,生成特征图;所述Faster R‑ResNet网络是通过使用ResNet残差网络替代Faster R‑CNN中卷积神经网络VGG16而得到;基于RPN网络与所述特征图生在多个候选目标区域建议;基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。本发明通过在Faster R‑CNN中引入残差网络,使得预测的建筑物区域更接近真实的建筑区域。

Description

一种建筑物检测与识别方法及装置
技术领域
本发明属于物体识别与目标检测应用技术领域,尤其涉及一种建筑物检测与识别方法及装置。
背景技术
在中国,“标志性景观”这一概念最早出现于1999年,但提出者当时并未对其作出明确的定义。普遍认为,城市标志性景观应该指的是,一个城市中用来浓缩、凝聚、集中反映和折射、代表城市总体特征的特定地段是城市的缩影区,是城市的代表性区域,是城市的窗口,是外来游客的必游之地。地标建筑,“网红建筑物”逐渐成为了一座城市的形象,人们通过这些“网红建筑物”来认识一座城。地标建筑物在城市中具有以下五方面作用:1).空间标识作用;2).空间参照物作用;3).空间向导作用;4).空间统辖作用;5).文化意义。然而,越来越多的“网红建筑物”的出现,让人眼花缭乱,繁杂的特色建筑物让人们识别混乱。因此,需要一种方法或智能工具可以帮助人们准确快速地识别“网红建筑”、地标建筑。
常用深度学习方法可以有效检测图像中的目标,完成目标分类和识别,其中R-CNN(Regions with Convolutional Neural Network Feature)算法是将深度模型应用于目标检测的开创性工作之一,算法的关键在于CNN具有良好的特征提取和分类性能,算法主要分为四个步骤:1.对输入图像使用选择性搜索(Selective Search);2.选取一个预先训练好的的卷积神经网络,计算输出提取的提议区域特征;3.将每个区域建议的特征连同其标注的类别作为一个样本,训练多个支持向量机对目标进行分类;4.将每个提议区域的特征连同其标注的边界框作为一个样本,训练线性回归模型来预测真实边界框。但R-CNN仍然存在一些不足,如:R-CNN里面的大量区域可能是相互覆盖,每次重新抽取特征过于浪费;算法检测耗时和存储压力大的问题。
随后是针对R-CNN的一系列改进方法,从R-CNN到Fast R-CNN再到FasterR-CNN,目标检测的流程变得越来越精简、精度越来越高、速度也越来越快。目标检测的四个基本步骤(候选区域生成,特征提取,分类,位置精修)终于被统一到一个深度网络框架之内,那就是Faster R-CNN。Faster R-CNN的流程图图如图1所示。对任意大小的图片,经过处理后由VGG16网络生成特征框图,RPN网络在这些特征框图上用3x3的卷积核进行滑动滤波,以特征框图每个单元为中心,生成多个不同大小和宽高比的锚框并标注它们,然后对经过滑动滤波的特征框图回归与分类并产生区域建议。这些区域建议在RoI Pooling兴趣区域池化层映射到之前的特征框图上,然后处理为固定大小的特征向量,接着送入后面的回归层和分类层。最后使用非极大值抑制算法,从预测类别为目标的预测边界框中移除相似的结果,最终输出目标物体的类别和所在区域的坐标。但是,Faster R-CNN算法中CNN是VGG16,RPN网络利用VGG16的Conv5_3输出作为特征框图,而这种特征框图只与上一层卷积网络的输出有关,与之前层的输出关系较浅,导致随着层数的增加,梯度消失,网络退化,可用的特征信息越来越少,很有可能网络的准确度已经达到饱和,增加了网络层数,却依然什么东西也学习不到。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种建筑物检测与识别方法及装置,用于解决现有技术的缺陷。
为实现上述目的及其他相关目的,本发明提供一种建筑物检测与识别方法,包括:
通过Faster R-ResNet网络对输入图像进行特征提取,生成特征图;所述FasterR-ResNet网络是通过使用ResNet残差网络替代Faster R-CNN中卷积神经网络VGG16而得到;
基于RPN网络与所述特征图生在多个候选目标区域建议;
基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;
对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。
可选地,所述ResNet残差网络包括多个依次连接的残差模块,后一个残差模块的输入等于前一个残差模块的输出加上第一个残差模块块的输入。
可选地,将所述特征图输入到RPN网络中,通过滑动窗口,进行边界预测,生成多个候选目标区域建议。
可选地,将所述第一候选框图和所述特征图输入到RoI Pooling兴趣区域池化层中,生成第二候选框图。
可选地,将所述第二候选框图输入到全连接层中,对全连接层的输出进行回归和分类。
为实现上述目的及其他相关目的,本发明提供一种建筑物检测与识别装置,包括:
特征提取模块,用于通过Faster R-ResNet网络对输入图像进行特征提取,生成特征图;所述Faster R-ResNet网络是通过使用ResNet残差网络替代Faster R-CNN中卷积神经网络VGG16而得到;
区域建议提取模块,用于基于RPN网络与所述特征图生在多个候选目标区域建议;
有效目标框图获取模块,用于基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;
位置获取模块,用于对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。
可选地,所述ResNet残差网络包括多个依次连接的残差模块,后一个残差模块的输入等于前一个残差模块的输出加上第一个残差模块块的输入。
可选地,将所述特征图输入到RPN网络中,通过滑动窗口,进行边界预测,生成多个候选目标区域建议。
可选地,将所述第一候选框图和所述特征图输入到RoI Pooling兴趣区域池化层中,生成第二候选框图。
可选地,将所述第二候选框图输入到全连接层中,对全连接层的输出进行回归和分类。
如上所述,本发明的一种建筑物检测与识别方法及装置,具有以下有益效果:
1.在Faster R-CNN中,引入残差网络,在反向过程中,随着层数的增加,可以无损传播梯度,让网络学习到更多的图像特征信息。
2.Faster R-ResNet通过直接将输入信息绕道传到输出,保护信息的完整性,整个网络只需要学习输入以及输出差别的那一部分,简化了网络学习难度。
3.ResNet通过残差学习解决了深度网络的退化问题,让我们可以训练出更深的网络,检测边框信息更加精准。
通过在Faster R-CNN中引入残差网络,使得预测的建筑物区域更接近真实的建筑区域。
附图说明
图1为本发明一实施例中基于Faster R-CNN的建筑物检测与识别方法的流程图;
图2为本发明一实施例中一种建筑物检测与识别方法的流程图;
图3为本发明一实施例中ResNet残差网络的示意图;
图4为本发明另一实施例中一种建筑物检测与识别方法的流程图;
图5为本发明一实施例中一种建筑物检测与识别装置的示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
针对Faster R-CNN算法的缺陷,本发明基于残差网络的理论方法和Faster R-CNN算法思想,改进了这一缺点,实现了对建筑物智能检测和识别。
如图2所示,本发明提供一种建筑物检测与识别方法,包括:
S21通过Faster R-CNN网络对输入图像进行特征提取,生成特征图;所述FasterR-ResNet网络是通过使用ResNet残差网络替代Faster R-CNN中卷积神经网络VGG16而得到;
S22基于RPN网络与所述特征图生在多个候选目标区域建议;
S23基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;
S24对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。
引入ResNet的思想是假设涉及一个网络层,存在最优化的网络层次,那么往往深层次网络是有很多网络层为冗余层。这些冗余层在网络中并没有对模型性能有实质性的提高,因此希望这些冗余层能够完成恒等映射,保证经过该恒等层之后的输出和输入完全相同。具体哪些层是恒等层,这个可以在网络训练的时候判断出来。原始Faster R-CNN算法中CNN是VGG16,RPN网络利用VGG16的Conv5_3输出作为特征框图,而这种特征框图只与上一层卷积网络的输出有关,与之前层的输出关系较浅,导致随着层数的增加,可用的特征信息越来越少,而且有可能网络的准确度已经达到饱和,增加的层什么东西也学习不到。
在一实施例中,所述ResNet残差网络包括多个依次连接的残差模块,后一个残差模块的输入等于前一个残差模块的输出加上第一个残差模块块的输入。
将原Faster R-CNN网络的中的卷积网络改成一个残差模块,如图3所示,可以看到x是这一层残差模块的输入,也称作F(x)为残差,x为输入值,F(x)是经过第一层线性变化并激活后的输出。该图表示在残差网络中,下一层进行线性变化之后激活之前,F(x)加入了这一层输入值x,然后再进行激活后输出。在下一层输出值激活前加入x,这条路径称作便捷(Shortcut)连接。
假设这一层是冗余的,在引入ResNet残差网络之前,想让该层学习到的参数能够满足h(x)=x,即输入是x,经过该冗余层后,输出仍然为x。但是可以看见,要想学习h(x)=0恒等映射时的这层参数时比较困难的。ResNet残差网络想到避免去学习该层恒等映射的参数,使用了如图3的结构,让h(x)=F(x)+x;这里的F(x)称作残差项,要想让该冗余层能够恒等映射,只需要学习F(x)=0。学习F(x)=0比学习h(x)=x要简单,因为在每层网络中参数的初始值一般都偏向于0,这样相比于更新该网络层的参数来学习h(x)=x,该冗余层通过学习F(x)=0后更新参数能够更快的收敛,这样当网络自行决定了哪些层为冗余层后,通过学习残差F(x)=0来让该层网络恒等映射上一层的输入。通过恒等映射,即使有了冗余层的网络效果也与没有这些冗余层的网络效果相同,解决了网络的退化问题。
从直观上看残差学习相对更容易,残差学习需要学习的内容少,因为残差网络结构比较小。从数学的角度来分析这个问题,首先,残差单元可以表示为:
y1=h(x1)+F(x1,W1) (1)
xl+1=f(y1) (2)
其中,xl和xl+1分别表示的是第l个残差单元的输入和输出,注意每个残差单元一般包含多层结构。F是残差函数,表示学习到的残差,而h(x1)=x1表示恒等映射,W1表示构建模型中的参数矩阵,f是ReLU激活函数。基于上式,求得从浅层l到深层F的学习特征:
Figure BDA0002503100790000051
利用链式规则,可以求得反向过程的梯度:
Figure BDA0002503100790000052
式子的第一个因子
Figure BDA0002503100790000053
表示的损失函数到达的梯度,小括号中的1表明短路机制可以无损地传播梯度,而另外一项残差梯度则需要经过卷积层,梯度不是直接传递过来的。残差梯度的值不会全为-1,而且就算残差梯度的值比较小,有1的存在也不会导致梯度消失,所以残差学习会更容易。
ResNet残差网络通过直接将输入信息绕道传到输出,保护信息的完整性,整个网络只需要学习输入以及输出差别的那一部分,简化了网络学习难度。Faster R-CNN引入了ResNet残差网络,通过残差学习解决了深度网络的退化问题,可以训练出更深的网络,获得更全面的特征信息。
在一实施例中,如图4所示,将所述特征图输入到RPN网络中,通过滑动窗口,进行边界预测,生成多个候选目标区域建议。
在一实施例中,如图4所示,将所述多个候选目标区域建议和所述特征图输入到RoI Pooling兴趣区域池化层中,生成有效目标框图。
在一实施例中,如图4所示,将所述有效目标框图输入到全连接层中,对全连接层的输出进行回归和分类。
如图5所示产,本发明提供一种建筑物检测与识别装置,包括:
特征提取模块51,用于通过Faster R-ResNet网络对输入图像进行特征提取,生成特征图;所述Faster R-ResNet网络是通过使用ResNet残差网络替代Faster R-CNN中卷积神经网络VGG16而得到;
区域建议提取模块52,用于基于RPN网络与所述特征图生在多个候选目标区域建议;
有效目标框图获取模块53,用于基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;
位置获取模块54,用于对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例的内容请参见方法部分的实施例的描述,这里暂不赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器((RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种建筑物检测与识别方法,其特征在于,包括:
通过Faster R-ResNet网络对输入图像进行特征提取,生成特征图;所述Faster R-ResNet网络是通过使用ResNet残差网络替代Faster R-CNN中卷积神经网络VGG16而得到;
基于RPN网络与所述特征图生在多个候选目标区域建议;
基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;
对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。
2.根据权利要求1所述的建筑物检测与识别方法,其特征在于,所述ResNet残差网络包括多个依次连接的残差模块,后一个残差模块的输入等于前一个残差模块的输出加上第一个残差模块的输入。
3.根据权利要求1所述的建筑物检测与识别方法,其特征在于,将所述特征图输入到RPN网络中,通过滑动窗口,进行边界预测,生成多个候选目标区域建议。
4.根据权利要求1所述的建筑物检测与识别方法,其特征在于,将所述第一候选框图和所述特征图输入到RoI Pooling兴趣区域池化层中,生成第二候选框图。
5.根据权利要求1或4所述的建筑物检测与识别方法,其特征在于,将所述第二候选框图输入到全连接层中,对全连接层的输出进行回归和分类。
6.一种建筑物检测与识别装置,其特征在于,包括:
特征提取模块,用于通过Faster R-ResNet网络对输入图像进行特征提取,生成特征图;所述Faster R-ResNet网络是通过使用ResNet残差网络替代Faster R-CNN中卷积神经网络VGG16而得到;
区域建议提取模块,用于基于RPN网络与所述特征图生在多个候选目标区域建议;
有效目标框图获取模块,用于基于所述多个候选目标区域建议和所述特征图,得到有效目标框图;
位置获取模块,用于对所述有效目标框图进行回归和分类,得到目标物体的类别和所在区域的坐标。
7.根据权利要求6所述的建筑物检测与识别装置,其特征在于,所述ResNet残差网络包括多个依次连接的残差模块,后一个残差模块的输入等于前一个残差模块的输出加上第一个残差模块块的输入。
8.根据权利要求6所述的建筑物检测与识别装置,其特征在于,将所述特征图输入到RPN网络中,通过滑动窗口,进行边界预测,生成多个候选目标区域建议。
9.根据权利要求6所述的建筑物检测与识别装置,其特征在于,将所述第一候选框图和所述特征图输入到RoI Pooling兴趣区域池化层中,生成第二候选框图。
10.根据权利要求6或9所述的建筑物检测与识别装置,其特征在于,将所述第二候选框图输入到全连接层中,对全连接层的输出进行回归和分类。
CN202010438235.4A 2020-05-21 2020-05-21 一种建筑物检测与识别方法及装置 Pending CN111611925A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010438235.4A CN111611925A (zh) 2020-05-21 2020-05-21 一种建筑物检测与识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010438235.4A CN111611925A (zh) 2020-05-21 2020-05-21 一种建筑物检测与识别方法及装置

Publications (1)

Publication Number Publication Date
CN111611925A true CN111611925A (zh) 2020-09-01

Family

ID=72199150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010438235.4A Pending CN111611925A (zh) 2020-05-21 2020-05-21 一种建筑物检测与识别方法及装置

Country Status (1)

Country Link
CN (1) CN111611925A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418334A (zh) * 2020-11-26 2021-02-26 哈尔滨市科佳通用机电股份有限公司 一种铁路动车裙板格栅变形故障识别方法
CN113065400A (zh) * 2021-03-04 2021-07-02 国网河北省电力有限公司 基于无锚框两阶段网络检测发票印章的方法及装置
CN115100536A (zh) * 2022-06-01 2022-09-23 中科星睿科技(北京)有限公司 建筑物识别方法、装置、电子设备和计算机可读介质
AU2021203702A1 (en) * 2021-06-05 2022-12-22 Yuguang Guo A Method and A Device for Building Positioning and Identifying Based on An Intelligent Terminal

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
WO2019068141A1 (en) * 2017-10-02 2019-04-11 Sensen Networks Group Pty Ltd AUTOMATIC LEARNING GUIDED OBJECT DETECTION SYSTEM AND METHOD
CN109816695A (zh) * 2019-01-31 2019-05-28 中国人民解放军国防科技大学 一种复杂背景下的红外小型无人机目标检测与跟踪方法
CN109949297A (zh) * 2019-03-20 2019-06-28 天津工业大学 基于Reception和Faster R-CNN的肺结节检测方法
CN110046572A (zh) * 2019-04-15 2019-07-23 重庆邮电大学 一种基于深度学习的地标建筑物识别与检测方法
CN110298821A (zh) * 2019-05-28 2019-10-01 昆明理工大学 一种基于Faster R-CNN的钢筋检测方法
CN110472628A (zh) * 2019-08-10 2019-11-19 四创科技有限公司 一种基于视频特征的改进Faster R-CNN网络检测漂浮物方法
CN110647802A (zh) * 2019-08-07 2020-01-03 北京建筑大学 基于深度学习的遥感影像舰船目标检测方法
WO2020020472A1 (en) * 2018-07-24 2020-01-30 Fundación Centro Tecnoloxico De Telecomunicacións De Galicia A computer-implemented method and system for detecting small objects on an image using convolutional neural networks

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019068141A1 (en) * 2017-10-02 2019-04-11 Sensen Networks Group Pty Ltd AUTOMATIC LEARNING GUIDED OBJECT DETECTION SYSTEM AND METHOD
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
WO2020020472A1 (en) * 2018-07-24 2020-01-30 Fundación Centro Tecnoloxico De Telecomunicacións De Galicia A computer-implemented method and system for detecting small objects on an image using convolutional neural networks
CN109816695A (zh) * 2019-01-31 2019-05-28 中国人民解放军国防科技大学 一种复杂背景下的红外小型无人机目标检测与跟踪方法
CN109949297A (zh) * 2019-03-20 2019-06-28 天津工业大学 基于Reception和Faster R-CNN的肺结节检测方法
CN110046572A (zh) * 2019-04-15 2019-07-23 重庆邮电大学 一种基于深度学习的地标建筑物识别与检测方法
CN110298821A (zh) * 2019-05-28 2019-10-01 昆明理工大学 一种基于Faster R-CNN的钢筋检测方法
CN110647802A (zh) * 2019-08-07 2020-01-03 北京建筑大学 基于深度学习的遥感影像舰船目标检测方法
CN110472628A (zh) * 2019-08-10 2019-11-19 四创科技有限公司 一种基于视频特征的改进Faster R-CNN网络检测漂浮物方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵江洪等: "深度学习的遥感影像舰船目标检测", 《测绘科学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418334A (zh) * 2020-11-26 2021-02-26 哈尔滨市科佳通用机电股份有限公司 一种铁路动车裙板格栅变形故障识别方法
CN112418334B (zh) * 2020-11-26 2021-08-06 哈尔滨市科佳通用机电股份有限公司 一种铁路动车裙板格栅变形故障识别方法
CN113065400A (zh) * 2021-03-04 2021-07-02 国网河北省电力有限公司 基于无锚框两阶段网络检测发票印章的方法及装置
AU2021203702A1 (en) * 2021-06-05 2022-12-22 Yuguang Guo A Method and A Device for Building Positioning and Identifying Based on An Intelligent Terminal
CN115100536A (zh) * 2022-06-01 2022-09-23 中科星睿科技(北京)有限公司 建筑物识别方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN110084292B (zh) 基于DenseNet和多尺度特征融合的目标检测方法
Xie et al. Multilevel cloud detection in remote sensing images based on deep learning
CN109584248B (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
CN111611925A (zh) 一种建筑物检测与识别方法及装置
CN110991311B (zh) 一种基于密集连接深度网络的目标检测方法
TWI821671B (zh) 一種文本區域的定位方法及裝置
CN108734210B (zh) 一种基于跨模态多尺度特征融合的对象检测方法
CN110246181B (zh) 基于锚点的姿态估计模型训练方法、姿态估计方法和系统
WO2022179587A1 (zh) 一种特征提取的方法以及装置
CN111160249A (zh) 基于跨尺度特征融合的光学遥感图像多类目标检测方法
CN110598788B (zh) 目标检测方法、装置、电子设备及存储介质
CN115147598B (zh) 目标检测分割方法、装置、智能终端及存储介质
CN111625608A (zh) 一种基于gan模型根据遥感影像生成电子地图的方法、系统
CN113159232A (zh) 一种三维目标分类、分割方法
CN111831844A (zh) 图像检索方法、图像检索装置、图像检索设备及介质
CN106339753A (zh) 一种有效提升卷积神经网络稳健性的方法
CN115512251A (zh) 基于双分支渐进式特征增强的无人机低照度目标跟踪方法
CN115311730B (zh) 一种人脸关键点的检测方法、系统和电子设备
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN115601692A (zh) 数据处理方法、神经网络模型的训练方法及装置
CN114266894A (zh) 一种图像分割方法、装置、电子设备及存储介质
CN108363962B (zh) 一种基于多层次特征深度学习的人脸检测方法及系统
CN116310386A (zh) 基于浅层自适应增强上下文的CenterNet小目标检测方法
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
CN113963333B (zh) 一种基于改进yolof模型的交通标志牌检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200901

RJ01 Rejection of invention patent application after publication