CN118072190A - 一种基于目标边界的弱监督学习实例分割方法及终端设备 - Google Patents

一种基于目标边界的弱监督学习实例分割方法及终端设备 Download PDF

Info

Publication number
CN118072190A
CN118072190A CN202410212176.7A CN202410212176A CN118072190A CN 118072190 A CN118072190 A CN 118072190A CN 202410212176 A CN202410212176 A CN 202410212176A CN 118072190 A CN118072190 A CN 118072190A
Authority
CN
China
Prior art keywords
training
image
model
building
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410212176.7A
Other languages
English (en)
Inventor
李军
丰慧芳
马凌飞
陈一平
陆超
童涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute Of Basic Science And Technology Co ltd
Original Assignee
Nanjing Institute Of Basic Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute Of Basic Science And Technology Co ltd filed Critical Nanjing Institute Of Basic Science And Technology Co ltd
Priority to CN202410212176.7A priority Critical patent/CN118072190A/zh
Publication of CN118072190A publication Critical patent/CN118072190A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0895Weakly supervised learning, e.g. semi-supervised or self-supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/176Urban or other man-made structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于目标边界的弱监督学习实例分割方法及终端设备,涉及建筑物屋顶轮廓线提取技术领域;本申请降低了建筑屋顶轮廓线自动化提取对训练数据集质量和体量的依赖;有效推动了深度学习技术对训练数据集质量和体量的依赖,推动了其在实际生产中的应用,在实际操作中需要更少的专业背景知识,方法的性能已有完整的定量评估。本申请提供的基于目标边界框的弱监督学习方法,较于以往的深度学习技术,可以在保证数据精度的同时,极大的降低深度学习技术对训练数据质量和体量的依赖。

Description

一种基于目标边界的弱监督学习实例分割方法及终端设备
技术领域
本发明属于建筑物屋顶轮廓线提取技术领域,具体是一种基于目标边界的弱监督学习实例分割方法及终端设备。
背景技术
随着城市化的发展,越来越多的人口聚集在城市,为城市的管理规划和可持续发展带来了严峻的挑战。城市高清地图作为城市的基础数据能够为决策者和政策制定者提供有价值的信息。因此,近些年来城市高清地图的制作引起了学界和业界的广泛关注。高清地图的制作经历了从最初的实地勘测到现在基于遥感影像的制图技术,制图的时效性和成本得到了有效的控制。然而,在在追求制图精度和速度的背景下,高清制图迎来了新的挑战。
随着深度学习技术的复兴和发展,深度学习技术已然取代了传统的实地勘测、目视解译和基于传统机器学习制图技术,成为了这一领域的主流技术。现有的深度学习技术能够从航空影像和卫星影像中精确的提取建筑物屋顶的轮廓线。生成的结果甚至可以直接运用于高清制图且无需任何或者只需少量的人工后处理。然而深度学习技术非常依赖于训练数据的质量和体量,严重阻碍了深度学习技术在包括制图领域在内的所有领域的实际应用。这一现象在对地观测以及医学影像处理中尤为明显。
作为与遥感影像处理紧密相关的领域,计算机视觉领已然对深度学习技术的这一限制关注许久。研究者们提出众多方案来克服深度学习对高质量和高体量训练数据集的依赖。在这些方案中,弱监督和半监督的方法运用较为广泛。前者使用想对较弱的监督信息实现模型的训练。例如,使用图像级标签、带类别信息的涂鸦和边界框来代替完整的掩膜标注实现图像的分割。半监督则是采用部分完全标注和部分无标注数据的组合来实现模型的训练。由于城市环境较为复杂,城市中同类目标间差异较大,使用半监督的方案往往无法取得较好的分类结果。相比较而言,弱监督的方案更加适合城市场景的影像分类分割。
在基于影像的建筑物屋顶轮廓线提取这一任务中,已有的弱监督学习方案中有使用图像级标签和带类别信息的涂鸦作为标注,但是很少有使用边界框作为标注信息。图像标签的标注代价虽然是三种方案中成本最低的,但是基于图像标签的方案往往表现不佳。而在带类别信息的涂鸦标注方案中,涂鸦的工作量与最终模型性能挂钩。涂鸦越详细,模型性能越好。基于边界框的标注,虽然标注量较大,但是训练出来的模型性能稳定,且优秀。对于建筑物屋顶轮廓线的自动化提取,基于边界框的实例分割算法可以提供更有效的解决方案。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一;
为此,本发明提出了一种基于目标边界的弱监督学习实例分割方法,该方法具体包括如下步骤:
1)、获取高分辨率航空影像或卫星影像,高分辨率指代为亚米级,并标注出建筑物屋顶轮廓线的边界框;
在获取的高分辨率卫星影像或者航空影像上,使用标注软件,标注出目标类别的所有目标的边界框;对标注好的影像和标注好的结果进行裁切,并将标注文件存储为JSON文件,以备后续模型训练使用;
2)、部署计算机环境;
3)、针对建筑物屋顶轮廓线自动提取任务,训练好开发的深度学习网络;
使用步骤1)中生成的训练数据,在步骤2)搭建好的环境下训练建筑物屋顶轮廓线提取方法;
4)、将训练好的模型,部署到终端;
生成的模型文件为一个进展文件,其内包含模型的基本结构和训练所得的最优参数组;将方法代码和模型文件移植到跟步骤2)一致的计算环境的终端上;将其标记为部署终端;
5)、输入目标区域的影像,使用部署的模型生成建筑物屋顶轮廓线;
获取到的目标区域的影像经过裁切后输入部到部署终端,用于生成最终的建筑物屋顶轮廓。
进一步地,标注软件包括ArcGIS。
进一步地,在标注软件中使用数字化工具,创建目标类别所有目标的边界框,并将标注结果和影像才切成小块,存储为JSON文件。
进一步地,对标注好的影像和结果进行裁切时,所有图像被切分成512*512像素大小。
进一步地,裁切过程为从左上角至右下角的无重叠裁切,边界处不足512*512的图像块的标注数据使用像素值为127的像素填充补全。
进一步地,步骤2)具体方式为:
计算机环境部署中:
所开发的方法需要的计算机环境应至少满足:配置支持深度学习加速的英伟达GPU和CUDA,和深度学习框架Pytorch;程序库包括python,GCC,mmdet,mmcv。
进一步地,建筑物屋顶轮廓线提取方法具体包括一个特征提取器,一个实例感知的解码器,一个水平集匹配和水平集迭代模块;训练过程中,输入是影像,训练的输出是基于建筑物实例的边界框使用水平集算法迭代生成的目标掩膜;训练的最终结果是使模型在训练数据集上误差最小的一组最优模型参数。
一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述方法。
与现有技术相比,本发明的有益效果是:
本申请提供的基于目标边界框的弱监督学习方法的应用,降低了建筑屋顶轮廓线自动化提取对训练数据集质量和体量的依赖;有效推动了深度学习技术对训练数据集质量和体量的依赖,推动了其在实际生产中的应用,在实际操作中需要更少的专业背景知识,方法的性能已有完整的定量评估。
本申请提供的基于目标边界框的弱监督学习方法,较于以往的深度学习技术,可以在保证数据精度的同时,极大的降低深度学习技术对训练数据质量和体量的依赖。
附图说明
图1是本申请的基于目标边界框的弱监督学习方法实施例的流程示意图;
图2是本申请的基于目标边界框的弱监督学习算法结构图;
图3是本申请的建筑物屋顶轮廓提取效果示意图;
图4是本申请的终端设备结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本申请提供了一种基于目标边界的弱监督学习实例分割方法,该方法具体包括如下步骤:
1)、获取高分辨率航空影像或卫星影像,高分辨率指代为亚米级,并标注出建筑物屋顶轮廓线的边界框;
在获取的高分辨率卫星影像或者航空影像上,使用ArcGIS等标注软件,标注出目标类别的所有目标的边界框;以建筑物屋顶轮廓线提取为例,需要标注出建筑物屋顶的边界框;对标注好的影像和标注好的结果进行裁切,并将标注文件存储为JSON文件,以备后续模型训练使用;
在ArcGIS等软件中,使用数字化工具,创建目标类别所有目标的边界框,并将标注结果和影像才切成小块,存储为JSON文件;
由于标注边界框相比于标注完整的目标掩膜更加省时省力,因此本次所提出的方法只需要标注目标边界框;由于计算机性能的限制,目前深度学习技术一般都是用小图像作为输入,一般为2的n次方,因此标注好的结果需要切分成小块;在本申请中,所有图像被切分成512*512像素大小;为了便于数据存储和读取,所有的标注文件存储为JSON文件。
2)部署计算机环境;
部署计算机环境,需要安装深度学习必须的底层程序库,以及运行本方法所必需的程序库;
具体的,从最底层的支持深度学习加速的英伟达GPU和CUDA,到深度学习框架Pytorch,再到本方法需要的python,GCC,mmdet,mmcv等开源程序库是成功运行本方法必不可少的程序库。因此,在正式使用本方法前,需要成功配置本方法所需要的计算机运行环境;
3)针对特定任务,训练好开发的深度学习网络;
不同任务需要不同的训练数据训练出需要的特定模型。使用步骤1)中生成的训练数据,在步骤2)搭建好的环境下训练本申请开发的方法。训练过程中,输入是影像,训练的输出是边界框迭代生成的目标掩膜。训练的最终结果是使模型在训练数据集上误差最小的一组最优模型参数;
4)将训练好的模型,部署到终端;
将训练好的模型,部署到终端。训练好的模型,可以部署或移植到有相同计算环境的终端机器上,以备后续生产活动使用。
具体的,生成的模型文件为一个而进展文件,期内包含模型的基本结构和训练所得的最优参数组。将方法代码和模型文件移植到有类似计算环境的终端上,即可保证本申请中方法的正常使用。
5)输入目标区域的影像,使用部署的模型生成建筑物屋顶轮廓线;
输入目标区域的影像,使用部署的模型生成建筑物屋顶轮廓线;获取到的目标区域的影像经过裁切后即可输入部署了本申请中方法的终端,用于生成最终的建筑物屋顶轮廓。
本申请中基于目标边界框的弱监督学习实例分割方法应用于从航空影像提取建筑物屋顶轮廓线。图3中DiscoBox,BoxInst,Box2Mask和Box2Boundary是四个基于目标边界框的弱监督学习方法,其中Box2Boundary为本申请提出的方法,其余三个为当前世界领先的其他的基于目标边界框的弱监督学习实例分割算法。图3上方,方法名字右侧为这些方法在武汉大学建筑物数据集上提取建筑物屋顶轮廓的效果示意图。图3下方,方法名字上方为第一列效果示意图的放大版。
本申请还提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
该实施例的终端设备包括:至少一个处理器,如图4,仅示出一个,处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现下述任意各个代谢路径预测方法实施例中的步骤。
本申请实施例提供的分子优化方法可以应用于平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personaldigital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
例如,所述终端设备可以是WLAN中的站点(STAION,ST),可以是个人数字处理(Personal Digital Assistant,PDA)设备、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、电脑、膝上型计算机、手持式通信设备、手持式计算设备、卫星无线设备、无线调制解调器卡。
所述终端设备可以是台式计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,仅仅是终端设备的举例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器可以是中央处理单元(CentralProcessingUnit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器在一些实施例中可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器在另一些实施例中也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,MC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括所述终端设备的内部存储单元也包括外部存储设备。所述存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。

Claims (8)

1.一种基于目标边界的弱监督学习实例分割方法,其特征在于,该方法具体包括如下步骤:
1)、获取高分辨率航空影像或卫星影像,高分辨率指代为亚米级,并标注出建筑物屋顶轮廓线的边界框;
在获取的高分辨率卫星影像或者航空影像上,使用标注软件,标注出目标类别的所有目标的边界框;对标注好的影像和标注好的结果进行裁切,并将标注文件存储为JSON文件,以备后续模型训练使用;
2)、部署计算机环境;
3)、针对建筑物屋顶轮廓线自动提取任务,训练好开发的深度学习网络;
使用步骤1)中生成的训练数据,在步骤2)搭建好的环境下训练建筑物屋顶轮廓线提取方法;
4)、将训练好的模型,部署到终端;
生成的模型文件为一个进展文件,其内包含模型的基本结构和训练所得的最优参数组;将方法代码和模型文件移植到跟步骤2)一致的计算环境的终端上;将其标记为部署终端;
5)、输入目标区域的影像,使用部署的模型生成建筑物屋顶轮廓线;
获取到的目标区域的影像经过裁切后输入部到部署终端,用于生成最终的建筑物屋顶轮廓。
2.根据权利要求1所述的一种基于目标边界的弱监督学习实例分割方法,其特征在于,标注软件包括ArcGIS。
3.根据权利要求2所述的一种基于目标边界的弱监督学习实例分割方法,其特征在于,在标注软件中使用数字化工具,创建目标类别所有目标的边界框,并将标注结果和影像才切成小块,存储为JSON文件。
4.根据权利要求1所述的一种基于目标边界的弱监督学习实例分割方法,其特征在于,对标注好的影像和结果进行裁切时,所有图像被切分成512*512像素大小。
5.根据权利要求4所述的一种基于目标边界的弱监督学习实例分割方法,其特征在于,裁切过程为从左上角至右下角的无重叠裁切,边界处不足512*512的图像块的标注数据使用像素值为127的像素填充补全。
6.根据权利要求1所述的一种基于目标边界的弱监督学习实例分割方法,其特征在于,步骤2)具体方式为:
计算机环境部署中:
所开发的方法需要的计算机环境应至少满足:配置支持深度学习加速的英伟达GPU和CUDA,和深度学习框架Pytorch;程序库包括python,GCC,mmdet,mmcv。
7.根据权利要求1所述的一种基于目标边界的弱监督学习实例分割方法,其特征在于,建筑物屋顶轮廓线提取方法具体包括一个特征提取器,一个实例感知的解码器,一个水平集匹配和水平集迭代模块;训练过程中,输入是影像,训练的输出是基于建筑物实例的边界框使用水平集算法迭代生成的目标掩膜;训练的最终结果是使模型在训练数据集上误差最小的一组最优模型参数。
8.一种终端设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-7任意一种方法。
CN202410212176.7A 2024-02-27 2024-02-27 一种基于目标边界的弱监督学习实例分割方法及终端设备 Pending CN118072190A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410212176.7A CN118072190A (zh) 2024-02-27 2024-02-27 一种基于目标边界的弱监督学习实例分割方法及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410212176.7A CN118072190A (zh) 2024-02-27 2024-02-27 一种基于目标边界的弱监督学习实例分割方法及终端设备

Publications (1)

Publication Number Publication Date
CN118072190A true CN118072190A (zh) 2024-05-24

Family

ID=91108649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410212176.7A Pending CN118072190A (zh) 2024-02-27 2024-02-27 一种基于目标边界的弱监督学习实例分割方法及终端设备

Country Status (1)

Country Link
CN (1) CN118072190A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334578A (zh) * 2019-05-05 2019-10-15 中南大学 图像级别标注自动提取高分遥感影像建筑物的弱监督方法
CN114842330A (zh) * 2022-03-29 2022-08-02 深圳市规划和自然资源数据管理中心 一种多尺度背景感知池化弱监督建筑物提取方法
CN116704371A (zh) * 2023-06-20 2023-09-05 航天宏图信息技术股份有限公司 屋顶检测及分类方法、装置、设备和介质
KR102587288B1 (ko) * 2023-07-10 2023-10-10 연세대학교 산학협력단 건설객체 데이터셋의 의미적 분할 모델의 학습을 위한 자기 지도학습 기반의 고품질 의사 라벨 생성시스템 및 생성방법
CN117390207A (zh) * 2023-11-13 2024-01-12 中国人民解放军战略支援部队信息工程大学 基于自监督学习的遥感影像建筑物样本库构建方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334578A (zh) * 2019-05-05 2019-10-15 中南大学 图像级别标注自动提取高分遥感影像建筑物的弱监督方法
CN114842330A (zh) * 2022-03-29 2022-08-02 深圳市规划和自然资源数据管理中心 一种多尺度背景感知池化弱监督建筑物提取方法
CN116704371A (zh) * 2023-06-20 2023-09-05 航天宏图信息技术股份有限公司 屋顶检测及分类方法、装置、设备和介质
KR102587288B1 (ko) * 2023-07-10 2023-10-10 연세대학교 산학협력단 건설객체 데이터셋의 의미적 분할 모델의 학습을 위한 자기 지도학습 기반의 고품질 의사 라벨 생성시스템 및 생성방법
CN117390207A (zh) * 2023-11-13 2024-01-12 中国人民解放军战略支援部队信息工程大学 基于自监督学习的遥感影像建筑物样本库构建方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONGJIE HE: "Optimization of Rooftop Delineation from Aerial Imagery with Deep Learning", 《HONGJIE HE (2023). OPTIMIZATION OF ROOFTOP DELINEATION FROM AERIAL IMAGERY WITH DEEP LEARNING. UWSPACE. HTTP://HDL.HANDLE.NET/10012/19735》, 21 August 2023 (2023-08-21), pages 1 - 117 *

Similar Documents

Publication Publication Date Title
US11410435B2 (en) Ground mark extraction method, model training METHOD, device and storage medium
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN108229303B (zh) 检测识别和检测识别网络的训练方法及装置、设备、介质
US9396546B2 (en) Labeling objects in image scenes
US20170124711A1 (en) Universal correspondence network
CN111460927B (zh) 对房产证图像进行结构化信息提取的方法
Alidoost et al. A CNN-based approach for automatic building detection and recognition of roof types using a single aerial image
US9530218B2 (en) Method for classification and segmentation and forming 3D models from images
CN104134234A (zh) 一种全自动的基于单幅图像的三维场景构建方法
CN112633277A (zh) 基于深度学习的航道船牌检测、定位及识别方法
US11455502B2 (en) Learning device, classification device, learning method, classification method, learning program, and classification program
CN110838105A (zh) 一种业务流程模型图像识别与再构方法
CN111415364B (zh) 一种计算机视觉中图像分割样本的转换方法、系统及存储介质
Li et al. Unsupervised road extraction via a Gaussian mixture model with object-based features
Zhou et al. Region convolutional features for multi-label remote sensing image retrieval
CN116071389A (zh) 一种基于前背景匹配的边界框弱监督图像分割方法
CN115265545A (zh) 基于决策分析的地图匹配导航方法、装置、设备及存储介质
CN103295026B (zh) 基于空间局部聚合描述向量的图像分类方法
CN114782355A (zh) 基于改进vgg16网络的胃癌数字病理切片检测方法
CN106056575B (zh) 一种基于似物性推荐算法的图像匹配方法
CN118072190A (zh) 一种基于目标边界的弱监督学习实例分割方法及终端设备
CN114429573B (zh) 一种基于数据增强的生活垃圾数据集生成方法
CN110751153B (zh) 一种室内场景rgb-d图像的语义标注方法
CN111435537B (zh) 模型训练方法、装置及基于拼接图的位姿优化方法、装置
Shi et al. Text detection in trademark images under semi-supervision

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination