CN117893559A - 基于对象成像网络的水域标注方法、装置和电子设备 - Google Patents

基于对象成像网络的水域标注方法、装置和电子设备 Download PDF

Info

Publication number
CN117893559A
CN117893559A CN202410289235.0A CN202410289235A CN117893559A CN 117893559 A CN117893559 A CN 117893559A CN 202410289235 A CN202410289235 A CN 202410289235A CN 117893559 A CN117893559 A CN 117893559A
Authority
CN
China
Prior art keywords
image
data set
object imaging
training
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410289235.0A
Other languages
English (en)
Other versions
CN117893559B (zh
Inventor
李军
张娆
陈韦兆
丘仕林
罗舒琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202410289235.0A priority Critical patent/CN117893559B/zh
Publication of CN117893559A publication Critical patent/CN117893559A/zh
Application granted granted Critical
Publication of CN117893559B publication Critical patent/CN117893559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了基于对象成像网络的水域标注方法、装置和电子设备,方法包括:获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;根据卷积核参数,构建对象成像网络中的特征滤波器;将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像,能够对待标注图像自动进行标注,提高标注效率,可广泛应用于图像处理技术领域。

Description

基于对象成像网络的水域标注方法、装置和电子设备
技术领域
本申请涉及图像处理技术领域,尤其涉及基于对象成像网络的水域标注方法、装置和电子设备。
背景技术
传统的水域监测方法是用卫星采集不同波长的图片结合水的吸收波长特征判断水体,分割出类水体后再进行处理,这种方法成本较大,并且无法一次性得到结果。其中,作为分割级任务,数据标注严重依赖于人工标注且人工标注成本高,而一些现有的自动标注方案基本都是基于卷积神经网络实现的,标签使用二值化的分割图像,使用二值标签往往会产生目标漂移、定位不准等问题。
发明内容
本申请实施例旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出基于对象成像网络的水域标注方法、装置和电子设备,能够提高标注的准确性和标注效率,减少人工标注的工作量。
为实现上述目的,本申请实施例的一方面提出了基于对象成像网络的水域标注方法,所述方法包括:
获取若干包含水域的原始图像,并将所述原始图像按预设数量比例构建训练数据集;
对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;
将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,所述对象成像网络包含卷积核参数,所述卷积核参数包含目标水域特征;
根据所述卷积核参数,构建所述对象成像网络中的特征滤波器;
将包含水域的第一待标注图像输入至所述对象成像网络中,通过所述对象成像网络中的特征滤波器对所述第一待标注图像进行自动标注,输出第一目标标注图像。
在一些实施例中,所述对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集,包括:
按预设标注规则对所述训练数据集中的各个训练图像进行分割标注处理,得到若干保留有所述训练图像中水域对应的水域内部信息和水域边缘信息的标签图像;
根据各个所述标签图像构建标签数据集。
在一些实施例中,所述方法还包括:
获取所述原始图像中水域对应的原始中心经纬度坐标。
在一些实施例中,在所述将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络之前,所述方法还包括:
对初始神经网络中的网络输出层进行修改,得到目标神经网络。
在一些实施例中,所述方法还包括:
将所述原始图像按预设数量比例构建测试数据集;
将所述测试数据集输入至所述对象成像网络中,输出第二目标标注图像;
对所述第二目标标注图像进行偏移误差验证。
在一些实施例中,所述对所述第二目标标注图像进行偏移误差验证,包括:
提取所述第二目标标注图像中水域边缘对应的目标边缘点像素坐标;
根据所述目标边缘点像素坐标,重构所述目标边缘点像素坐标对应的目标边缘经纬度坐标;
将所述目标边缘经纬度坐标与所述测试数据集中的测试图像对应的原始中心经纬度坐标进行偏移误差计算,得出偏移误差结果。
在一些实施例中,所述方法还包括:
将包含水域的第二待标注图像输入至所述对象成像网络中,确定所述第二待标注图像中水域对应的连通体数量;
根据所述连通体数量,确定所述第二待标注图像中水域的水体类型;
若所述水体类型为多水体类型,则将所述第二待标注图像进行分片处理,得到若干分片图像;
将各个所述分片图像分别输入至所述对象成像网络,输出各个所述分片图像对应的第三标注图像;
将各个所述第三标注图像进行拼接,得到多水体标注结果。
为实现上述目的,本申请实施例的另一方面提出了基于对象成像网络的水域标注装置,所述装置包括:
训练数据集构建模块,用于获取若干包含水域的原始图像,并将所述原始图像按预设数量比例构建训练数据集;
标签数据集获取模块,用于对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;
对象成像网络训练模块,用于将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,所述对象成像网络包含卷积核参数,所述卷积核参数包含目标水域特征;
特征滤波器构建模块,用于根据所述卷积核参数,构建所述对象成像网络中的特征滤波器;
图像标注模块,用于将包含水域的第一待标注图像输入至所述对象成像网络中,通过所述对象成像网络中的特征滤波器对所述第一待标注图像进行自动标注,输出第一目标标注图像。
为实现上述目的,本申请实施例的另一方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前面所述的方法。
为实现上述目的,本申请实施例的另一方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前面所述的方法。
本申请实施例至少包括以下有益效果:本申请提供基于对象成像网络的水域标注方法、装置和电子设备,该方案通过获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;然后对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;接着将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;进而根据卷积核参数,构建对象成像网络中的特征滤波器;最后将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像。本申请实施例通过对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,再将标签数据集和训练数据集输入至目标神经网络中训练,有助于目标神经网络学习到更准确的特征,提高后续图像标注的准确性,并且,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即能够获取感兴趣对象特征的卷积核参数,接着可以通过卷积核参数构建特征滤波器,进而可以借助特征滤波器完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了输出的标注图像含有无关信息以及背景信息,提高标注的准确性,实现了对未知图像的水域区域自动标注,大大地提高标注效率,减少了人工标注的工作量,同时减少人工成本。
附图说明
图1是本申请实施例提供的基于对象成像网络的水域标注方法的步骤流程图;
图2是本申请实施例提供的一种标签制作前的原图示意图;
图3是本申请实施例提供的一种标签制作后的标签示意图;
图4是本申请实施例提供的基于对象成像网络的水域标注方法的流程示意图;
图5是本申请实施例提供的一种水域连通图;
图6是本申请实施例提供的一种水域边缘像素坐标数据示意图;
图7是本申请实施例提供的一种对象成像网络测试前的第一输入示意图;
图8是本申请实施例提供的一种对象成像网络测试后的第一输出示意图;
图9是本申请实施例提供的一种对象成像网络测试前的第二输入示意图;
图10是本申请实施例提供的一种对象成像网络测试前的第二输出示意图;
图11是本申请实施例提供的一种对象成像网络测试前的第三输入示意图;
图12是本申请实施例提供的一种对象成像网络测试后的第三输出示意图;
图13是本申请实施例提供的一种对象成像网络测试前的第四输入示意图;
图14是本申请实施例提供的一种对象成像网络测试前的第四输出示意图;
图15是本申请实施例提供的一种水域标注软件的初始界面示意图;
图16是本申请实施例提供的一种水域标注软件的处理界面示意图;
图17是本申请实施例提供的一种对象成像网络的训练测试结构示意图;
图18是本申请实施例提供的一种对象成像网络的验证流程示意图;
图19是本申请实施例提供的一种识别多水体的流程示意图;
图20是本申请实施例提供的一种多水体输入对象成像网络的输入示意图;
图21是本申请实施例提供的一种对象成像网络输出多水体结果的输出示意图;
图22是本申请实施例提供的基于对象成像网络的水域标注装置的结构示意图;
图23是本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请实施例相一致的所有实施方式,它们仅是与如所附权利要求书中所详述的、本申请实施例的一些方面相一致的装置和方法的例子。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。例如,在不脱离本申请实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“若”、“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”等,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,每个是指对应的多个中的每一个,任一是指多个中的任意一个。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
相关技术中,传统的水域监测方法是用卫星采集不同波长的图片结合水的吸收波长特征判断水体,分割出类水体后再进行处理,这种方法成本较大,并且无法一次性得到结果。其中,作为分割级任务,数据标注严重依赖于人工标注且人工标注成本高,而一些现有的自动标注方案基本都是基于卷积神经网络实现的,标签使用二值化的分割图像,使用二值标签往往会产生目标漂移、定位不准等问题。
作为一种示例,人们开始关注如何利用技术手段来监测溺水事件,以最大限度地降低溺水死亡风险。海边、江河或湖泊等水域被公认为极易导致溺水的危险场所。因此,市面上推出了一种具有危险水域报警功能的可穿戴设备,当设备检测到人员处于危险水域周围时,会向与其绑定的移动设备发送警报信息,提醒移动设备的用户采取相应的保护措施。现有技术中,这些可穿戴设备一般都是通过全球卫星定位(Global Positioning System简称GPS)系统进行自身定位来判断人员是否处于危险水域周围。传统的水域监测方法是用卫星采集不同波长的图片结合水的吸收波长特征判断水体,分割出类水体后再进行处理,这种方法成本较大,并且无法一次性得到结果。作为分割级任务,数据标注严重依赖于人工标注且人工标注成本高,而一些现有的自动标注方案基本都是基于卷积神经网络实现的,标签使用二值化的分割图像,这样会导致分割时更关注图像边缘,忽略图像的内部信息,可以理解的是,使用二值标签往往会产生目标漂移、定位不准等问题,这对定位经纬度误差是巨大的。
基于上述示例可知,目前地图上标记的危险水域大多是大范围自然水域,如海洋、湖泊、河流等,但是,还有很多的潜在的小范围危险水域并没有在地图上做出标记,如农田水坑、水上乐园、游泳池、水库等,因此,对危险水域电子地图进行完善是很有必要的,其中,图像的内部信息对于标注目标的一致性和整体性来说也是很重要的。
有鉴于此,本申请实施例中提供基于对象成像网络的水域标注方法、装置和电子设备,该方案通过获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;然后对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;接着将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;进而根据卷积核参数,构建对象成像网络中的特征滤波器;最后将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像。本申请实施例通过对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,再将标签数据集和训练数据集输入至目标神经网络中训练,有助于目标神经网络学习到更准确的特征,提高后续图像标注的准确性,并且,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即能够获取感兴趣对象特征的卷积核参数,接着可以通过卷积核参数构建特征滤波器,进而可以借助特征滤波器完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了输出的标注图像含有无关信息以及背景信息,提高标注的准确性,实现了对未知图像的水域区域自动标注,大大地提高标注效率,减少了人工标注的工作量,同时减少人工成本。
本申请实施例提供的基于对象成像网络的水域标注方法,涉及图像处理技术领域。本申请实施例提供的基于对象成像网络的水域标注方法可应用于终端中,也可应用于服务器中,还可以是运行于终端或服务器中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表以及车载终端等,但并不局限于此;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network 内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,服务器还可以是区块链网络中的一个节点服务器;软件可以是实现基于对象成像网络的水域标注方法的应用等,但并不局限于以上形式。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC(personalcomputer 个人计算机)、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
请参阅图1,图1是本申请实施例提供的基于对象成像网络的水域标注方法的一个可选的流程图,图1中的方法可以包括但不限于包括步骤S101至步骤S105。
步骤S101,获取若干包含水域的原始图像,并将所述原始图像按预设数量比例构建训练数据集;
其中,原始图像为包含有水域信息的图像,即仅获取正样本,示例性地,可以选取500张分辨率均为2560×1600的图像以构建数据集。对于预设数量比例,其可以根据实际情况进行调整,在本申请实施例中,预设数量比例划分为训练数据集和测试数据集两个比例,示例性地,可以按照7:3的比例对500张原始图像进行随机划分,其中,训练数据集用于训练对象成像网络,测试数据集用于测试训练完成的对象成像网络的分割精度、偏移误差和处理速度等。
需要说明的是,由于训练数据集和测试数据集均为原始图像随机划分构成的数据集,那么训练数据集和测试数据集中的图像均包含有水域。
其中,原始图像可以通过目前相关地图软件所公开的API接口(ApplicationProgramming Interface 应用程序编程接口)在同一地图层级下截取,在同一地图层级下截取图像可以保证图像的像素坐标和经纬度坐标的对应计算。
需要说明的是,对于地图软件所公开的API接口,可以参考相关地图软件的API接口技术实现方式,本申请实施例在此不作赘述,可以理解的是,本申请对此不作限制。
在一些实施例中,还可以包括:获取原始图像中水域对应的原始中心经纬度坐标。
其中,在获取原始图像的同时保存原始图像对应的原始中心经纬度坐标,原始中心经纬度坐标也可以称为原始中心点经纬度坐标,原始中心经纬度坐标可以通过地图软件公开的API接口进行获取,可以用于与后续对象成像网络重构的水域边缘经纬度坐标进行比对,得出偏移验证误差。
示例性地,原始图像可以通过地图软件公开的API接口在同一地图层级下截取,以保证图像像素坐标和经纬度坐标的对应计算,同时保存原始图像的中心点经纬度坐标。具体地,本申请实施例中仅获取正样本,即获取的所有原始图像都是包含(危险)水域的,分辨率均收集为2560×1600的,选取500张原始图像构建原始数据集,并按7:3的比例随机划分为训练数据集和测试数据集。另外,由于包含多水体的图像打标工作量大,本申请实施例中构建的数据集只包含单水体。
需要说明的是,危险水域可以包括大范围自然水域,如海洋、湖泊、河流等,也可以包含潜在的小范围而并没有在地图上做出标记的危险水域,如农田水坑、水上乐园、游泳池、水库等,需要说明的是,对于危险水域的划分和定义,本领域技术人员可以根据实际情况进行调整,可以理解的是,本申请实施例对此不作限制,在本申请实施例中,随机选择部分含有水域的图像进行数据集的构建。
另外,对于上述示例中列举的图像分辨率大小、图像的数量以及数据集的划分比例,本领域技术人员可以根据实际情况进行调整,本申请实施例对此不作限制。
步骤S102,对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;
在一些实施例中,步骤S102可以包括:按预设标注规则对训练数据集中的各个训练图像进行分割标注处理,得到若干保留有训练图像中水域对应的水域内部信息和水域边缘信息的标签图像;根据各个标签图像构建标签数据集。
其中,由于训练数据集是由包含水域的原始图像划分而来,则训练数据集中的所有训练图像也均包含有水域。
对于分割标注处理,其为对训练数据集中的所有训练图像进行标签制作的过程,训练图像通过标签制作后可以得到对应的标签图像,从而可以根据得到的多个标签图像构建标签数据集。
其中,预设标注规则为保证进行标签制作后的标签图像保留有训练图像在进行标签制作前的水域内部信息和水域边缘信息,可以理解的是,训练图像原本含有的水域内部信息和水域边缘信息,在训练图像经过标签制作之后得到的标签图像中也同样包含有训练图像原本含有的水域内部信息和水域边缘信息。其中,对于标签制作的方式,可以通过相关图像处理工具进行抠图处理等,本申请实施例在此不做赘述,可以理解的是,本领域技术人员可以选择适当的图像处理工具进行标签的制作,本申请实施例对此不作限制。
在本申请实施例中,不同于一般的目标分割标签,本申请实施例构造的标签不仅包含目标边缘,也包含目标的内部信息,在一定程度上保留了物体的统一性、完整性和稳定性,这也是解决目标漂移问题的理论基础。请参阅图2,图2是本申请实施例提供的一种标签制作前的原图示意图,如图2所示,图2为标签制作前的原图,图2的中间有一处水域,请参阅图3,图3是本申请实施例提供的一种标签制作后的标签示意图,如图3所示,在经过标签制作处理后的图像,亮区域仅保留水体内部信息及水体边缘信息,黑区域为水体所在区域,黑区域即为背景区域。
步骤S103,将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,所述对象成像网络包含卷积核参数,所述卷积核参数包含目标水域特征;
在一些实施例中,在步骤S103之前,还可以包括:对初始神经网络中的网络输出层进行修改,得到目标神经网络。
其中,初始神经网络为未进行输出层修改前的神经网络。目标神经网络为经过输出层修改后的神经网络。
其中,理论上对象成像可以基于各类卷积神经网络实现,但并不排除特殊的情况出现,可以理解的是,对于卷积神经网络的选取,需要根据实际的情况进行选择,本申请实施例对此不作限制。本申请实施例考虑到对象成像任务和分割任务的相似性,选取基于经典的U-Net网络实现,U-Net网络是一个用于图像分割的卷积神经网络(ConvolutionalNeural Network 简称CNN),U-Net网络在2015年提出,多用于医学图像分割任务,U-Net网络的结构是一个对称的编码器-解码器结构,其中编码器采用了类似于VGG网络的堆叠卷积层结构,每个编码器阶段都包含卷积层和池化层;解码器和编码器对称,每个解码器阶段都包含上采样操作(反卷积或插值)和卷积层,在解码器阶段,还引入了跳过连接,将编码器的特征图与解码器的特征图合并,以提高模型的精度。U-Net的优点是可以处理相对较小的数据集,具有较高的分割精度,并且可以应用于不同的图像分割任务。
对于对初始神经网络中的网络输出层进行修改的操作,在本申请实施例中,根据数据集命名规律构建数据集加载模块,同时作为端到端的训练任务,不同于二值标签的二分类。本申请实施例需要修改网络输出层,以适应标签的形式,以U-Net网络为例,具体地,本申请实施例构建的标签图像是RGB(RGB color mode RGB色彩模式)三通道的,并且作为端到端的回归任务,需要去掉U-Net网络中输出层中的激活函数,在去掉U-Net网络中输出层中的激活函数的基础上,再加上一个全连接层,将全连接层的输出通道修改为3。
其中,对象成像网络为一种训练完成的自动标注的神经网络,能够对包含水域的图像进行识别和水域提取,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即感兴趣对象特征的卷积核参数,含有目标水域特征的卷积核参数能够用于构建特征滤波器,以提高图像识别的准确性。
步骤S104,根据所述卷积核参数,构建所述对象成像网络中的特征滤波器;
其中,特征滤波器能够完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了成像时图像含有无关信息以及背景信息。
步骤S105,将包含水域的第一待标注图像输入至所述对象成像网络中,通过所述对象成像网络中的特征滤波器对所述第一待标注图像进行自动标注,输出第一目标标注图像。
其中,第一待标注图像为包含有水域的图像,其可以为从原始图像中获取的,也可以是从其他途径中获取的,对于第一待标注图像的获取方式,本申请实施例在此不作限制。
对于第一目标标注图像,其为第一待标注图像经过对象成像网络中的特征滤波器的自动标注所输出的标注图像,需要说明的是,第一目标标注图像包含有第一待标注图像原本含有的水域内部信息和水域边缘信息。
在具体实现中,请参阅图4,图4是本申请实施例提供的基于对象成像网络的水域标注方法的流程示意图;如图4所示,首先可以基于对象成像方法构建特定的对象成像网络,然后基于对象成像网络训练得到特征滤波器,此时,可以将待标注数据输入至对象成像网络中,由对象成像网络中的特征滤波器对待标注数据进行自动标注,得到自动标注结果。
在本申请实施例中,通过获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;然后对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;接着将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;进而根据卷积核参数,构建对象成像网络中的特征滤波器;最后将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像。本申请实施例通过对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,再将标签数据集和训练数据集输入至目标神经网络中训练,有助于目标神经网络学习到更准确的特征,提高后续图像标注的准确性,并且,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即能够获取感兴趣对象特征的卷积核参数,接着可以通过卷积核参数构建特征滤波器,进而可以借助特征滤波器完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了输出的标注图像含有无关信息以及背景信息,提高标注的准确性,实现了对未知图像的水域区域自动标注,大大地提高标注效率,减少了人工标注的工作量,同时减少人工成本。
在另一些实施例中,还可以包括:将原始图像按预设数量比例构建测试数据集;将测试数据集输入至对象成像网络中,输出第二目标标注图像;对第二目标标注图像进行偏移误差验证。
示例性地,测试数据集可以由原始图像按7:3的比例随机划分为训练数据集和测试数据集,可以理解的是,测试数据集中的测试图像均为含有水域的图像。其中,预设数量比例可以根据实际情况进行调整,本申请实施例对此不作限制。
其中,第二目标标注图像为测试数据集经过对象成像网络自动标注之后输出的目标标注图像,可以理解的是,第二目标标注图像包含有测试数据集中的测试图像原本含有的水域内部信息和水域边缘信息。
其中,偏移误差验证主要为验证原始图像对应的中心点经纬度坐标和对象成像网络中自动标注输出的目标标注图像经过重构的水域边缘经纬度坐标之间的偏移误差。
在一些具体实施例中,对第二目标标注图像进行偏移误差验证,可以包括:提取第二目标标注图像中水域边缘对应的目标边缘点像素坐标;根据目标边缘点像素坐标,重构目标边缘点像素坐标对应的目标边缘经纬度坐标;将目标边缘经纬度坐标与测试数据集中的测试图像对应的原始中心经纬度坐标进行偏移误差计算,得出偏移误差结果。
其中,目标边缘点像素坐标为第二目标标注图像中水域边缘对应的边缘点像素坐标,可以用于与水域边缘的经纬度坐标对应计算,重构出第二目标标注图像对应的目标边缘经纬度坐标。
示例性地,选取测试数据集中的水池样本(包含水域的测试图像),输入至对象成像网络中,通过对象成像网络进行自动标注,对标注后的图像选取连通图(连通图指图像中由若干个连续的像素点组成的区域)进行边缘提取,从而获得水池样本中水域边缘的像素坐标数据,并将该像素坐标数据存入预先设置好的“txt”文件(计算机中的纯文本文件)中,请参阅图5,图5是本申请实施例提供的一种水域连通图,如图5所示,图5为标注后的图像对应的水域连通图,其中,由图5可知,该水域连通图的质心坐标为(x,y):(688,419);请参阅图6,图6是本申请实施例提供的一种水域边缘像素坐标数据示意图,如图6所示,图6中的数据对应为图5连通图中水域边缘的像素坐标,图6提取有图5连通图中的“质心坐标(x,y):(688,419)”数据,图6中“pointcoll”下方输出的第1行至第12行对应的像素坐标数据为图5连通图中标注的1至12的点位置对应的水域边缘像素坐标,即测试图像经过对象成像网络获取到的标注图像对应的水域边缘的像素坐标。在得到经过对象成像网络获取到的标注图像对应的水域边缘的像素坐标数据之后,通过地图软件的像素坐标与经纬度坐标转化API接口将获取到的水域边缘像素坐标数据转化成对应的水域边缘经纬度坐标数据,接着将得到的水域边缘经纬度坐标数据与测试数据集中的测试图像对应的原始中心经纬度坐标进行偏移误差计算,得出偏移误差结果。
其中,原始中心经纬度坐标也可以称为原始中心点经纬度坐标,需要指出的是,此处的中心或中心点并非特指整个图像的中心,而是指图像中某个选定位置的中心或中心点,可以理解的是,本领域技术人员可以根据实际情况进行定义,本申请实施例对此不作限制。示例性地,首先可以通过地图软件的经纬度API接口获取水池边缘一个位置的经纬度坐标(此时原始中心经纬度坐标表示为水域边缘的点位置中心对应的经纬度坐标),接着将这个水池图像输入至对象成像网络中得到标注图像,从标注图像中提取水池图像边缘对应的像素坐标,并将该水池图像边缘的像素坐标进行转化重构出对应的水池图像边缘的经纬度坐标,此时,可以将重构的水池图像边缘的经纬度坐标与初始获取的水池边缘一个位置的经纬度坐标(原始中心经纬度坐标)进行比较,得出经水池图像标注前后的经纬度误差结果。
需要说明的是,在实际的应用中,水域边缘的像素坐标数据可能远不止上述图6中列举的数据,可以理解的是,图6中的示例仅为简单的示例,本申请实施例对此不作限制。
在重构图像中水域边缘经纬度坐标的过程中,假设给定一个池塘图像,首先,可以通过地图软件的API接口,进行鼠标交互即可获取池塘图像边缘的初始经纬度,并且选取一个基准点,可以取地图软件左上角为基准点(0,0),右下角坐标则为(255,255),在确定了基准点之后,获取像素坐标和经纬度的映射,根据此基准点,对对象成像网络处理过后的标注图像边缘进行部分点取坐标处理,得到标注图像边缘的像素坐标数据,并将该像素坐标数据存储于“txt”文件,特别地,对于变化较大的边缘,拥有更多的信息,因此需要选取更多的点;最后通过像素坐标和经纬度的映射关系,借助地图软件API接口,可以根据“txt”文件中标注图像边缘的像素坐标数据重构池塘边缘经纬度坐标。
在对象成像网络训练完成之后,不仅包括对对象成像网络的偏移误差验证,还包括对对象成像网络的分割精度进行评估、以及对对象成像网络进行处理速度的测试。
如上所述,在本申请实施例中,根据数据集命名规律构建数据集加载模块,同时作为端到端的训练任务,不同于二值标签的二分类。本申请实施例需要修改网络输出层,以适应标签的形式,以U-Net网络为例,具体地,本申请实施例构建的标签图像是RGB(RGB colormode RGB色彩模式)三通道的,并且作为端到端的回归任务,需要去掉U-Net网络中输出层中的激活函数,在去掉U-Net网络中输出层中的激活函数的基础上,再加上一个全连接层,将全连接层的输出通道修改为3,以适应标签的形式,优化器使用Adam(Adaptive MomentEstimation 自适应学习率的优化算法),训练损失函数(loss)至逐渐平缓收敛。请参阅图7至图14,图7是本申请实施例提供的一种对象成像网络测试前的第一输入示意图,图8是本申请实施例提供的一种对象成像网络测试后的第一输出示意图,图9是本申请实施例提供的一种对象成像网络测试前的第二输入示意图,图10是本申请实施例提供的一种对象成像网络测试前的第二输出示意图,图11是本申请实施例提供的一种对象成像网络测试前的第三输入示意图,图12是本申请实施例提供的一种对象成像网络测试后的第三输出示意图,图13是本申请实施例提供的一种对象成像网络测试前的第四输入示意图,图14是本申请实施例提供的一种对象成像网络测试前的第四输出示意图。其中,图7至图14中,输入示意图为原图,输出示意图为标注后的图,图7和图8相对应,图9和图10相对应,图11和图12相对应,图13和图14相对应,图7至图14为本申请实施例通过测试数据集对对象成像网络进行分割精度的评估数据,由图7至图14可以看出,尽管水域和草丛接触边缘有较复杂形状,本申请实施例中训练的对象成像网络依然可以完整地保留水域边缘形状,并且在有很多类似水体物质(如草丛、树影)的干扰下,依然可以精确提取到水体的全部特征,基本不会误识别。
为了方便使用,提供了一个可视化软件界面,通过调用自动标注接口,可以直接输入水域的卫星图像得到水域边缘的经纬度坐标。
在本申请实施例中,还提供了一种水域标注软件,请参阅图15,图15是本申请实施例提供的一种水域标注软件的初始界面示意图;如图15所示,界面由菜单栏、操作按钮栏和图片显示栏构成。菜单栏包括模式切换和退出,模式切换可以选择单张图片处理或者文件夹处理,通过选项可以实时切换工作模式,软件打开默认是单张图片处理;操作按钮栏包括“选择图片”、“开始自动标注”和“保存边缘点经纬度”,根据工作模式的不同选择,上传图片可以上传单张图片或文件夹,保存输出结果也可以保存单张图片或文件夹。
在具体实现中,请参阅图16,图16是本申请实施例提供的一种水域标注软件的处理界面示意图;如图16所示,首先点击“选择图片”,从文件管理器中选择图片显示在下图左框(选择图片按钮的下方方框),输入中心点经纬度坐标(中间栏),点击“开始自动标注”按钮,软件执行自动打标程序,中间栏会显示打标进度(如进度条所示)和检测到的水域个数,检测完成后,根据检测到的边缘点经纬度在地图中定位,并在水域上画出边缘点以显示标注效果,最后点击“保存边缘点经纬度”,从文件管理器中选择文件夹保存为“txt”文件。其中,此时在水域标注软件检测后得到的边缘点经纬度为已经经过像素坐标转化得到的经纬度,即重构后的边缘点经纬度,并且,在得到重构后的边缘点经纬度之后,将该重构后的边缘点经纬度保存于“txt”文件中,用于与边缘点原始经纬度进行比较。
需要说明的是,在本申请实施例中,为了便于整理或区分,用于存储重构后的边缘点经纬度的“txt”文件和用于存储边缘点像素数据的“txt”文件不同。可以理解的是,本领域技术人员可以将标注后的图像的边缘点像素坐标数据和边缘点经纬度数据分别存放于不同的“txt”文件中,但若需要将标注后的图像的边缘点像素坐标数据和边缘点经纬度数据均放置在一个“txt”文件中,在做好区分等情况下,可以将二者对应的数据存储于一个“txt”文件,本领域技术人员可以根据实际情况进行调整,本申请实施例对此不作限制。
在对对象成像网络进行处理速度的测试的部分,主要为测试对象成像网络的标注处理速度,在本申请实施例中,将上述水域标注软件部署在双核CPU(Central ProcessingUnit 中心处理器)电脑上进行测试。
需要说明的是,对于电脑的CPU核心,本申请实施例的示例中是将水域标注软件部署在双核CPU,但本领域技术人员可以根据实际情况选择CPU核心,本申请实施例对此不作限制。
在具体实现中,对象成像方法通过神经网络模型训练,获取含有感兴趣对象特征的卷积核参数,通过卷积核参数构建特征滤波器,借助特征滤波器完成对复杂图像中特定图像进行筛选与提取,即感兴趣对象的识别,避免了成像时图像含有无关信息以及背景信息,通过改变网络输入输出映射关系,仅需较少的训练样本,就可以自动对新样本进行标注,处理速度快,分割效果好,并且不会产生较大偏移影响。
为详细解释本发明技术方案的原理,下面结合一些具体实施例对本发明的整体流程进行说明,容易理解的是,下述为对本发明技术原理的解释,不能看作对本发明的限制。
请参阅图17,图17是本申请实施例提供的一种对象成像网络的训练测试结构示意图;如图17所示,本申请实施例包括对象成像网络的训练阶段和测试评估阶段,在测试阶段中,首先需要构建数据集,接着根据数据集制作对象成像标签,再将数据集和对象成像标签输入至目标神经网络进行训练,得到对象成像网络,同时,获取包含目标水域特征的卷积核参数,根据该卷积核参数构建特征滤波器,从而完成对对象成像网络的训练。在训练完成对象成像网络之后,包括对对象成像网络进行自动标注测试(分割精度的评估)、标准误差分析(偏移误差验证)和处理速度测试三个部分,对于自动标注测试、标准误差分析和处理速度测试的具体实现方式,请参阅上述示例,本申请实施例在此不作赘述。
在具体实现中,请参阅图18,图18是本申请实施例提供的一种对象成像网络的验证流程示意图,首先,原始图像可以通过目前相关地图软件的截图API接口在同一地图层级下截取,在同一地图层级下截取图像可以保证图像的像素坐标和经纬度坐标的对应计算,在获取原始图像的同时保存原始图像对应的原始中心经纬度坐标,原始中心经纬度坐标可以通过地图软件公开的经纬度坐标API接口进行获取,即通过地图软件的API接口可以获取到水域的卫星图片(原始图像)和中心点经纬度坐标(原始图像的中心点经纬度坐标),然后将原始图像按预设数量比例构建训练数据集,对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,接着将训练数据集(图18中直接描述为数据集)和标签数据集(图18中描述为对象成像标签)输入至目标神经网络进行训练得到对象成像网络(图18中描述为基于对象成像的自动标注网络),其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征,进而可以根据卷积核参数构建对象成像网络中的特征滤波器,最后将包含水域的待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对待标注图像进行自动标注,输出自动标注结果,在输出自动标注结果之后,获取自动标注结果的边缘点像素坐标,并将获得的边缘像素坐标存入“txt”文件中,通过边缘点像素坐标和边缘点经纬度坐标的映射关系,借助地图软件的像素坐标与经纬度坐标转化API接口,可以从对象成像网络处理过后的图像边缘像素坐标“txt”文件重构水域边缘经纬度坐标,最后将重构后的水域边缘经纬度坐标和原始中心点经纬度坐标进行偏移误差分析,得到偏移误差结果。
在本申请实施例中,通过获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;然后对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;接着将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;进而根据卷积核参数,构建对象成像网络中的特征滤波器;最后将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像。本申请实施例通过对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,再将标签数据集和训练数据集输入至目标神经网络中训练,有助于目标神经网络学习到更准确的特征,提高后续图像标注的准确性,并且,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即能够获取感兴趣对象特征的卷积核参数,接着可以通过卷积核参数构建特征滤波器,进而可以借助特征滤波器完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了输出的标注图像含有无关信息以及背景信息,提高标注的准确性,实现了对未知图像的水域区域自动标注,大大地提高标注效率,减少了人工标注的工作量,同时减少人工成本。
另外,通过测试数据集对对象成像网络进行分割精度评估、偏移误差验证以及处理速度测试的测试操作,验证了本申请实施例中所提供的基于对象成像网络的水域标注方法分割效果好、处理速度快,并且不会产生较大偏移影响的优点。
在另一些实施例中,还可以包括:将包含水域的第二待标注图像输入至对象成像网络中,确定第二待标注图像中水域对应的连通体数量;根据连通体数量,确定所述第二待标注图像中水域的水体类型;若水体类型为多水体类型,则将第二待标注图像进行分片处理,得到若干分片图像;将各个分片图像分别输入至对象成像网络,输出各个分片图像对应的第三标注图像;将各个第三标注图像进行拼接,得到多水体标注结果。
其中,第二待标注图像为包含水域的待标注图像。对于连通体数量,其可以理解为在同一水体区域内,相邻像素点连接形成的连续区域。其中,水体类型可以为单水体类型或多水体类型,多水体类型可以理解为图像中存在多个相互独立的水体区域,单水体类型可以理解为是图像中存在的单个、连续的水体区域。
对于分片图像,其为对待标注图像进行分片处理后得到的图像,多个分片图像可以组合成原始的待标注图像。示例性地,假设需要对原始的待标注图像进行四等份的分片处理,在经过分片处理之后,则可以得到四个分片图像,这四个分片图像在进行整合拼接之后可以得到原始的待标注图像。
其中,第三标注图像在此处的意思为各个分片图像对应的第三标注图像,即第三标注图像的数量为多个,分别对应各个分片图像。
其中,多水体标注结果,即为各个分片图像对应的第三标注图像进行拼接后得到的多水体最终标注图像。
需要说明的是,上述由单水体构建的对象成像网络对多水体具有一定的识别能力,但可能会有覆盖面积不完全的情况,为此,本申请实施例采取分片处理方法对多水体进行识别处理。
在具体实现中,由于单水体训练的对象成像网络对多水体具有一定的识别能力,其至少可以确定水体数量,因此可以通过单水体训练的对象成像网络判断待标注图像的连通体数量n,具体地,请参阅图19,图19是本申请实施例提供的一种识别多水体的流程示意图;如图19所示,首先将待标注的水体图片输入至对象成像网络,然后通过对象成像网络判断待标注的水体图片的连通体数量n,其中,在本申请实施例中,判断连通体数量n采用区域生长算法,区域生长算法是将图像中所有种子附近的像素按照相似度和似然性进行合并、归类的二值化过程,区域生长算法的生长准则包括四邻域和八邻域两种。除了生长准则外,图像中种子点的位置与个数也与分类结果紧密相关。关于种子点的选择方式也有两种,分别是手动选点和自动选点。鉴于本申请实施例的数据量与分割精度,采用八邻域和自动选点方式。若对象成像网络检测到输入的水体图片为多水体类型(n>1),将输入的水体图片按横纵中线分成4个分片图像(请参阅图20,图20是本申请实施例提供的一种多水体输入对象成像网络的输入示意图),整体像素变为原图(输入的水体图片)的1/4,由于在训练网络时图像输入本身有一个下采样的过程,因此由分片处理导致的像素值减少不会影响网络处理结果;接着,将4张分片图片分别输入自对象成像网络中,由对象成像网络输出4个分片图像对应的4个标注图像,最后对对象成像网络输出4个分片图像对应的4个标注图像进行拼接处理,得到多水体输出结果,经测试效果良好,请参阅图21,图21是本申请实施例提供的一种对象成像网络输出多水体结果的输出示意图;如图21所示,图21输出的多水体标注结果包含了图7所示的输入图像的水域内部信息和水域边缘信息。另外,若对象成像网络检测到输入的水体图片为单水体类型(n=1),则可以由对象成像网络直接进行自动标注,得到单水体输出结果,具体实施方式可以参照上述基于对象成像网络的水域标注方法的具体实施方案,本申请实施例在此不作赘述。
需要说明的是,对于区域生长算法,本领域技术人员可以参照相关技术中的实现方式,本申请实施例在此不作赘述。
在具体实现中,首先将包含水域的第二待标注图像输入至对象成像网络中确定第二待标注图像中水域对应的连通体数量,然后根据连通体数量确定第二待标注图像中水域的水体类型,若水体类型为多水体类型,则将第二待标注图像进行分片处理得到若干分片图像,接着将各个分片图像分别输入至对象成像网络,输出各个分片图像对应的第三标注图像,最后将各个第三标注图像进行拼接得到多水体标注结果;若水体类型为单水体类型,则可以对第二待标注图像直接进行标注,输出单水体标注结果。本申请实施例通过单水体训练的对象成像网络判断输入图像的连通体数量,然后根据连通体数量确定水体类型,这种方法能够更准确地识别和标注多水体图像,对于多水体图像,本申请实施例采用分片处理策略,将大图像分解为小分片,然后对每个分片进行单独处理,可以很好分割出所有的多水体,降低了计算复杂度,提高了处理速度。
在本申请实施例中,通过获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;然后对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;接着将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;进而根据卷积核参数,构建对象成像网络中的特征滤波器;最后将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像。本申请实施例通过对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,再将标签数据集和训练数据集输入至目标神经网络中训练,有助于目标神经网络学习到更准确的特征,提高后续图像标注的准确性,并且,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即能够获取感兴趣对象特征的卷积核参数,接着可以通过卷积核参数构建特征滤波器,进而可以借助特征滤波器完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了输出的标注图像含有无关信息以及背景信息,提高标注的准确性,实现了对未知图像的水域区域自动标注,大大地提高标注效率,减少了人工标注的工作量,同时减少人工成本。
可以理解的是,基于对象成像的危险水域自动标注方法无需复杂的遥感设备,仅通过地图软件API接口即可获取数据,然后构建数据集,进而制作特有的对象成像标签,并用对象成像网络训练得到特征滤波器进行测试,初步结果表明,仅用少量的数据进行训练,可以在测试集上达到很好的分割效果,并且在处理速度上,超越人工标注速度。并且,在后续的偏移误差验证中,由该自动标注方法标注的危险水域,可以通过水域边缘重构得到水域边缘经纬度坐标,进而可以将重构得到水域边缘经纬度坐标和原始经纬度坐标相比较,得出偏移误差结果。还有的是,为了方便使用,本申请实施例提供了一个可视化软件界面,通过调用自动标注接口,可以直接输入水域的卫星图像得到水域边缘的经纬度坐标。
此外,区别于其他的水体标注方法,本申请实施例的训练数据只使用单水体卫星图片,避免多水体需要的巨大标注成本,经测试,仅由单水体数据训练得到的对象成像网络还具有一定多水体识别能力,若对象成像网络确定输入图像为多水体图像时,则将多水体图像进行分片处理得到若干分片图像,在经过分片处理后,可以很好分割出所有的多水体,接着将各个分片图像分别输入至对象成像网络,输出各个分片图像对应的标注图像,最后将各个标注图像进行拼接得到多水体标注结果。通过采用分片处理策略,将大图像分解为小分片,然后对每个分片进行单独处理,可以很好分割出所有的多水体,降低了计算复杂度,提高了处理速度。
请参阅图22,本申请实施例还提供基于对象成像网络的水域标注装置2200,可以实现上述基于对象成像网络的水域标注方法,该装置包括:
训练数据集构建模块2201,用于获取若干包含水域的原始图像,并将所述原始图像按预设数量比例构建训练数据集;
标签数据集获取模块2202,用于对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;
对象成像网络训练模块2203,用于将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,所述对象成像网络包含卷积核参数,所述卷积核参数包含目标水域特征;
特征滤波器构建模块2204,用于根据所述卷积核参数,构建所述对象成像网络中的特征滤波器;
图像标注模块2205,用于将包含水域的第一待标注图像输入至所述对象成像网络中,通过所述对象成像网络中的特征滤波器对所述第一待标注图像进行自动标注,输出第一目标标注图像。
可以理解的是,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
本申请实施例还提供了一种电子设备,电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述基于对象成像网络的水域标注方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。
可以理解的是,上述方法实施例中的内容均适用于本设备实施例中,本设备实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
请参阅图23,图23示意了另一实施例的电子设备的硬件结构,电子设备包括:
处理器2301,可以采用通用的CPU(CentralProcessingUnit,中央处理器)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请实施例所提供的技术方案;
存储器2302,可以采用只读存储器(ReadOnlyMemory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(RandomAccessMemory,RAM)等形式实现。存储器2302可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器2302中,并由处理器2301来调用执行本申请实施例的基于对象成像网络的水域标注方法;
输入/输出接口2303,用于实现信息输入及输出;
通信接口2304,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;
总线2305,在设备的各个组件(例如处理器2301、存储器2302、输入/输出接口2303和通信接口2304)之间传输信息;
其中处理器2301、存储器2302、输入/输出接口2303和通信接口2304通过总线2305实现彼此之间在设备内部的通信连接。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述基于对象成像网络的水域标注方法。
可以理解的是,上述方法实施例中的内容均适用于本存储介质实施例中,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例提供的基于对象成像网络的水域标注方法、基于对象成像网络的水域标注装置和电子设备,其通过获取若干包含水域的原始图像,并将原始图像按预设数量比例构建训练数据集;然后对训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;接着将训练数据集和标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,对象成像网络包含卷积核参数,卷积核参数包含目标水域特征;进而根据卷积核参数,构建对象成像网络中的特征滤波器;最后将包含水域的第一待标注图像输入至对象成像网络中,通过对象成像网络中的特征滤波器对第一待标注图像进行自动标注,输出第一目标标注图像。本申请实施例通过对训练数据集中的各个训练图像进行分割标注处理得到标签数据集,再将标签数据集和训练数据集输入至目标神经网络中训练,有助于目标神经网络学习到更准确的特征,提高后续图像标注的准确性,并且,在对象成像网络的训练过程中,能够获取含有目标水域特征的卷积核参数,即能够获取感兴趣对象特征的卷积核参数,接着可以通过卷积核参数构建特征滤波器,进而可以借助特征滤波器完成对复杂图像中特定图像的筛选与提取,即对感兴趣对象的识别,避免了输出的标注图像含有无关信息以及背景信息,提高标注的准确性,实现了对未知图像的水域区域自动标注,大大地提高标注效率,减少了人工标注的工作量,同时减少人工成本。
本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本申请实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上参照附图说明了本申请实施例的优选实施例,并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本申请实施例的权利范围之内。

Claims (10)

1.基于对象成像网络的水域标注方法,其特征在于,所述方法包括:
获取若干包含水域的原始图像,并将所述原始图像按预设数量比例构建训练数据集;
对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;
将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,所述对象成像网络包含卷积核参数,所述卷积核参数包含目标水域特征;
根据所述卷积核参数,构建所述对象成像网络中的特征滤波器;
将包含水域的第一待标注图像输入至所述对象成像网络中,通过所述对象成像网络中的特征滤波器对所述第一待标注图像进行自动标注,输出第一目标标注图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集,包括:
按预设标注规则对所述训练数据集中的各个训练图像进行分割标注处理,得到若干保留有所述训练图像中水域对应的水域内部信息和水域边缘信息的标签图像;
根据各个所述标签图像构建标签数据集。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述原始图像中水域对应的原始中心经纬度坐标。
4.根据权利要求1所述的方法,其特征在于,在所述将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络之前,所述方法还包括:
对初始神经网络中的网络输出层进行修改,得到目标神经网络。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述原始图像按预设数量比例构建测试数据集;
将所述测试数据集输入至所述对象成像网络中,输出第二目标标注图像;
对所述第二目标标注图像进行偏移误差验证。
6.根据权利要求5所述的方法,其特征在于,所述对所述第二目标标注图像进行偏移误差验证,包括:
提取所述第二目标标注图像中水域边缘对应的目标边缘点像素坐标;
根据所述目标边缘点像素坐标,重构所述目标边缘点像素坐标对应的目标边缘经纬度坐标;
将所述目标边缘经纬度坐标与所述测试数据集中的测试图像对应的原始中心经纬度坐标进行偏移误差计算,得出偏移误差结果。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将包含水域的第二待标注图像输入至所述对象成像网络中,确定所述第二待标注图像中水域对应的连通体数量;
根据所述连通体数量,确定所述第二待标注图像中水域的水体类型;
若所述水体类型为多水体类型,则将所述第二待标注图像进行分片处理,得到若干分片图像;
将各个所述分片图像分别输入至所述对象成像网络,输出各个所述分片图像对应的第三标注图像;
将各个所述第三标注图像进行拼接,得到多水体标注结果。
8.基于对象成像网络的水域标注装置,其特征在于,所述装置包括:
训练数据集构建模块,用于获取若干包含水域的原始图像,并将所述原始图像按预设数量比例构建训练数据集;
标签数据集获取模块,用于对所述训练数据集中的各个训练图像进行分割标注处理,得到标签数据集;
对象成像网络训练模块,用于将所述训练数据集和所述标签数据集输入至目标神经网络进行训练,得到对象成像网络;其中,所述对象成像网络包含卷积核参数,所述卷积核参数包含目标水域特征;
特征滤波器构建模块,用于根据所述卷积核参数,构建所述对象成像网络中的特征滤波器;
图像标注模块,用于将包含水域的第一待标注图像输入至所述对象成像网络中,通过所述对象成像网络中的特征滤波器对所述第一待标注图像进行自动标注,输出第一目标标注图像。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。
CN202410289235.0A 2024-03-14 2024-03-14 基于对象成像网络的水域标注方法、装置和电子设备 Active CN117893559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410289235.0A CN117893559B (zh) 2024-03-14 2024-03-14 基于对象成像网络的水域标注方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410289235.0A CN117893559B (zh) 2024-03-14 2024-03-14 基于对象成像网络的水域标注方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN117893559A true CN117893559A (zh) 2024-04-16
CN117893559B CN117893559B (zh) 2024-06-04

Family

ID=90644451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410289235.0A Active CN117893559B (zh) 2024-03-14 2024-03-14 基于对象成像网络的水域标注方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN117893559B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564056A (zh) * 2018-04-25 2018-09-21 中国水利水电科学研究院 一种遥感影像水体识别提取的方法
CN111950618A (zh) * 2020-08-05 2020-11-17 中国建设银行股份有限公司 水域图像数据标注方法、装置、设备和存储介质
KR20210080772A (ko) * 2019-12-23 2021-07-01 한국건설기술연구원 수질데이터의 라벨링과 인공신경망의 학습을 이용한 수질 분석시스템
CN116110045A (zh) * 2022-12-14 2023-05-12 黄伟 一种图像标注方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564056A (zh) * 2018-04-25 2018-09-21 中国水利水电科学研究院 一种遥感影像水体识别提取的方法
KR20210080772A (ko) * 2019-12-23 2021-07-01 한국건설기술연구원 수질데이터의 라벨링과 인공신경망의 학습을 이용한 수질 분석시스템
CN111950618A (zh) * 2020-08-05 2020-11-17 中国建设银行股份有限公司 水域图像数据标注方法、装置、设备和存储介质
CN116110045A (zh) * 2022-12-14 2023-05-12 黄伟 一种图像标注方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TAMBE RISHIKESH G ET AL.: "Deep multi-feature learning architecture for water body segmentation from satellite images", 《JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION》, 31 December 2021 (2021-12-31), pages 1 - 8 *
赵熙 等: "遥感监测信息提取质量控制研究", 《黑龙江科学》, 31 December 2022 (2022-12-31), pages 1 - 6 *

Also Published As

Publication number Publication date
CN117893559B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
CN111986099B (zh) 基于融合残差修正的卷积神经网络的耕地监测方法及系统
Chen et al. Global land cover mapping at 30 m resolution: A POK-based operational approach
Zhang et al. Coastal wetland vegetation classification with a Landsat Thematic Mapper image
Lu et al. Impervious surface mapping with Quickbird imagery
CN109934154B (zh) 一种遥感影像变化检测方法及检测装置
CN112464766B (zh) 一种农田地头自动识别方法及系统
WO2015017366A1 (en) Automatic generation of built-up layers from high resolution satellite image data
WO2015009798A1 (en) Automatic extraction of built-up footprints from high resolution overhead imagery through manipulation of alpha-tree data structures
CN114067219A (zh) 一种基于语义分割与超像素分割融合的农田作物识别方法
CN116091492B (zh) 一种图像变化像素级检测方法与系统
CN115272887A (zh) 基于无人机检测的海岸带垃圾识别方法、装置以及设备
Parajuli et al. Attentional dense convolutional neural network for water body extraction from sentinel-2 images
CN111723814A (zh) 基于跨图像关联的弱监督图像语义分割方法、系统、装置
CN117058367A (zh) 高分辨率遥感影像建筑物语义分割方法及装置
Bouvet et al. Evaluation of large-scale unsupervised classification of New Caledonia reef ecosystems using Landsat 7 ETM+ imagery
Zhang et al. Deep learning for semantic segmentation of coral images in underwater photogrammetry
CN112084865A (zh) 目标检测方法、装置、电子设备和存储介质
CN107680070B (zh) 一种基于原始图像内容的分层权重图像融合方法
Şimşek et al. Land cover classification using Land Parcel Identification System (LPIS) data and open source Eo-Learn library
CN117893559B (zh) 基于对象成像网络的水域标注方法、装置和电子设备
CN116681930A (zh) 遥感图像变化检测及其模型训练方法、设备及存储介质
US20230005261A1 (en) Object detection over water using normalized difference vegetation index system and method
CN115410086A (zh) 一种基于遥感影像的水质反演方法、装置以及设备
CN115439713A (zh) 模型训练方法及装置、图像分割方法、设备、存储介质
CN109460700B (zh) 一种面向作物分类的遥感数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant