CN110781948A - 图像处理方法、装置、设备及存储介质 - Google Patents

图像处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110781948A
CN110781948A CN201911008506.6A CN201911008506A CN110781948A CN 110781948 A CN110781948 A CN 110781948A CN 201911008506 A CN201911008506 A CN 201911008506A CN 110781948 A CN110781948 A CN 110781948A
Authority
CN
China
Prior art keywords
image
neural network
result
target
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911008506.6A
Other languages
English (en)
Inventor
董润敏
李聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN201911008506.6A priority Critical patent/CN110781948A/zh
Publication of CN110781948A publication Critical patent/CN110781948A/zh
Priority to JP2021524146A priority patent/JP2022509030A/ja
Priority to PCT/CN2020/115423 priority patent/WO2021077947A1/zh
Priority to US17/701,812 priority patent/US20220215656A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/17Terrestrial scenes taken from planes or by drones

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)

Abstract

本申请实施例提供一种图像处理方法,其中,所述方法包括:从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;对所述第一目标结果进行调整,得到第二目标结果;根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。

Description

图像处理方法、装置、设备及存储介质
技术领域
本申请实施例涉及机器学习和深度学习领域,涉及但不限于图像处理方法、装置、设备及存储介质。
背景技术
随着农业扩张、城市化、气候变化等对全球粮食安全、生物多样性、水资源、环境污染以及人类健康带来的巨大影响,制作地表覆盖图是非常重要的;在相关技术中,采用传统的网络对高分辨率的图像进行分类的过程中,忽略了图像的细节特征,使得分类结果不够准确;而且对图像处理的算法较为复杂,使得绘制地表覆盖图的效率较低,且得到的地图覆盖图的正确率不高。
发明内容
本申请实施例提供一种图像处理方法、装置、设备及存储介质。
第一方面,本申请实施例提供一种图像处理方法,所述方法包括:
从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;
对所述第一目标结果进行调整,得到第二目标结果;
根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。
在上述方法中,在所述待处理图像为样本图像的情况下,所述样本图像包括至少两组不同时节的子样本图像经拼接后得到的图像。
在上述方法中,所述方法还包括:
根据训练好的第二神经网络,得到所述第一神经网络;其中,所述第二神经网络的复杂度大于所述第一神经网络的复杂度;
所述获取第一目标结果之前,所述方法还包括:
将所述待处理图像作为输入数据,输入所述第一神经网络,经过所述第一神经网络第一卷积层处理后得到第一中间结果;
将经过所述第一神经网络第一卷积层输出的所述第一中间结果与所述待处理图像,作为所述第一神经网络第二卷积层的输入,得到第二中间结果,并将所述第一神经网络上一卷积层输出的所述第二中间结果与所述待处理图像,作为所述第一神经网络下一卷积层的输入,直至得到所述分类结果集合。
在上述方法中,所述根据训练好的第二神经网络,得到所述第一神经网络,包括:
对所述第二神经网络进行裁剪,得到所述第一神经网络。
在上述方法中,所述对所述第二神经网络进行裁剪,得到所述第一神经网络,包括:
确定所述第二神经网络中至少一层的卷积核对应的二范数之和集合;其中,单个卷积核对应的所述二范数之和集合包括:所述单个卷积核的卷积核参数与其他卷积核的卷积核参数之间的二范数之和,所述单个卷积核与所述其他卷积核位于所述第二神经网络的同一层;
确定所述二范数之和集合中小于预设阈值的目标二范数之和;
调整所述目标二范数之和对应的卷积核的卷积核参数,以得到所述第一神经网络。
在上述方法中,从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果,包括:
采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,所述分类结果集合包括多个地表覆盖类别的概率图;
将所述多个地表覆盖类别的概率图中,地表覆盖类别为特定类别的概率图,确定为所述第一目标结果;其中,所述特定类别包括:类别识别度小于识别度阈值的画面内容对应的地表覆盖类别。
在上述方法中,所述采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,包括:
采用所述第一神经网络对所述待处理图像依次进行实例归一化处理和批归一化处理,得到候选图像,并对所述候选图像的画面内容对应的地表覆盖物进行分类,得到多个地表覆盖类别的概率图。
在上述方法中,所述采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,包括:
根据预设地表覆盖类别库中的多个地表覆盖类别,采用所述第一神经网络,确定所述候选图像中各像素点对应的概率集合;其中,单个像素点对应的概率集合,包括所述单个像素点分别为所述多个地表覆盖类别中各地表覆盖类别的概率;
根据所述候选图像中各像素点对应的概率集合,得到多个地表覆盖类别的概率图。
在上述方法中,所述对所述第一目标结果进行调整,得到第二目标结果,包括:
对所述第一目标结果的识别参数进行调整,得到所述第二目标结果,所述第二目标结果的可识别度高于所述第一目标结果的可识别度。
在上述方法中,所述根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果,包括:
根据所述分类结果集合除所述第一目标结果之外的分类结果和所述第二目标结果,确定所述待处理图像的各像素点对应目标分类结果;
根据所述目标分类结果对应的地表覆盖类别,得到所述图像识别结果。
本申请实施例提供一种图像处理装置,所述装置包括:
获取模块,用于从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;
处理模块,用于对所述获取模块获取的所述第一目标结果进行调整,得到第二目标结果;
所述处理模块,还用于根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。
在上述装置中,在所述待处理图像为样本图像的情况下,所述样本图像包括至少两组不同时节的子样本图像经拼接后得到的图像。
在上述装置中,所述处理模块,还用于根据训练好的第二神经网络,得到所述第一神经网络;其中,所述第二神经网络的复杂度大于所述第一神经网络的复杂度;
对应地,所述第一获取模块,还用于将所述待处理图像作为输入数据,输入所述第一神经网络,经过所述第一神经网络第一卷积层处理后得到第一中间结果;将经过所述第一神经网络第一卷积层输出的所述第一中间结果与所述待处理图像,作为所述第一神经网络第二卷积层的输入,得到第二中间结果,并将所述第一神经网络上一卷积层输出的所述第二中间结果与所述待处理图像,作为所述第一神经网络下一卷积层的输入,直至得到所述分类结果集合。
在上述装置中,所述处理模块,包括:
裁剪模块,用于对所述第二神经网络进行裁剪,得到所述第一神经网络。
在上述装置中,所述裁剪模块,包括:
第一确定单元,用于确定所述第二神经网络中至少一层的卷积核对应的二范数之和集合;其中,单个卷积核对应的所述二范数之和集合包括:所述单个卷积核的卷积核参数与其他卷积核的卷积核参数之间的二范数之和,所述单个卷积核与所述其他卷积核位于所述第二神经网络的同一层;
第二确定单元,用于确定所述第一确定单元确定的所述二范数之和集合中小于预设阈值的目标二范数之和;
第一调整单元,用于调整所述第二确定单元确定的所述目标二范数之和对应的卷积核的卷积核参数,以得到所述第一神经网络。
在上述装置中,获取模块,包括:
第一分类子模块,用于采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,所述分类结果集合包括多个地表覆盖类别的概率图;
第一确定子模块,用于将所述第一分类子模块确定的分类结果集合中,地表覆盖类别为特定类别的概率图,确定为所述第一目标结果;其中,所述特定类别包括:类别识别度小于识别度阈值的画面内容对应的地表覆盖类别。
在上述装置中,所述第一分类子模块,还用于采用所述第一神经网络对所述待处理图像依次进行实例归一化处理和批归一化处理,得到候选图像,并对所述候选图像的画面内容对应的地表覆盖物进行分类,得到多个地表覆盖类别的概率图。
在上述装置中,所述第一分类子模块,包括:
第二确定单元,用于根据预设地表覆盖类别库中的多个地表覆盖类别,采用所述第一神经网络,确定所述候选图像中各像素点对应的概率集合;其中,单个像素点对应的概率集合,包括所述单个像素点分别为所述多个地表覆盖类别中各地表覆盖类别的概率;
第三确定单元,用于根据所述第二确定单元得到的概率集合,得到多个地表覆盖类别的概率图。
在上述装置中,所述处理模块,还用于对所述第一目标结果的识别参数进行调整,得到所述第二目标结果,所述第二目标结果的可识别度高于所述第一目标结果的可识别度。
在上述装置中,所述处理模块,包括:
第二确定子模块,用于根据第一分类子模块得到的分类结果集合除所述第一目标结果之外的分类结果和所述第二目标结果,确定所述待处理图像的各像素点对应目标分类结果;
第三确定子模块,用于根据所述第二确定子模块确定的目标分类结果对应的地表覆盖类别,得到所述图像识别结果。
本申请实施例提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现本申请实施例提供的图像处理方法中的步骤。
本申请实施例提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现本申请实施例提供的图像处理方法中的步骤。
本申请实施例提供一种计算机程序,包括计算机可读代码,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于本申请实施例提供的图像处理方法中的指令。
本申请实施例提供一种图像处理方法、装置、设备及存储介质。其中,首先,从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;然后,对所述第一目标结果进行调整,得到第二目标结果;最后,根据所述第二目标结果,或是根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。如此,通过对分类结果集合中部分或全部进行调整,即针对确定出的第一目标结果进行调整,以得到第二目标结果,之后根据所有调整后得到的第二目标结果以及未调整的第一目标结果来得到图像识别结果。其中,可以存在或是不存在未调整的第一目标结果。由于经过调整后得到的第二目标结果相比较于调整前的第一目标结果,具有更高的可识别性,因此,采用本申请实施例提供的实现方式能够使图像识别结果更准确。
附图说明
图1为本申请实施例图像处理方法方法的流程示意图;
图2A为本申请实施例图像处理方法的另一实现流程示意图;
图2B为本申请实施例图像处理方法的又一实现流程示意图;
图3为本申请实施例图像处理方法的再一实现流程示意图;
图4为本申请实施例神经网络的结构示意图;
图5为本申请实施例图像处理装置组成结构示意图;
图6为本申请实施例计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对发明的具体技术方案做进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本公开实施例提供的技术方案可以应用于采用小型的高分辨率网络对待处理图像进行处理。其中,小型的高分辨率网络指的可以是对原始的高分辨率网络(即第二神经网络)进行裁剪,得到的包含卷积核更少的神经网络(即第一神经网络)。在实现过程中,采用第一神经网络对待处理图像进行处理,可以保持待处理图像的高分辨率,并且,由于卷积核的减少,可以简化处理步骤,加速处理过程。
在一中实现方式中,第二神经网络和第一神经网络可以为具有保持输入该网络的待处理图像的分辨率的功能的任意一种神经网络,本公开实施例对此不做限定。
下面将详细说明第一神经网络的应用过程。
该方法应用于计算机设备,在一些实施例中,该方法所实现的功能可以通过计算机设备中的处理器调用程序代码来实现,其中,程序代码可以保存在计算机存储介质中。
本申请实施例提供一种图像处理方法,下面结合图1进行详细描述。
步骤S101,从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果。
待处理图像可以为任意尺寸的包含地表覆盖情况的静态图像、遥感影像或视频帧图像等。待处理图像可以是进行目标检测或识别的图像、进行前背景分割的图像或进行目标跟踪的图像等。
在一种实现方式中,可以基于已训练好的第二神经网络来得到第一神经网络。其中,所述第二神经网络的复杂度大于所述第一神经网络的复杂度。在步骤S101之前,即在所述获取第一目标结果之前,所述方法还包括:将所述待处理图像作为输入数据,输入所述第一神经网络,经过所述第一神经网络第一卷积层处理后得到第一中间结果;将经过所述第一神经网络第一卷积层输出的所述第一中间结果与所述待处理图像,作为所述第一神经网络第二卷积层的输入,得到第二中间结果,并将所述第一神经网络上一卷积层输出的所述第二中间结果与所述待处理图像,作为所述第一神经网络下一卷积层的输入,直至得到所述分类结果集合。也就是说,首先,将所述对待处理图像输入所述第一神经网络,经过所述第一神经网络的第i卷积层处理后,得到输出结果;然后,将所述输出结果和所述待处理图像,输入第i+1卷积层,以得到所述分类结果集合。其中,i为大于等于1的整数;比如,可以通过对第二神经网络进行裁剪的方式,得到第一神经网络。这样,得到的第一神经网络可以同样具备第二神经网络的特性,即第一神经网络与第二神经网络都具有保持输入图像的分辨率的功能。并且,由于第一神经网络是基于第二神经网络进行裁剪后得到的,因此,第二神经网络的复杂度通常会大于第一神经网络的复杂度。
在得到第一神经网络后,可以通过第一神经网络对待处理图像进行处理,得到待处理图像的分类结果集合。
在一种实现方式中,待处理图像可以为样本图像,那么待处理图像可以包括基于同一区域的多时节图像。其中,同一区域的不同时节的图像可以作为子样本图像,采用通道结合的方式进行处理,以将处理后得到的处理结果作为输入第一神经网络模型的样本图像。
比如,可以获取一组子样本图像,这一组子样本图像为同一区域不同时节的图像,之后将这一组子样本图像中各子样本图像包含的像素通道结合,以得到该同一区域对应的样本图像。其中,像素通道结合的方式可以实现为,将各子样本图像进行拼接。其中,用于拼接成样本图像的多个子样本图像的画面内容对应的时节不同。
在一个具体例子中,图像可以是标签图像文件格式(Tag Image File Format,TIFF),每个图像包括4个通道,具体为RGBN,即红(Red)绿(Green)蓝(Blue)和近红外光(Near Infrared,NIR)。第一神经网络的输入图像为两个时节的图像,以夏季图像为例,输入的夏季图像都有与其对应的冬季图像,在夏季图像输入第一神经网络后,将存在对应关系的冬季图像和该夏季图像进行整合,即将两张图像拼接一张图像去处理。比如,夏季图像(夏季图像的4个通道值分别为R1G1B1N1)和对应的冬季图像(冬季图像的4个通道值分别为R2G2B2N2)均有RGBN这4个通道的值。将两张图像拼接起来,指的可以是将两张图像的通道值拼接在一起,即拼接后的图像的通道值为R1G1B1N1 R2G2B2N2,如此,将两个具备4个通道的图像经像素通道结合,得到一个具备8个通道的图像。
需要说明的是,在本申请实施例中,对于实现像素通道结合的图像具备几个通道不予限定,具体的实现方式可以参照上述例举的内容。当然,在实现图像的拼接时,还可以是3个时节甚至更多时节的图像进行拼接,和/或,在实现图像拼接的过程中,具体拼接方式可以包括但不限于上述将通道值拼接在一起的实现方式,在次不予限定。
在样本图像的确定过程中,一组子样本图像为多区域在夏季采集的图像,另一组子样本图像为同样的多区域在冬季采集的图像。这两组子样本图像经通道结合后,可以得到一组多区域对应的样本图像,每一样本图像可以体现夏季和冬季两个时节采集到的子样本图像的内容,具体的通道结合方式可以参考前文的说明,在此不予赘述。
在本申请实施例中,将冬季采集的图像和夏季采集的图像进行通道结合后,作为一组多区域对应的样本图像,由于每一样本图像可以体现夏季和冬季两个时节采集到的子样本图像的内容。这样,由于夏季的样本图像有利于各类植被的识别,冬季的样本图像云覆盖较少,从而在图像处理过程中,有效利用这两个时节对应图像在处理过程中的优势,进而有效地解决了制图过程中夏季的样本图像有云覆盖的情况,以增加网络的鲁棒性。
在本申请实施例中,分类结果集合可以包括多个地表覆盖类别中每个类别对应的分类结果。例如,某个地表覆盖类别对应的分类结果可以包括待处理图像的画面内容属于该地表覆盖类别的概率信息。其中,概率信息可以理解为,类别对应的概率图或者类别对应的置信度图,等等,本公开实施例对此不做限定。
采用第一神经网络对至少两个样本图像进行处理得到的分类结果集合,从分类结果集合中选择第一目标结果。其中,所述至少两个样本图像为不同时节的样本图像,且该样本图像为已标注的样本图像,因此,上述过程可以理解为,采用第一神经网络对已经标注的样本图像进行处理得到分类结果集合,并从中选择第一目标结果;这样,采用已经标注的样本图像作为第一神经网络的输入图像,不需要昂贵且耗时的数据解译过程。而且将两个时节下的样本图像输入第一神经网络以得到分类结果集合,由于夏季的样本图像有利于各类植被的识别,冬季的样本图像云覆盖较少,可以有效解决制图过程中夏季的样本图像有云覆盖的情况,以增加网络的鲁棒性。
步骤S102,对所述第一目标结果进行调整,得到第二目标结果。
在一些可能的实现方式中,可以通过对第一目标结果进行调整来得到第二目标结果。其中,调整方式可以具体实现为对第一目标结果的识别参数进行调整,得到第二目标结果。经调整得到的第二目标结果的可识别度往往高于第一目标结果的可识别度。比如,识别参数可以是对比度等对图像可识别度造成影响的参数。
在一个具体例子中,对第一目标结果的对比度进行调整,得到第二目标结果,比如,对第一目标结果进行直方图均衡化处理,得到第二目标结果;或者,对第一目标结果进行grama变换,得到第二目标结果;或者,对第一目标结果进行聚类处理,得到第二目标结果;或者,对第一目标结果进行自适应灰度直方图均衡化,得到第二目标结果。需要说明的是,得到第二目标结果的实现方式可以包括但不限于上述例举的实现方式,具体可以是单独一种实现方式或是多种实现方式的组合等,在此不予限定。
在一个具体例子中,第一目标结果为特定类别的概率图,对该特定类别的概率图采用直方图均衡化进行处理,对该概率图的对比度进行增强,以得到第二目标结果。比如,特定类别为不透水层类别,那么第一目标结果可以是基于样本图像中每一像素点的类别可能为不透水层类别的概率,形成的概率图,对于该不透水层类别的概率图进行直方图均衡化处理,从而对该概率图中的道路或者建筑物等加强,从而能够更好的识别出不透水层类别。
步骤S103,根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。
图像识别结果包括创建的地表覆盖图,比如,根据分类结果集合中除第一目标结果之外的分类结果和第二目标结果,创建地表覆盖图。通过分类结果集合中除第一目标结果之外的分类结果和所述第二目标结果,确定出每一个地表覆盖类别对应的分类结果的最大值,这样就确定了该样本图像中每一像素点最可能的类别,基于此,创建表明地表覆盖情况的地表覆盖图。在本申请实施例中,根据第二目标结果来得到图像识别结果,可以理解为“除第一目标结果之外的分类结果”的集合为空,即分类结果结合中各分类结果均被确定为第一目标结果,而后采用对所有第一目标结果进行处理后得到的第二目标结果,来实现后续图像识别结果的确定。
需要说明的是,考虑到在实际操作过程中可能对全部第一目标结果进行调整,或是对部分第一目标结果进行调整,因此,在得到图像识别结果的过程中,会基于不同的实现情况来选择相应的实现手段进行处理。即在对全部第一目标结果进行调整的情况下,根据得到的全部第二目标结果得到图像识别结果,或是,在对部分第一目标结果进行调整的情况下,根据得到的全部第二目标结果,以及未用于得到第二目标结果的全部第一目标结果,得到图像识别结果。
在本申请实施例中,可以采用具有保持输入第一神经网络的样本图像的分辨率的功能的第一神经网络,针对已标注的样本图像进行分类,并从分类结果结合中选择出第一目标结果;然后对于第一目标结果的对比度进行调整,以提高该第一目标结果的易识别度,基于调整后的第二目标结果和分类结果集合中的其他分类结果,创建地表覆盖图;这样,通过高分辨率的第一神经网络对待处理图像进行分类,并对目标结果的对比度进行优化,既可以保持待处理图像更多的特征信息,以有利于提高分类结果的准确度,从而提高创建地表覆盖图的准确率。
在一些实施例中,通过对第二神经网络进行裁剪,得到第一神经网络,可以采用如下实现方式:
第一步,确定第二神经网络中至少一层的卷积核对应的二范数之和集合。
单个卷积核对应的二范数之和集合包括:单个卷积核的卷积核参数与其他卷积核的卷积核参数之间的二范数之和,其中,单个卷积核与其他卷积核位于第二神经网络的同一层。比如,确定第二神经网络中第I层的第i个卷积核参数与所述第I层的其他卷积核参数之间的二范数之和;这样分别确定每一个卷积核对应的二范数之和;其中,I和i为大于或等于1的整数,第二神经网络为已经训练好的神经网络,且具有保持输入图像的分辨率的功能,或者可以将第二神经网络理解为是高分辨率网络,即在提取输入的待处理图像的语义信息的同时,还可以保持该待处理图像原始的分辨率,从而为对该待处理图像进行分类提供更多的特征信息,以提高分类的准确度。所述第一神经网络可以是对第二神经网络中的满足条件的卷积核进行删除得到的,第一神经网络和第二神经网络均具有保持输入的待处理图像的分辨率的功能。对具有保持输入图像的分辨率的功能第二神经网络进行裁剪,得到所述第一神经网络,这样,得到的第一神经网络的层数或者卷积核数均小于第二神经网络,即第一神经网络的复杂度小于所述第二神经网络的复杂度。在一些可能的实现方式中,所述第一神经网络包含的卷积核的数量小于所述第二神经网络包含的卷积核的数量,且所述第二神经网络是训练好的神经网络。在一个具体例子中,第二神经网络为包含30个卷积核的网络,第一神经网络为删除第二神经网络中12个卷积核的网络。
第二步,确定二范数之和集合中小于预设阈值的目标二范数之和。
通常情况下,二范数之和集合会包括多个二范数之和,小于预设阈值的目标二范数之和通常为多个。
第三步,调整所述目标二范数之和对应的卷积核的卷积核参数,以得到所述第一神经网络。在一个具体例子中,针对第I层的第i个卷积核,确定第i个卷积核的卷积核参数与其他卷积核的卷积核参数之间的二范数之和小于预设阈值之后,可以将第i个卷积核的卷积核参数设置为0,或者直接删除该第i个卷积核。所述二范数之和小于预设阈值,说明该卷积核与该卷积核同一层中其他卷积核较为相似,所以可以用其他卷积核来替换,因此将该卷积核删除,对第一神经网络的性能影响较小,可忽略不计。
在一些可能的实现方式中,上述第三步,可以通过以下过程实现:首先,将目标二范数之和对应的卷积核参数设置为0,得到参数调整的第二神经网络;其次,采样待处理图像和参数调整的第二神经网络的损失函数继续对参数调整的第二神经网络进行训练;再次,确定训练后的参数调整的第二神经网络中每一卷积核参数,与所述卷积核参数所属层的其他卷积核参数之间的二范数之和,以得到另一二范数之和集合;再次,确定所述另一二范数之和集合中小于预设阈值的另一目标二范数之和;最后,将这些另一目标二范数之和对应的卷积核删除,以得到所述第一神经网络;这样,对于第二神经网路中与其他卷积核比较相似的卷积核进行删除,实现了对第二神经网络的裁剪,得到包含参数更少的第一神经网络,如此,采用包含参数更少的第一神经网络对待处理图像进行处理,能够提高对待处理图像的处理速度。
在一些实施例中,为了提高获取的第一目标结果的准确度,所述步骤S101可以通过以下步骤实现,参见图2A,图2A为本申请实施例图像处理方法的另一实现流程示意图,基于图1的步骤进行以下说明:
步骤S201,采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,所述分类结果集合包括多个地表覆盖类别的概率图。
将所述待处理图像输入第一神经网络,所述第一神经网络对待处理图像中的画面内容进行地表覆盖类别分类,确定画面内容所属的地表覆盖类别可能属于不透水层类别、冰雪类别或耕地类别等中的哪一类。在一个具体例子中,所述步骤S201可以理解为,采用第一神经网络对待处理图像的画面内容所属的地表覆盖类别为不透水层类别、冰雪类别和耕地类别的概率信息,然后得到待处理图像的画面内容所属的地表覆盖类别为不透水层类别的概率图、待处理图像的画面内容所属的地表覆盖类别为冰雪类别的概率图和待处理图像的画面内容所属的地表覆盖类别为耕地类别的概率图。每一个地表覆盖类别的概率图,可以理解为是一个分类结果的中间参数。
步骤S202,将所述多个地表覆盖类别的概率图中,地表覆盖类别为特定类别的概率图,确定为所述第一目标结果。
所述特定类别包括:类别识别度小于识别度阈值的画面内容对应的地表覆盖类别。所述特定类别为识别难度较大的类别,比如,不透水层类别。从多个地表覆盖类别的概率图中,选出地表覆盖类别为不透水层类别的概率图,即第一目标结果。当可以存在未调整的第一目标结果时,在步骤S102和S103中,根据所有调整后得到的第二目标结果以及未调整的第一目标结果来得到图像识别结果,由于经过调整后得到的第二目标结果相比较于调整前的第一目标结果,具有更高的可识别性,从而提高了图像识别结果的准确率。
在一些实施例中,为了提高第一神经网络的迁移性,在步骤S201之前,所述方法还包括以下过程:采用所述第一神经网络对所述待处理图像依次进行实例归一化处理和批归一化处理,得到候选图像,并对所述候选图像的画面内容对应的地表覆盖物进行分类,得到多个地表覆盖类别的概率图。比如,首先,确定所述第一神经网络中第一个具有批归一化功能的批归一化层。确定第一神经网络中第一个对待处理图像进行批归一化处理的批归一化层。然后,将所述批归一化层中的批归一化替换为实例归一化。在一些可能的实现方式中,将批归一化层中的批归一化替换为实例归一化,那么该层即具有了实例归一化的功能,对于输入的待处理图像可进行实例归一化,这样,即使输入的待处理图像与其他待处理图像差距较大,仍然能够对该待处理图像自身的分布进行归一化,从而提高了第一神经网络的迁移性。
在一些可能的实现方式中,所述对所述候选图像的画面内容对应的地表覆盖物进行分类,得到多个地表覆盖类别的概率图,可以通过以下步骤实现:
第一步,根据预设地表覆盖类别库中的多个地表覆盖类别,采用所述第一神经网络,确定所述候选图像中各像素点对应的概率集合。
单个像素点对应的概率集合,包括所述单个像素点分别为所述多个地表覆盖类别中各地表覆盖类别的概率。所述预设地表覆盖类别库可以包括:耕地类、林地类、草地类、灌林地类、湿地类、水体类、苔原类、不透水层类、裸地类和冰雪类这10个类别中的多项,还可以包括除例举的这10个类别以外的其他类别,在此不予限定。
在一个具体例子中,首先,采用所述第一神经网络,确定所述待处理图像的第j个像素点包含的10种地表覆盖类别,为所述预设地表覆盖类别库中的每一预设地表覆盖类别的概率。然后,基于所述每一预设地表覆盖类别的概率,得到所述第j个像素点的概率集合。比如,先是,采用所述替换后的第一神经网络,确定所述待处理图像的第j个像素点包含的地表覆盖类别;j为大于或等于1的整数;然后,确定所述第j个像素点包含的地表覆盖类别为所述预设地表覆盖类别库中的每一预设地表覆盖类别的概率,以得到所述第j个像素点的概率集合。比如,确定第j个像素点包含的地表覆盖类别为上述预设地表覆盖类别库中10个类别中每一个类别的概率,得到一个10维的概率值。
再次,根据所述候选图像中各像素点对应的概率集合,得到多个地表覆盖类别的概率图。
在一些可能的实现方式中,首先,根据所述候选图像中的多个像素点的概率集合中相同类别的概率,生成所述相同类别的概率图。然后,基于每一相同类别的概率图,得到所述多个地表覆盖类别的概率图。从候选图像中的所有像素点的概率集合中选出相同类别的概率,生成该类别的概率图。比如,候选图像中有100个像素点,经过第一神经网络分类处理后,得到每一像素点的地表覆盖类别为预设地表覆盖类别库中每一预设地表覆盖类别的概率,即得到10个概率;然后,从每一个像素点的10个概率中,分别挑出类别为耕地类的概率,得到耕地类别的概率图;接着,从每一个像素点的10个概率中,分别挑出类别为不透水层类的概率,得到不透水层类别的概率图等,以此类推,得到预设地表覆盖类别库中每一地表覆盖类别的概率图。
在一些实施例中,为了提高创建地表覆盖图的准确率,所述步骤S103可以通过以下步骤实现,参见图2B,图2B为本申请实施例图像处理方法的又一实现流程示意图,基于图1所示的步骤进行以下说明:
步骤S221,根据所述分类结果集合除所述第一目标结果之外的分类结果和所述第二目标结果,确定所述待处理图像的各像素点对应目标分类结果。
根据所述分类结果集合除所述第一目标结果之外的分类结果和所述第二目标结果,确定所述待处理图像中每一像素点所属的地表覆盖类别对应的概率的最大值。
在一个具体例子中,地表覆盖类别分为10类,如果所述分类结果集合为多个地表覆盖类别的概率图,第一目标结果为多个地表覆盖类别的概率图中的不透水层类别的概率图;第二目标结果为对不透水层类别的概率图进行区域自适应直方图均衡化得到的;所述步骤S221可以理解为,根据直方图均衡化之后的不透水层类别的概率图和多个地表覆盖类别的概率图中其他9个类别的概率图,确定待处理图像中每一个像素点所属的地表覆盖类别对应的概率最大值,即,如果预设地表覆盖类别库中包含10个类别,那么每一个像素点均对应10个概率(即每一个像素点可能为预设地表覆盖类别库中包含10个类别中每一个类别的概率)。比如,从第i个像素点对应的10个概率中,选择最大的概率值,那么该最大的概率值对应的目标类别即为该第i个像素点最有可能属于的类别;这样,依次确定每一个像素点最有可能属于的目标类别。
步骤S222,根据所述目标分类结果对应的地表覆盖类别,得到所述图像识别结果。
在一个具体例子中,针对第i个像素点,确定该第i个像素点对应的最大概率值对应的目标类别,比如,第i个像素点的10个概率中,冰雪类的概率值最大,说明该像素点最有可能是冰雪类。在一个具体例子中,确定了待处理图像中每一像素点的目标类别,即确定每一个像素点最有可能属于的类别之后,即确定了在该像素点的位置最有可能的地表覆盖类别,这样,在确定了待处理图像中每一像素点的地表覆盖类别的基础上,即可创建地表覆盖图。
在本申请实施例中,首先确定待处理图像中每一个像素点最有可能属于的地表覆盖类别,然后,基于此,创建地表覆盖图,从而提高了创建地表覆盖图的准确度。
采用地表覆盖信息能够分析随着农业扩张、城市化、气候变化等对全球粮食安全、生物多样性、水资源、环境污染以及人类健康带来的巨大影响。但由于卫星影像手动或半手动的地表覆盖解译成本非常昂贵,且耗时久,使得大规模地表覆盖制图成本和周期都非常长。例如,美国东北部切萨皮克湾流域约160000平方公里的标注数据花了10个月和130万美元。而且已公开的地表覆盖数据集也非常有限,难以支持国家尺度甚至全球尺度的地表覆盖制图工作。由于数据标注的限制,在有限的场景下得到的模型的鲁棒性和泛化性都有一定的局限,很难直接应用到大规模场景。由于需要的地表覆盖制图分辨率变高,直接导致卫星影像数据量急剧增加,因此,在高分辨率卫星影像的地表覆盖制图过程中需要更高的效率,势必增加了模型预测的开销。
为解决以上问题,本申请实施例提供一种图像处理方法,首先,使用已标注的样本图像作为数据标签,并筛选其中较高质量的图像用于模型训练,这样,就减少了昂贵且耗时的数据解译过程。然后,针对遥感地表覆盖应用场景,利用高分辨率网络(High-ResolutionNet,HR-Net)提升地表覆盖制图结果。同时使用自适应直方图均衡化,对不透水层中不连续的道路目标预测结果和城区建筑物连成片没有细节的部分,进行优化。最后,使用对模型通道进行剪枝,提高使用复杂模型的地表覆盖制图效率,同时提升结果的准确率。
图3为本申请实施例图像处理方法的再一实现流程示意图,如图3所示,所述方法可以通过以下步骤实现:
第一步,针对样本图像为遥感影像场景下的网络分割和训练。
在一些可能的实现方式中,首先,由于提取遥感影像中的样本图像的语义信息需要高分辨率特征,所以在本申请请实施例中选择高分辨网络(HR-Net),对遥感影像中的样本图像只能够的图像进行语义信息的提取;如图4所示,图4为本申请实施例神经网络的结构示意图,所述高分辨率网络,即第一神经网络401,包括4个阶段,即阶段402至阶段405,其中:
阶段402作为输入端,接收输入的遥感影像中的样本图像,保持输入图像的分辨率,并输出到阶段403。
阶段403中第一层431继续保持输入图像的分辨率,第二层432对输入图像的分辨率进行压缩,将图像的分辨率压缩到原来分辨率的1/2,将第一层431保持的输入图像和压缩的图像输入阶段404。
阶段404中第一层441继续保持输入图像的分辨率,第二层442对阶段403中输入图像的压缩图像的分辨率进行保持,第三层443对阶段403中输入图像的压缩图像再次压缩,将输入图像、阶段403中压缩的图像和第三层443再次压缩的图像输入阶段405。
阶段405中第一层451继续保持输入图像的分辨率,第二层452对阶段403中的压缩图像的分辨率进行保持,第三层453对阶段404中第三层443再次压缩的图像的分辨率进行保持,第三层454对第三层443中再次压缩的图像的分辨率进行第三次压缩,这样对输入图像的分辨率进行多次压缩,能够提取出图像的语义信息;同时保持每一分辨率下的图像,能够保留更多的特征信息(比如,纹理特征,使得分割结果更加精细,还可以辅助深层网络提取特征),从而提高了地表覆盖制图精度。
其次,将遥感影像中两个时像的样本图像(比如,夏季和冬季)作为网络的输入。夏季图像有利于各类植被的识别,冬季图像云覆盖较少,可以有效解决制图中夏季图像有云覆盖的情况,从而增加网络的鲁棒性;如图3所示,将图像301和图像302在数据层进行通道结合,输入高分辨率网络,即初始网络(即第二神经网络)303中,这样将两个时像的图像进行结合,可以使得网络的预测结果更加精准。在本申请实施例中,使用标注的地表覆盖图像作为样本图像的数据标签,可节省昂贵且耗时的数据解译过程。
再次,将网络中第一个BN层替换为IN层,而且针对复杂空间分布数据采用归一化策略,以提高模型的泛化能力。这样将网络中第一个BN层替换为IN层,能够增加网络的迁移性,而且在不同传感器得到的卫星影像上,使用IN对图像进行处理,能够有效地提升预测结果。
最后,增加损失函数中不透水层类别所占的比例;这样,针对比例较少、目标复杂的不透水层类别(如道路和建筑物),增加损失函数中该类别的比例,当不透水层类别的预测结果发生错误时,损失函数会明显变大,通过调整损失函数,可以快速纠正预测结果,从而可以有效地提升该不透水层类别的目标漏检的情况,进而提高训练的效率和精度。
第二步,在复杂的HR-Net上利用几何中位数进行模型剪枝。
在一些可能的实现方式中,将第一步中训练好的HR-Net作为初始网络303,对初始网络303中每个block中的特定的卷积层进行剪枝操作,得到裁剪后的网络(即第一神经网络)304。比如,将每个block中的卷积层中除了不同分辨率结合的前一层,之外的卷积层进行35%至45%比例的剪枝,比如,进行40%比例的剪枝。
首先,确定每一层中每个卷积核与该层其他卷积核的二范数之和,按照从小到大排列,将前40%对应的卷积核参数全部设为0,因为二范数之和越小表示该卷积核与其他卷积核越相似,即该卷积核可以用其他卷积核表示,即使裁剪掉该卷积核也不会对整个网络性能产生太大的影响。
然后,将裁剪后的网络的参数赋给初始网络303,再继续对包含裁剪后的网络的参数的裁剪后的网络304进行训练。比如,初始网络中包含10个参数,首先,先采用初始网络中的10个参数对输入的图像进行处理,并将这10个参数中比较小的4个参数设置为0;然后,采用该包含4个数值为0的10个参数,继续对网络进行训练,训练之后,其中,4个为0的参数得到新的结果(不再为0),继续将训练后的网络中的10个参数中较小的4个参数设定为0。重复上面的步骤。这样依次迭代,最终删除最后一次训练结果中4个为0的参数,得到包含6个参数的网络,保存裁剪后的网络304,实现对初始网络的裁剪,提高了地表覆盖制图的效率。
这样,针对制作大规模的地表覆盖图需要的高效性,通过对参数较多的第二神经网络的卷积核进行剪枝,压缩,从而减少第一神经网络对于样本图像中像素点的类别的预测时间,同时使得单个图形处理器(Graphics Processing Unit,GPU)卡上可以分配多个预测任务,有效地提高了制作大规模的地表覆盖图的效率。
第三步,采用区域自适应直方图均衡化对不透水层类别的概率图进行处理。
在一些可能的实现方式中,如图3所示,对于样本图像301和302经过裁剪后的网络304之后,得到预设地表覆盖类别库中每一类别的概率图,比如,首先,对于地表覆盖类别,设定10个类别,得到预设地表覆盖类别库,那么将输入的样本图像301和302经过裁剪后的网络304后,得到10个类别的概率图,比如,耕地类别的概率图305,其中,对于不透水层类别的概率图306进行区域自适应直方图均衡化处理,得到增强后的概率图307,对于不透水层类别之外的其他类别,比如,对冰雪类别的概率图308不进行处理,基于此,确定这10类别的概率图;然后,根据这10类别的概率图,确定每一像素点的在10个类别的概率中最大的概率,将概率最大的目标类别作为该像素点所属的类别,这样,就得到了每一个像素点所属的目标类别,最后,基于每一个像素点所属的目标类别,创建地表覆盖图309。
针对不透水层这一类别,分析该类别的预测结果的概率图,发现在不同的区域该类别的响应程度不同,比如,在不透水层类别密集的区域(比如,城区)响应偏高,在不透水层类别稀疏的区域(比如,郊区)响应偏低,且与其他类别的响应区分度不够,导致道路目标预测结果不连续、城区建筑物连成片没有细节等。因此,采用局部法对概率结果进行处理,不同区域采用不同的直方图均衡化,以增强响应的区分度,比如,对于大规模高分辨率遥感图像中区域块大小可以设置为512*512,以提高识别不透水层类别的概率,从而能够更加的清晰的识别出不透水层类别。在一个具体例子中,在不透水层类别稀疏的郊区,由于道路周围都是农田,道路目标较窄,所以对于道路的识别是比较困难的,在该道路识别的概率图中,路周围的农田的概率值为0.4,路的概率为0.3,对该概率图进行区域自适应直方图均衡化之后,对于识别为可能是道路的区域进行加强,将道路的概率提升到0.7,周围农田的概率还是0.4,这样,就提高了识别不透水层类别的正确率,而且区域自适应直方图均衡化简单明了、快速有效,不会带来额外的计算开销的负担。
本申请实施例提供一种图像处理装置,图5为本申请实施例图像处理装置组成结构示意图,如图5所示,所述装置500包括:所述装置包括:
获取模块501,用于从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;
处理模块502,用于对所述获取模块获取的所述第一目标结果进行调整,得到第二目标结果;
所述处理模块502,还用于根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。
在上述装置中,在所述待处理图像为样本图像的情况下,所述样本图像包括至少两组不同时节的子样本图像经拼接后得到的图像。
在上述装置中,所述处理模块502,还用于根据训练好的第二神经网络,得到所述第一神经网络;其中,所述第二神经网络的复杂度大于所述第一神经网络的复杂度;对应地,所述获取模块,还用于将所述待处理图像作为输入数据,输入所述第一神经网络,经过所述第一神经网络第一卷积层处理后得到第一中间结果;将经过所述第一神经网络第一卷积层输出的所述第一中间结果与所述待处理图像,作为所述第一神经网络第二卷积层的输入,得到第二中间结果,并将所述第一神经网络上一卷积层输出的所述第二中间结果与所述待处理图像,作为所述第一神经网络下一卷积层的输入,直至得到所述分类结果集合。
在上述装置中,所述处理模块502,包括:
裁剪模块,用于对所述第二神经网络进行裁剪,得到所述第一神经网络。
在上述装置中,所述裁剪模块,包括:
第一确定单元,用于确定所述第二神经网络中至少一层的卷积核对应的二范数之和集合;其中,单个卷积核对应的所述二范数之和集合包括:所述单个卷积核的卷积核参数与其他卷积核的卷积核参数之间的二范数之和,所述单个卷积核与所述其他卷积核位于所述第二神经网络的同一层;
第二确定单元,用于确定所述第一确定单元确定的所述二范数之和集合中小于预设阈值的目标二范数之和;
第一调整单元,用于调整所述第二确定单元确定的所述目标二范数之和对应的卷积核的卷积核参数,以得到所述第一神经网络。
在上述装置中,获取模块501,包括:
第一分类子模块,用于采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,所述分类结果集合包括多个地表覆盖类别的概率图;
第一确定子模块,用于将所述第第一分类子模块确定的分类结果集合中,地表覆盖类别为特定类别的概率图,确定为所述第一目标结果;其中,所述特定类别包括:类别识别度小于识别度阈值的画面内容对应的地表覆盖类别。
在上述装置中,所述第一分类子模块,还用于采用所述第一神经网络对所述待处理图像依次进行实例归一化处理和批归一化处理,得到候选图像,并对所述候选图像的画面内容对应的地表覆盖物进行分类,得到多个地表覆盖类别的概率图。
在上述装置中,所述第一分类子模块,包括:
第二确定单元,用于根据预设地表覆盖类别库中的多个地表覆盖类别,采用所述第一神经网络,确定所述候选图像中各像素点对应的概率集合;其中,单个像素点对应的概率集合,包括所述单个像素点分别为所述多个地表覆盖类别中各地表覆盖类别的概率;
第三确定单元,用于根据所述第二确定单元得到的概率集合,得到多个地表覆盖类别的概率图。
在上述装置中,所述处理模块502,还用于对所述第一目标结果的识别参数进行调整,得到所述第二目标结果,所述第二目标结果的可识别度高于所述第一目标结果的可识别度。
在上述装置中,所述处理模块502,包括:
第二确定子模块,用于根据第一分类子模块得到的分类结果集合除所述第一目标结果之外的分类结果和所述第二目标结果,确定所述待处理图像的各像素点对应目标分类结果;
第三确定子模块,用于根据所述第二确定子模块确定的目标分类结果对应的地表覆盖类别,得到所述图像识别结果。
需要说明的是,以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的图像处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是终端、服务器等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例再提供一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,该计算机可执行指令用于实现本申请实施例提供的图像处理方法中的步骤。
相应的,本申请实施例再提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令用于实现上述实施例提供的图像处理方法的步骤。
本申请实施例再提供一种计算机程序,包括计算机可读代码,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现上述所述图像处理方法的指令。
相应的,本申请实施例提供一种计算机设备,图6为本申请实施例计算机设备的结构示意图,如图6所示,所述设备600包括:一个处理器601、至少一个通信接口602和存储器603。其中,通信接口602配置为实现这些组件之间的连接通信。其中,通信接口602可以包括标准的有线接口和无线接口。其中,所述处理器601,配置为执行存储器中图像处理程序,以实现上述实施例提供的图像处理方法的步骤。
以上计算机设备和存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明计算机设备和存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本申请实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种图像处理方法,其特征在于,所述方法包括:
从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;
对所述第一目标结果进行调整,得到第二目标结果;
根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。
2.根据权利要求1所述的方法,其特征在于,在所述待处理图像为样本图像的情况下,所述样本图像包括至少两组不同时节的子样本图像经拼接后得到的图像。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据训练好的第二神经网络,得到所述第一神经网络;其中,所述第二神经网络的复杂度大于所述第一神经网络的复杂度;
所述获取第一目标结果之前,所述方法还包括:
将所述待处理图像作为输入数据,输入所述第一神经网络,经过所述第一神经网络第一卷积层处理后得到第一中间结果;
将经过所述第一神经网络第一卷积层输出的所述第一中间结果与所述待处理图像,作为所述第一神经网络第二卷积层的输入,得到第二中间结果,并将所述第一神经网络上一卷积层输出的所述第二中间结果与所述待处理图像,作为所述第一神经网络下一卷积层的输入,直至得到所述分类结果集合。
4.根据权利要求3所述的方法,其特征在于,所述根据训练好的第二神经网络,得到所述第一神经网络,包括:
对所述第二神经网络进行裁剪,得到所述第一神经网络。
5.根据权利要求1至4任一项所述的方法,其特征在于,从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果,包括:
采用所述第一神经网络对所述待处理图像中的地表覆盖物进行分类,得到所述分类结果集合,所述分类结果集合包括多个地表覆盖类别的概率图;
将所述多个地表覆盖类别的概率图中,地表覆盖类别为特定类别的概率图,确定为所述第一目标结果;其中,所述特定类别包括:类别识别度小于识别度阈值的画面内容对应的地表覆盖类别。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述对所述第一目标结果进行调整,得到第二目标结果,包括:
对所述第一目标结果的识别参数进行调整,得到所述第二目标结果,所述第二目标结果的可识别度高于所述第一目标结果的可识别度。
7.一种图像处理装置,其特征在于,所述装置包括:
获取模块,用于从第一神经网络对待处理图像进行处理得到的分类结果集合中,获取第一目标结果;所述分类结果集合包括多个地表覆盖类别中每个类别对应的分类结果;
处理模块,用于对所述获取模块获取的所述第一目标结果进行调整,得到第二目标结果;
所述处理模块,还用于根据所述分类结果集合中除所述第一目标结果之外的分类结果和所述第二目标结果,得到图像识别结果。
8.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现权利要求1至6任一项所述的方法步骤。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现权利要求1至6任一项所述的方法步骤。
10.一种计算机程序,包括计算机可读代码,其特征在于,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现权利要求1至6任一项所述图像处理方法的指令。
CN201911008506.6A 2019-10-22 2019-10-22 图像处理方法、装置、设备及存储介质 Pending CN110781948A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201911008506.6A CN110781948A (zh) 2019-10-22 2019-10-22 图像处理方法、装置、设备及存储介质
JP2021524146A JP2022509030A (ja) 2019-10-22 2020-09-15 画像処理方法、装置、機器及び記憶媒体
PCT/CN2020/115423 WO2021077947A1 (zh) 2019-10-22 2020-09-15 图像处理方法、装置、设备及存储介质
US17/701,812 US20220215656A1 (en) 2019-10-22 2022-03-23 Method, apparatus, device for image processing, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911008506.6A CN110781948A (zh) 2019-10-22 2019-10-22 图像处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110781948A true CN110781948A (zh) 2020-02-11

Family

ID=69386343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911008506.6A Pending CN110781948A (zh) 2019-10-22 2019-10-22 图像处理方法、装置、设备及存储介质

Country Status (4)

Country Link
US (1) US20220215656A1 (zh)
JP (1) JP2022509030A (zh)
CN (1) CN110781948A (zh)
WO (1) WO2021077947A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414993A (zh) * 2020-03-03 2020-07-14 三星(中国)半导体有限公司 卷积神经网络的裁剪、卷积计算方法及装置
CN111488930A (zh) * 2020-04-09 2020-08-04 北京市商汤科技开发有限公司 分类网络的训练方法、目标检测方法、装置和电子设备
WO2021077947A1 (zh) * 2019-10-22 2021-04-29 北京市商汤科技开发有限公司 图像处理方法、装置、设备及存储介质
CN112734036A (zh) * 2021-01-14 2021-04-30 西安电子科技大学 基于剪枝卷积神经网络的目标检测方法
CN113673546A (zh) * 2020-05-15 2021-11-19 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516103A (zh) * 2016-06-17 2017-12-26 北京市商汤科技开发有限公司 一种影像分类方法和系统
CN108875787A (zh) * 2018-05-23 2018-11-23 北京市商汤科技开发有限公司 一种图像识别方法及装置、计算机设备和存储介质
CN109948697A (zh) * 2019-03-19 2019-06-28 中南大学 一种利用众源数据辅助遥感影像分类提取城市建成区的方法
CN110033083A (zh) * 2019-03-29 2019-07-19 腾讯科技(深圳)有限公司 卷积神经网络模型压缩方法和装置、存储介质及电子装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897681B (zh) * 2017-02-15 2020-11-10 武汉喜恩卓科技有限责任公司 一种遥感图像对比分析方法及系统
CN107092921A (zh) * 2017-03-10 2017-08-25 佛山市南海区广工大数控装备协同创新研究院 基于k最近邻滤波的高光谱图像分类方法
JP6870114B2 (ja) * 2017-05-15 2021-05-12 ディープマインド テクノロジーズ リミテッド 3d時空畳み込みニューラルネットワークを使用した映像におけるアクション認識
JP7244996B2 (ja) * 2018-03-30 2023-03-23 株式会社パスコ 人口統計データ作成装置及び人口統計データ作成プログラム
CN109522949B (zh) * 2018-11-07 2021-01-26 北京交通大学 目标识别模型建立方法及装置
CN110348357B (zh) * 2019-07-03 2022-10-11 昆明理工大学 一种基于深度卷积神经网络的快速目标检测方法
CN110781948A (zh) * 2019-10-22 2020-02-11 北京市商汤科技开发有限公司 图像处理方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516103A (zh) * 2016-06-17 2017-12-26 北京市商汤科技开发有限公司 一种影像分类方法和系统
CN108875787A (zh) * 2018-05-23 2018-11-23 北京市商汤科技开发有限公司 一种图像识别方法及装置、计算机设备和存储介质
CN109948697A (zh) * 2019-03-19 2019-06-28 中南大学 一种利用众源数据辅助遥感影像分类提取城市建成区的方法
CN110033083A (zh) * 2019-03-29 2019-07-19 腾讯科技(深圳)有限公司 卷积神经网络模型压缩方法和装置、存储介质及电子装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘云: "基于深度学习的视网膜OCT图像分层与疾病筛查研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
段丽英: "基于有监督策略的无监督SAR图像变化检测方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021077947A1 (zh) * 2019-10-22 2021-04-29 北京市商汤科技开发有限公司 图像处理方法、装置、设备及存储介质
CN111414993A (zh) * 2020-03-03 2020-07-14 三星(中国)半导体有限公司 卷积神经网络的裁剪、卷积计算方法及装置
CN111414993B (zh) * 2020-03-03 2024-03-01 三星(中国)半导体有限公司 卷积神经网络的裁剪、卷积计算方法及装置
CN111488930A (zh) * 2020-04-09 2020-08-04 北京市商汤科技开发有限公司 分类网络的训练方法、目标检测方法、装置和电子设备
CN111488930B (zh) * 2020-04-09 2024-05-24 北京市商汤科技开发有限公司 分类网络的训练方法、目标检测方法、装置和电子设备
CN113673546A (zh) * 2020-05-15 2021-11-19 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备和存储介质
CN113673546B (zh) * 2020-05-15 2024-04-16 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备和存储介质
CN112734036A (zh) * 2021-01-14 2021-04-30 西安电子科技大学 基于剪枝卷积神经网络的目标检测方法
CN112734036B (zh) * 2021-01-14 2023-06-02 西安电子科技大学 基于剪枝卷积神经网络的目标检测方法

Also Published As

Publication number Publication date
WO2021077947A1 (zh) 2021-04-29
US20220215656A1 (en) 2022-07-07
JP2022509030A (ja) 2022-01-20

Similar Documents

Publication Publication Date Title
CN110781948A (zh) 图像处理方法、装置、设备及存储介质
CN111767801B (zh) 一种基于深度学习的遥感影像水域自动提取方法及系统
CN111986099B (zh) 基于融合残差修正的卷积神经网络的耕地监测方法及系统
CN110119728B (zh) 基于多尺度融合语义分割网络的遥感图像云检测方法
CN113780296B (zh) 基于多尺度信息融合的遥感图像语义分割方法及系统
CN111914611B (zh) 城市绿地高分遥感监测方法与系统
CN111738165B (zh) 一种从高分辨率无人机可见光遥感影像中提取单株植物冠层的方法
CN107918776B (zh) 一种基于机器视觉的用地规划方法、系统及电子设备
Sheeren et al. Discriminating small wooded elements in rural landscape from aerial photography: a hybrid pixel/object-based analysis approach
Grigillo et al. Automated building extraction from IKONOS images in suburban areas
CN115272887A (zh) 基于无人机检测的海岸带垃圾识别方法、装置以及设备
CN116645592A (zh) 一种基于图像处理的裂缝检测方法和存储介质
CN109657728B (zh) 样例生产方法及模型训练方法
CN116091937A (zh) 基于深度学习的高分辨率遥感影像地物识别模型计算方法
CN112883900A (zh) 遥感影像裸地反演可视图的方法及装置
CN113033386B (zh) 一种基于高分辨率遥感影像的输电线路通道隐患识别方法及系统
CN113989649A (zh) 一种基于深度学习的遥感地块识别方法
CN113743300A (zh) 基于语义分割的高分遥感图像云检测方法和装置
CN113378668A (zh) 积水类别的确定方法、装置、设备及存储介质
CN110175638B (zh) 一种扬尘源监测方法
CN115761223A (zh) 一种利用数据合成的遥感影像实例分割方法
Panagiotopoulou et al. Sentinel-2 Images at 2.5 m Spatial Resolution via Deep-Learning: A Case Study in Zakythnos
Liu et al. Identification of Damaged Building Regions from High-Resolution Images Using Superpixel-Based Gradient and Autocorrelation Analysis
Dali et al. Deep Learning Based Multi Task Road Extractor Model for Parcel Extraction and Crop Classification Using Knowledge Based Ndvi Time Series Data
CN117576571B (zh) 基于图像和文本的多模态果蔬叶片病害识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021721

Country of ref document: HK

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211