CN110610495A - 图像处理方法、系统和电子设备 - Google Patents

图像处理方法、系统和电子设备 Download PDF

Info

Publication number
CN110610495A
CN110610495A CN201810626543.2A CN201810626543A CN110610495A CN 110610495 A CN110610495 A CN 110610495A CN 201810626543 A CN201810626543 A CN 201810626543A CN 110610495 A CN110610495 A CN 110610495A
Authority
CN
China
Prior art keywords
tiles
image
tile
processed
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810626543.2A
Other languages
English (en)
Other versions
CN110610495B (zh
Inventor
孙晓峰
李艳丽
杨恒
张峥
赫桂望
蔡金华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810626543.2A priority Critical patent/CN110610495B/zh
Publication of CN110610495A publication Critical patent/CN110610495A/zh
Application granted granted Critical
Publication of CN110610495B publication Critical patent/CN110610495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本公开提供了一种图像处理方法,包括将待处理图像切分成多个瓦片,针对每个瓦片,获得该瓦片的多通道概率图,将所述多个瓦片的多通道概率图融合成全幅面概率图,以及基于所述全幅面概率图,对所述待处理图像进行语义分割。本公开还提供了一种图像处理系统、一种电子设备以及一种计算机可读介质。

Description

图像处理方法、系统和电子设备
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种图像处理方法、系统和电子设备。
背景技术
为了提高语义分割的精度,现有技术方案大都采用深度卷积神经网络的方法进行分割。例如,已经出现了采用以卷积神经网络为基础的全卷积神经网络直接进行像素级别端到端(end-to-end)的语义分割,只需将待分割的整张影像输入到事先训练好的网络中,便可得到最终的分割结果。因此,网络模型的好坏直接决定了该类方法的最终分割精度。
为了处理大幅面图像,现有技术通常采用更为复杂的网络模型,或者对图像缩小后进行处理。然而,采用较为复杂的网络模型导致对显存的需求提高,往往会超过系统资源的限制,造成系统崩溃,而缩小图像的方式将对分割精度产生较大影响。因此,在满足一定的分割精度的前提下,很难将现有技术直接应用于幅面较大影像的语义分割。
发明内容
有鉴于此,本公开提供了一种图像处理方法、系统和电子设备。
本公开的一个方面提供了一种图像处理方法,包括将待处理图像切分成多个瓦片,针对每个瓦片,获得该瓦片的多通道概率图,将所述多个瓦片的多通道概率图融合成全幅面概率图,以及基于所述全幅面概率图,对所述待处理图像进行语义分割。
根据本公开实施例,所述将待处理图像切分成多个瓦片包括基于瓦片尺寸,将待处理图像切分成多个瓦片。
根据本公开实施例,所述基于瓦片尺寸,将待处理图像切分成多个瓦片包括基于瓦片尺寸以及第一步长,将待处理图像切分成多个瓦片,其中,相邻的两个瓦片之间至少具有第一步长的重叠部分。
根据本公开实施例,所述基于瓦片尺寸,将待处理图像切分成多个瓦片包括,基于瓦片尺寸,确定用于切分待处理图像的瓦片数量,基于所述瓦片尺寸以及瓦片数量,确定第二步长,以及将待处理图像切分成所述瓦片数量的多个瓦片,其中,相邻的两个瓦片之间具有第二步长的重叠部分。
根据本公开实施例,所述将所述多个瓦片的多通道概率图融合成全幅面概率图包括,在多个瓦片覆盖同一像素的情况下,将所述多个瓦片的多个多通道概率图中对应于所述像素的数据加权融合,其中,一个瓦片的数据的权重为所述像素所在位置距离所述瓦片边缘的像素距离。
根据本公开实施例,所述方法还包括通过全连接条件随机场模型优化所述全幅面概率图。
本公开的另一个方面提供了一种图像处理系统,包括切分模块、处理模块、融合模块以及语义分割模块。切分模块,用于将待处理图像切分成多个瓦片。处理模块,用于针对每个瓦片,获得该瓦片的多通道概率图。融合模块,用于将所述多个瓦片的多通道概率图融合成全幅面概率图。语义分割模块,用于基于所述全幅面概率图,对所述待处理图像进行语义分割。
根据本公开实施例,所述切分模块用于基于瓦片尺寸,将待处理图像切分成多个瓦片。
根据本公开实施例,所述切分模块包括第一切分子模块,用于基于瓦片尺寸以及第一步长,将待处理图像切分成多个瓦片,其中,相邻的两个瓦片之间至少具有第一步长的重叠部分。
根据本公开实施例,所述切分模块包括数量确定子模块、步长确定子模块以及第二切分子模块。数量确定子模块,用于基于瓦片尺寸,确定用于切分待处理图像的瓦片数量。步长确定子模块,用于基于所述瓦片尺寸以及瓦片数量,确定第二步长。第二切分子模块,用于将待处理图像切分成所述瓦片数量的多个瓦片,其中,相邻的两个瓦片之间具有第二步长的重叠部分。
根据本公开实施例,所述融合模块用于在多个瓦片覆盖同一像素的情况下,将所述多个瓦片的多个多通道概率图中对应于所述像素的数据加权融合,其中,一个瓦片的数据的权重为所述像素所在位置距离所述瓦片边缘的像素距离。
根据本公开实施例,所述系统还包括优化模块,用于通过全连接条件随机场模型优化所述全幅面概率图。
本公开的另一个方面提供了一种电子设备,包括,至少一个处理器以及存储器,用于存储一个或多个计算机指令,其中,当所述一个或多个计算机指令被所述至少一个处理器执行时,使得所述处理器执行如上所述的方法。
本公开的另一个方面提供了一种计算机可读介质,其上存储有计算机指令,该指令被执行时使处理器执行如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机指令,所述指令在被执行时用于实现如上所述的方法。
该方法将瓦片切分与合并机制融入语义分割过程中,能够在不损失分割精度的情况下,突破现有技术对于待分割影像尺寸的限制,使语义分割技术在更多的应用场景中发挥作用。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了现有技术中用于语义分割的卷积神经网络的示意图;
图2示意性示出了根据本公开实施例的图像处理方法的流程图;
图3A示意性示出了根据本公开实施例的将待处理图像切分成多个瓦片的示意图;
图3B示意性示出了根据本公开另一实施例的将待处理图像切分成多个瓦片的示意图;
图4示意性示出了根据本公开另一实施例的将待处理图像切分成多个瓦片的流程图;
图5示意性示出了根据本公开另一实施例的将待处理图像切分成多个瓦片的示意图;
图6示意性示出了根据本公开实施例的图像处理方法的示意图;
图7A和7B示意性示出了根据本公开实施例的语义分割的示意图;
图8示意性示出了根据本公开实施例的图像处理系统的框图;
图9示意性示出了根据本公开实施例的切分模块的框图;以及
图10示意性示出了根据本公开实施例的适于实现图像处理方法和系统的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
本公开的实施例提供了一种图像处理方法,包括将待处理图像切分成多个瓦片,针对每个瓦片,获得该瓦片的多通道概率图,其中,该瓦片中的像素在不同通道的概率数据表示所述像素属于不同类别的概率,将所述多个瓦片的多通道概率图融合成全幅面概率图,以及基于所述全幅面概率图,对所述待处理图像进行语义分割。
图1示意性示出了现有技术中用于语义分割的卷积神经网络的示意图。
现有的语义分割通常使用如图1所示意的卷积神经网络100实现。该神经网络100可能包括多个卷积层、池化层、上采样层、损失层等,将待分割的整张影像输入到事先训练好的神经网络100中,便可得到最终的分割结果,属于端到端的语义分割。因此网络模型的好坏直接决定了该类方法的最终分割精度。为了得到理想的分割结果,现有技术往往采用复杂度较高的网络模型,且网络深度有不断增加的趋势,例如已经出现了采用多达101层的网络结构来保证模型性能。
由于现有方案多采用以整张影像作为网络输入的端到端的分割方法,因此对分割图像的尺寸适应性较差。特别是为了提高语义分割的精度,而采用较为复杂的网络模型时,算法对显存的需求往往会超过系统资源的限制,造成系统崩溃。尽管通过事先将待分割影像进行尺度缩放,然后在缩放后的尺度上进行分割的方法,可以在一定程度上减轻这种限制,但这又会对分割精度产生较大影响。因此,在满足一定的分割精度的前提下,很难将现有技术直接应用于幅面较大影像的语义分割。
本发明的主要目的是解决现有的基于深度卷积神经网络的多层次、高精度语义分割方法无法直接作用于超大幅面影像的问题。在不损失分割精度的情况下,突破现有技术对于待分割影像尺寸的限制。使语义分割技术在更多的应用场景中发挥作用。
图2示意性示出了根据本公开实施例的图像处理方法的流程图。
如图2所示,该方法包括操作S210~S240。
在操作S210,将待处理图像切分成多个瓦片。
根据本公开实施例,所述将待处理图像切分成多个瓦片包括基于瓦片尺寸,将待处理图像切分成多个瓦片。
在瓦片切分过程中,计算机显存容量与所采用的网络模型大小共同决定了瓦片切分的尺寸。假设待分割图像的宽度与高度分别为w和h,计算资源所能承载的最大瓦片尺寸为u×v,则最终整张影像被切分为N个瓦片,N=[w/u]×[h/v],其中,中括号表示向上取整。通常地,u、v可以相等,例如,u=v=s,则N=[w/s]×[h/s]。
图3A示意性示出了根据本公开实施例的将待处理图像切分成多个瓦片的示意图。
如图3A所示,待处理图像310被切分成25个瓦片(最后一行和最后一列仅示出了一个瓦片311),由于瓦片的尺寸是固定的,所以瓦片通常不能刚好覆盖整幅图像。
在本公开的一些实施例中,由于在后续过程中需要所有瓦片具有相同的尺寸,因此为了满足该条件,最后一行与最后一列的瓦片起始位置需根据整幅影像的右下角坐标进行反向推算。如图3A所示意的实施例中,在排布4×4个瓦片后,剩余的部分仍以9个同样大小的瓦片覆盖。
为了使整幅图像的分割结果过度自然,避免瓦片间出现明显的分割裂缝,在瓦片切分过程中还需设定一定步长的重叠区域。根据本公开另一实施例,所述基于瓦片尺寸,将待处理图像切分成多个瓦片包括基于瓦片尺寸以及第一步长,将待处理图像切分成多个瓦片,其中,相邻的两个瓦片之间至少具有第一步长的重叠部分。假定所设定的重叠步长为o像素,则最终得到的瓦片总数N为:
N=[(w-o)/(s-o)]×[(h-o)/(s-o)]。
图3B示意性示出了根据本公开另一实施例的将待处理图像切分成多个瓦片的示意图。
如图3B所示,待处理图像320被切分成36个瓦片(每一行和每一列仅示出了一个瓦片),其中,根据预设的第一步长,相邻的两个瓦片之间具有第一步长的重叠部分321。在图3B所示意的实施例中,在排布5×5个瓦片后,剩余的部分仍以11个同样大小的瓦片覆盖。
图4示意性示出了根据本公开另一实施例的将待处理图像切分成多个瓦片的流程图。
如图4所示,该方法包括操作S410~S430。
在操作S410,基于瓦片尺寸,确定用于切分待处理图像的瓦片数量。例如,计算N=[w/s]×[h/s],得到瓦片数量N;或者,根据最小步长t,计算N=[(w-t)/(s-t)]×[(h-t)/(s-t)]。
在操作S420,基于所述瓦片尺寸以及瓦片数量,确定第二步长。例如,第二步长q=(N×s-w)/(N-1)或者q=(N×s-h)/(N-1)。
在操作S430,将待处理图像切分成所述瓦片数量的多个瓦片,其中,相邻的两个瓦片之间具有第二步长的重叠部分。
图5示意性示出了根据本公开另一实施例的将待处理图像切分成多个瓦片的示意图。
如图5所示,待处理图像510被切分成25个瓦片(每一行和每一列仅示出了一个瓦片),其中,相邻的两个瓦片之间具有第二步长的重叠部分511。由于第二步长是基于瓦片尺寸以及瓦片数量确定的,使得最后一行和最后一列的瓦片512刚好覆盖到待处理图像510的边缘,整个图像的瓦片分割更加均匀。
根据本公开实施例,在对图像进行瓦片切分后,记录好每一瓦片单元与整幅影像的映射关系,并生成瓦片信息列表以供后续流程使用。
在操作S220,针对每个瓦片,获得该瓦片的多通道概率图。例如,每一瓦片分别被输入到事先训练好的网络模型进行处理,网络模型以每一瓦片对应的浮点数多通道概率图作为输出,以便于瓦片间进行后续的高精度融合。其中,该瓦片中的像素在不同通道的概率数据表示所述像素属于不同类别的概率,例如,根据预先设定或在处理过程中确定的所有可能的类别,如人、汽车、房屋、道路等等,根据其数量确定多通道概率图中的通道数量,每个通道表示该像素属于一个类别的概率。例如,在一个瓦片的多通道概率图中,某一像素点的多个通道的数据为(0.02,0.06,0.76,0.05,……),可以用于表示该像素可能为人、汽车、房屋、道路等类别的概率分别为0.05,0.06,0.76,0.05等。
根据本公开实施例,在该神经网络中,可以采用孔洞卷积算法以减少池化层带来的空间分辨率损失。
在操作S230,将所述多个瓦片的多通道概率图融合成全幅面概率图。
根据本公开实施例,首先收集原始大幅面影像(待处理图像)的所有瓦片的多通道概率图,然后根据瓦片切分过程中记录的映射信息,恢复瓦片间的空间排布关系。
为了避免因瓦片间分割结果的不一致造成的接边裂痕,加权融合覆盖同一像素区域的多个瓦片分割结果。根据本公开实施例,所述将所述多个瓦片的多通道概率图融合成全幅面概率图包括,在多个瓦片覆盖同一像素的情况下,将所述多个瓦片的多个多通道概率图中对应于所述像素的数据加权融合,其中,一个瓦片的数据的权重为所述像素所在位置距离所述瓦片边缘的像素距离。
设语义分割的总类别数为m,对于某一被n个瓦片单元覆盖的待融合像素p而言,融合后各类别的概率按照下式计算:
其中,w为对应瓦片单元的权重,由于距离瓦片边缘越近的像素其分割结果的可靠性越低,w取值可以是像素p所在位置距离该瓦片边缘的真实像素距离。
该方法可以综合参考不同瓦片的概率结果进行融合,避免因瓦片间分割结果的不一致造成的接边裂痕。另外,由于靠近边缘的结果可靠性较低,采用到边缘的距离作为权重进行融合的效果更好。
根据本公开实施例,所述方法还包括通过全连接条件随机场模型优化所述全幅面概率图。
本发明以融合多瓦片信息后的全幅面概率图为基础,根据原始图像的色彩信息,通过建立全连接条件随机场模型来进行分割结果的进一步精化。其中,全连接条件随机场模型对应的能量函数如下所示:
一元项为像素i被赋予类别标签xi时,对应的能量损失,P(xi)为上一步计算得到的融合概率。二元项由下式所示的两个高斯核函数加权构成,
Pi与Pj为像素点i和j在概率图中所处的空间位置坐标,而Ii和Ij为像素点i和j在原始图像中的三通道灰度信息,σα、σβ和σγ为卷积核的尺度。通过能量最小化求解可以优化结果。
在操作S240,基于所述全幅面概率图,对所述待处理图像进行语义分割。
图6示意性示出了根据本公开实施例的图像处理方法的示意图。
如图6所示,大幅面影像,即待处理图像,通过瓦片切分,被切分为n个瓦片,瓦片1、瓦片2、……、瓦片n。每个瓦片通过深度卷积神经网络模型单片分割,获得每个瓦片的多通道概率图,概率图1、概率图2、……、概率图n。将其加权合并,得到全幅面概率图。最后对概率进行分析,获得语义类别图,即为待处理图像的语义分割结果。
图7A示意性示出了根据本公开实施例的待处理图像的示意图,图7B示意性示出了根据本公开实施例的语义分割结果的示意图。在图7B中,不同的物体被区分出来。
该方法将瓦片切分与合并机制融入语义分割过程中,能够在不损失分割精度的情况下,突破现有技术对于待分割影像尺寸的限制,使语义分割技术在更多的应用场景中发挥作用。
图8示意性示出了根据本公开实施例的图像处理系统800的框图。
如图8所示,该图像处理系统800包括切分模块810、处理模块820、融合模块830以及语义分割模块840。
切分模块810,例如执行上文参考图2描述的操作S210,用于将待处理图像切分成多个瓦片。
处理模块820,例如执行上文参考图2描述的操作S220,用于针对每个瓦片,获得该瓦片的多通道概率图。
融合模块830,例如执行上文参考图2描述的操作S230,用于将所述多个瓦片的多通道概率图融合成全幅面概率图。
语义分割模块840,例如执行上文参考图2描述的操作S240,用于基于所述全幅面概率图,对所述待处理图像进行语义分割。
根据本公开实施例,所述切分模块用于基于瓦片尺寸,将待处理图像切分成多个瓦片。
根据本公开实施例,所述切分模块包括第一切分子模块,用于基于瓦片尺寸以及第一步长,将待处理图像切分成多个瓦片,其中,相邻的两个瓦片之间至少具有第一步长的重叠部分。
图9示意性示出了根据本公开实施例的切分模块810的框图。
如图9所示,该切分模块810包括数量确定子模块910、步长确定子模块920以及第二切分子模块930。
数量确定子模块910,例如执行上文参考图4描述的操作S410,用于基于瓦片尺寸,确定用于切分待处理图像的瓦片数量。
步长确定子模块920,例如执行上文参考图4描述的操作S420,用于基于所述瓦片尺寸以及瓦片数量,确定第二步长。
第二切分子模块930,例如执行上文参考图4描述的操作S430,用于将待处理图像切分成所述瓦片数量的多个瓦片,其中,相邻的两个瓦片之间具有第二步长的重叠部分。
根据本公开实施例,所述融合模块用于在多个瓦片覆盖同一像素的情况下,将所述多个瓦片的多个多通道概率图中对应于所述像素的数据加权融合,其中,一个瓦片的数据的权重为所述像素所在位置距离所述瓦片边缘的像素距离。
根据本公开实施例,所述系统还包括优化模块,用于通过全连接条件随机场模型优化所述全幅面概率图。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或同件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,切分模块810、处理模块820、融合模块830、语义分割模块840、第一切分子模块、数量确定子模块910、步长确定子模块920、第二切分子模块930以及优化模块中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,切分模块810、处理模块820、融合模块830、语义分割模块840、第一切分子模块、数量确定子模块910、步长确定子模块920、第二切分子模块930以及优化模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,切分模块810、处理模块820、融合模块830、语义分割模块840、第一切分子模块、数量确定子模块910、步长确定子模块920、第二切分子模块930以及优化模块中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图10示意性示出了根据本公开实施例的适于实现图像处理方法和系统的计算机系统的方框图。图10示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,根据本公开实施例的计算机系统1000包括处理器1001,其可以根据存储在只读存储器(ROU)1002中的程序或者从存储部分1008加载到随机访问存储器(RAU)1003中的程序而执行各种适当的动作和处理。处理器1001例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器1001还可以包括用于缓存用途的板载存储器。处理器1001可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAU 1003中,存储有系统1000操作所需的各种程序和数据。处理器1001、ROU1002以及RAU 1003通过总线1004彼此相连。处理器1001通过执行ROU 1002和/或RAU 1003中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROU 1002和RAU 1003以外的一个或多个存储器中。处理器1001也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统1000还可以包括输入/输出(I/O)接口1005,输入/输出(I/O)接口1005也连接至总线1004。系统1000还可以包括连接至I/O接口1005的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被处理器1001执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的;电可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAU)、只读存储器(ROU)、可擦式可编程只读存储器(EPROU或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROU)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
例如,根据本公开的实施例,计算机可读介质可以包括上文描述的ROU 1002和/或RAU 1003和/或ROU 1002和RAU 1003以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (14)

1.一种图像处理方法,包括:
将待处理图像切分成多个瓦片;
针对每个瓦片,获得该瓦片的多通道概率图;
将所述多个瓦片的多通道概率图融合成全幅面概率图;以及
基于所述全幅面概率图,对所述待处理图像进行语义分割。
2.根据权利要求1所述的方法,其中,所述将待处理图像切分成多个瓦片包括:
基于瓦片尺寸,将待处理图像切分成多个瓦片。
3.根据权利要求2所述的方法,其中,所述基于瓦片尺寸,将待处理图像切分成多个瓦片包括:
基于瓦片尺寸以及第一步长,将待处理图像切分成多个瓦片,其中,相邻的两个瓦片之间至少具有第一步长的重叠部分。
4.根据权利要求2所述的方法,其中,所述基于瓦片尺寸,将待处理图像切分成多个瓦片包括:
基于瓦片尺寸,确定用于切分待处理图像的瓦片数量;
基于所述瓦片尺寸以及瓦片数量,确定第二步长;以及
将待处理图像切分成所述瓦片数量的多个瓦片,其中,相邻的两个瓦片之间具有第二步长的重叠部分。
5.根据权利要求1所述的方法,其中,所述将所述多个瓦片的多通道概率图融合成全幅面概率图包括:
在多个瓦片覆盖同一像素的情况下,将所述多个瓦片的多个多通道概率图中对应于所述像素的数据加权融合,其中,一个瓦片的数据的权重为所述像素所在位置距离所述瓦片边缘的像素距离。
6.根据权利要求1所述的方法,还包括:
通过全连接条件随机场模型优化所述全幅面概率图。
7.一种图像处理系统,包括:
切分模块,用于将待处理图像切分成多个瓦片;
处理模块,用于针对每个瓦片,获得该瓦片的多通道概率图;
融合模块,用于将所述多个瓦片的多通道概率图融合成全幅面概率图;以及
语义分割模块,用于基于所述全幅面概率图,对所述待处理图像进行语义分割。
8.根据权利要求7所述的系统,其中,所述切分模块用于:
基于瓦片尺寸,将待处理图像切分成多个瓦片。
9.根据权利要求8所述的系统,其中,所述切分模块包括:
第一切分子模块,用于基于瓦片尺寸以及第一步长,将待处理图像切分成多个瓦片,其中,相邻的两个瓦片之间至少具有第一步长的重叠部分。
10.根据权利要求8所述的系统,其中,所述切分模块包括:
数量确定子模块,用于基于瓦片尺寸,确定用于切分待处理图像的瓦片数量;
步长确定子模块,用于基于所述瓦片尺寸以及瓦片数量,确定第二步长;以及
第二切分子模块,用于将待处理图像切分成所述瓦片数量的多个瓦片,其中,相邻的两个瓦片之间具有第二步长的重叠部分。
11.根据权利要求7所述的系统,其中,所述融合模块用于:
在多个瓦片覆盖同一像素的情况下,将所述多个瓦片的多个多通道概率图中对应于所述像素的数据加权融合,其中,一个瓦片的数据的权重为所述像素所在位置距离所述瓦片边缘的像素距离。
12.根据权利要求7所述的系统,还包括:
优化模块,用于通过全连接条件随机场模型优化所述全幅面概率图。
13.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机指令,
其中,当所述一个或多个计算机指令被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1~6所述的方法。
14.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1~6所述的方法。
CN201810626543.2A 2018-06-15 2018-06-15 图像处理方法、系统和电子设备 Active CN110610495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810626543.2A CN110610495B (zh) 2018-06-15 2018-06-15 图像处理方法、系统和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810626543.2A CN110610495B (zh) 2018-06-15 2018-06-15 图像处理方法、系统和电子设备

Publications (2)

Publication Number Publication Date
CN110610495A true CN110610495A (zh) 2019-12-24
CN110610495B CN110610495B (zh) 2022-06-07

Family

ID=68888718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810626543.2A Active CN110610495B (zh) 2018-06-15 2018-06-15 图像处理方法、系统和电子设备

Country Status (1)

Country Link
CN (1) CN110610495B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150093021A1 (en) * 2013-09-29 2015-04-02 Founder Apabi Technology Limited Table recognizing method and table recognizing system
CN104751163A (zh) * 2013-12-27 2015-07-01 同方威视技术股份有限公司 对货物进行自动分类识别的透视检查系统和方法
CN106228561A (zh) * 2016-07-29 2016-12-14 上海联影医疗科技有限公司 血管提取方法
CN107025457A (zh) * 2017-03-29 2017-08-08 腾讯科技(深圳)有限公司 一种图像处理方法和装置
CN107092921A (zh) * 2017-03-10 2017-08-25 佛山市南海区广工大数控装备协同创新研究院 基于k最近邻滤波的高光谱图像分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150093021A1 (en) * 2013-09-29 2015-04-02 Founder Apabi Technology Limited Table recognizing method and table recognizing system
CN104751163A (zh) * 2013-12-27 2015-07-01 同方威视技术股份有限公司 对货物进行自动分类识别的透视检查系统和方法
CN106228561A (zh) * 2016-07-29 2016-12-14 上海联影医疗科技有限公司 血管提取方法
CN107092921A (zh) * 2017-03-10 2017-08-25 佛山市南海区广工大数控装备协同创新研究院 基于k最近邻滤波的高光谱图像分类方法
CN107025457A (zh) * 2017-03-29 2017-08-08 腾讯科技(深圳)有限公司 一种图像处理方法和装置

Also Published As

Publication number Publication date
CN110610495B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
US11113840B2 (en) Systems and methods for detecting objects in images
US20190042888A1 (en) Training method, training apparatus, region classifier, and non-transitory computer readable medium
US20230394671A1 (en) Image segmentation method and apparatus, and device, and storage medium
US20210117704A1 (en) Obstacle detection method, intelligent driving control method, electronic device, and non-transitory computer-readable storage medium
CN110879960B (zh) 生成卷积神经网络学习用图像数据集的方法及计算装置
US10521700B2 (en) Methods and systems for converting a line drawing to a rendered image
US11741726B2 (en) Lane line detection method, electronic device, and computer storage medium
CN111027539A (zh) 一种基于空间位置信息的车牌字符分割方法
CN111523558A (zh) 一种基于电子围网的船只遮挡检测方法、装置及电子设备
CN112712036A (zh) 交通标志识别方法、装置、电子设备及计算机存储介质
CN111753114A (zh) 图像预标注方法、装置及电子设备
EP4181013A1 (en) Method and apparatus for determining labeling information
CN113936232A (zh) 一种碎屏识别方法、装置、设备和存储介质
CN110610495B (zh) 图像处理方法、系统和电子设备
CN113496138A (zh) 稠密点云数据的生成方法、装置、计算机设备及存储介质
CN114549961B (zh) 目标对象的检测方法、装置、设备以及存储介质
CN115527187A (zh) 一种障碍物的分类方法以及装置
CN116452911A (zh) 目标检测模型训练方法及装置、目标检测方法及装置
CN113762266B (zh) 目标检测方法、装置、电子设备和计算机可读介质
CN113298822B (zh) 点云数据的选取方法及选取装置、设备、存储介质
CN114283343A (zh) 基于遥感卫星图像的地图更新方法、训练方法和设备
CN111860349A (zh) 一种智能车辆车道线语义分割的方法及系统
CN112069899A (zh) 一种路肩检测方法、装置及存储介质
CN111340813A (zh) 图像实例分割方法、装置、电子设备及存储介质
CN110019627B (zh) 识别交通导流线的方法及其系统、计算机系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant