CN111340813B - 图像实例分割方法、装置、电子设备及存储介质 - Google Patents

图像实例分割方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111340813B
CN111340813B CN202010117530.XA CN202010117530A CN111340813B CN 111340813 B CN111340813 B CN 111340813B CN 202010117530 A CN202010117530 A CN 202010117530A CN 111340813 B CN111340813 B CN 111340813B
Authority
CN
China
Prior art keywords
image
feature data
segmentation
segmented
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010117530.XA
Other languages
English (en)
Other versions
CN111340813A (zh
Inventor
卢艺帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010117530.XA priority Critical patent/CN111340813B/zh
Publication of CN111340813A publication Critical patent/CN111340813A/zh
Application granted granted Critical
Publication of CN111340813B publication Critical patent/CN111340813B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本实施例提供的图像实例分割方法、装置、电子设备及存储介质,通过对待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据,根据中间特征数据和第一特征数据,确定待分割图像中物体的图像位置和物体分类,根据中间特征数据和第二特征数据,确定待分割图像中的物体分割掩码,从而进行分割处理获得图像实例。在获得物体的图像位置、物体分类以及物体分割掩码时,均采用了多种特征数据,相对于现有技术来说,提高了识别准确性,也有效提升图像实例的分割准确性。

Description

图像实例分割方法、装置、电子设备及存储介质
技术领域
本公开实施例涉及图像处理领域,尤其涉及一种图像实例分割方法、装置、电子设备及存储介质。
背景技术
由于科技的发展,图像在生活中的应用频率和规模不断提高,对于图像的处理需求也不断增强。
图像实例分割是一种对图像中像素所属于的物体进行判断的处理方法,在现有的技术方案中,该方法是基于MASK RCNN架构实现的,具体的,对图像进行特征提取以得到不同维度的第一特征数据和第二特征数据,基于该第一特征数据获得图像的物体分类,基于该第一特征数据和第二特征数据获得图像中物体的位置和分割掩码,进而实现对于图像实例的分割。
但是,在获得特征数据时会对特征信息进行摒弃,因此,针对于仅通过第一特征数据确定的物体分类来说,其准确率将受到影响,进而也使得图像实例的分割结果并不准确。
发明内容
针对上述问题,本公开提供了一种图像实例分割方法、装置、电子设备及存储介质。
第一方面,本公开实施例提供一种图像实例分割方法,包括:
获取待分割图像;
对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据;
根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类;
根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码;
根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
第二方面,本公开实施例提供一种图像实例分割装置,包括:
获取模块,获取待分割图像;
处理模块,用于对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据;根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类;根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码;
分割模块,用于根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的图像实例分割方法。
第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的图像实例分割方法。
本实施例提供的图像实例分割方法、装置、电子设备及存储介质,通过对待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据,根据中间特征数据和第一特征数据,确定待分割图像中物体的图像位置和物体分类,根据中间特征数据和第二特征数据,确定待分割图像中的物体分割掩码,从而进行分割处理获得图像实例。在获得物体的图像位置、物体分类以及物体分割掩码时,均采用了多种特征数据,相对于现有技术来说,提高了识别准确性,也有效提升图像实例的分割准确性。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有的MASK RCNN架构的结构示意图;
图2为本公开所基于的一种网络架构的示意图;
图3为本公开实施例提供的一种图像实例分割方法的流程示意图;
图4为本公开提供的图像实例分割方法中的模型架构的结构示意图;
图5为本公开实施例提供的一种图像实例分割方法的界面示意图;
图6为本公开实施例提供的图像实例分割装置的结构框图;
图7为本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
由于科技的发展,图像在生活中的应用频率和规模不断提高,对于图像的处理需求也不断增强。
图像实例分割是一种对图像中像素所属于的物体进行判断的处理方法,在现有的技术方案中,该方法是基于掩码区域卷积神经网络(MASK Region-based ConvolutionalNeural Networks,简称MASK RCNN)实现的。图1为现有的MASK RCNN架构的结构示意图,如图1所示的,MASK RCNN中的图像实例分割处理模型将对图像进行特征提取,以得到不同维度的第一特征数据和第二特征数据,基于该第一特征数据获得图像的物体分类,基于该第一特征数据和第二特征数据获得图像中物体的位置和分割掩码,进而实现对于图像实例的分割。
但是,在MASK RCNN提取特征信息时,图像中的部分信息将被舍弃,这就使得利用第一特征数据确定的物体分类的准确性受到影响,也使得图像实例的分割结果出现不准确的问题。
针对上述问题,本公开提供了一种图像实例分割方法、装置、电子设备及存储介质。
参考图2,图2为本公开所基于的一种网络架构的示意图,该图2所示网络架构具体可包括图像实例分割装置2以及各终端1。
其中,各终端1具体可为用户手机、台式电脑、智能家居设备、平板电脑等可用于采集图像的硬件设备,而图像实例分割装置2是可与各终端1通过网络进行交互的硬件或软件,其可用于执行下述各示例中所述的图像实例分割方法,并将从各终端1获得的图像进行实例分割,以得到图像实例并进行输出,其中,该输出的对象可为各终端1,也可为其他硬件或软件,如下游处理设备、下游处理服务器等。
在上述图2所示的网络架构中,当图像实例分割装置1为硬件时,其可包括具备运算功能的云端服务器;当图像实例分割装置1为软件时,其可以安装在具备运算功能的电子设备中,其中的电子设备包括但不限于膝上型便携计算机和台式计算机等等。
也就是说,本公开所基于的图像实例分割方法具体可基于图2所示的实施例中,适用于多种应用场景,该应用场景包括但不限于:基于终端的人脸识别场景、基于人体的手势/表情/姿态对于智能家居进行控制的场景、基于自动驾驶车辆的图像雷达识别场景等。
第一方面,参考图3,图3为本公开实施例提供的一种图像实例分割方法的流程示意图。本公开实施例提供的图像实例分割方法,包括:
步骤101、获取待分割图像。
需要说明的是,本示例的提供的处理方法的执行主体为前述的图像实例分割装置,其可通过与终端进行交互,以得到终端执行自身任务时采集得到待分割图像或预存的待分割图像。这些待分割图像将被预处理,以成为可用于进行分割的图像数据。其中,该预处理包括但不限于对图像进行去噪、矩阵化等处理。
步骤102、对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据。
步骤103、根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类。
步骤104、根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码。
步骤105、根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
在图像实例分割装置中,可利用预设的图像分割处理模型对待分割图像进行处理,也就是说,将所述待分割图像输入至图像分割处理模型,以使所述图像分割处理模型对所述待分割图像执行特征提取,分别获得所述第一特征数据、所述中间特征数据以及所述第二特征数据;以及,输出所述物体的图像位置、物体分类以及物体分割掩码。
图4为本公开提供的图像实例分割方法中的模型架构的结构示意图。
首先,图像分割处理模型会对待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据。
需要说明的是,第一特征数据、第二特征数据以及中间特征数据具体可表示待分割图像的不同图像特征信息,其三者所表示的信息内容可不重叠,即相互独立;其三者所示的信息内容也可存在一定重叠,即相互关联。
第一特征数据的提取的数据维度可第一维度,如图4所示的7×7;第二特征数据的数据维度与中间特征数据的数据维度相同,如均为第二维度,如图4所示的14×14。一般的,为了便于处理,第一维度的尺寸大于所述第二维度的尺寸。
然后,图像分割处理模型将对这些特征数据将通过模型中的卷积模块以进行卷积变换和卷积逆变换等处理,进而得到物体的图像位置、物体分类以及物体分割掩码。
为了提高本公开所输出的物体的图像位置、物体分类以及物体分割掩码的准确性,利用不同的卷积模块对特征数据进行处理时,均会利用到中间特征数据,以增加处理过程中考虑到的特征信息,进而提高处理得到的结果的准确性。
也就是说,图像分割模型会对中间特征数据进行下采样处理,获得下采样特征数据,即将数据维度为14×14的中间特征数据进行下采样以得到数据维度为7×7的下采样特征数据。将数据维度均为7×7的下采样特征数据和第一特征数据,输入至图像分割模型中的第一卷积模块,以输出待分割图像中的物体的图像位置和物体分类。
此外,图像分割模型还会对中间特征数据和第二特征数据进行叠加处理,获得叠加特征数据,即将数据维度为14×14的中间特征数据与数据维度同为14×14的第二特征数据进行叠加,以得到数据维度为14×14的叠加特征数据。将该叠加特征数据输入至图像分割模型中的第二卷积模块,以输出待分割图像中的物体分割掩码。
通过利用上述的获取方式,由于获得的物体的图像位置、物体分类以及物体分割掩码时均采用了多种特征数据,相对于现有技术来说,其结果准确性更高。
最后,可基于获得的物体的图像位置、物体分类以及物体分割掩码,对待分割图像进行分割处理,获得图像实例。具体的,图5为本公开实施例提供的一种图像实例分割方法的界面示意图,在对待分割图像进行分割处理时,可先基于图像中每一物体的图像位置,确定其物体位置方形框,并对其物体分类进行标识,如将图5中的狗、自行车、卡车,以及物体在图像中的位置,如每一物体位置对应的方形框,显示出来。然后,将利用物体分割掩码,将物体位置方形框中的物体与非物体进行分割掩码处理,即确定非物体与物体的交界,并将非物体利用掩码掩盖,以凸显物体。最后,将在待分割图像中呈现该凸显出的物体并对其物体分类进行标识,从而得到图像实例。
本实施例提供的图像实例分割方法、装置、电子设备及存储介质,通过对待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据,根据中间特征数据和第一特征数据,确定待分割图像中物体的图像位置和物体分类,根据中间特征数据和第二特征数据,确定待分割图像中的物体分割掩码,从而进行分割处理获得图像实例。在获得物体的图像位置、物体分类以及物体分割掩码时,均采用了多种特征数据,相对于现有技术来说,提高了识别准确性,也有效提升图像实例的分割准确性。
对应于上文实施例的图像实例分割方法,图6为本公开实施例提供的图像实例分割装置的结构框图。为了便于说明,仅示出了与本公开实施例相关的部分。参照图6,所述图像实例分割装置包括:获取模块10、处理模块20和分割模块30。
其中,获取模块10,获取待分割图像;
处理模块20,用于对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据;根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类;根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码;
分割模块30,用于根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
可选实施例中,所述处理模块20,具体用于:对所述中间特征数据进行下采样处理,获得下采样特征数据;根据所述下采样特征数据和所述第一特征数据,确定所述待分割图像中物体的图像位置和物体分类。
可选实施例中,所述第一特征数据的数据维度为第一维度,所述中间特征数据的数据维度为第二维度;
所述第一维度的尺寸大于所述第二维度的尺寸。
可选实施例中,所述处理模块20,具体用于:对所述中间特征数据和所述第二特征数据进行叠加处理,获得叠加特征数据;根据所述叠加特征数据确定所述待分割图像中的物体分割掩码。
可选实施例中,所述第二特征数据的数据维度与所述中间特征数据的数据维度相同。
可选实施例中,所述处理模块20中还预设有图像分割处理模型;
所述处理模块具体用于:将所述待分割图像输入至图像分割处理模型,以使所述图像分割处理模型对所述待分割图像执行特征提取,分别获得所述第一特征数据、所述中间特征数据以及所述第二特征数据;以及,输出所述物体的图像位置、物体分类以及物体分割掩码。
可选实施例中,该图像实例分割装置还包括:训练模块;
所述训练模块具体用于建立待训练的图像分割处理模型,并获得图像分割处理样本;其中,所述图像分割处理样本包括待分割图像样本,以及待分割图像样本中的物体的图像位置、物体分类以及物体分割掩码;利用所述图像分割处理样本对所述待训练的图像分割处理模型进行训练,获得训练完毕的所述图像分割处理模型。
本实施例提供的图像实例分割装置,通过对待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据,根据中间特征数据和第一特征数据,确定待分割图像中物体的图像位置和物体分类,根据中间特征数据和第二特征数据,确定待分割图像中的物体分割掩码,从而进行分割处理获得图像实例。在获得物体的图像位置、物体分类以及物体分割掩码时,均采用了多种特征数据,相对于现有技术来说,提高了识别准确性,也有效提升图像实例的分割准确性。
本实施例提供的电子设备,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
参考图7,其示出了适于用来实现本公开实施例的电子设备900的结构示意图,该电子设备900可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑(Portable Android Device,简称PAD)、便携式多媒体播放器(Portable MediaPlayer,简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备900可以包括图像实例分割装置(例如中央处理器、图形处理器等)901,其可以根据存储在只读存储器(Read Only Memory,简称ROM)902中的程序或者从存储装置908加载到随机访问存储器(Random Access Memory,简称RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有电子设备900操作所需的各种程序和数据。图像实例分割装置901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
通常,以下装置可以连接至I/O接口905:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置906;包括例如液晶显示器(Liquid CrystalDisplay,简称LCD)、扬声器、振动器等的输出装置907;包括例如磁带、硬盘等的存储装置908;以及通信装置909。通信装置909可以允许电子设备900与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备900,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置909从网络上被下载和安装,或者从存储装置908被安装,或者从ROM902被安装。在该计算机程序被图像实例分割装置901执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network,简称LAN)或广域网(Wide Area Network,简称WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以下是本公开的一些实施例。
第一方面,根据本公开的一个或多个实施例,一种图像实例分割方法,包括:
获取待分割图像;
对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据;
根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类;
根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码;
根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
在本公开提供的可选实施例中,所述根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类,包括:
对所述中间特征数据进行下采样处理,获得下采样特征数据;
根据所述下采样特征数据和所述第一特征数据,确定所述待分割图像中物体的图像位置和物体分类。
在本公开提供的可选实施例中,所述第一特征数据的数据维度为第一维度,所述中间特征数据的数据维度为第二维度;
所述第一维度的尺寸大于所述第二维度的尺寸。
在本公开提供的可选实施例中,所述根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码,包括:
对所述中间特征数据和所述第二特征数据进行叠加处理,获得叠加特征数据;
根据所述叠加特征数据确定所述待分割图像中的物体分割掩码。
在本公开提供的可选实施例中,所述第二特征数据的数据维度与所述中间特征数据的数据维度相同。
在本公开提供的可选实施例中,所述获取待分割图像之后,还包括:
将所述待分割图像输入至图像分割处理模型,以使所述图像分割处理模型对所述待分割图像执行特征提取,分别获得所述第一特征数据、所述中间特征数据以及所述第二特征数据;以及,输出所述物体的图像位置、物体分类以及物体分割掩码。
在本公开提供的可选实施例中,该图像实例分割方法,还包括:
建立待训练的图像分割处理模型,并获得图像分割处理样本;其中,所述图像分割处理样本包括待分割图像样本,以及待分割图像样本中的物体的图像位置、物体分类以及物体分割掩码;
利用所述图像分割处理样本对所述待训练的图像分割处理模型进行训练,获得训练完毕的所述图像分割处理模型。
第二方面,根据本公开的一个或多个实施例,一种图像实例分割装置,包括:
获取模块,获取待分割图像;
处理模块,用于对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据;根据所述中间特征数据和所述第一特征数据,确定待分割图像中物体的图像位置和物体分类;根据所述中间特征数据和所述第二特征数据,确定待分割图像中的物体分割掩码;
分割模块,用于根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
在本公开提供的可选实施例中,所述处理模块,具体用于:对所述中间特征数据进行下采样处理,获得下采样特征数据;根据所述下采样特征数据和所述第一特征数据,确定所述待分割图像中物体的图像位置和物体分类。
在本公开提供的可选实施例中,所述第一特征数据的数据维度为第一维度,所述中间特征数据的数据维度为第二维度;
所述第一维度的尺寸大于所述第二维度的尺寸。
在本公开提供的可选实施例中,所述处理模块,具体用于:对所述中间特征数据和所述第二特征数据进行叠加处理,获得叠加特征数据;根据所述叠加特征数据确定所述待分割图像中的物体分割掩码。
在本公开提供的可选实施例中,所述第二特征数据的数据维度与所述中间特征数据的数据维度相同。
在本公开提供的可选实施例中,所述处理模块中还预设有图像分割处理模型;
所述处理模块具体用于:将所述待分割图像输入至图像分割处理模型,以使所述图像分割处理模型对所述待分割图像执行特征提取,分别获得所述第一特征数据、所述中间特征数据以及所述第二特征数据;以及,输出所述物体的图像位置、物体分类以及物体分割掩码。
在本公开提供的可选实施例中,该图像实例分割装置还包括:训练模块;
所述训练模块具体用于建立待训练的图像分割处理模型,并获得图像分割处理样本;其中,所述图像分割处理样本包括待分割图像样本,以及待分割图像样本中的物体的图像位置、物体分类以及物体分割掩码;利用所述图像分割处理样本对所述待训练的图像分割处理模型进行训练,获得训练完毕的所述图像分割处理模型。
第三方面,根据本公开的一个或多个实施例,一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如前任一项所述的图像实例分割方法。
第四方面,根据本公开的一个或多个实施例,一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如前任一项所述的图像实例分割方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (10)

1.一种图像实例分割方法,其特征在于,包括:
获取待分割图像;
对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据,所述第一特征数据的数据维度为第一维度,所述中间特征数据的数据维度为第二维度;所述第一维度的尺寸大于所述第二维度的尺寸;所述第二特征数据的数据维度与所述中间特征数据的数据维度相同;
对所述中间特征数据进行下采样处理,获得下采样特征数据;
将所述下采样特征数据和所述第一特征数据,输入至图像分割处理模型中的第一卷积模块,以输出所述待分割图像中物体的图像位置和物体分类;
根据所述中间特征数据和所述第二特征数据,确定所述待分割图像中的物体分割掩码;
根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
2.根据权利要求1所述的图像实例分割方法,其特征在于,所述根据所述中间特征数据和所述第二特征数据,确定所述待分割图像中的物体分割掩码,包括:
对所述中间特征数据和所述第二特征数据进行叠加处理,获得叠加特征数据;
根据所述叠加特征数据确定所述待分割图像中的物体分割掩码。
3.根据权利要求1或2所述的图像实例分割方法,其特征在于,所述获取待分割图像之后,还包括:
将所述待分割图像输入至所述图像分割处理模型,以使所述图像分割处理模型对所述待分割图像执行特征提取,分别获得所述第一特征数据、所述中间特征数据以及所述第二特征数据;以及,输出所述物体的图像位置、物体分类以及物体分割掩码。
4.根据权利要求3所述的图像实例分割方法,其特征在于,还包括:
建立待训练的图像分割处理模型,并获得图像分割处理样本;其中,所述图像分割处理样本包括待分割图像样本,以及待分割图像样本中的物体的图像位置、物体分类以及物体分割掩码;
利用所述图像分割处理样本对所述待训练的图像分割处理模型进行训练,获得训练完毕的所述图像分割处理模型。
5.一种图像实例分割处理装置,其特征在于,包括:
获取模块,获取待分割图像;
处理模块,用于对所述待分割图像的特征进行提取,获得第一特征数据、第二特征数据以及中间特征数据,所述第一特征数据的数据维度为第一维度,所述中间特征数据的数据维度为第二维度;所述第一维度的尺寸大于所述第二维度的尺寸;所述第二特征数据的数据维度与所述中间特征数据的数据维度相同;
对所述中间特征数据进行下采样处理,获得下采样特征数据;
将所述下采样特征数据和所述第一特征数据,输入至图像分割处理模型中的第一卷积模块,以输出所述待分割图像中物体的图像位置和物体分类;
根据所述中间特征数据和所述第二特征数据,确定所述待分割图像中的物体分割掩码;
分割模块,用于根据所述物体的图像位置、物体分类以及物体分割掩码,对所述待分割图像进行分割处理,获得图像实例。
6.根据权利要求5所述的图像实例分割装置,其特征在于,所述处理模块,具体用于:对所述中间特征数据和所述第二特征数据进行叠加处理,获得叠加特征数据;根据所述叠加特征数据确定所述待分割图像中的物体分割掩码。
7.根据权利要求5或6所述的图像实例分割装置,其特征在于,所述处理模块中还预设有图像分割处理模型;
所述处理模块具体用于:将所述待分割图像输入至所述图像分割处理模型,以使所述图像分割处理模型对所述待分割图像执行特征提取,分别获得所述第一特征数据、所述中间特征数据以及所述第二特征数据;以及,输出所述物体的图像位置、物体分类以及物体分割掩码。
8.根据权利要求7所述的图像实例分割装置,其特征在于,还包括:训练模块;
所述训练模块具体用于建立待训练的图像分割处理模型,并获得图像分割处理样本;其中,所述图像分割处理样本包括待分割图像样本,以及待分割图像样本中的物体的图像位置、物体分类以及物体分割掩码;利用所述图像分割处理样本对所述待训练的图像分割处理模型进行训练,获得训练完毕的所述图像分割处理模型。
9.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-4任一项所述的图像实例分割方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-4任一项所述的图像实例分割方法。
CN202010117530.XA 2020-02-25 2020-02-25 图像实例分割方法、装置、电子设备及存储介质 Active CN111340813B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010117530.XA CN111340813B (zh) 2020-02-25 2020-02-25 图像实例分割方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010117530.XA CN111340813B (zh) 2020-02-25 2020-02-25 图像实例分割方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111340813A CN111340813A (zh) 2020-06-26
CN111340813B true CN111340813B (zh) 2023-09-01

Family

ID=71183755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117530.XA Active CN111340813B (zh) 2020-02-25 2020-02-25 图像实例分割方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111340813B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016559A (zh) * 2020-08-26 2020-12-01 北京推想科技有限公司 实例分割模型的训练方法及装置,图像处理的方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3316217A1 (en) * 2016-10-31 2018-05-02 Siemens Healthcare GmbH Deep learning based bone removal in computed tomography angiography
CN109409371A (zh) * 2017-08-18 2019-03-01 三星电子株式会社 用于图像的语义分割的系统和方法
WO2019066794A1 (en) * 2017-09-27 2019-04-04 Google Llc END-TO-END NETWORK MODEL FOR HIGH-RESOLUTION IMAGE SEGMENTATION
WO2019080685A1 (zh) * 2017-10-24 2019-05-02 北京京东尚科信息技术有限公司 视频图像分割方法及装置、存储介质、电子设备
CN110298851A (zh) * 2019-07-04 2019-10-01 北京字节跳动网络技术有限公司 人体分割神经网络的训练方法及设备
WO2019200758A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 语义分割模型的训练方法、装置、计算机设备和存储介质
CN110443812A (zh) * 2019-07-26 2019-11-12 北京百度网讯科技有限公司 眼底图像分割方法、装置、设备和介质
CN110490203A (zh) * 2019-07-05 2019-11-22 平安科技(深圳)有限公司 图像分割方法及装置、电子设备和计算机可读存储介质
CN110705558A (zh) * 2019-09-29 2020-01-17 郑州阿帕斯科技有限公司 图像实例分割方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311716B2 (en) * 2014-05-14 2016-04-12 International Business Machines Corporation Static image segmentation
US10896508B2 (en) * 2018-02-07 2021-01-19 International Business Machines Corporation System for segmentation of anatomical structures in cardiac CTA using fully convolutional neural networks
US10726555B2 (en) * 2018-06-06 2020-07-28 International Business Machines Corporation Joint registration and segmentation of images using deep learning
US10817758B2 (en) * 2018-06-20 2020-10-27 International Business Machines Corporation Framework for integrating deformable modeling with 3D deep neural network segmentation

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3316217A1 (en) * 2016-10-31 2018-05-02 Siemens Healthcare GmbH Deep learning based bone removal in computed tomography angiography
CN109409371A (zh) * 2017-08-18 2019-03-01 三星电子株式会社 用于图像的语义分割的系统和方法
WO2019066794A1 (en) * 2017-09-27 2019-04-04 Google Llc END-TO-END NETWORK MODEL FOR HIGH-RESOLUTION IMAGE SEGMENTATION
WO2019080685A1 (zh) * 2017-10-24 2019-05-02 北京京东尚科信息技术有限公司 视频图像分割方法及装置、存储介质、电子设备
WO2019200758A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 语义分割模型的训练方法、装置、计算机设备和存储介质
CN110298851A (zh) * 2019-07-04 2019-10-01 北京字节跳动网络技术有限公司 人体分割神经网络的训练方法及设备
CN110490203A (zh) * 2019-07-05 2019-11-22 平安科技(深圳)有限公司 图像分割方法及装置、电子设备和计算机可读存储介质
CN110443812A (zh) * 2019-07-26 2019-11-12 北京百度网讯科技有限公司 眼底图像分割方法、装置、设备和介质
CN110705558A (zh) * 2019-09-29 2020-01-17 郑州阿帕斯科技有限公司 图像实例分割方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种Unet图像分割模型的联邦蒸馏优化算法;Jeong Y S et al;《Ksii Transactions on Internet & Information Systems》;第07卷(第12期);全文 *

Also Published As

Publication number Publication date
CN111340813A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN112184738B (zh) 一种图像分割方法、装置、设备及存储介质
US11443438B2 (en) Network module and distribution method and apparatus, electronic device, and storage medium
CN110298851B (zh) 人体分割神经网络的训练方法及设备
CN111783626B (zh) 图像识别方法、装置、电子设备及存储介质
CN111310815A (zh) 图像识别方法、装置、电子设备及存储介质
CN113313064A (zh) 字符识别方法、装置、可读介质及电子设备
CN111209856B (zh) 发票信息的识别方法、装置、电子设备及存储介质
CN110310293B (zh) 人体图像分割方法及设备
CN111783632B (zh) 针对视频流的人脸检测方法、装置、电子设备及存储介质
CN111340813B (zh) 图像实例分割方法、装置、电子设备及存储介质
CN111368668B (zh) 三维手部识别方法、装置、电子设备及存储介质
CN112418054A (zh) 图像处理方法、装置、电子设备和计算机可读介质
CN116681765A (zh) 图像内标识位置确定方法、模型训练方法、装置及设备
WO2023065895A1 (zh) 文本识别方法、装置、可读介质及电子设备
CN114004229A (zh) 文本识别方法、装置、可读介质及电子设备
CN114511744A (zh) 图像分类方法、装置、可读介质和电子设备
CN112070034A (zh) 图像识别方法、装置、电子设备和计算机可读介质
CN112418233A (zh) 图像处理方法、装置、可读介质及电子设备
CN111860209B (zh) 手部识别方法、装置、电子设备及存储介质
CN115393472B (zh) 画布处理方法、装置、电子设备、可读介质和程序产品
CN115719468B (zh) 图像处理方法、装置及设备
CN116704473B (zh) 障碍物信息检测方法、装置、电子设备和计算机可读介质
CN117746273A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN116740775A (zh) 关键点检测方法及设备
CN118071671A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant