CN111583283B - 图像分割方法、装置、电子设备及介质 - Google Patents

图像分割方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN111583283B
CN111583283B CN202010431983.XA CN202010431983A CN111583283B CN 111583283 B CN111583283 B CN 111583283B CN 202010431983 A CN202010431983 A CN 202010431983A CN 111583283 B CN111583283 B CN 111583283B
Authority
CN
China
Prior art keywords
target
frame image
area
determining
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010431983.XA
Other languages
English (en)
Other versions
CN111583283A (zh
Inventor
李华夏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Original Assignee
Douyin Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd filed Critical Douyin Vision Co Ltd
Priority to CN202010431983.XA priority Critical patent/CN111583283B/zh
Publication of CN111583283A publication Critical patent/CN111583283A/zh
Application granted granted Critical
Publication of CN111583283B publication Critical patent/CN111583283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例提供了一种图像分割方法、装置、电子设备及介质。该方法包括:确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域;图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域;循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件。本公开实施例提升了分割效果。

Description

图像分割方法、装置、电子设备及介质
技术领域
本公开涉及图像处理技术领域,具体而言,本公开涉及一种图像分割方法、装置、电子设备及介质。
背景技术
随着信息技术的不断发展,图像已成为传输网络中不可或缺的重要信息。随着图像的使用越来越广泛,图像处理技术也变得越来越重要,其中,图像分割处理是图像处理技术中的一种重要处理技术。
图像分割处理技术是一种把图像分割成具有特征的区域,并提取感兴趣的目标特征的技术。现有技术中,通常对一张图像中的前景、背景以及目标对象做分割处理,以提取目标对象。若针对视频中至少两帧图像且目标对象在各帧图像中的占比均较小时,不容易识别到目标对象,可能对目标对象进行分割的复杂度较高,且分割效果不佳,因此,如何对至少两帧图像进行分割得到目标对象成为一个关键问题。
发明内容
本公开提供了一种图像分割方法、装置、电子设备及介质,可以解决以上至少一种技术问题。
第一方面,提供了一种图像分割方法,该方法包括:
确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域;
图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;
确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域;
循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件。
第二方面,提供了一种图像分割装置,该装置包括:
确定第一目标区域模块,用于确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域;
图像分割模块,用于对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;
确定目标对象区域模块,用于当存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域;
第一循环模块,用于循环执行确定第一目标区域模块、图像分割模块以及确定目标对象区域模块对应的操作,直至满足第二预设条件。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行根据第一方面所示的图像分割方法对应的操作。
第四方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所示的图像分割方法。
本公开提供的技术方案带来的有益效果是:
本公开提供了一种图像分割方法、装置、电子设备及介质,与现有技术相比,本公开通过确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域,然后通过图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果,然后确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域,然后循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件,实现了针对待处理视频,当确定各目标帧图像中包含目标对象的目标区域时,基于各目标区域分别对目标对象进行图像分割,由于目标对象在目标区域中的占比大于目标对象在目标帧图像中的占比,使得相较于直接基于目标帧图像对目标对象进行图像分割,基于目标区域对目标对象进行图像分割时更容易在目标区域中识别到目标对象,从而降低对目标对象进行图像分割的复杂度,进而提升了分割效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种图像分割方法的流程示意图;
图2为本公开实施例提供的一种图像分割装置的结构示意图;
图3为本公开实施例提供的一种电子设备的结构示意图;
图4为本公开实施例提供的分割网络的结构示意图;
图5为本公开实施例提供的步骤A的详细流程示意图;
图6为本公开实施例提供的一种基于全图的检测网络的结构示意图;
图7为本公开实施例提供的步骤B的详细流程示意图;
图8为本公开实施例提供的步骤S102的详细流程示意图;
图9为本公开实施例提供的第四图像中各区域的示意图;
图10为本公开实施例提供的对图像进行分割的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
实施例一
本公开实施例提供了一种图像分割方法,由电子设备执行,该电子设备可以为终端设备,也可以为服务器,如图1所示,该方法包括:
步骤S101,确定第一目标区域步骤。
其中,确定第一目标区域步骤可以包括:确定目标帧图像中的至少一个第一目标区域。
其中,任一第一目标区域为目标帧图像中包含目标对象的区域。
对于本公开实施例,针对预设视频,目标帧图像为能检测到包含第一目标区域的任一帧图像,且目标帧图像中包含至少一个第一目标区域。例如,预设视频包含三帧图像,其中,第一帧图像可以检测到第一目标区域1,第三帧图像可以检测到第一目标区域2以及第一目标区域3,则目标帧图像可以为第一帧图像和第三帧图像,当目标帧图像为第一帧图像时,目标帧图像中包含一个第一目标区域(即第一目标区域1);当目标帧图像为第三帧图像时,目标帧图像中包含两个第一目标区域(即第一目标区域2以及第一目标区域3)。
对于本公开实施例,第一目标区域可以为目标帧图像中包含目标对象的矩形区域,如目标帧图像中由至少三个位置点的坐标信息所构成的矩形区域,或者目标帧图像中由一个位置点的坐标信息以及两个边长信息所构成的矩形区域;第一目标区域还可以为目标帧图像中包含目标对象的圆形区域,如目标帧图像中由一个点的坐标信息以及半径信息所构成的圆形区域;其中,第一目标区域不限于矩形区域或者圆形区域,还可以为其他形状的区域,在本公开实施例中不做限定。
其中,第一目标区域中包含的目标对象可以为任意的物体,如目标对象可以为人、动物、车辆中的至少一个,在本公开实施例中不做限定。
步骤S102,图像分割步骤。
其中,图像分割步骤可以包括:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果。
例如,当目标帧图像为第一帧图像时,且目标帧图像中包含第一目标区域1时,可以对第一目标区域1进行图像分割处理,得到第一目标区域1对应的分割结果;当目标帧图像为第三帧图像时,且目标帧图像中包含第一目标区域2以及第一目标区域3时,可以对第一目标区域2以及第一目标区域3分别进行图像分割处理,得到第一目标区域2对应的分割结果以及第一目标区域3对应的分割结果。
步骤S103,确定目标对象区域步骤。
其中,确定目标对象区域步骤可以包括:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
其中,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域。
对于本公开实施例,当至少一个第一目标区域对应的分割结果中存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,其中,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域。例如,当目标帧图像为第三帧图像,目标帧图像中包含第一目标区域2以及第一目标区域3,且第一目标区域2对应的分割结果满足第一预设条件,第一目标区域3对应的分割结果不满足第一预设条件,则第一目标区域2为第二目标区域,第一目标区域2对应的分割结果为第二目标区域对应的分割结果,进一步地,可以基于第一目标区域2对应的分割结果确定第一目标区域2内的目标对象区域,即可以基于第二目标区域对应的分割结果确定第二目标区域内的目标对象区域。
对于本公开实施例,满足第一预设条件为基于分割结果计算得到的连通域值大于预设连通域阈值,即可以基于分割结果计算连通域值,当连通域值大于预设连通域阈值时,分割结果满足第一预设条件;当连通域值不大于预设连通域阈值时,分割结果不满足第一预设条件。其中,在图像中将具有相同像素值且位置相邻的前景像素点组成的图像区域称为连通区域。
进一步地,循环执行步骤S101、步骤S102以及步骤S103,直至满足第二预设条件。
对于本公开实施例,当不满足第二预设条件时,可以循环执行步骤S101、步骤S102以及步骤S103,直至当满足第二预设条件时,循环终止。其中,满足第二预设条件可以包括目标帧图像满足第二预设条件,即目标帧图像为预设视频的最后一帧图像,当目标帧图像为非最后一帧图像时,可以循环执行步骤S101、步骤S102以及步骤S103,直至当目标帧图像为最后一帧图像时,循环终止。
本公开实施例提供了如下实例:
如图10所示,针对目标帧图像1000,按照本公开实施例的方式,可以确定目标帧图像1000中包括三个第一目标区域,分别为第一目标区域1001、第一目标区域1002、以及第一目标区域1003。
进一步地,对第一目标区域1001、第一目标区域1002以及第一目标区域1003分别进行图像分割处理,得到第一目标区域1001对应的分割结果、第一目标区域1002对应的分割结果以及以及第一目标区域1003对应的分割结果,当第一目标区域对应的分割结果满足第一预设条件时,该第一目标区域可以确定为第二目标区域,可以基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
如图10中,第一目标区域1001对应的分割结果以及第一目标区域1002对应的分割结果均满足第一预设条件,而第一目标区域1003对应的分割结果不满足第一预设条件,则第一目标区域1001可以确定为第二目标区域1001,以及第一目标区域1002可以确定为第二目标区域1002。进一步地,可以基于第二目标区域1001对应的分割结果,确定第二目标区域1001中的目标对象区域1004,以及基于第二目标区域1002对应的分割结果,第二目标区域1002中的目标对象区域1005。
本公开实施例提供了一种图像分割方法,与现有技术相比,本公开实施例通过确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域,然后通过图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果,然后确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域,然后循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件,实现了针对待处理视频,当确定各目标帧图像中包含目标对象的目标区域时,基于各目标区域分别对目标对象进行图像分割,由于目标对象在目标区域中的占比大于目标对象在目标帧图像中的占比,使得相较于直接基于目标帧图像对目标对象进行图像分割,基于目标区域对目标对象进行图像分割时更容易在目标区域中识别到目标对象,从而降低对目标对象进行图像分割的复杂度,进而提升了分割效果。
实施例二
本公开实施例提供了另一种可能实现方式,步骤S101即确定第一目标区域步骤,具体可以包括步骤A(图中未示出)以及步骤B(图中未示出)中的至少一项,其中,
步骤A,基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤。
具体地,如图5所示,步骤A可以包括:
步骤S501,获取待检测帧图像。
步骤S502,将待检测帧图像通过基于全图的检测网络进行图像检测处理,得到至少一个第一检测结果。
步骤S503,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域。
对于本公开实施例,如图6所示,图6示出了一种基于全图的检测网络的结构示意图。基于全图的检测网络包括7个卷积层,在图6中分别为conv1至conv7,其中,conv1可以为VGG(全称:Visual Geometry Group)网络。在本公开实施例中,可以将待检测帧图像输入至基于全图的检测网络中,可以将conv7的输出作为至少一个第一检测结果,也可以从conv1至conv7的输出中,选择置信度最高的输出作为至少一个第一检测结果。
作为一优选实例,可以将300*300*3的图像输入至基于全图的检测网络,经过conv1进行卷积处理,将300*300*3的图像转换为38*38*512的图像;经过conv2进行卷积处理,将38*38*512的图像转换为19*19*1024的图像;经过conv3、conv4进行卷积处理,将19*19*1024的图像转换为10*10*512的图像;经过conv5进行卷积处理,将10*10*512的图像转换为5*5*256的图像;经过conv6进行卷积处理,将5*5*256的图像转换为3*3*256的图像;经过conv7进行卷积处理,将3*3*256的图像转换为1*1*256的图像。
其中,x*y*z的图像中,x指图像的长,y指图像的宽,z指图像的通道数。
对于本公开实施例,待检测帧图像可以为预设视频中的任意一帧图像,如待检测帧图像可以为预设视频的第一帧图像、预设视频的中间某一帧图像、预设视频的最后一帧图像、包含至少一个第二目标区域的目标帧图像的下一帧图像以及不包含第二目标区域的目标帧图像的下一帧图像中的至少一项,在本公开实施例中不做限定。在本公开实施例中,可以从预设视频中获取待检测帧图像,并将待检测帧图像通过基于全图的检测网络进行图像检测处理,得到待检测帧图像对应的至少一个第一检测结果,例如,从预设视频中获取第一帧图像,可以将第一帧图像通过基于全图的检测网络进行图像检测处理,得到第一帧图像对应的两个第一检测结果,分别为第一检测结果1以及第一检测结果2。
进一步地,基于至少一个第一检测结果可以确定目标帧图像中的至少一个第一目标区域。
其中,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域,具体可以包括:若至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,基于至少一个满足第三预设条件的第一检测结果分别确定待检测帧图像中的至少一个目标区域,并将待检测帧图像中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
对于本公开实施例,满足第三预设条件为第一检测结果中的第一概率信息大于第一概率阈值,即当第一检测结果中的第一概率信息大于第一概率阈值时,第一检测结果满足第三预设条件;当第一检测结果中的第一概率信息不大于第一概率阈值时,第一检测结果不满足第三预设条件。
进一步地,针对至少一个第一检测结果,当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于至少一个满足第三预设条件的第一检测结果分别确定待检测帧图像中的至少一个目标区域,并将待检测帧图像中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。例如,针对第一帧图像对应的第一检测结果1以及第一检测结果2,若第一检测结果1满足第三预设条件,第一检测结果2不满足第三预设条件,则基于第一检测结果1确定第一帧图像中的目标区域,并将第一帧图像中的目标区域确定为目标帧图像中的第一目标区域。
其中,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域,具体还可以包括:若各个第一检测结果均不满足第三预设条件,循环执行确定下一帧图像为待检测帧图像以及步骤A,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果;当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于至少一个满足第三预设条件的第一检测结果,确定目标帧图像中的至少一个第一目标区域。
其中,可以从预设视频中提取待下一帧图像,且下一帧图像为待检测帧图像的下一帧。如待检测帧图像为预设视频中的第一帧图像时,下一帧图像为预设视频中的第二帧图像。
对于本公开实施例,当不满足第二预设条件时,且针对至少一个第一检测结果,当各个第一检测结果均不满足第三预设条件时,说明当前的待检测帧图像中不包含第一目标区域,则循环执行确定下一帧图像为待检测帧图像以及步骤A,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,循环终止。其中,满足第二预设条件包括待检测帧图像满足第二预设条件,即待检测帧图像为预设视频的最后一帧图像,当待检测帧图像为预设视频的非最后一帧图像,且针对至少一个第一检测结果,各个第一检测结果均不满足第三预设条件时,循环执行确定下一帧图像为待检测帧图像以及步骤A,直至当待检测帧图像为预设视频的非最后一帧图像,或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,循环终止。
例如,预设视频包括三帧图像,当待检测帧图像为第一帧图像(即待检测帧图像为非最后一帧图像),且针对第一帧图像对应的第一检测结果1以及第一检测结果2,第一检测结果1以及第一检测结果2均不满足第三预设条件时,说明第一帧图像不包含第一目标区域,则循环执行确定第二帧图像为待检测帧图像以及步骤A,从而得到第二帧图像对应的至少一个第一检测结果,若第二帧图像对应第一检测结果3,且第一检测结果3满足第三预设条件,则循环终止。
对于本公开实施例,当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于至少一个满足第三预设条件的第一检测结果,确定目标帧图像中的至少一个第一目标区域,可以见上述实施例的相关说明,这里不再赘述。
进一步地,循环执行确定下一帧图像为待检测帧图像以及步骤A,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,具体可以包括:循环执行利用第一预设特效图像替换待检测帧图像,确定下一帧图像为待检测帧图像以及步骤A,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果。
对于本公开实施例,第一预设特效图像包括计算机生成的特效图像以及人工拍摄的特效图像中的至少一种,其中,第一预设特效图像可以为任意特效的图像,例如,雪花特效、气泡特效、雷电特效、卡通人物特效等。
对于本公开实施例,针对至少一个第一检测结果,当各个第一检测结果均不满足第三预设条件,即各个第一检测结果中的第一概率信息均不大于第一概率阈值时,说明待检测帧图像中不包含第一目标区域,可以获取第一预设特效图像,并利用第一预设特效图像替换待检测帧图像。其中,针对任意两帧不存在第一目标区域的待检测帧图像,可以利用同一张第一预设特效图像去替换,也可以利用不同的两张第一预设特效图像去替换,例如,若第n帧图像(待检测帧图像)不存在目标区域信息,则可以获取雪花特效图像,并利用雪花特效图像替换第n帧图像;若第n+1帧图像(待检测帧图像)也不存在目标区域信息,则可以获取雪花特效图像,并利用雪花特效图像替换第n+1帧图像,也可以获取雷电特效图像,并利用雷电特效图像替换第n+1帧图像。
具体地,任一第一检测结果可以包括待检测帧图像中的第一检测区域以及第一检测区域内包含目标对象的第一概率信息。
其中,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域,具体可以包括:基于至少一个第一检测区域内分别包含目标对象的第一概率信息确定大于第一概率阈值的第一概率信息,并将确定出的大于第一概率阈值的第一概率信息所对应的第一检测区域确定为第一目标区域。
对于本公开实施例,将待检测帧图像通过基于全图的检测网络进行图像检测处理,得到至少一个第一检测结果,任一个第一检测结果包括待检测帧图像中的第一检测区域以及第一检测区域内包含目标对象的第一概率信息。例如,第一帧图像通过基于全图的检测网络进行图像检测处理,得到第一检测结果1以及第一检测结果2,第一检测结果1包括第一检测区域1以及第一检测区域1内包含目标对象的第一概率信息0.75;第一检测结果2包括第一检测区域2以及第一检测区域2内包含目标对象的第一概率信息0.9。
其中,待检测帧图像中的第一检测区域可以为矩形区域,如待检测帧图像中由至少三个位置点的坐标信息所构成的矩形区域,或者待检测帧图像中由一个位置点的坐标信息以及两个边长信息所构成的矩形区域;待检测帧图像中的第一检测区域还可以为圆形区域,如待检测帧图像中由一个点的坐标信息以及半径信息所构成的圆形区域;其中,第一检测区域不限于矩形区域或者圆形区域,还可以为其他形状的区域,在本公开实施例中不做限定。
进一步地,基于至少一个第一检测区域内分别包含目标对象的第一概率信息确定大于第一概率阈值的第一概率信息,并将确定出的大于第一概率阈值的第一概率信息所对应的第一检测区域确定为第一目标区域。即当任一第一检测结果中的第一概率信息大于第一概率阈值时,该任一第一检测结果满足第三预设条件,将该任一第一检测结果中的第一检测区域确定为第一目标区域。
例如,第一概率阈值为0.85,第一检测结果1包括第一检测区域1以及第一检测区域1内包含目标对象的第一概率信息0.75;第一检测结果2包括第一检测区域2以及第一检测区域2内包含目标对象的第一概率信息0.9。由于第一检测区域1内包含目标对象的第一概率信息0.75小于第一概率阈值为0.85,且第一检测区域2内包含目标对象的第一概率信息0.9大于第一概率阈值为0.85,因此,第一检测结果1不满足第三预设条件且第一检测结果2满足第三预设条件,可以将第一检测结果2中的第一检测区域2确定为第一目标区域,即将确定出的大于第一概率阈值0.85的第一概率信息0.9所对应的第一检测区域2确定为第一目标区域。
步骤B,基于待处理帧图像确定目标帧图像中的至少一个第一目标区域的步骤。
其中,如图7所示,步骤B具体可以包括:
步骤S701,获取待处理帧图像。
步骤S702,基于至少一个第二目标区域确定待处理帧图像中的待检测区域。
步骤S703,将待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个第二检测结果。
步骤S704,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域。
对于本公开实施例,基于框的检测网络的结构与基于全图的检测网络的结构相似,二者仅存在网络大小的区别,具体针对基于框的检测网络的结构的详细描述,可以见对基于全图的检测网络的结构的详细描述,在此不再赘述。
其中,待处理帧图像为包含至少一个第二目标区域的目标帧图像的下一帧图像。具体地,待检测帧图像对应的至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,该待检测帧图像可以为目标帧图像,当该待检测帧图像中存在至少一个满足第一预设条件的分割结果时,该待检测帧图像中包含至少一个第二目标区域,待处理帧图像为该包含至少一个第二目标区域的待检测帧图像的下一帧图像,如第一帧图像(待检测帧图像)对应第一检测结果1以及第一检测结果2,若第一检测结果1满足第三预设条件,第一检测结果2不满足第三预设条件,则第一帧图像可以为目标帧图像,当第一帧图像中存在至少一个满足第一预设条件的分割结果时,第一帧图像包含至少一个第二目标区域,此时待处理帧图像为包含至少一个第二目标区域的第一帧图像的下一帧图像,即第二帧图像;待处理帧图像中的待检测区域对应的至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,该待处理帧图像可以为目标帧图像,当该待处理帧图像中存在至少一个满足第一预设条件的分割结果时,该待处理帧图像中包含至少一个第二目标区域,此时待处理帧图像为该包含至少一个第二目标区域的待处理帧图像的下一帧图像,如,第二帧图像(待处理帧图像)中的待检测区域对应第二检测结果1,若第二检测结果1满足第四预设条件,则第二帧图像可以为目标帧图像,当第二帧图像中存在至少一个满足第一预设条件的分割结果时,第二帧图像中包含至少一个第二目标区域,此时,待检测帧图像为包含至少一个第二目标区域的第二帧图像的下一帧图像,即第三帧图像。
对于本公开实施例,可以从预设视频中获取待处理帧图像,基于目标帧图像对应的至少一个第二目标区域确定待处理帧图像中的至少一个待检测区域。其中,可以基于目标帧图像中各个第二目标区域的位置信息,确定待处理帧图像中的待检测区域,该位置信息可以为顶点的坐标信息、中心点的坐标信息以及边长信息中的至少一项。
具体地,可以确定目标帧图像中各个第二目标区域各自的位置信息,基于各个第二目标区域各自的位置信息确定目标位置信息,从而基于目标位置信息确定待处理帧图像中的一个待检测区域,例如,可以确定目标帧图像中第二目标区域a的位置信息:顶点的坐标信息(1,0)、边长信息2cm以及边长信息1cm、以及目标帧图像中第二目标区域b的位置信息:顶点的坐标信息(1,2)、边长信息1cm以及边长信息1cm,基于第二目标区域a的位置信息以及第二目标区域b的位置信息,确定一个目标位置信息,如顶点的坐标信息(1,0)、边长信息2cm以及边长信息3cm,从而基于目标位置信息确定待检测帧图像中的一个待检测区域,该待检测区域的位置信息为目标位置信息;还可以确定目标帧图像中各个第二目标区域各自的位置信息,基于各个第二目标区域各自的位置信息分别确定待处理帧图像中的各个待检测区域,例如,可以确定目标帧图像中第二目标区域a的位置信息:顶点的坐标信息(1,0)、边长信息2cm以及边长信息1cm,从而确定待处理帧图像中的待检测区域a的位置信息:顶点的坐标信息(1,0)、边长信息2cm以及边长信息1cm;可以确定目标帧图像中第二目标区域b的位置信息:顶点的坐标信息(1,2)、边长信息1cm以及边长信息1cm,从而确定待处理帧图像中的待检测区域b的位置信息:顶点的坐标信息(1,2)、边长信息1cm以及边长信息1cm。
对于本公开实施例,基于至少一个第二目标区域确定待处理帧图像中的待检测区域时,可以按照预设扩展比例对各个第二目标区域进行扩展处理,基于扩展处理后的各个第二目标区域确定待处理帧图像中的待检测区域。其中,优选按照1:1.15对各个第二目标区域进行扩展处理,即对各个第二目标区域扩展15%。
对于本公开实施例,将至少一个待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个待检测区域对应的至少一个第二检测结果,例如,待检测区域a以及待检测区域b通过基于框的检测网络进行图像检测处理,得到一个第二检测结果1。进一步地,基于至少一个第二检测结果可以确定目标帧图像中的至少一个第一目标区域。
其中,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域,具体可以包括:若至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,基于至少一个满足第四预设条件的第二检测结果分别确定待检测区域中的至少一个目标区域,并将待检测区域中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
对于本公开实施例,满足第四预设条件为第二检测结果中的第二概率信息大于第二概率阈值,即当第二检测结果中的第二概率信息大于第二概率阈值时,第二检测结果满足第四预设条件;当第二检测结果中的第二概率信息不大于第二概率阈值时,表征第二检测结果不满足第四预设条件。
进一步地,针对至少一个第二检测结果,当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于至少一个满足第四预设条件的第二检测结果分别确定待检测区域中的至少一个目标区域,并将待检测区域中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域,其中,待检测区域中的至少一个目标区域即为待处理帧图像中的至少一个目标区域。例如,针对待检测区域对应的第二检测结果1,若第二检测结果1满足第四预设条件,则基于第二检测结果1确定待检测区域中的目标区域,即基于第二检测结果1确定待处理帧图像中的目标区域,并将待处理帧图像中的目标区域确定为目标帧图像中的第一目标区域。
其中,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域,具体还可以包括:若各个第二检测结果均不满足第四预设条件,循环执行确定预设帧图像为待检测帧图像、步骤A、步骤S102、步骤S103、步骤B,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果;当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于至少一个满足第四预设条件的第二检测结果,确定目标帧图像中的至少一个第一目标区域。
其中,可以从预设视频中提取预设帧图像,且预设帧图像为待处理帧图像的下一帧。如待处理帧图像为预设视频中的第二帧图像时,预设帧图像为预设视频中的第三帧图像。
对于本公开实施例,当不满足第二预设条件时,且针对至少一个第二检测结果,当各个第二检测结果均不满足第四预设条件时,说明待检测区域中不包含第一目标区域,即待处理帧图像中不包含第一目标区域,则循环执行确定预设帧图像为待检测帧图像、步骤A、步骤S102、步骤S103、步骤B,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,循环终止。其中,满足第二预设条件包括待处理帧图像满足第二预设条件,即待处理帧图像为预设视频的最后一帧图像,当待处理帧图像为预设视频的非最后一帧图像,且针对至少一个第二检测结果,各个第二检测结果均不满足第四预设条件时,循环执行确定预设帧图像为待检测帧图像、步骤A、步骤S102、步骤S103、步骤B,直至待处理帧图像为预设视频的最后一帧图像或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,循环终止。
例如,预设视频包括三帧图像,当待处理帧图像为第二帧图像(即待处理帧图像为非最后一帧图像),且第二帧图像中的待检测区域对应的第二检测结果1不满足第四预设条件时,说明第二帧图像不包含第一目标区域,则循环执行确定第三帧图像为待检测帧图像、步骤A、步骤S102、步骤S103、步骤B,从而得到第三帧图像中的待检测区域对应的至少一个第二检测结果,由于第三帧图像为最后一帧图像,循环终止。
对于本公开实施例,当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于至少一个满足第四预设条件的第二检测结果,确定目标帧图像中的至少一个第一目标区域,可以见上述实施例的相关说明,这里不再赘述。
进一步地,循环执行确定预设帧图像为待检测帧图像、步骤A、步骤S102、步骤S103、步骤B,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,具体可以包括:循环执行利用第二预设特效图像替换待处理帧图像,确定预设帧图像为待检测帧图像、步骤A、步骤S102、步骤S103、步骤B,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果。
对于本公开实施例,针对至少一个第二检测结果,当各个第二检测结果均不满足第四预设条件,即各个第二检测结果中的第二概率信息均不大于第二概率阈值时,说明待处理帧图像中不包含第一目标区域,可以获取第二预设特效图像,并利用第二预设特效图像替换待处理帧图像。其中,针对任意两帧不存在第一目标区域的待处理帧图像,可以利用同一张第二预设特效图像去替换,也可以利用不同的两张第二预设特效图像去替换,在此不做限定。在本公开实施例中,第二预设特效图像可以与第一预设特效图像相同,也可以不同。
具体地,任一第二检测结果可以包括待检测区域中的第二检测区域以及第二检测区域中包含目标对象的第二概率信息。
其中,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域,具体可以包括:基于至少一个第二检测区域内分别包含目标对象的第二概率信息确定大于第二概率阈值的第二概率信息,并将确定出的大于第二概率阈值的第二概率信息所对应的第二检测区域确定为第一目标区域。
对于本公开实施例,将待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个第二检测结果,任一个第二检测结果包括待检测区域中的第二检测区域以及第二检测区域内包含目标对象的第二概率信息。例如,第二帧图像中的待检测区域通过基于框的检测网络进行图像检测处理,得到第二检测结果1,第一检测结果1包括第二检测区域1以及第二检测区域1内包含目标对象的第二概率信息0.8。
其中,待检测区域中的第二检测区域可以为矩形区域,如待检测区域中由至少三个位置点的坐标信息所构成的矩形区域,或者待检测区域中由一个位置点的坐标信息以及两个边长信息所构成的矩形区域;待检测区域中的第二检测区域还可以为圆形区域,如待检测区域中由一个点的坐标信息以及半径信息所构成的圆形区域;其中,第二检测区域不限于矩形区域或者圆形区域,还可以为其他形状的区域,在本公开实施例中不做限定。
进一步地,基于至少一个第二检测区域内分别包含目标对象的第二概率信息确定大于第二概率阈值的第二概率信息,并将确定出的大于第二概率阈值的第二概率信息所对应的第二检测区域确定为第一目标区域。即当任一第二检测结果中的第二概率信息大于第二概率阈值时,该任一第二检测结果满足第四预设条件,将该任一第二检测结果中的第二检测区域确定为第一目标区域,其中,第二概率阈值可以与第一概率阈值相同,也可以与第一概率阈值不同,在本公开实施例中不做限定。
上述实施例从详细介绍了步骤S101,其中,步骤S101可以采用上述实施例中记载的方式,也可以采用现有技术中的方式,在本公开实施例中不做限定。
实施例三
本公开实施例提供的另一种可能实现方式,如图8所示,步骤S102,即图像分割步骤,具体可以包括:
步骤S801,基于至少一个第一目标区域对目标帧图像进行剪切处理,得到各个第一目标区域对应的待分割图像。
步骤S802,将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理,得到各个第一目标区域对应的分割结果。
对于本公开实施例,基于框的分割网络模型的结构如图4所示,其中,基于框的分割网络模型为U型结构,为全卷积网络。基于框的分割网络模型的左侧(即左侧虚线框)是对图像进行下采样操作,如图4为四次下采样操作,具体地,对输入基于框的分割网络模型的图像先进行两次卷积操作(左侧虚线框内向右的箭头“→”表示卷积操作)以及一次下采样操作(左侧虚线框内向下的箭头“↓”表示下采样),每一次下采样的倍数都是2,以此类推,共进行四次下采样操作;基于框的分割网络模型的右侧(即右侧虚线框)是对图像进行上采样操作,如图4为四次上采样操作,具体地,对第四次下采样后的图片先进行两次反卷积操作(右侧虚线框内向右的箭头“→”表示反卷积操作)和一次上采样操作(右侧虚线框内向上的箭头“↑”表示上采样),每一次上采样的倍数也为2,然后将右侧上采样操作后的图片的通道数与左侧对称的下采样前图片的通道数进行叠加(即右侧虚线框内向上的箭头“↑”所指向的图片与虚线箭头所指向的图片进行通道数叠加),以此类推,共进行四次上采样操作,其中,第四次上采样操作后,再经过三次反卷积操作,得到输出结果。
对于本公开实施例,基于框的分割网络模型能够将浅层的特征通过通道叠加的方式加到深层,从而保留更多的原图信息。需要说明的是,在本公开实施例中上采样操作与下采样操作的次数不做限定,如图4中采用四次上采样操作和四次下采样操作,在本公开实施例中,可以优选采用三次上采样操作和三次下采样操作。
对于本公开实施例,可以基于目标帧图像中的至少一个第一目标区域对该目标帧图像进行剪切处理,得到各个第一目标区域对应的待分割图像,将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理,得到各个第一目标区域对应的分割结果。例如,当目标帧图像为第三帧图像,且第三帧图像中包含第一目标区域2以及第一目标区域3,可以基于第一目标区域2以及第一目标区域3对第三帧图像进行剪切处理,得到第一目标区域2对应的待分割图像以及第一目标区域3对应的待分割图像,将第一目标区域2对应的待分割图像以及第一目标区域3对应的待分割图像分别通过基于框的分割网络进行图像分割处理,得到第一目标区域2对应的分割结果以及第一目标区域3对应的分割结果。
进一步地,步骤S102之后,即图像分割步骤之后,还可以包括:若各个第一目标区域对应的分割结果均不满足第一预设条件,循环执行步骤S101以及步骤S102,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件;当存在至少一个第一目标区域对应的分割结果满足第一预设条件时,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
对于本公开实施例,当目标帧图像为非最后一帧图像且目标帧图像中各个第一目标区域对应的分割结果均不满足第一预设条件时,说明目标帧图像不包含第二目标区域,可以循环执行步骤S101以及步骤S102,直至目标帧图像为最后一帧图像或者目标帧图像中存在至少一个第一目标区域对应的分割结果满足第一预设条件,循环终止。其中,执行步骤S101时,可以执行步骤A,关于步骤A可以详见上述实施例的相关说明,在此不再赘述。
例如,预设视频包括三帧图像,当目标帧图像为第二帧图像(即目标帧图像为非最后一帧图像),且第二帧图像中各个第一目标区域对应的分割结果均不满足第一预设条件时,说明第二帧图像不包含第二目标区域,则循环执行步骤S102以及步骤S103,从而得到目标帧图像中各个第一目标区域对应的分割结果,若目标帧图像为第三帧图像,由于第三帧图像为最后一帧图像,循环终止。
对于本公开实施例,当存在至少一个第一目标区域对应的分割结果满足第一预设条件时,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,可以见上述实施例的相关说明,这里不再赘述。
其中,循环执行步骤S101以及步骤S102,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件,具体可以包括:循环执行利用第三预设特效图像替换目标帧图像、步骤S101以及步骤S102,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件。
对于本公开实施例,针对目标帧图像中的至少一个第一目标区域对应的分割结果,当各个分割结果均不满足第一预设条件,即基于各个分割结果分别计算得到的连通域值均不大于预设连通域阈值时,说明目标帧图像中不包含第二目标区域,可以获取第三预设特效图像,并利用第三预设特效图像替换目标帧图像。其中,针对任意两帧不存在第二目标区域的目标帧图像,可以利用同一张第三预设特效图像去替换,也可以利用不同的两张第三预设特效图像去替换,在此不做限定。在本公开实施例中,第三预设特效图像可以与第一预设特效图像相同,也可以不同,第三预设特效图像可以与第二预设特效图像相同,也可以不同。
上述详细地介绍了步骤S102的相关内容,其中,步骤S102可以采用本公开实施例中介绍的方式,也可以采用现有技术中的方式,在此不做限定。
本公开实施例的另一种可能实现方式,任一第一目标区域对应的分割结果为任一第一目标区域中各个像素点属于目标对象的第三概率信息。
在步骤S103中,基于任一个第二目标区域对应的分割结果确定任一个第二目标区域内的目标对象区域,具体可以包括:针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域。
对于本公开实施例,可以基于第三概率信息计算得到的连通域值,当连通域值大于预设连通域阈值时,分割结果满足第一预设条件;当连通域值不大于预设连通域阈值时,分割结果不满足第一预设条件。具体地,基于任一个第一目标区域中各个像素点属于目标对象的第三概率信息,确定第三概率信息大于预设概率阈值的至少一个像素点,利用确定出的各个第三概率信息大于预设概率阈值的像素点,计算连通域值,当连通域值大于预设连通域阈值时,任一第一目标区域对应的分割结果满足第一预设条件,即该任一第一目标区域为第二目标区域;当连通域值不大于预设连通域阈值时,任一第一目标区域对应的分割结果不满足第一预设条件,即该任一第一目标区域为非第二目标区域。
例如,利用第一目标区域2中第三概率信息大于0.5(预设概率阈值)的像素点计算连通域值,基于连通阈值与0.75(预设连通域阈值)的关系,确定第一目标区域2对应的分割结果是否满足第一预设条件,当连通阈值大于0.75时,第一目标区域2对应的分割结果满足第一预设条件,第一目标区域2为第二目标区域;当连通阈值不大于0.75时,第一目标区域2对应的分割结果不满足第一预设条件,第一目标区域2为非第二目标区域。
进一步地,针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域,如,将第二目标区域中第三概率信息大于0.7(第三概率阈值)的像素点组成的区域确定为目标对象区域。
更进一步地,针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域,之后还可以包括:针对目标帧图像,确定非目标对象区域内各个像素点分别对应的第三概率信息;在第四预设特效图像中确定非目标对象区域内各个像素点分别对应的像素值;基于目标对象区域、非目标对象区域内各个像素点分别对应的第三概率信息以及非目标对象区域内各个像素点分别对应的像素值,确定目标帧图像对应的特效图像。
对于本公开实施例,将第三概率信息大于第三预设阈值的像素点组成的区域确定为目标对象区域,即确定目标帧图像中存在目标对象区域。
进一步地,确定目标帧图像中的目标对象区域之后,针对目标帧图像中的非目标对象区域,可以确定非目标对象区域中各个像素点属于目标对象的第三概率信息,并获取第四预设特效图像,基于第四预设特效图像,确定非目标对象区域中各个像素点分别对应的像素值,基于非目标对象区域中各个像素点属于目标对象的第三概率信息以及非目标对象区域中各个像素点分别对应的第一像素值,分别确定非目标对象区域中各个像素点的像素更新值,从而确定目标帧图像中的非目标对象区域对应的特效区域。其中,第四预设特效图像可以与第一至三预设特效图像中的至少一项相同,也可以均不同,在本公开实施例中不做限定。
例如,针对目标帧图像中的非目标对象区域,该非目标对象区域中存在像素点1以及像素点2,则可以基于目标帧图像确定像素点1属于目标对象的第三概率信息p1,基于雪花特效图像确定像素点1对应的像素值x1,基于第三概率信息p1以及像素值x1确定像素点1的像素更新值(1-p1)×x1;可以基于目标帧图像确定像素点2属于目标对象的第三概率信息p2,基于雪花特效图像确定像素点2对应的像素值x2,基于第三概率信息p2以及像素值x2确定像素点2的像素更新值(1-p2)×x2,基于像素更新值(1-p1)×x1以及像素更新值(1-p2)×x2确定非目标对象区域对应的特效区域。
进一步地,基于目标帧图像中的非目标对象区域对应的特效区域,以及目标帧图像中的目标对象区域,确定目标帧图像对应的特效图像。即,按照上述方式将目标帧图像中的非目标对象区域替换为特效区域,结合目标帧图像中的目标对象区域,得到目标帧图像对应的特效图像。
对于本公开实施例,可以按照本公开实施例中的方式,循环执行步骤S101、步骤S102以及步骤S103,直至目标帧图像满足第二预设条件。
上述详细介绍了本公开实施例提供的通过网络模型进行图像分割方法中的各个步骤,下面将针对本公开实施例中涉及的网络模型,分别详细介绍各网络模型的训练方式,具体如下:
本公开实施例的另一种可能实现方式,将待检测帧图像通过基于全图的检测网络进行图像检测处理之前,还可以包括:获取多个第一训练样本,利用多个第一训练样本对第一初始网络进行训练,得到基于全图的检测网络。
其中,第一训练样本包括第一图像以及第一图像的标注信息,第一图像的标注信息包括第一图像中各个第一预设区域的位置信息以及各个第一预设区域中是否包含目标对象的标注信息。
对于本公开实施例,将多张第一图像输入至第一初始网络模型进行图像检测处理,第一初始网络模型输出每张第一图像各自对应的至少一个第一检测结果,针对每张第一图像,其任一第一检测结果均包括第一检测区域以及第一检测区域内包含目标对象的第一概率信息,利用每张第一图像各自对应的至少一个第一检测结果以及每张第一图像的标注信息,调整第一初始网络模型对应的模型参数,实现利用第一训练样本对第一初始网络模型进行训练,以得到基于全图的检测网络。
本公开实施例的另一种可能实现方式,将待检测区域通过基于框的检测网络进行图像检测处理之前,还可以包括:获取多个第二训练样本,利用多个第二训练样本对第二初始网络进行训练,得到基于框的检测网络。
其中,第二训练样本包括第二图像以及第二图像的标注信息,第二图像中包括至少一个第二预设区域,第二图像的标注信息包括每个第二预设区域中各个第三预设区域的位置信息以及各个第三预设区域中是否包含目标对象的标注信息。
对于本公开实施例,将第二图像输入至第二初始网络模型,以利用第二初始网络模型对第二图像中的至少一个第二预设区域进行图像检测处理,第二初始网络模型输出第二图像中至少一个第二预设区域所对应的至少一个第二检测结果,针对至少一个第二预设区域,其对应的任一第二检测结果均包括第二检测区域以及第二检测区域内包含目标对象的第二概率信息,利用第二图像中至少一个第二预设区域所对应的至少一个第二检测结果,以及第二图像的标注信息,调整第二初始网络模型对应的模型参数,实现利用第二训练样本对第二初始网络模型进行训练,以得到基于框的检测网络。
本公开实施例的另一种可能实现方式,将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理之前,还可以包括:获取多个第三训练样本,利用多个第三训练样本对第三初始网络进行训练,得到基于框的分割网络。
其中,第三训练样本包括第三图像以及第三图像中各个像素点是否属于目标对象的标注信息。
对于本公开实施例,获取任一张第三图像,可以包括:获取第四图像,并确定第四图像中的目标对象区域,基于目标对象区域确定目标区域信息;按照预设扩展比例分别对第四图像中的目标区域信息进行扩展处理,得到第四图像中的目标剪切区域;对第四图像中的目标剪切区域进行剪切处理,得到任一张第三图像。
例如,如图9所示,针对第四图像901,该第四图像901的尺寸可以为5cm×3cm,可以确定该第四图像901中的人体轮廓所围成的区域902(即目标对象区域),基于人体轮廓所围成的区域902确定一个矩形区域信息(即目标区域信息),该矩形区域信息对应的矩形区域为图9中标号903所指示的区域,矩形区域信息对应的第四图像中的区域包括人体轮廓所围成的区域,该矩形区域信息为中心的坐标信息(0,0)以及两条边的边长信息,各边长均为1cm,可以按照1:1.25的扩展比例对矩形区域信息进行扩展处理,得到扩展后的矩形区域信息,该扩展后的矩形区域信息对应的矩形区域为图9中标号904所指示的区域,其中心的坐标信息为(0,0)且两条边的边长均为1.25cm,该扩展后的矩形区域信息对应的第四图像中的区域即为目标剪切区域,如图9中标号904所指示的区域,并对第四图像中的目标剪切区域进行剪切处理,得到一张第三图像,即图9中标号904所指示的区域,即最后剪切得到一张1.25cm×1.25cm的第三图像。
进一步地,对每张第三图像进行标注,得到每张第三图像内各个像素点是否属于目标对象的标注信息,从而得到第三训练样本。更进一步地,将多张第三图像输入至第三初始网络模型进行图像分割处理,第三初始网络模型输出多张第三图像各自对应的分割结果,针对每张第三图像,其分割结果均包括第三图像中各个像素点属于目标对象的第三概率信息,利用多张第三图像各自对应的分割结果以及多张第三图像各自的标注信息,调整第三初始网络模型对应的模型参数,实现利用第三训练样本对第三初始网络模型进行训练,以得到基于框的分割网络。
上述从方法流程的角度具体阐述了图像分割方法,下面从虚拟模块或者虚拟单元的角度介绍图像分割装置,具体如下所示:
本公开实施例提供了一种图像分割装置,如图2所示,该图像分割装置20可以包括:确定第一目标区域模块201、图像分割模块202、确定目标对象区域模块203以及第一循环模块204,其中,
确定第一目标区域模块201,用于确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为所述目标帧图像中包含目标对象的区域。
图像分割模块202,用于对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果。
确定目标对象区域模块203,用于当存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域。
第一循环模块204,用于循环执行确定第一目标区域模块、图像分割模块以及确定目标对象区域模块对应的操作,直至满足第二预设条件。
本公开实施例的另一种可能实现方式,确定第一目标区域模块201可以包括第一获取单元、第一检测单元以及第一确定单元,其中,
第一获取单元,用于获取待检测帧图像。
第一检测单元,用于将待检测帧图像通过基于全图的检测网络进行图像检测处理,得到至少一个第一检测结果。
第一确定单元,用于基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域。
本公开实施例的另一种可能实现方式,第一确定单元,具体用于当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,基于至少一个满足第三预设条件的第一检测结果分别确定待检测帧图像中的至少一个目标区域,并将待检测帧图像中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
本公开实施例的另一种可能实现方式,第一确定单元,包括第一循环子单元以及第一确定子单元,其中,
第一循环子单元,用于当各个第一检测结果均不满足第三预设条件,循环执行确定下一帧图像为待检测帧图像以及第一获取单元、第一检测单元以及第一确定单元对应的操作,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果。
第一确定子单元,用于当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于至少一个满足第三预设条件的第一检测结果,确定目标帧图像中的至少一个第一目标区域。
本公开实施例的另一种可能实现方式,第一循环子单元,具体用于循环执行利用第一预设特效图像替换待检测帧图像,确定下一帧图像为待检测帧图像以及第一获取单元、第一检测单元以及第一确定单元对应的操作,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果。
本公开实施例的另一种可能实现方式,任一第一检测结果包括待检测帧图像中的第一检测区域以及第一检测区域内包含目标对象的第一概率信息。
其中,第一确定单元,具体用于基于至少一个第一检测区域内分别包含目标对象的第一概率信息确定大于第一概率阈值的第一概率信息,并将确定出的大于第一概率阈值的第一概率信息所对应的第一检测区域确定为第一目标区域。
本公开实施例的另一种可能实现方式,确定第一目标区域模块301还包括第二获取单元、第二确定单元、第二检测单元以及第三确定单元,其中,
第二获取单元,用于获取待处理帧图像,待处理帧图像为包含至少一个第二目标区域的目标帧图像的下一帧图像。
第二确定单元,用于基于至少一个第二目标区域确定待处理帧图像中的待检测区域;
第二检测单元,用于将待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个第二检测结果。
第三确定单元,用于基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域。
本公开实施例的另一种可能实现方式,第三确定单元,具体用于当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,基于至少一个满足第四预设条件的第二检测结果分别确定待检测区域中的至少一个目标区域,并将待检测区域中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
本公开实施例的另一种可能实现方式,第三确定单元包括第二循环子单元以及第二确定子单元,其中,
第二循环子单元,用于当各个第二检测结果均不满足第四预设条件,循环执行确定预设帧图像为待检测帧图像、第一获取单元、第一检测单元、第一确定单元、图像分割模块202、确定目标对象区域模块203、第二获取单元、第二确定单元、第二检测单元以及第三确定单元对应的操作,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果。
第二确定子单元,用于当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于至少一个满足第四预设条件的第二检测结果,确定目标帧图像中的至少一个第一目标区域。
本公开实施例的另一种可能实现方式,第二循环子单元,具体用于循环执行利用第二预设特效图像替换待处理帧图像,确定预设帧图像为待检测帧图像、第一获取单元、第一检测单元、第一确定单元、图像分割模块202、确定目标对象区域模块203、第二获取单元、第二确定单元、第二检测单元以及第三确定单元对应的操作,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果。
本公开实施例的另一种可能实现方式,任一第二检测结果包括待检测区域中的第二检测区域以及第二检测区域中包含目标对象的第二概率信息。
其中,第三确定单元,具体用于基于至少一个第二检测区域内分别包含目标对象的第二概率信息确定大于第二概率阈值的第二概率信息,并将确定出的大于第二概率阈值的第二概率信息所对应的第二检测区域确定为第一目标区域。
本公开实施例的另一种可能实现方式,图像分割模块202包括剪切单元以及分割单元,其中,
剪切单元,用于基于至少一个第一目标区域对目标帧图像进行剪切处理,得到各个第一目标区域对应的待分割图像。
分割单元,用于将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理,得到各个第一目标区域对应的分割结果。
本公开实施例的另一种可能实现方式,图像分割装置20还包括第二循环模块以及第一确定模块,其中,
第二循环模块,用于当各个第一目标区域对应的分割结果均不满足第一预设条件,循环执行确定第一目标区域模块201以及图像分割模块202对应的操作,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件。
第一确定模块,用于当存在至少一个第一目标区域对应的分割结果满足第一预设条件时,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
本公开实施例的另一种可能实现方式,第二循环模块,具体用于循环执行利用第三预设特效图像替换目标帧图像,确定第一目标区域模块201以及图像分割模块202对应的操作,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件。
本公开实施例的另一种可能实现方式,任一第一目标区域对应的分割结果为任一第一目标区域中各个像素点属于目标对象的第三概率信息。
确定目标对象区域模块203,具体用于针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域。
本公开实施例的另一种可能实现方式,图像分割装置20还包括第二确定模块、第三确定模块以及第四确定模块,其中,
第二确定模块,用于针对目标帧图像,确定非目标对象区域内各个像素点分别对应的第三概率信息。
第三确定模块,用于在第四预设特效图像中确定非目标对象区域内各个像素点分别对应的像素值。
第四确定模块,用于基于目标对象区域、非目标对象区域内各个像素点分别对应的第三概率信息以及非目标对象区域内各个像素点分别对应的像素值,确定目标帧图像对应的特效图像。
本公开实施例的另一种可能实现方式,图像分割装置20还包括第一获取模块以及第一训练模块,其中,
第一获取模块,用于获取多个第一训练样本,第一训练样本包括第一图像以及第一图像的标注信息,第一图像的标注信息包括第一图像中各个第一预设区域的位置信息以及各个第一预设区域中是否包含目标对象的标注信息。
第一训练模块,用于利用多个第一训练样本对第一初始网络进行训练,得到基于全图的检测网络。
本公开实施例的另一种可能实现方式,图像分割装置20还包括第二获取模块以及第二训练模块,其中,
第二获取模块,用于获取多个第二训练样本,第二训练样本包括第二图像以及第二图像的标注信息,第二图像中包括至少一个第二预设区域,第二图像的标注信息包括每个第二预设区域中各个第三预设区域的位置信息以及各个第三预设区域中是否包含目标对象的标注信息。
第二训练模块,用于利用多个第二训练样本对第二初始网络进行训练,得到基于框的检测网络。
本公开实施例的另一种可能实现方式,图像分割装置20还包括第三获取模块以及第三训练模块,其中,
第三获取模块,用于获取多个第三训练样本,第三训练样本包括第三图像以及第三图像中各个像素点是否属于目标对象的标注信息。
第三训练模块,用于利用多个第三训练样本对第三初始网络进行训练,得到基于框的分割网络。
本公开实施例的另一种可能实现方式,满足第一预设条件为基于分割结果计算得到的连通域值大于预设连通域阈值。
本公开实施例的另一种可能实现方式,满足第二预设条件为预设视频的最后一帧图像。
本公开实施例的另一种可能实现方式,满足第三预设条件为第一检测结果中的第一概率信息大于第一概率阈值。
本公开实施例的另一种可能实现方式,满足第四预设条件为第二检测结果中的第二概率信息大于第二概率阈值。
对于本公开实施例,第一循环模块204以及第二循环模块可以为同一个循环模块,也可以为两个不同的循环模块;第一确定模块、第二确定模块、第三确定模块以及第四确定模块可以为同一个确定模块,也可以为不同的确定模块,还可以任意两个为相同的确定模块;第一获取模块、第二获取模块以及第三获取模块可以为同一个获取模块,也可以为不同的获取模块,还可以任意两个为相同的获取模块;第一训练模块、第二训练模块以及第三训练模块可以为同一个训练模块,也可以为不同的训练模块,还可以任意两个为相同的训练模块;第一获取单元以及第二获取单元可以为同一个获取单元,也可以为两个不同的获取单元;第一检测单元以及第二检测单元可以为同一个检测单元,也可以为两个不同的检测单元;第一确定单元、第二确定单元以及第三确定单元可以为同一个确定单元,也可以为不同的确定单元,还可以任意两个为相同的确定单元,在本公开实施例中不做限定。
本实施例的图像分割装置20可执行本公开方法实施例提供的一种图像分割方法,其实现原理相类似,此处不再赘述。
本公开实施例提供了一种图像分割装置,与现有技术相比,本公开实施例通过确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域,然后通过图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果,然后确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域,以及循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件,实现了针对待处理视频,当确定各目标帧图像中包含目标对象的目标区域时,基于各目标区域分别对目标对象进行图像分割,由于目标对象在目标区域中的占比大于目标对象在目标帧图像中的占比,使得相较于直接基于目标帧图像对目标对象进行图像分割,基于目标区域对目标对象进行图像分割时更容易在目标区域中识别到目标对象,从而降低对目标对象进行图像分割的复杂度,进而提升了分割效果。
上述从虚拟模块或者虚拟单元的角度介绍本公开的图像分割装置,下面从实体装置的角度介绍本公开的电子设备。
下面参考图3,其示出了适于用来实现本公开实施例的电子设备300(可以为上述方法实施例中的终端设备或者服务器)的结构示意图。
其中,该电子设备300包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行本公开方法实施例所示的图像分割方法。
本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
电子设备300包括:存储器以及处理器,其中,这里的处理器可以称为下文所述的处理装置301,存储器可以包括下文中的只读存储器(ROM)302、随机访问存储器(RAM)303以及存储装置308中的至少一项,具体如下所示:
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域;图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域;循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块或单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取待检测帧图像的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
本公开实施例提供了一种电子设备,本公开实施例中的电子设备包括:存储器和处理器;至少一个程序,存储于所述存储器中,用于被所述处理器执行时,与现有技术相比可实现:本公开实施例通过确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域,然后通过图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果,然后确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域,然后循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件,实现了针对待处理视频,当确定各目标帧图像中包含目标对象的目标区域时,基于各目标区域分别对目标对象进行图像分割,由于目标对象在目标区域中的占比大于目标对象在目标帧图像中的占比,使得相较于直接基于目标帧图像对目标对象进行图像分割,基于目标区域对目标对象进行图像分割时更容易在目标区域中识别到目标对象,从而降低对目标对象进行图像分割的复杂度,进而提升了分割效果。
上述从实体装置的角度介绍本公开的电子设备,下面从可读介质的角度介绍本公开的计算机可读介质。
本公开实施例提供了一种计算机可读介质,该计算机可读介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与现有技术相比,本公开实施例通过确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域,然后通过图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果,然后确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域,然后循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件,实现了针对待处理视频,当确定各目标帧图像中包含目标对象的目标区域时,基于各目标区域分别对目标对象进行图像分割,由于目标对象在目标区域中的占比大于目标对象在目标帧图像中的占比,使得相较于直接基于目标帧图像对目标对象进行图像分割,基于目标区域对目标对象进行图像分割时更容易在目标区域中识别到目标对象,从而降低对目标对象进行图像分割的复杂度,进而提升了分割效果。
根据本公开的一个或多个实施例,提供了一种图像分割方法,包括:
确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域;
图像分割步骤:对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;
确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域;
循环执行确定第一目标区域步骤、图像分割步骤以及确定目标对象区域步骤,直至满足第二预设条件。
根据本公开的一个或多个实施例,确定第一目标区域步骤,包括:
基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤:
获取待检测帧图像;
将待检测帧图像通过基于全图的检测网络进行图像检测处理,得到至少一个第一检测结果;
基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域,包括:
若至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,基于至少一个满足第三预设条件的第一检测结果分别确定待检测帧图像中的至少一个目标区域,并将待检测帧图像中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域,包括:
若各个第一检测结果均不满足第三预设条件,循环执行确定下一帧图像为待检测帧图像以及基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果;
当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于至少一个满足第三预设条件的第一检测结果,确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,循环执行确定下一帧图像为待检测帧图像以及基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,包括:
循环执行利用第一预设特效图像替换待检测帧图像,确定下一帧图像为待检测帧图像以及基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果。
根据本公开的一个或多个实施例,任一第一检测结果包括待检测帧图像中的第一检测区域以及第一检测区域内包含目标对象的第一概率信息;
其中,基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域,包括:
基于至少一个第一检测区域内分别包含目标对象的第一概率信息确定大于第一概率阈值的第一概率信息,并将确定出的大于第一概率阈值的第一概率信息所对应的第一检测区域确定为第一目标区域。
根据本公开的一个或多个实施例,确定第一目标区域步骤,还包括:
基于待处理帧图像确定目标帧图像中的至少一个第一目标区域的步骤:
获取待处理帧图像,待处理帧图像为包含至少一个第二目标区域的目标帧图像的下一帧图像;
基于至少一个第二目标区域确定待处理帧图像中的待检测区域;
将待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个第二检测结果;
基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域,包括:
若至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,基于至少一个满足第四预设条件的第二检测结果分别确定待检测区域中的至少一个目标区域,并将待检测区域中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域,包括:
若各个第二检测结果均不满足第四预设条件,循环执行确定预设帧图像为待检测帧图像、基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤、图像分割步骤、确定目标对象区域步骤、基于待处理帧图像确定目标帧图像中的至少一个第一目标区域的步骤,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果;
当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于至少一个满足第四预设条件的第二检测结果,确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,循环执行确定预设帧图像为待检测帧图像、基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤、图像分割步骤、确定目标对象区域步骤、基于待处理帧图像确定目标帧图像中的至少一个第一目标区域的步骤,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,包括:
循环执行利用第二预设特效图像替换待处理帧图像,确定预设帧图像为待检测帧图像、基于待检测帧图像确定目标帧图像中的至少一个第一目标区域的步骤、图像分割步骤、确定目标对象区域步骤、基于待处理帧图像确定目标帧图像中的至少一个第一目标区域的步骤,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果。
根据本公开的一个或多个实施例,任一第二检测结果包括待检测区域中的第二检测区域以及第二检测区域中包含目标对象的第二概率信息;
其中,基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域,包括:
基于至少一个第二检测区域内分别包含目标对象的第二概率信息确定大于第二概率阈值的第二概率信息,并将确定出的大于第二概率阈值的第二概率信息所对应的第二检测区域确定为第一目标区域。
根据本公开的一个或多个实施例,图像分割步骤,包括:
基于至少一个第一目标区域对目标帧图像进行剪切处理,得到各个第一目标区域对应的待分割图像;
将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理,得到各个第一目标区域对应的分割结果。
根据本公开的一个或多个实施例,图像分割步骤之后还包括:
若各个第一目标区域对应的分割结果均不满足第一预设条件,循环执行确定第一目标区域步骤以及图像分割步骤,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件;
当存在至少一个第一目标区域对应的分割结果满足第一预设条件时,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
根据本公开的一个或多个实施例,循环执行确定第一目标区域步骤以及图像分割步骤,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件,包括:
循环执行利用第三预设特效图像替换目标帧图像,确定第一目标区域步骤以及图像分割步骤,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件。
根据本公开的一个或多个实施例,任一第一目标区域对应的分割结果为任一第一目标区域中各个像素点属于目标对象的第三概率信息;
基于任一个第二目标区域对应的分割结果确定任一个第二目标区域内的目标对象区域,包括:
针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域。
根据本公开的一个或多个实施例,针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域,之后还包括:
针对目标帧图像,确定非目标对象区域内各个像素点分别对应的第三概率信息;
在第四预设特效图像中确定非目标对象区域内各个像素点分别对应的像素值;
基于目标对象区域、非目标对象区域内各个像素点分别对应的第三概率信息以及非目标对象区域内各个像素点分别对应的像素值,确定目标帧图像对应的特效图像。
根据本公开的一个或多个实施例,将待检测帧图像通过基于全图的检测网络进行图像检测处理之前,还包括:
获取多个第一训练样本,第一训练样本包括第一图像以及第一图像的标注信息,第一图像的标注信息包括第一图像中各个第一预设区域的位置信息以及各个第一预设区域中是否包含目标对象的标注信息;
利用多个第一训练样本对第一初始网络进行训练,得到基于全图的检测网络。
根据本公开的一个或多个实施例,将待检测区域通过基于框的检测网络进行图像检测处理之前,还包括:
获取多个第二训练样本,第二训练样本包括第二图像以及第二图像的标注信息,第二图像中包括至少一个第二预设区域,第二图像的标注信息包括每个第二预设区域中各个第三预设区域的位置信息以及各个第三预设区域中是否包含目标对象的标注信息;
利用多个第二训练样本对第二初始网络进行训练,得到基于框的检测网络。
根据本公开的一个或多个实施例,将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理之前,还包括:
获取多个第三训练样本,第三训练样本包括第三图像以及第三图像中各个像素点是否属于目标对象的标注信息;
利用多个第三训练样本对第三初始网络进行训练,得到基于框的分割网络。
根据本公开的一个或多个实施例,满足第一预设条件为基于分割结果计算得到的连通域值大于预设连通域阈值。
根据本公开的一个或多个实施例,满足第二预设条件为预设视频的最后一帧图像。
根据本公开的一个或多个实施例,满足第三预设条件为第一检测结果中的第一概率信息大于第一概率阈值。
根据本公开的一个或多个实施例,满足第四预设条件为第二检测结果中的第二概率信息大于第二概率阈值。
根据本公开的一个或多个实施例,提供了一种图像分割装置,包括:
确定第一目标区域模块,用于确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为目标帧图像中包含目标对象的区域;
图像分割模块,用于对至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;
确定目标对象区域模块,用于当存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足第一预设条件的分割结果对应的第一目标区域;
第一循环模块,用于循环执行确定第一目标区域模块、图像分割模块以及确定目标对象区域模块对应的操作,直至满足第二预设条件。
根据本公开的一个或多个实施例,确定第一目标区域模块包括第一获取单元、第一检测单元以及第一确定单元,其中,
第一获取单元,用于获取待检测帧图像;
第一检测单元,用于将待检测帧图像通过基于全图的检测网络进行图像检测处理,得到至少一个第一检测结果;
第一确定单元,用于基于至少一个第一检测结果确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,第一确定单元,具体用于当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,基于至少一个满足第三预设条件的第一检测结果分别确定待检测帧图像中的至少一个目标区域,并将待检测帧图像中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,第一确定单元,包括第一循环子单元以及第一确定子单元,其中,
第一循环子单元,用于当各个第一检测结果均不满足第三预设条件,循环执行确定下一帧图像为待检测帧图像以及第一获取单元、第一检测单元以及第一确定单元对应的操作,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果;
第一确定子单元,用于当至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于至少一个满足第三预设条件的第一检测结果,确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,第一循环子单元,具体用于循环执行利用第一预设特效图像替换待检测帧图像,确定下一帧图像为待检测帧图像以及第一获取单元、第一检测单元以及第一确定单元对应的操作,直至满足第二预设条件或者至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果。
根据本公开的一个或多个实施例,任一第一检测结果包括待检测帧图像中的第一检测区域以及第一检测区域内包含目标对象的第一概率信息;
其中,第一确定单元,具体用于基于至少一个第一检测区域内分别包含目标对象的第一概率信息确定大于第一概率阈值的第一概率信息,并将确定出的大于第一概率阈值的第一概率信息所对应的第一检测区域确定为第一目标区域。
根据本公开的一个或多个实施例,确定第一目标区域模块还包括第二获取单元、第二确定单元、第二检测单元以及第三确定单元,其中,
第二获取单元,用于获取待处理帧图像,待处理帧图像为包含至少一个第二目标区域的目标帧图像的下一帧图像;
第二确定单元,用于基于至少一个第二目标区域确定待处理帧图像中的待检测区域;
第二检测单元,用于将待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个第二检测结果;
第三确定单元,用于基于至少一个第二检测结果确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,第三确定单元,具体用于当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,基于至少一个满足第四预设条件的第二检测结果分别确定待检测区域中的至少一个目标区域,并将待检测区域中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,第三确定单元包括第二循环子单元以及第二确定子单元,其中,
第二循环子单元,用于当各个第二检测结果均不满足第四预设条件,循环执行确定预设帧图像为待检测帧图像、第一获取单元、第一检测单元、第一确定单元、图像分割模块、确定目标对象区域模块、第二获取单元、第二确定单元、第二检测单元以及第三确定单元对应的操作,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果;
第二确定子单元,用于当至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于至少一个满足第四预设条件的第二检测结果,确定目标帧图像中的至少一个第一目标区域。
根据本公开的一个或多个实施例,第二循环子单元,具体用于循环执行利用第二预设特效图像替换待处理帧图像,确定预设帧图像为待检测帧图像、第一获取单元、第一检测单元、第一确定单元、图像分割模块、确定目标对象区域模块、第二获取单元、第二确定单元、第二检测单元以及第三确定单元对应的操作,直至满足第二预设条件或者至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果。
根据本公开的一个或多个实施例,任一第二检测结果包括待检测区域中的第二检测区域以及第二检测区域中包含目标对象的第二概率信息;
其中,第三确定单元,具体用于基于至少一个第二检测区域内分别包含目标对象的第二概率信息确定大于第二概率阈值的第二概率信息,并将确定出的大于第二概率阈值的第二概率信息所对应的第二检测区域确定为第一目标区域。
根据本公开的一个或多个实施例,图像分割模块包括剪切单元以及分割单元,其中,
剪切单元,用于基于至少一个第一目标区域对目标帧图像进行剪切处理,得到各个第一目标区域对应的待分割图像;
分割单元,用于将各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理,得到各个第一目标区域对应的分割结果。
根据本公开的一个或多个实施例,装置还包括第二循环模块以及第一确定模块,其中,
第二循环模块,用于当各个第一目标区域对应的分割结果均不满足第一预设条件,循环执行确定第一目标区域模块以及图像分割模块对应的操作,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件;
第一确定模块,用于当存在至少一个第一目标区域对应的分割结果满足第一预设条件时,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
根据本公开的一个或多个实施例,第二循环模块,具体用于循环执行利用第三预设特效图像替换目标帧图像,确定第一目标区域模块以及图像分割模块对应的操作,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件。
根据本公开的一个或多个实施例,任一第一目标区域对应的分割结果为任一第一目标区域中各个像素点属于目标对象的第三概率信息;
确定目标对象区域模块,具体用于针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域。
根据本公开的一个或多个实施例,装置还包括第二确定模块、第三确定模块以及第四确定模块,其中,
第二确定模块,用于针对目标帧图像,确定非目标对象区域内各个像素点分别对应的第三概率信息;
第三确定模块,用于在第四预设特效图像中确定非目标对象区域内各个像素点分别对应的像素值;
第四确定模块,用于基于目标对象区域、非目标对象区域内各个像素点分别对应的第三概率信息以及非目标对象区域内各个像素点分别对应的像素值,确定目标帧图像对应的特效图像。
根据本公开的一个或多个实施例,装置还包括第一获取模块以及第一训练模块,其中,
第一获取模块,用于获取多个第一训练样本,第一训练样本包括第一图像以及第一图像的标注信息,第一图像的标注信息包括第一图像中各个第一预设区域的位置信息以及各个第一预设区域中是否包含目标对象的标注信息;
第一训练模块,用于利用多个第一训练样本对第一初始网络进行训练,得到基于全图的检测网络。
根据本公开的一个或多个实施例,装置还包括第二获取模块以及第二训练模块,其中,
第二获取模块,用于获取多个第二训练样本,第二训练样本包括第二图像以及第二图像的标注信息,第二图像中包括至少一个第二预设区域,第二图像的标注信息包括每个第二预设区域中各个第三预设区域的位置信息以及各个第三预设区域中是否包含目标对象的标注信息;
第二训练模块,用于利用多个第二训练样本对第二初始网络进行训练,得到基于框的检测网络。
根据本公开的一个或多个实施例,装置还包括第三获取模块以及第三训练模块,其中,
第三获取模块,用于获取多个第三训练样本,第三训练样本包括第三图像以及第三图像中各个像素点是否属于目标对象的标注信息;
第三训练模块,用于利用多个第三训练样本对第三初始网络进行训练,得到基于框的分割网络。
根据本公开的一个或多个实施例,满足第一预设条件为基于分割结果计算得到的连通域值大于预设连通域阈值。
根据本公开的一个或多个实施例,满足第二预设条件为预设视频的最后一帧图像。
根据本公开的一个或多个实施例,满足第三预设条件为第一检测结果中的第一概率信息大于第一概率阈值。
根据本公开的一个或多个实施例,满足第四预设条件为第二检测结果中的第二概率信息大于第二概率阈值。
根据本公开的一个或多个实施例,提供了一种电子设备,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行根据方法实施例所示的图像分割方法。
根据本公开的一个或多个实施例,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时方法实施例所示的图像分割方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (24)

1.一种图像分割方法,其特征在于,包括:
确定第一目标区域步骤:确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为所述目标帧图像中包含目标对象的区域;
图像分割步骤:对所述至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;
确定目标对象区域步骤:若存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足所述第一预设条件的分割结果对应的第一目标区域,其中,所述满足第一预设条件为基于所述分割结果计算得到的连通域值大于预设连通域阈值;
循环执行所述确定第一目标区域步骤、所述图像分割步骤以及所述确定目标对象区域步骤,直至满足第二预设条件,其中,所述第二预设条件包括所述目标帧图像为预设视频的最后一帧图像。
2.根据权利要求1所述的方法,其特征在于,所述确定第一目标区域步骤,包括:
基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤:
获取待检测帧图像;
将所述待检测帧图像通过基于全图的检测网络进行图像检测处理,得到至少一个第一检测结果;
基于所述至少一个第一检测结果确定所述目标帧图像中的至少一个第一目标区域。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个第一检测结果确定所述目标帧图像中的至少一个第一目标区域,包括:
若所述至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,基于所述至少一个满足第三预设条件的第一检测结果分别确定待检测帧图像中的至少一个目标区域,并将所述待检测帧图像中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
4.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个第一检测结果确定所述目标帧图像中的至少一个第一目标区域,包括:
若各个第一检测结果均不满足第三预设条件,循环执行确定下一帧图像为待检测帧图像以及所述基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤,直至满足所述第二预设条件或者所述至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果;
当所述至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果时,基于所述至少一个满足第三预设条件的第一检测结果,确定所述目标帧图像中的至少一个第一目标区域。
5.根据权利要求4所述的方法,其特征在于,所述循环执行确定下一帧图像为待检测帧图像以及所述基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤,直至满足所述第二预设条件或者所述至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果,包括:
循环执行利用第一预设特效图像替换所述待检测帧图像,确定下一帧图像为待检测帧图像以及所述基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤,直至满足所述第二预设条件或者所述至少一个第一检测结果中存在至少一个满足第三预设条件的第一检测结果。
6.根据权利要求2所述的方法,其特征在于,任一第一检测结果包括待检测帧图像中的第一检测区域以及第一检测区域内包含目标对象的第一概率信息;
其中,所述基于所述至少一个第一检测结果确定所述目标帧图像中的至少一个第一目标区域,包括:
基于至少一个第一检测区域内分别包含目标对象的第一概率信息确定大于第一概率阈值的第一概率信息,并将确定出的大于第一概率阈值的第一概率信息所对应的第一检测区域确定为第一目标区域。
7.根据权利要求2-6任一项所述的方法,其特征在于,所述确定第一目标区域步骤,还包括:
基于待处理帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤:
获取待处理帧图像,所述待处理帧图像为包含至少一个第二目标区域的目标帧图像的下一帧图像;
基于所述至少一个第二目标区域确定所述待处理帧图像中的待检测区域;
将所述待检测区域通过基于框的检测网络进行图像检测处理,得到至少一个第二检测结果;
基于所述至少一个第二检测结果确定所述目标帧图像中的至少一个第一目标区域。
8.根据权利要求7所述的方法,其特征在于,所述基于所述至少一个第二检测结果确定所述目标帧图像中的至少一个第一目标区域,包括:
若所述至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,基于所述至少一个满足第四预设条件的第二检测结果分别确定待检测区域中的至少一个目标区域,并将所述待检测区域中的至少一个目标区域确定为目标帧图像中的至少一个第一目标区域。
9.根据权利要求7所述的方法,其特征在于,所述基于所述至少一个第二检测结果确定所述目标帧图像中的至少一个第一目标区域,包括:
若各个第二检测结果均不满足第四预设条件,循环执行确定预设帧图像为所述待检测帧图像、所述基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤、所述图像分割步骤、所述确定目标对象区域步骤、所述基于待处理帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤,直至满足所述第二预设条件或者所述至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果;
当所述至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果时,基于所述至少一个满足第四预设条件的第二检测结果,确定所述目标帧图像中的至少一个第一目标区域。
10.根据权利要求9所述的方法,其特征在于,所述循环执行确定预设帧图像为所述待检测帧图像、所述基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤、所述图像分割步骤、所述确定目标对象区域步骤、所述基于待处理帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤,直至满足所述第二预设条件或者所述至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果,包括:
循环执行利用第二预设特效图像替换所述待处理帧图像,确定预设帧图像为所述待检测帧图像、所述基于待检测帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤、所述图像分割步骤、所述确定目标对象区域步骤、所述基于待处理帧图像确定所述目标帧图像中的至少一个第一目标区域的步骤,直至满足所述第二预设条件或者所述至少一个第二检测结果中存在至少一个满足第四预设条件的第二检测结果。
11.根据权利要求7所述的方法,其特征在于,任一第二检测结果包括待检测区域中的第二检测区域以及第二检测区域中包含目标对象的第二概率信息;
其中,所述基于所述至少一个第二检测结果确定所述目标帧图像中的至少一个第一目标区域,包括:
基于至少一个第二检测区域内分别包含目标对象的第二概率信息确定大于第二概率阈值的第二概率信息,并将确定出的大于第二概率阈值的第二概率信息所对应的第二检测区域确定为第一目标区域。
12.根据权利要求1所述的方法,其特征在于,所述图像分割步骤,包括:
基于所述至少一个第一目标区域对所述目标帧图像进行剪切处理,得到各个第一目标区域对应的待分割图像;
将所述各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理,得到各个第一目标区域对应的分割结果。
13.根据权利要求1所述的方法,其特征在于,所述图像分割步骤之后还包括:
若所述各个第一目标区域对应的分割结果均不满足所述第一预设条件,循环执行所述确定第一目标区域步骤以及所述图像分割步骤,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件;
当存在至少一个第一目标区域对应的分割结果满足第一预设条件时,基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域。
14.根据权利要求13所述的方法,其特征在于,循环执行所述确定第一目标区域步骤以及所述图像分割步骤,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件,包括:
循环执行利用第三预设特效图像替换所述目标帧图像,所述确定第一目标区域步骤以及所述图像分割步骤,直至满足第二预设条件或者存在至少一个第一目标区域对应的分割结果满足第一预设条件。
15.根据权利要求1所述的方法,其特征在于,任一第一目标区域对应的分割结果为任一第一目标区域中各个像素点属于目标对象的第三概率信息;
基于任一个第二目标区域对应的分割结果确定任一个第二目标区域内的目标对象区域,包括:
针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域。
16.根据权利要求15所述的方法,其特征在于,所述针对任一个第二目标区域,将第三概率信息大于第三概率阈值的像素点组成的区域确定为目标对象区域,之后还包括:
针对所述目标帧图像,确定非目标对象区域内各个像素点分别对应的第三概率信息;
在第四预设特效图像中确定所述非目标对象区域内各个像素点分别对应的像素值;
基于所述目标对象区域、所述非目标对象区域内各个像素点分别对应的第三概率信息以及所述非目标对象区域内各个像素点分别对应的像素值,确定所述目标帧图像对应的特效图像。
17.根据权利要求2所述的方法,其特征在于,所述将所述待检测帧图像通过所述基于全图的检测网络进行图像检测处理之前,还包括:
获取多个第一训练样本,所述第一训练样本包括第一图像以及第一图像的标注信息,所述第一图像的标注信息包括第一图像中各个第一预设区域的位置信息以及各个第一预设区域中是否包含目标对象的标注信息;
利用所述多个第一训练样本对第一初始网络进行训练,得到所述基于全图的检测网络。
18.根据权利要求7所述的方法,其特征在于,所述将所述待检测区域通过基于框的检测网络进行图像检测处理之前,还包括:
获取多个第二训练样本,所述第二训练样本包括第二图像以及第二图像的标注信息,所述第二图像中包括至少一个第二预设区域,所述第二图像的标注信息包括每个第二预设区域中各个第三预设区域的位置信息以及各个第三预设区域中是否包含目标对象的标注信息;
利用所述多个第二训练样本对第二初始网络进行训练,得到所述基于框的检测网络。
19.根据权利要求12所述的方法,其特征在于,所述将所述各个第一目标区域对应的待分割图像通过基于框的分割网络进行图像分割处理之前,还包括:
获取多个第三训练样本,所述第三训练样本包括第三图像以及第三图像中各个像素点是否属于目标对象的标注信息;
利用所述多个第三训练样本对第三初始网络进行训练,得到所述基于框的分割网络。
20.根据权利要求6所述的方法,其特征在于,所述满足第三预设条件为所述第一检测结果中的第一概率信息大于第一概率阈值。
21.根据权利要求11所述的方法,其特征在于,所述满足第四预设条件为所述第二检测结果中的第二概率信息大于第二概率阈值。
22.一种图像分割装置,其特征在于,包括:
确定第一目标区域模块,用于确定目标帧图像中的至少一个第一目标区域,任一第一目标区域为所述目标帧图像中包含目标对象的区域;
图像分割模块,用于对所述至少一个第一目标区域分别进行图像分割处理,得到各个第一目标区域对应的分割结果;
确定目标对象区域模块,用于当存在至少一个满足第一预设条件的分割结果,则基于各个第二目标区域对应的分割结果确定各个第二目标区域内的目标对象区域,任一第二目标区域为满足所述第一预设条件的分割结果对应的第一目标区域,其中,所述满足第一预设条件为基于所述分割结果计算得到的连通域值大于预设连通域阈值;
第一循环模块,用于循环执行所述确定第一目标区域模块、所述图像分割模块以及所述确定目标对象区域模块对应的操作,直至满足第二预设条件,其中,所述第二预设条件包括所述目标帧图像为预设视频的最后一帧图像。
23.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~21任一项所述的图像分割方法。
24.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~21任一项所述的图像分割方法。
CN202010431983.XA 2020-05-20 2020-05-20 图像分割方法、装置、电子设备及介质 Active CN111583283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010431983.XA CN111583283B (zh) 2020-05-20 2020-05-20 图像分割方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010431983.XA CN111583283B (zh) 2020-05-20 2020-05-20 图像分割方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN111583283A CN111583283A (zh) 2020-08-25
CN111583283B true CN111583283B (zh) 2023-06-20

Family

ID=72123186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010431983.XA Active CN111583283B (zh) 2020-05-20 2020-05-20 图像分割方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN111583283B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289811A (zh) * 2011-08-17 2011-12-21 深圳市旭东数字医学影像技术有限公司 一种半自动序列图像分割方法及系统
JP5403180B1 (ja) * 2013-05-23 2014-01-29 富士ゼロックス株式会社 画像評価方法、画像評価装置及び画像評価プログラム
CN104021552A (zh) * 2014-05-28 2014-09-03 华南理工大学 一种基于图论分割过程的多目标粒子群参数优化方法
CN107388960A (zh) * 2016-05-16 2017-11-24 杭州海康机器人技术有限公司 一种确定物体体积的方法及装置
CN109544568A (zh) * 2018-11-30 2019-03-29 长沙理工大学 目标图像分割方法、装置及设备
CN109961403A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 照片的调整方法、装置、存储介质及电子设备
CN110533676A (zh) * 2019-09-06 2019-12-03 青岛海信医疗设备股份有限公司 肿瘤图像分割方法、装置及终端设备
CN110544258A (zh) * 2019-08-30 2019-12-06 北京海益同展信息科技有限公司 图像分割的方法、装置、电子设备和存储介质
CN110675409A (zh) * 2019-09-20 2020-01-10 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质
CN111161275A (zh) * 2018-11-08 2020-05-15 腾讯科技(深圳)有限公司 医学图像中目标对象的分割方法、装置和电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567087B (zh) * 2009-05-25 2012-05-23 北京航空航天大学 复杂天空背景下红外序列图像弱小目标检测与跟踪方法
CN104408743A (zh) * 2014-11-05 2015-03-11 百度在线网络技术(北京)有限公司 图像分割方法和装置
CN108230346B (zh) * 2017-03-30 2020-09-11 北京市商汤科技开发有限公司 用于分割图像语义特征的方法和装置、电子设备
CN106997466B (zh) * 2017-04-12 2021-05-04 百度在线网络技术(北京)有限公司 用于检测道路的方法和装置
CN108389210A (zh) * 2018-02-28 2018-08-10 深圳天琴医疗科技有限公司 一种医学图像分割方法及装置
CN111091576B (zh) * 2020-03-19 2020-07-28 腾讯科技(深圳)有限公司 图像分割方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289811A (zh) * 2011-08-17 2011-12-21 深圳市旭东数字医学影像技术有限公司 一种半自动序列图像分割方法及系统
JP5403180B1 (ja) * 2013-05-23 2014-01-29 富士ゼロックス株式会社 画像評価方法、画像評価装置及び画像評価プログラム
CN104021552A (zh) * 2014-05-28 2014-09-03 华南理工大学 一种基于图论分割过程的多目标粒子群参数优化方法
CN107388960A (zh) * 2016-05-16 2017-11-24 杭州海康机器人技术有限公司 一种确定物体体积的方法及装置
CN109961403A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 照片的调整方法、装置、存储介质及电子设备
CN111161275A (zh) * 2018-11-08 2020-05-15 腾讯科技(深圳)有限公司 医学图像中目标对象的分割方法、装置和电子设备
CN109544568A (zh) * 2018-11-30 2019-03-29 长沙理工大学 目标图像分割方法、装置及设备
CN110544258A (zh) * 2019-08-30 2019-12-06 北京海益同展信息科技有限公司 图像分割的方法、装置、电子设备和存储介质
CN110533676A (zh) * 2019-09-06 2019-12-03 青岛海信医疗设备股份有限公司 肿瘤图像分割方法、装置及终端设备
CN110675409A (zh) * 2019-09-20 2020-01-10 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN111583283A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111598902B (zh) 图像分割方法、装置、电子设备及计算机可读介质
CN113313064B (zh) 字符识别方法、装置、可读介质及电子设备
CN110413812B (zh) 神经网络模型的训练方法、装置、电子设备及存储介质
CN111784712B (zh) 图像处理方法、装置、设备和计算机可读介质
CN112561840B (zh) 视频裁剪方法、装置、存储介质及电子设备
CN113689372B (zh) 图像处理方法、设备、存储介质及程序产品
CN110298851B (zh) 人体分割神经网络的训练方法及设备
CN114282581B (zh) 基于数据增强的训练样本获取方法、装置和电子设备
CN110705511A (zh) 模糊图像的识别方法、装置、设备及存储介质
CN114037716A (zh) 图像分割方法、装置、设备及存储介质
CN112418232A (zh) 图像分割方法、装置、可读介质及电子设备
CN112418249A (zh) 掩膜图像生成方法、装置、电子设备和计算机可读介质
CN110310293B (zh) 人体图像分割方法及设备
CN112418054B (zh) 图像处理方法、装置、电子设备和计算机可读介质
CN114422698A (zh) 视频生成方法、装置、设备及存储介质
CN111915532B (zh) 图像追踪方法、装置、电子设备及计算机可读介质
CN111583283B (zh) 图像分割方法、装置、电子设备及介质
CN115086541B (zh) 一种拍摄位置确定方法、装置、设备及介质
CN114399696A (zh) 一种目标检测方法、装置、存储介质及电子设备
CN114419298A (zh) 虚拟物体的生成方法、装置、设备及存储介质
CN114723600A (zh) 美妆特效的生成方法、装置、设备、存储介质和程序产品
CN113256659B (zh) 图片处理方法、装置和电子设备
CN114359673B (zh) 基于度量学习的小样本烟雾检测方法、装置和设备
CN113283436B (zh) 图片处理方法、装置和电子设备
CN111815656B (zh) 视频处理方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: Tiktok vision (Beijing) Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant