CN111179287A - 人像实例分割方法、装置、设备及存储介质 - Google Patents

人像实例分割方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111179287A
CN111179287A CN202010005259.0A CN202010005259A CN111179287A CN 111179287 A CN111179287 A CN 111179287A CN 202010005259 A CN202010005259 A CN 202010005259A CN 111179287 A CN111179287 A CN 111179287A
Authority
CN
China
Prior art keywords
portrait
target image
detection frame
preset
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010005259.0A
Other languages
English (en)
Inventor
田兴业
刘挺
孙彪
朱鹏飞
万鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN202010005259.0A priority Critical patent/CN111179287A/zh
Publication of CN111179287A publication Critical patent/CN111179287A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种人像实例分割方法、装置、设备及存储介质,涉及图像处理技术领域。其中,该方法包括:采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息;按照预设比例扩大人像检测框,获取扩大后的人像检测框;采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果。本申请实施例中,扩大后的人像检测框可以增加目标图像中的人像被全部框中的概率,从而使得在对目标图像进行人像实例分割时可以获取到更加完整的目标人像区域,进而满足人像实例分割的精度要求。

Description

人像实例分割方法、装置、设备及存储介质
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种人像实例分割方法、装置、设备及存储介质。
背景技术
人像实例分割技术是指在图像中找出指定类别的对象实例“人”的技术,可以被广泛应用于娱乐、拍照、美颜等场景中。具体地,人像实例分割技术可以细分为人像检测技术和人像分割技术,其中,人像检测技术负责从图像中检测到人像区域,人像分割技术负责对检测到的人像区域进行前景/背景的分割,从而实现对图像进行人像实例分割。
但是,人像在图像中可能以任意尺寸、任意姿态出现,导致现有的人像实例分割技术往往无法获取完整的目标人像区域,从而无法满足人像实例分割的精度要求。
发明内容
本申请提供一种人像实例分割方法、装置、设备及存储介质,可以在对目标图像进行人像实例分割时,获取更加完整的目标人像区域,以满足人像实例分割的精度要求。
第一方面,本申请实施例提供一种人像实例分割方法,包括:
采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息;
按照预设比例扩大人像检测框,获取扩大后的人像检测框;
采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果。
可选地,上述按照预设比例扩大人像检测框,获取扩大后的人像检测框之后,该方法还包括:
获取扩大后的人像检测框中每条边与目标图像所对应的边缘之间的距离;
将扩大后的人像检测框中与目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与目标图像所对应边缘一致的位置。
可选地,目标图像的特征信息为多尺度特征图。
可选地,上述预设检测模型采用快速区域卷积神经网络Faster-RCNN检测框架训练第一样本图像集获取,其中,Faster-RCNN检测框架根据卷积神经网络CNN、区域生成网络RPN和分类回归网络建立,第一样本图像集包括:第一样本图像,第一样本图像标注有人像检测框。
可选地,上述预设分割模型采用第二样本图像集训练获取,其中,第二样本图像集包括:第二样本图像,第二样本图像标注有人像检测框以及人像实例分割结果。
可选地,人像实例分割结果包括:人像分割掩码结果。
可选地,上述采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息,包括:
采用预设检测模型获取目标图像中的N个人像检测框、以及目标图像的多尺度特征图,N为大于0的整数;
相应地,上述按照预设比例扩大人像检测框,获取扩大后的人像检测框,包括:
按照预设比例分别扩大N个人像检测框,获取N个扩大后的人像检测框。
第二方面,本申请实施例提供一种人像实例分割装置,包括:第一获取模块、第一扩大模块和分割模块;第一获取模块用于采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息;第一扩大模块用于按照预设比例扩大人像检测框,获取扩大后的人像检测框;分割模块用于采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果。
可选地,该装置还包括:第二获取模块和第二扩大模块;第二获取模块用于在第一扩大模块按照预设比例扩大人像检测框,获取扩大后的人像检测框之后,获取扩大后的人像检测框中每条边与所述目标图像所对应的边缘之间的距离;第二扩大模块用于将扩大后的人像检测框中与目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与目标图像所对应边缘一致的位置。
可选地,目标图像的特征信息为多尺度特征图。
可选地,上述预设检测模型采用快速区域卷积神经网络Faster-RCNN检测框架训练第一样本图像集获取,其中,Faster-RCNN检测框架根据卷积神经网络CNN、区域生成网络RPN和分类回归网络建立,第一样本图像集包括:第一样本图像,第一样本图像标注有人像检测框。
可选地,上述预设分割模型采用第二样本图像集训练获取,其中,第二样本图像集包括:第二样本图像,第二样本图像标注有人像检测框以及人像实例分割结果。
可选地,人像实例分割结果包括:人像分割掩码结果。
可选地,第一获取模块具体用于采用预设检测模型获取目标图像中的N个人像检测框、以及目标图像的多尺度特征图,N为大于0的整数;相应地,第一扩大模块具体用于按照预设比例分别扩大N个人像检测框,获取N个扩大后的人像检测框。
第三方面,本申请实施例提供一种人像实例分割设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当人像实例分割设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行如第一方面所述的方法。
第四方面,本申请实施例还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行如第一方面所述的方法。
本申请的有益效果是:
本申请实施例中,通过采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息,并按照预设比例扩大人像检测框,获取扩大后的人像检测框,然后,采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果,可以由于扩大后的人像检测框可以增加目标图像中的人像被全部框中的概率,从而使得在对目标图像进行人像实例分割时可以获取到更加完整的目标人像区域,进而满足人像实例分割的精度要求。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的人像实例分割方法的流程示意图;
图2示出了本申请实施例提供的人像实例分割方法的另一流程示意图;
图3示出了本申请实施例提供的人像检测框扩大示意图;
图4示出了本申请实施例提供的预设检测模型的训练流程示意图;
图5示出了本申请实施例提供的预设分割模型的训练流程示意图;
图6示出了本申请实施例提供的人像实例分割装置的结构示意图;
图7示出了本申请实施例提供的人像实例分割装置的另一结构示意图;
图8示出了本申请实施例提供的人像实例分割设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本申请的描述中,还需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请实施例提供一种人像实例分割方法,通过该方法对目标图像进行人像实例分割时,可以获取到更加完整的目标人像区域,能够满足满足人像实例分割的精度要求。该方法可以应用于服务器、计算机等具备图像处理能力的设备,也可以应用于手机、平板电脑、相机等终端。例如,手机或美颜相机中可以通过该方法对目标图像进行处理,以实现更好的拍照效果或美颜效果等。对于该方法的执行设备,本申请不作限制。
图1示出了本申请实施例提供的人像实例分割方法的流程示意图。
如图1所示,该人像实例分割方法,可以包括:
S101、采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息。
其中,人像检测框是指沿着人像在图像中的所在区域的轮廓所围成的人像区域框;特征信息可以包括目标图像的颜色特征、纹理特征、形状特征和空间关系特征等。目标图像是指需要进行人像实例分割的待处理图像,例如,目标图像可以是在任意场景中拍摄的人的照片、或者也可以是视频中包含有人物某一帧图像等。目标图像的颜色特征可以用于表示目标图像或目标图像中的部分区域所对应的场景的表面性质,可以是基于像素点的亮度值;目标图像的纹理特征可以用于描述目标图像或目标图像中的部分区域的纹理,不同场景的目标图像的纹理特征不同;目标图像的形状特征可以用于表示目标图像中的目标物体的轮廓,如目标物体可以是人、树木、建筑物等;目标图像的空间关系特征可以用于表示目标图像中不同目标之间的相对空间位置或相对方向关系等,如:不同目标之间可以是连接、重叠、交叉等关系。
预设检测模型的输入可以为目标图像,预设检测模型的输出可以为目标图像中的人像检测框、以及目标图像的特征信息。将目标图像输入预设检测模型后,预设检测模型可以输出目标图像中的人像检测框、以及目标图像的特征信息。
S102、按照预设比例扩大人像检测框,获取扩大后的人像检测框。
可选地,获取到目标图像中的人像检测框后,可以按照预设比例对人像检测框进行扩大处理,以增加目标图像中的人像被人像检测框全部框中的概率。
其中,预设比例可以预设设定的比例值或比例范围,例如,预设比例可以是105%、110%、115%、120%等预先设定的固定比例值,可以将人像检测框按照该比例值进行扩大处理;或者,预设比例也可以是105%~115%、115%~120、110%~120%等预设的比例范围,在进行人像检测框的扩大处理时,可以从预设的比例范围内任意选取一个比例值进行扩大处理。预设比例的具体数值或比例范围可以基于对训练数据集中的样本进行统计得到。统计时,可以综合考虑下述条件:1)避免比例过大而导致人像检测框中引入过多背景信息,影响分割精度;2)避免比例过小,导致会有一定概率出现检测框小于人像掩膜的情况。
可选地,在对人像检测框进行扩大处理时,可以以人像检测框的中心点为基准,将人像检测框按照预设比例进行外扩;或者,也可以以人像检测框内的点或人像检测框边缘上的点为基准,将人像检测框按照预设比例进行外扩,本申请对此不作限制。
S103、采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果。
其中,预设分割模型的输入可以为人像检测框和目标图像的特征信息,预设分割模型的输出可以为目标图像的人像实例分割结果。人像实例分割结果可以是目标图像对应的人像分割图,人像分割图为从目标图像中分割出的人像所在区域对应的图像。
可选地,本申请实施例中,可以将通过上述步骤S102进行扩大处理后得到的扩大后的人像检测框和目标图像的特征信息输入该预设分割模型,预设检测模型可以输出目标图像的人像实例分割结果。由于预设分割模型在获取目标图像的人像实例分割结果时,所使用的人像检测框为按照预设比例扩大后的人像检测框,扩大后的人像检测框可以增加目标图像中的人像被全部框中的概率,从而使得在对目标图像进行人像实例分割时可以获取到更加完整的目标人像区域,进而满足人像实例分割的精度要求。
由上所述,本申请实施例通过采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息,并按照预设比例扩大人像检测框,获取扩大后的人像检测框,然后,采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果,可以由于扩大后的人像检测框可以增加目标图像中的人像被全部框中的概率,从而使得在对目标图像进行人像实例分割时可以获取到更加完整的目标人像区域,进而满足人像实例分割的精度要求。
图2示出了本申请实施例提供的人像实例分割方法的另一流程示意图。
可选地,如图2所示,上述按照预设比例扩大人像检测框,获取扩大后的人像检测框之后,该方法还包括:
S201、获取扩大后的人像检测框中每条边与目标图像所对应的边缘之间的距离。
S202、将扩大后的人像检测框中与目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与目标图像所对应边缘一致的位置。
其中,预设阈值可以是1个单位长度、2个单位长度、5个单位长度等预设的值,每个单位长度可以是1个像素点、1mm、1cm等。或者,部分实施方式中,预设阈值还可以是目标图像最短边边长的1/20、3/40等,预设阈值同样可以基于对训练数据集中的样本进行统计所得到。
如上所述,当获取到扩大后的人像检测框中某一条边与目标图像所对应的边缘之间的距离小于预设阈值时,可以人像检测框中该条边的位置扩大至该条边与目标图像所对应边缘一致的位置。
以下述图3为例,图3示出了本申请实施例提供的人像检测框扩大示意图:
图3中,M表示目标图像,T表示扩大后的人像检测框;目标图像的边缘分别为A、B、C、D;扩大后的人像检测框的边依次包括:a、b、c、d;扩大后的人像检测框中边a在目标图像对应的边缘为A,扩大后的人像检测框中边b在目标图像对应的边缘为B,扩大后的人像检测框中边c在目标图像对应的边缘为C,扩大后的人像检测框中边d在目标图像对应的边缘为D。
以图3中所示的扩大后的人像检测框的边d、以及d在目标图像中所对应的边缘D为例,d与D之间的距离为L;在获取到d与D之间的距离L后,可以判断L是否小于预设阈值,若L小于预设阈值,则将扩大后的人像检测框的边d扩大至目标图像的边缘D的位置处;若L大于或等于预设阈值,则可以对d不作处理。
类似地,对于图3中所示的扩大后的人像检测框的边a、b和c,也可以按照上述对边d的处理方式进行处理,本申请在此不再赘述。
本申请实施例中,按照如上所述的方式,将扩大后的人像检测框中与目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与目标图像所对应边缘一致的位置,可以进一步增加目标图像中的人像被全部框中的概率,从而可以使得在对目标图像进行人像实例分割时所获取到的目标人像区域完整性更高。
可选地,目标图像的特征信息为多尺度特征图。
其中,多尺度特征图可以是由不同高斯核平滑卷积得到,在所有尺度上有相同的分辨率,可以用于在不同尺度上以特征图的形式描述目标图像的特征信息;多尺度特征图包含有目标图像的高级语义信息和低级的人像边缘细节信息,通过使用多尺度特征图作为目标图像的特征信息,可以使得采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取到的目标图像的人像实例分割结果更加精细。
可选地,上述预设检测模型采用快速区域卷积神经网络(Faster Region with ConvolutionalNeuralNetworksfeatures,Faster-RCNN)检测框架训练第一样本图像集获取,其中,Faster-RCNN检测框架根据卷积神经网络(ConvolutionalNeuralNetwork,CNN)、区域生成网络(Region Proposal Network,RPN)和分类回归网络建立,第一样本图像集包括:第一样本图像,第一样本图像标注有人像检测框。
Faster-RCNN检测框架可以作为基础框架,通过标注有人像检测框的第一样本图像对Faster-RCNN检测框架进行训练,可以得到上述预设检测模型。其中,RPN可以生成目标图像中的粗略的检测框,即初步人像检测框;CNN可以提取出目标图像的特征信息,如可以提取目标图像对应的多尺度特征图;然后,可以根据前述初步人像检测框,从CNN提取的特征信息中裁剪出初步人像检测框所在区域的特征信息;分类回归网络可以根据目标图像的全部特征信息、以及初步人像检测框所在区域的特征信息,确定人像检测框的所在区域,并对目标图像进行前背景分离处理(人像检测框为前景,其他区域为背景)。
图4示出了本申请实施例提供的预设检测模型的训练流程示意图。
可选地,如图4所示,预设检测模型的训练流程可以如下:
S301、基于卷积神经网络CNN、区域生成网络RPN和分类回归网络,建立快速区域卷积神经网络Faster-RCNN检测框架。
S302、通过Faster-RCNN检测框架中的CNN对第一样本图像进行特征提取,得到第一样本图像的特征信息。
S303、通过Faster-RCNN检测框架中的RPN生成第一样本图像对应的人像初步检测框。
S304、根据人像初步检测框和第一样本图像的特征信息,确定人像初步检测框所在区域的特征信息。
S305、根据第一图像的特征信息、人像初步检测框所在区域的特征信息以及分类回归网络,获取Faster-RCNN检测框架输出的第一样本图像的人像检测框。
S306、根据Faster-RCNN检测框架输出的第一样本图像的人像检测框、以及第一样本图像中标注的人像检测框,对Faster-RCNN检测框架进行参数优化,获取预设检测模型。
例如,可以计算Faster-RCNN检测框架输出的第一样本图像的人像检测框、与第一样本图像中标注的人像检测框之间的损失,对Faster-RCNN检测框架的参数进行调整,以使得Faster-RCNN检测框架输出的第一样本图像的人像检测框的所在区域与第一样本图像中标注的人像检测框的所在区域最大程度地接近,从而使得训练得到的预设检测模型对目标图像中人像检测框的检测结果更加准确。
可选地,上述预设分割模型采用第二样本图像集训练获取,其中,第二样本图像集包括:第二样本图像,第二样本图像标注有人像检测框以及人像实例分割结果。
图5示出了本申请实施例提供的预设分割模型的训练流程示意图。
如图5所示,预设分割模型的训练流程可以如下:
S401、提取第二样本图像的特征信息。
S402、基于多输入神经网络、第二样本图像的特征信息、以及第二样本图像中标注的人像检测框和人像实例分割结果,训练获取预设分割模型。
可选地,在训练预设分割模型时,可以通过CNN、R-CNN等提取第二样本图像的特征信息,本申请对此不作限制。在提取到第二样本图像的特征信息后,可以将第二样本图像的特征信息、以及第二样本图像中标注的人像检测框作为多输入神经网络的输入,将第二样本图像中标注的人像实例分割结果作为多输入神经网络的输出,对多神经网络进行训练,获取上述预设分割模型。
可选地,人像实例分割结果可以包括:人像分割掩码结果。
其中,人像分割掩码是对人像所在区域进行掩码处理,将人像所在区域进行屏蔽,在对目标图像进行分割处理时,可以避开人像所在区域,从而可以获得人像分割掩码结果。
可选地,一种实施方式中,上述采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息,可以包括:
采用预设检测模型获取目标图像中的N个人像检测框、以及目标图像的多尺度特征图,N为大于0的整数。
例如,首先,可以将目标图像输入预设检测模型中,预设检测模型可以输出目标图像中的N个人像检测框,N个人像检测框可以具有不同大小的边框尺寸(即,人像检测框的面积不同)、或者具有不同的位置关系(即,人像检测框的所在区域有偏差);另外,预设检测模型还可以输出目标图像对应的多尺度特征图,如:可以是具有分辨率的图像特征图。
相应地,上述按照预设比例扩大人像检测框,获取扩大后的人像检测框,可以包括:
按照预设比例分别扩大N个人像检测框,获取N个扩大后的人像检测框。
也即,在得到目标图像中的N个人像检测框、以及目标图像的多尺度特征图后,对于每个人像检测框,均可以按照前述实施例中所述的方式,对其进行扩大处理,得到对应的扩大后的人像检测框。然后,可以将每个扩大后的人像检测框与多尺度特征图(如:所有分辨率的图像特征图)一起输入预设分割模型中,预设分割模型可以输出相应的人像实例分割结果。
由于本实施方式中,可以获取到N个扩大后的人像检测框,预设分割模型可以针对N个扩大后的人像检测框,得到目标图像的N个人像实例分割结果,从而,获取到的目标图像的人像实例分割结果也可以更加精细和完整。
基于前述方法实施例中所述的人像实例分割方法,本申请实施例还对应提供一种人像实例分割装置,图6示出了本申请实施例提供的人像实例分割装置的结构示意图。
如图6所示,该人像实例分割装置可以包括:第一获取模块11、第一扩大模块12和分割模块13。
第一获取模块11用于采用预设检测模型获取目标图像中的人像检测框、以及目标图像的特征信息;第一扩大模块12用于按照预设比例扩大人像检测框,获取扩大后的人像检测框;分割模块13用于采用预设分割模型,根据扩大后的人像检测框、目标图像的特征信息,获取目标图像的人像实例分割结果。
图7示出了本申请实施例提供的人像实例分割装置的另一结构示意图,可选地,如图7所示,该人像实例分割装置还可以包括:第二获取模块14和第二扩大模块15。
第二获取模块14用于在第一扩大模块12按照预设比例扩大人像检测框,获取扩大后的人像检测框之后,获取扩大后的人像检测框中每条边与所述目标图像所对应的边缘之间的距离;第二扩大模块15用于将扩大后的人像检测框中与目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与目标图像所对应边缘一致的位置。
可选地,目标图像的特征信息可以为多尺度特征图。
可选地,上述预设检测模型采用快速区域卷积神经网络Faster-RCNN检测框架训练第一样本图像集获取,其中,Faster-RCNN检测框架根据卷积神经网络CNN、区域生成网络RPN和分类回归网络建立,第一样本图像集包括:第一样本图像,第一样本图像标注有人像检测框。
可选地,上述预设分割模型采用第二样本图像集训练获取,其中,第二样本图像集包括:第二样本图像,第二样本图像标注有人像检测框以及人像实例分割结果。
可选地,人像实例分割结果可以包括:人像分割掩码结果。
可选地,第一获取模块11具体用于采用预设检测模型获取目标图像中的N个人像检测框、以及目标图像的多尺度特征图,N为大于0的整数。相应地,第一扩大模块12具体用于按照预设比例分别扩大N个人像检测框,获取N个扩大后的人像检测框。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中方法的对应过程,本申请中不再赘述。
本申请实施例提供一种人像实例分割设备,图8示出了本申请实施例提供的人像实例分割设备的结构示意图。
如图8所示,该人像实例分割设备可以包括:处理器21、存储介质22和总线(图中未标出),存储介质22存储有处理器21可执行的机器可读指令,当人像实例分割设备运行时,处理器21与存储介质22之间通过总线通信,处理器21执行机器可读指令,以执行如前述方法实施例中所述的人像实例分割方法。具体实现方式和技术效果类似,在此不再赘述。
本申请实施例还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行如前述方法实施例中所述的人像实例分割方法。具体实现方式和技术效果类似,在此同样不再赘述。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种人像实例分割方法,其特征在于,包括:
采用预设检测模型获取目标图像中的人像检测框、以及所述目标图像的特征信息;
按照预设比例扩大所述人像检测框,获取扩大后的人像检测框;
采用预设分割模型,根据所述扩大后的人像检测框、所述目标图像的特征信息,获取所述目标图像的人像实例分割结果。
2.根据权利要求1所述的方法,其特征在于,所述按照预设比例扩大所述人像检测框,获取扩大后的人像检测框之后,还包括:
获取所述扩大后的人像检测框中每条边与所述目标图像所对应的边缘之间的距离;
将所述扩大后的人像检测框中与所述目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与所述目标图像所对应边缘一致的位置。
3.根据权利要求1所述的方法,其特征在于,所述目标图像的特征信息为多尺度特征图。
4.根据权利要求1所述的方法,其特征在于,所述预设检测模型采用快速区域卷积神经网络Faster-RCNN检测框架训练第一样本图像集获取,其中,所述Faster-RCNN检测框架根据卷积神经网络CNN、区域生成网络RPN和分类回归网络建立,所述第一样本图像集包括:第一样本图像,所述第一样本图像标注有人像检测框。
5.根据权利要求1所述的方法,其特征在于,所述预设分割模型采用第二样本图像集训练获取,其中,所述第二样本图像集包括:第二样本图像,所述第二样本图像标注有人像检测框以及人像实例分割结果。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述人像实例分割结果包括:人像分割掩码结果。
7.根据权利要求3所述的方法,其特征在于,所述采用预设检测模型获取目标图像中的人像检测框、以及所述目标图像的特征信息,包括:
采用预设检测模型获取目标图像中的N个人像检测框、以及所述目标图像的多尺度特征图,N为大于0的整数;
相应地,所述按照预设比例扩大所述人像检测框,获取扩大后的人像检测框,包括:
按照预设比例分别扩大N个所述人像检测框,获取N个扩大后的人像检测框。
8.一种人像实例分割装置,其特征在于,包括:
第一获取模块,用于采用预设检测模型获取目标图像中的人像检测框、以及所述目标图像的特征信息;
第一扩大模块,用于按照预设比例扩大所述人像检测框,获取扩大后的人像检测框;
分割模块,用于采用预设分割模型,根据所述扩大后的人像检测框、所述目标图像的特征信息,获取所述目标图像的人像实例分割结果。
9.根据权利要求8所述的装置,其特征在于,还包括:第二获取模块和第二扩大模块;
所述第二获取模块,用于在所述第一扩大模块按照预设比例扩大所述人像检测框,获取扩大后的人像检测框之后,获取所述扩大后的人像检测框中每条边与所述目标图像所对应的边缘之间的距离;
所述第二扩大模块,用于将所述扩大后的人像检测框中与所述目标图像所对应的边缘之间的距离小于预设阈值的边,扩大至与所述目标图像所对应边缘一致的位置。
10.根据权利要求8所述的装置,其特征在于,所述目标图像的特征信息为多尺度特征图。
11.根据权利要求8所述的装置,其特征在于,所述预设检测模型采用快速区域卷积神经网络Faster-RCNN检测框架训练第一样本图像集获取,其中,所述Faster-RCNN检测框架根据卷积神经网络CNN、区域生成网络RPN和分类回归网络建立,所述第一样本图像集包括:第一样本图像,所述第一样本图像标注有人像检测框。
12.根据权利要求8所述的装置,其特征在于,所述预设分割模型采用第二样本图像集训练获取,其中,所述第二样本图像集包括:第二样本图像,所述第二样本图像标注有人像检测框以及人像实例分割结果。
13.根据权利要求8-12任一项所述的装置,其特征在于,所述人像实例分割结果包括:人像分割掩码结果。
14.根据权利要求10所述的装置,其特征在于,所述第一获取模块,具体用于采用预设检测模型获取目标图像中的N个人像检测框、以及所述目标图像的多尺度特征图,N为大于0的整数;
相应地,所述第一扩大模块,具体用于按照预设比例分别扩大N个所述人像检测框,获取N个扩大后的人像检测框。
15.一种人像实例分割设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当人像实例分割设备运行时,所述处理器与所述存储介质之间通过所述总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1-7任一项所述的方法。
16.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7任一项所述的方法。
CN202010005259.0A 2020-01-03 2020-01-03 人像实例分割方法、装置、设备及存储介质 Pending CN111179287A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010005259.0A CN111179287A (zh) 2020-01-03 2020-01-03 人像实例分割方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010005259.0A CN111179287A (zh) 2020-01-03 2020-01-03 人像实例分割方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111179287A true CN111179287A (zh) 2020-05-19

Family

ID=70654420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010005259.0A Pending CN111179287A (zh) 2020-01-03 2020-01-03 人像实例分割方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111179287A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392820A (zh) * 2021-08-17 2021-09-14 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质
WO2022033513A1 (zh) * 2020-08-11 2022-02-17 影石创新科技股份有限公司 目标分割方法、装置、计算机可读存储介质及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916370A (zh) * 2010-08-31 2010-12-15 上海交通大学 人脸检测中非特征区域图像处理的方法
CN108985181A (zh) * 2018-06-22 2018-12-11 华中科技大学 一种基于检测分割的端对端人脸标注方法
CN109670429A (zh) * 2018-12-10 2019-04-23 广东技术师范学院 一种基于实例分割的监控视频多目标人脸检测方法及系统
EP3493105A1 (en) * 2017-12-03 2019-06-05 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916370A (zh) * 2010-08-31 2010-12-15 上海交通大学 人脸检测中非特征区域图像处理的方法
EP3493105A1 (en) * 2017-12-03 2019-06-05 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
CN108985181A (zh) * 2018-06-22 2018-12-11 华中科技大学 一种基于检测分割的端对端人脸标注方法
CN109670429A (zh) * 2018-12-10 2019-04-23 广东技术师范学院 一种基于实例分割的监控视频多目标人脸检测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
糜元根;陈丹驰;季鹏;: "基于几何特征与新Haar特征的人脸检测算法" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022033513A1 (zh) * 2020-08-11 2022-02-17 影石创新科技股份有限公司 目标分割方法、装置、计算机可读存储介质及计算机设备
CN113392820A (zh) * 2021-08-17 2021-09-14 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质
CN113392820B (zh) * 2021-08-17 2021-11-30 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN109493350B (zh) 人像分割方法及装置
CN106778928B (zh) 图像处理方法及装置
US10783354B2 (en) Facial image processing method and apparatus, and storage medium
CN110348294B (zh) Pdf文档中图表的定位方法、装置及计算机设备
CN108960229B (zh) 一种面向多方向的文字检测方法和装置
CN110163076B (zh) 一种图像数据处理方法和相关装置
CN108121931B (zh) 二维码数据处理方法、装置及移动终端
US10929978B2 (en) Image processing apparatus, training apparatus, image processing method, training method, and storage medium
CN108961158B (zh) 一种图像合成方法及装置
CN110909724B (zh) 一种多目标图像的缩略图生成方法
CN109903291B (zh) 图像处理方法及相关装置
CN112101386B (zh) 文本检测方法、装置、计算机设备和存储介质
CN111563908A (zh) 一种图像处理方法及相关装置
RU2697627C1 (ru) Способ корректировки освещенности объекта на изображении в последовательности изображений и вычислительное устройство пользователя, реализующее упомянутый способ
CN111612004A (zh) 一种基于语义内容的图像裁剪方法及装置
CN111179287A (zh) 人像实例分割方法、装置、设备及存储介质
CN113657370B (zh) 一种文字识别方法及其相关设备
CN111881846B (zh) 图像处理方法和相关装置、设备、存储介质
WO2019200785A1 (zh) 快速手部跟踪方法、装置、终端及存储介质
JP6754717B2 (ja) 物体候補領域推定装置、物体候補領域推定方法、及び物体候補領域推定プログラム
CN114255493A (zh) 图像检测方法、人脸检测方法及装置、设备及存储介质
CN112839167B (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN113392820A (zh) 动态手势识别方法、装置、电子设备及可读存储介质
CN113610864A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN112069885A (zh) 人脸属性识别方法、装置及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination