CN111401247B - 一种基于级联卷积神经网络的人像分割方法 - Google Patents

一种基于级联卷积神经网络的人像分割方法 Download PDF

Info

Publication number
CN111401247B
CN111401247B CN202010185088.4A CN202010185088A CN111401247B CN 111401247 B CN111401247 B CN 111401247B CN 202010185088 A CN202010185088 A CN 202010185088A CN 111401247 B CN111401247 B CN 111401247B
Authority
CN
China
Prior art keywords
portrait
network
image
segmentation network
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010185088.4A
Other languages
English (en)
Other versions
CN111401247A (zh
Inventor
张明琦
李云夕
熊永春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xiaoying Innovation Technology Co ltd
Original Assignee
Hangzhou Xiaoying Innovation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xiaoying Innovation Technology Co ltd filed Critical Hangzhou Xiaoying Innovation Technology Co ltd
Priority to CN202010185088.4A priority Critical patent/CN111401247B/zh
Publication of CN111401247A publication Critical patent/CN111401247A/zh
Application granted granted Critical
Publication of CN111401247B publication Critical patent/CN111401247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于级联卷积神经网络的人像分割方法。它具体包括如下步骤:(1)搜集大量的人像数据,对数据进行人工标注,得到与原始图像一致的二值化人像标注掩膜;(2)构建多尺度的图像输入;(3)构建主级人像分割网络;(4)构建次级人像分割网络;(5)构建次级人像分割网络的输入;(6)构建整个网络的损失函数;(7)根据整个网络的损失函数对整个网络进行反向传播更新权重,获得训练好的人像分割模型。本发明的有益效果是:在少量增加模型复杂度的情况下,较好的恢复人像边缘;保证次级网络在优化人像边缘的同时,保持人像完整性;提升人像整体的分割效果以及人像边缘的准确性。

Description

一种基于级联卷积神经网络的人像分割方法
技术领域
本发明涉及图像处理相关技术领域,尤其是指一种基于级联卷积神经网络的人像分割方法。
背景技术
人像分割是指将图片中的人像与背景分离出来,分离出来的人像将为后续进行背景虚化、背景替换、人像移动等应用提供基础。由于背景的复杂程度高,以及人像姿态的多样化,导致传统的人像分割不能很好的提取人像区域,因此目前的人像分割技术大多是基于深度学习的方法。
基于深度学习的人像分割方法通常采用全卷积神经网络,用端到端预测的方式来分割人像与背景,例如FCN、U-net、DeepLab等网络架构。但这些方法普遍存在边缘分割不准的问题,或者通过提高网络模型的大小来提升结果的准确性,从而导致算法复杂度增加,运行速度较慢。因此,无法在效果和性能方面达到一个很好的平衡,难以满足当前的需求。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种提升分割效率和边缘准确性的基于级联卷积神经网络的人像分割方法。
为了实现上述目的,本发明采用以下技术方案:
一种基于级联卷积神经网络的人像分割方法,具体包括如下步骤:
(1)搜集大量的人像数据,对数据进行人工标注,得到与原始图像一致的二值化人像标注掩膜;
(2)构建多尺度的图像输入:对原始输入图像进行预处理,得到RGB输入图像I1,对相应的二值化人像标注掩膜做同样的预处理操作得到人像掩膜Iy,对RGB输入图像I1进行两次缩放操作,分别得到RGB输入图像I2和RGB输入图像I3
(3)构建主级人像分割网络:由卷积模块、下采样层和上采样层组成,卷积模块由若干特征提取单元组成,每个特征提取单元包括卷积层、归一化层以及激活层,RGB输入图像I1经过主级人像分割网络后得到人像概率输出P1
(4)构建次级人像分割网络:由可分离卷积模块、下采样层和上采样层组成,可分离卷积模块由可分离卷积层、归一化层和激活层组成;
(5)将步骤(2)中RGB输入图像I1、RGB输入图像I2和RGB输入图像I3分别与不同等级的特征进行通道上的合并后输入到次级人像分割网络的不同阶段;经过次级人像分割网络后,得到最终的优化人像概率输出P2
(6)构建整个网络的损失函数:将人像概率输出P1、人像概率输出P2与人像掩膜Iy进行交叉熵损失函数运算,得到loss1和loss2,将loss1和loss2按不同权重相加作为整个网络的损失函数loss;
(7)根据权重loss对整个网络进行反向传播更新权重,获得训练好的人像分割模型。
整个人像分割算法包括多尺度的输入图像,主级分割网络以及次级分割网络。经过主级分割网络的整体分割,以及次级分割网络的人像边缘优化,最终输出精确的人像掩膜。采用级联卷积神经网络,主级网络用于对人像的整体分割,次级网络用于细化人像边缘;设计轻量的次级网络,在少量增加模型复杂度的情况下,较好的恢复人像边缘;将图像以多种尺度输入次级网络,保证次级网络在优化人像边缘的同时,保持人像完整性。故而,本发明在少量增加模型复杂度的情况下,提升人像整体的分割效果以及人像边缘的准确性。
作为优选,在步骤(1)中,具体操作方法为:从各种渠道搜集若干人像数据,并使用photoshop软件对数据进行人工标注,背景区域标记为0,人像区域标记为1,得到与原始图像一致的二值化人像标注掩膜。
作为优选,在步骤(2)中,构建多尺度的图像输入的具体操作方法为:首先对原始输入图像进行预处理,得到尺寸为512*512*3的RGB输入图像I1;然后对相应的二值化人像标注掩膜做同样的预处理操作得到尺寸为512*512*1的人像掩膜Iy;最后对RGB输入图像I1进行两次缩放操作,分别得到尺寸为256*256*3的RGB输入图像I2和尺寸为128*128*3的RGB输入图像I3
作为优选,在步骤(3)中,构建主级人像分割网络的具体操作方法为:由编码模块和解码模块组成,主级人像分割网络的左半部分为编码模块,其中每个卷积模块后都使用下采样层来降低特征的空间分辨率,整个网络使用16倍的下采样步长,即编码模块的特征输出尺寸为原始图像的1/16;主级人像分割网络的右半部分为解码模块,其中每个卷积模块后都使用上采样层来增加特征的空间分辨率,同时与编码模块中的特征进行融合来达到更好的分割效果;最后用sigmoid激活函数对主级人像分割网络的特征进行激活,输入图像I1经过主级人像分割网络后得到尺寸为512*512*1的人像概率输出P1
作为优选,sigmoid激活函数如下所示:
其中x表示未激活前的特征值,y(x)表示激活后的特征值。
作为优选,在步骤(4)中,构建次级人像分割网络具体操作方法为:由编码模块和解码模块组成,按照主级人像分割网络的编码模块构建方式,构建次级人像分割网络的编码模块,但在次级人像分割网络的编码模块中仅采用4倍的下采样步长来保留边缘细节;并按照主级人像分割网络的解码模块构建方式,构建次级人像分割网络的解码模块;最后用sigmoid激活函数对次级人像分割网络的输出特征进行激活。
作为优选,在步骤(5)中,RGB输入图像I1和主级人像分割网络的输出P1进行通道上的合并后输入到次级人像分割网络的第一级编码模块;RGB输入图像I2和次级人像分割网络的第一级下采样特征进行通道上的合并后输入到次级人像分割网络的第二级编码模块;RGB输入图像I3和次级人像分割网络的第二级下采样特征进行通道上的合并后输入到次级人像分割网络的第三级编码模块。
作为优选,在步骤(6)中,得到loss1和loss2的计算公式如下:
整个网络的损失函数loss的计算公式如下:
loss=loss1+λloss2
其中λ表示loss2的权重。
本发明的有益效果是:采用级联卷积神经网络,主级网络用于对人像的整体分割,次级网络用于细化人像边缘;设计轻量的次级网络,在少量增加模型复杂度的情况下,较好的恢复人像边缘;将图像以多种尺度输入次级网络,保证次级网络在优化人像边缘的同时,保持人像完整性;提升人像整体的分割效果以及人像边缘的准确性。
附图说明
图1是本发明的方法流程图;
图2是本发明的方法框架图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
如图1、图2所述的实施例中,一种基于级联卷积神经网络的人像分割方法,具体包括如下步骤:
(1)搜集大量的人像数据,对数据进行人工标注,得到与原始图像一致的二值化人像标注掩膜;具体操作方法为:从各种渠道搜集若干人像数据,并使用photoshop软件对数据进行人工标注,背景区域标记为0,人像区域标记为1,得到与原始图像一致的二值化人像标注掩膜。
(2)构建多尺度的图像输入:对原始输入图像进行预处理,得到RGB输入图像I1,对相应的二值化人像标注掩膜做同样的预处理操作得到人像掩膜Iy,对RGB输入图像I1进行两次缩放操作,分别得到RGB输入图像I2和RGB输入图像I3;构建多尺度的图像输入的具体操作方法为:首先对原始输入图像进行预处理,得到尺寸为512*512*3的RGB输入图像I1;然后对相应的二值化人像标注掩膜做同样的预处理操作得到尺寸为512*512*1的人像掩膜Iy;最后对RGB输入图像I1进行两次缩放操作,分别得到尺寸为256*256*3的RGB输入图像I2和尺寸为128*128*3的RGB输入图像I3
(3)构建主级人像分割网络:由卷积模块、下采样层和上采样层组成,卷积模块由若干特征提取单元组成,每个特征提取单元包括卷积层、归一化层以及激活层,RGB输入图像I1经过主级人像分割网络后得到人像概率输出P1;如图2所示,构建主级人像分割网络的具体操作方法为:由编码模块和解码模块组成,主级人像分割网络的左半部分为编码模块,其中每个卷积模块后都使用下采样层来降低特征的空间分辨率,整个网络使用16倍的下采样步长,即编码模块的特征输出尺寸为原始图像的1/16;主级人像分割网络的右半部分为解码模块,其中每个卷积模块后都使用上采样层来增加特征的空间分辨率,同时与编码模块中的特征进行融合来达到更好的分割效果;最后用sigmoid激活函数对主级人像分割网络的特征进行激活,输入图像I1经过主级人像分割网络后得到尺寸为512*512*1的人像概率输出P1。sigmoid激活函数如下所示:
其中x表示未激活前的特征值,y(x)表示激活后的特征值。
(4)构建次级人像分割网络:其目的是在不显著增加模型大小的情况下优化人像边缘细节,由可分离卷积模块、下采样层和上采样层组成,可分离卷积模块由可分离卷积层、归一化层和激活层组成,相比于主级人像分割网络中的卷积模块,其计算量更小,更适合轻量化的模型设计;构建次级人像分割网络具体操作方法为:由编码模块和解码模块组成,按照主级人像分割网络的编码模块构建方式,构建次级人像分割网络的编码模块,但由于边缘细节主要存在于网络的浅层特征中,因此在次级人像分割网络的编码模块中仅采用4倍的下采样步长来保留边缘细节;并按照主级人像分割网络的解码模块构建方式,构建次级人像分割网络的解码模块;最后用步骤(3)中的sigmoid激活函数对次级人像分割网络的输出特征进行激活。
(5)将步骤(2)中RGB输入图像I1、RGB输入图像I2和RGB输入图像I3分别与不同等级的特征进行通道上的合并后输入到次级人像分割网络的不同阶段;经过次级人像分割网络后,得到最终的优化人像概率输出P2;如图2所示,RGB输入图像I1和主级人像分割网络的输出P1进行通道上的合并后输入到次级人像分割网络的第一级编码模块;RGB输入图像I2和次级人像分割网络的第一级下采样特征进行通道上的合并后输入到次级人像分割网络的第二级编码模块;RGB输入图像I3和次级人像分割网络的第二级下采样特征进行通道上的合并后输入到次级人像分割网络的第三级编码模块。
(6)构建整个网络的损失函数:将人像概率输出P1、人像概率输出P2与人像掩膜Iy进行交叉熵损失函数运算,得到loss1和loss2,将loss1和loss2按不同权重相加作为整个网络的损失函数loss;得到loss1和loss2的计算公式如下:
整个网络的损失函数loss的计算公式如下:
loss=loss1+λloss2
其中λ表示loss2的权重,这里设置为1.5。
(7)根据权重loss对整个网络进行反向传播更新权重,获得训练好的人像分割模型。测试阶段,只需要将测试图片输入到训练好的分割模型即可得到精确的人像分割掩膜。
整个人像分割算法包括多尺度的输入图像,主级分割网络以及次级分割网络。经过主级分割网络的整体分割,以及次级分割网络的人像边缘优化,最终输出精确的人像掩膜。采用级联卷积神经网络,主级网络用于对人像的整体分割,次级网络用于细化人像边缘;设计轻量的次级网络,在少量增加模型复杂度的情况下,较好的恢复人像边缘;将图像以多种尺度输入次级网络,保证次级网络在优化人像边缘的同时,保持人像完整性。故而,本发明在少量增加模型复杂度的情况下,提升人像整体的分割效果以及人像边缘的准确性。

Claims (4)

1.一种基于级联卷积神经网络的人像分割方法,其特征是,具体包括如下步骤:
(1)搜集大量的人像数据,对数据进行人工标注,得到与原始图像一致的二值化人像标注掩膜;
(2)构建多尺度的图像输入:对原始输入图像进行预处理,得到RGB输入图像I 1 ,对相应的二值化人像标注掩膜做同样的预处理操作得到人像掩膜I y ,对RGB输入图像I 1 进行两次缩放操作,分别得到RGB输入图像I 2 和RGB输入图像I 3 ;构建多尺度的图像输入的具体操作方法为:首先对原始输入图像进行预处理,得到尺寸为512*512*3的RGB输入图像I 1 ;然后对相应的二值化人像标注掩膜做同样的预处理操作得到尺寸为512*512*1的人像掩膜I y ;最后对RGB输入图像I 1 进行两次缩放操作,分别得到尺寸为256*256*3的RGB输入图像I 2 和尺寸为128*128*3的RGB输入图像I 3
(3)构建主级人像分割网络:由卷积模块、下采样层和上采样层组成,卷积模块由若干特征提取单元组成,每个特征提取单元包括卷积层、归一化层以及激活层,RGB输入图像I 1 经过主级人像分割网络后得到人像概率输出P 1 ;构建主级人像分割网络的具体操作方法为:由编码模块和解码模块组成,主级人像分割网络的左半部分为编码模块,其中每个卷积模块后都使用下采样层来降低特征的空间分辨率,整个网络使用16倍的下采样步长,即编码模块的特征输出尺寸为原始图像的1/16;主级人像分割网络的右半部分为解码模块,其中每个卷积模块后都使用上采样层来增加特征的空间分辨率,同时与编码模块中的特征进行融合来达到更好的分割效果;最后用sigmoid激活函数对主级人像分割网络的特征进行激活,输入图像I 1 经过主级人像分割网络后得到尺寸为512*512*1的人像概率输出P 1
(4)构建次级人像分割网络:由可分离卷积模块、下采样层和上采样层组成,可分离卷积模块由可分离卷积层、归一化层和激活层组成;构建次级人像分割网络具体操作方法为:由编码模块和解码模块组成,按照主级人像分割网络的编码模块构建方式,构建次级人像分割网络的编码模块,但在次级人像分割网络的编码模块中仅采用4倍的下采样步长来保留边缘细节;并按照主级人像分割网络的解码模块构建方式,构建次级人像分割网络的解码模块;最后用sigmoid激活函数对次级人像分割网络的输出特征进行激活;
(5)构建次级人像分割网络的输入:将步骤(2)中RGB输入图像I 1 、RGB输入图像I 2 和RGB输入图像I 3 分别与不同等级的特征进行通道上的合并后输入到次级人像分割网络的不同阶段;经过次级人像分割网络后,得到最终的优化人像概率输出P 2 ;RGB输入图像I 1 和主级人像分割网络的输出P 1 进行通道上的合并后输入到次级人像分割网络的第一级编码模块;RGB输入图像I 2 和次级人像分割网络的第一级下采样特征进行通道上的合并后输入到次级人像分割网络的第二级编码模块;RGB输入图像I 3 和次级人像分割网络的第二级下采样特征进行通道上的合并后输入到次级人像分割网络的第三级编码模块;
(6)构建整个网络的损失函数:将人像概率输出P 1 、人像概率输出P 2 与人像掩膜I y 进行交叉熵损失函数运算,得到loss 1 loss 2 ,将loss 1 loss 2 按不同权重相加作为整个网络的损失函数loss
(7)根据权重loss对整个网络进行反向传播更新权重,获得训练好的人像分割模型。
2.根据权利要求1所述的一种基于级联卷积神经网络的人像分割方法,其特征是,在步骤(1)中,具体操作方法为:从各种渠道搜集若干人像数据,并使用photoshop软件对数据进行人工标注,背景区域标记为0,人像区域标记为1,得到与原始图像一致的二值化人像标注掩膜。
3.根据权利要求1所述的一种基于级联卷积神经网络的人像分割方法,其特征是,sigmoid激活函数如下所示:
其中x表示未激活前的特征值,y(x)表示激活后的特征值。
4.根据权利要求1所述的一种基于级联卷积神经网络的人像分割方法,其特征是,在步骤(6)中,得到loss 1 loss 2 的计算公式如下:
整个网络的损失函数loss的计算公式如下:
loss=loss1+λloss2
其中λ表示loss 2 的权重。
CN202010185088.4A 2020-03-17 2020-03-17 一种基于级联卷积神经网络的人像分割方法 Active CN111401247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010185088.4A CN111401247B (zh) 2020-03-17 2020-03-17 一种基于级联卷积神经网络的人像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010185088.4A CN111401247B (zh) 2020-03-17 2020-03-17 一种基于级联卷积神经网络的人像分割方法

Publications (2)

Publication Number Publication Date
CN111401247A CN111401247A (zh) 2020-07-10
CN111401247B true CN111401247B (zh) 2023-07-28

Family

ID=71432533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010185088.4A Active CN111401247B (zh) 2020-03-17 2020-03-17 一种基于级联卷积神经网络的人像分割方法

Country Status (1)

Country Link
CN (1) CN111401247B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516665A (zh) * 2020-12-16 2021-10-19 腾讯科技(深圳)有限公司 图像分割模型的训练方法、图像分割方法、装置、设备
CN112529914B (zh) * 2020-12-18 2021-08-13 北京中科深智科技有限公司 一种实时头发分割方法和系统
CN112699823A (zh) * 2021-01-05 2021-04-23 浙江得图网络有限公司 一种用于共享电动车的定点还车方法
CN112802012B (zh) * 2021-03-09 2024-09-13 中南大学湘雅医院 病理图像检测方法、装置、计算机设备和存储介质
CN113298830B (zh) * 2021-06-22 2022-07-15 西南大学 一种基于自监督的急性颅内ich区域图像分割方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176305A1 (zh) * 2014-05-23 2015-11-26 中国科学院自动化研究所 人形图像分割方法
CN107330900A (zh) * 2017-06-22 2017-11-07 成都品果科技有限公司 一种自动人像分割方法
CN108304788A (zh) * 2018-01-18 2018-07-20 陕西炬云信息科技有限公司 基于深度神经网络的人脸识别方法
WO2018188453A1 (zh) * 2017-04-11 2018-10-18 腾讯科技(深圳)有限公司 人脸区域的确定方法、存储介质、计算机设备
CN109523558A (zh) * 2018-10-16 2019-03-26 清华大学 一种人像分割方法及系统
WO2019199701A1 (en) * 2018-04-09 2019-10-17 Dolby Laboratories Licensing Corporation Hdr image representations using neural network mappings
CN110610526A (zh) * 2019-08-12 2019-12-24 江苏大学 一种基于wnet对单目人像进行分割和景深渲染的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109426858B (zh) * 2017-08-29 2021-04-06 京东方科技集团股份有限公司 神经网络、训练方法、图像处理方法及图像处理装置
CN110838124B (zh) * 2017-09-12 2021-06-18 深圳科亚医疗科技有限公司 用于分割具有稀疏分布的对象的图像的方法、系统和介质
CN109325954B (zh) * 2018-09-18 2021-08-10 北京旷视科技有限公司 图像分割方法、装置及电子设备
CN109816011B (zh) * 2019-01-21 2021-09-07 厦门美图之家科技有限公司 视频关键帧提取方法
CN110276766A (zh) * 2019-06-27 2019-09-24 广州久邦世纪科技有限公司 一种人像分割的方法及装置
CN110517278B (zh) * 2019-08-07 2022-04-29 北京旷视科技有限公司 图像分割和图像分割网络的训练方法、装置和计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176305A1 (zh) * 2014-05-23 2015-11-26 中国科学院自动化研究所 人形图像分割方法
WO2018188453A1 (zh) * 2017-04-11 2018-10-18 腾讯科技(深圳)有限公司 人脸区域的确定方法、存储介质、计算机设备
CN107330900A (zh) * 2017-06-22 2017-11-07 成都品果科技有限公司 一种自动人像分割方法
CN108304788A (zh) * 2018-01-18 2018-07-20 陕西炬云信息科技有限公司 基于深度神经网络的人脸识别方法
WO2019199701A1 (en) * 2018-04-09 2019-10-17 Dolby Laboratories Licensing Corporation Hdr image representations using neural network mappings
CN109523558A (zh) * 2018-10-16 2019-03-26 清华大学 一种人像分割方法及系统
CN110610526A (zh) * 2019-08-12 2019-12-24 江苏大学 一种基于wnet对单目人像进行分割和景深渲染的方法

Also Published As

Publication number Publication date
CN111401247A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111401247B (zh) 一种基于级联卷积神经网络的人像分割方法
CN113052210B (zh) 一种基于卷积神经网络的快速低光照目标检测方法
CN112669325B (zh) 一种基于主动式学习的视频语义分割方法
CN110443818B (zh) 一种基于涂鸦的弱监督语义分割方法与系统
CN111340814B (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN109035251B (zh) 一种基于多尺度特征解码的图像轮廓检测方法
CN111428718A (zh) 一种基于图像增强的自然场景文本识别方法
CN114943963A (zh) 一种基于双分支融合网络的遥感图像云和云影分割方法
CN112233129A (zh) 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN113052775B (zh) 一种图像去阴影方法及装置
CN114048822A (zh) 一种图像的注意力机制特征融合分割方法
CN114037930A (zh) 基于时空增强网络的视频动作识别方法
CN114693929A (zh) 一种rgb-d双模态特征融合的语义分割方法
CN115565043A (zh) 结合多表征特征以及目标预测法进行目标检测的方法
CN113436198A (zh) 一种协同图像超分辨率重建的遥感图像语义分割方法
CN114092467A (zh) 一种基于轻量化卷积神经网络的划痕检测方法及系统
CN114037893A (zh) 一种基于卷积神经网络的高分辨率遥感图像建筑提取方法
CN115908793A (zh) 一种基于位置注意力机制的编解码结构语义分割模型
CN113888505A (zh) 一种基于语义分割的自然场景文本检测方法
CN113436101A (zh) 基于高效通道注意力机制的龙格库塔模块去雨的方法
CN117237641A (zh) 一种基于双分支特征融合网络的息肉分割方法及系统
CN110264483A (zh) 一种基于深度学习的语义图像分割方法
CN118334365A (zh) 一种新的rgb-d图像显著性目标检测方法
CN114463340A (zh) 一种边缘信息引导的敏捷型遥感图像语义分割方法
CN113313721A (zh) 基于多尺度结构的实时语义分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 22nd floor, block a, Huaxing Times Square, 478 Wensan Road, Xihu District, Hangzhou, Zhejiang 310000

Applicant after: Hangzhou Xiaoying Innovation Technology Co.,Ltd.

Address before: 16 / F, HANGGANG Metallurgical Science and technology building, 294 Tianmushan Road, Xihu District, Hangzhou City, Zhejiang Province, 310012

Applicant before: HANGZHOU QUWEI SCIENCE & TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant