CN106611160B

CN106611160B - 一种基于卷积神经网络的图像头发识别方法及其装置

Info

Publication number: CN106611160B
Application number: CN201611159197.9A
Authority: CN
Inventors: 刘文奇; 曾坤; 龚永义; 罗笑南
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2016-12-15
Filing date: 2016-12-15
Publication date: 2019-12-17
Anticipated expiration: 2036-12-15
Also published as: CN106611160A

Abstract

本发明实施例公开了一种基于卷积神经网络的图像头发识别方法及其装置，其中，该方法包括：收集图集；对图集中的每一张图片进行标记；对图集中的每一张图片进行预处理；检测图集中每一张图片的人像头部位置，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息；基于全卷积网络构造头发全卷积网络；对头发全卷积网络进行训练；将输出的结果与头发区域遮蔽测试图集相比较，获得对头发全卷积网络的评估结果；将欲获取头发遮蔽图的图片输入头发全卷积网络，获得该图像头发区域的遮蔽图。可以解决现有技术中难以处理背景颜色与头发颜色相似的情况，以及无法在图像人脸偏转角度很大或人背面的情况下无法识别头发的问题。

Description

一种基于卷积神经网络的图像头发识别方法及其装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于卷积神经网络的图像头发识别方法及其装置。

背景技术

手机自拍已经成为现代人们生活中非常流行的现象。各种美图工具也孕育而生。很多软件都可以识别人脸的特征，对人脸进行一些有趣的处理。但是人们手机自拍时的背景往往很复杂，当软件想对人像做处理时，比如生成人物的素描图或者将人物动漫化，往往需要将背景分离出去。在分离的过程中，头发分割往往非常困难。在证件照背景替换软件中，头发也是一个非常难处理的问题，往往需要人工的参与。本发明提供一种自动头发分割，从而可以解决这个难题。

2008年，发表在ICIP的论文Frequential and color analysis for hair masksegmentation中，为了自动生成头发区域的遮蔽图，使用了头发区域的三个特征：1)头发分布在头部区域附近；2)头发由于其本身的特征，具有一种特殊的频率分布。3)在2)分析的频率遮蔽图基础上，构建头发颜色的模型，从而进一步优化头发区域遮蔽图。最后使用抠图算法生成头发区域的遮蔽图。虽然这种方法在大部分情况下有效，但是在背景与头发颜色相似的情况下，还是无法达到理想的结果。

2011年，发表在IEEE Automatic Face Gesture Recognition and Workshop的论文A novel coarse-to-fine hair segmentation method，提出了一种简单的方法进行头发分割。这篇论文的思想很简单，通过先使用Active Segmentation with Fixation(ASF)进行粗略的分割，然后使用Graph Cuts(GC)进行更细致的分割。但是该研究结果也无法分辨与头发颜色相似的背景。从而导致分割不准确。

在2016年发表在SIGGRAPH的论文，Autohair：Fully Automatic Hair Modelingfrom A Single Image中，通过先对头发分类，再在每个类中对头发进行分割。这种方法不仅可以分割头发区域，还可以预测头发的方向。但是这种方法不能解决侧脸的情况，因为在侧脸的时候无法检测到人脸的特征。对于人脸背向的情况，也是如此。

发明内容

本发明的目的在于克服现有技术的不足，本发明提供了一种基于卷积神经网络的图像头发识别方法及其装置，可以解决现有技术中难以处理背景颜色与头发颜色相似的情况，以及无法在图像人脸偏转角度很大或人背面的情况下无法识别头发的问题。

为了解决上述问题，本发明提出了一种基于卷积神经网络的图像头发识别方法，所述方法包括：

收集图集，该图集包括训练图集和测试图集；

对图集中的每一张图片进行标记，获得训练图集对应的头发区域遮蔽训练图集和测试图集对应的头发区域遮蔽测试图集；

对图集中的每一张图片进行预处理，获得与训练图集对应的YCrCb训练图集和频率遮蔽训练图集、与测试图集对应的YCrCb测试图集和频率遮蔽测试图集；

检测图集中每一张图片的人像头部位置，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息；

基于全卷积网络构造头发全卷积网络HFCN；

将YCrCb训练图集、频率遮蔽训练图集及训练图集的头部位置信息进行编码，输入到头发全卷积网络，同时，将头发区域遮蔽训练图集输入头发全卷积网络，对头发全卷积网络进行训练，获得训练好的头发全卷积网络；

将YCrCb测试图集、频率遮蔽测试图集及测试图集的头部位置信息进行编码，并输入到训练好的头发全卷积网络，将输出的结果与头发区域遮蔽测试图集相比较，获得对头发全卷积网络的评估结果；

将欲获取头发遮蔽图的图片输入头发全卷积网络，获得该图像头发区域的遮蔽图。

优选地，所述对所述图集中的每一张图片进行预处理的步骤，包括：

对图集中每一张图片进行处理，生成YCrCb图，获得训练图集对应的YCrCb训练图集和测试图集对应的YCrCb测试图集；

对图集中每一张图片进行处理，生成频率遮蔽图，获得训练图集对应的频率遮蔽训练图集和测试图集对应的频率遮蔽测试图集。

优选地，所述基于全卷积网络构造头发全卷积网络HFCN的步骤，包括：

确定头发全卷积网路的层数及每层的参数，获得头发全卷积网络参数信息；

根据头发全卷积网络参数信息及卷积神经网络的构造原理获得头发全卷积网络。

优选地，所述将YCrCb训练图集、频率遮蔽训练图集及训练图集的头部位置信息进行编码，输入到头发全卷积网络，同时，将头发区域遮蔽训练图集输入头发全卷积网络，对头发全卷积网络进行训练的步骤，包括：

根据获得的头发全卷积网络参数信息确定网络训练参数，获得头发全卷积网络训练参数信息；

根据头发全卷积网络训练参数信息及卷积神经网络训练网络的范式训练头发全卷积网络，获得训练好的头发全卷积网络。

优选地，所述根据头发全卷积网络训练参数信息及卷积神经网络训练网络的范式训练头发全卷积网络，获得训练好的头发全卷积网络的步骤，包括：

根据损失函数之和ε(θ)＝∑_pe(X_Θ(p)，l(p))获得误差值，其中，p是图像中像素的索引，X_θ(p)是在像素p位置、参数为θ的全卷积回归函数，损失函数e(.，.)测量回归输出与真实值l(p)之间的误差；

根据误差值，利用反向传播及随机梯度下降方法，更新网络参数，获得训练好的头发全卷积网络。

相应地，本发明还提供一种基于卷积神经网络的图像头发识别装置，所述装置包括：

收集模块，用于收集图集，该图集包括训练图集和测试图集；

标记模块，用于对图集中的每一张图片进行标记，获得训练图集对应的头发区域遮蔽训练图集和测试图集对应的头发区域遮蔽测试图集；

预处理模块，用于对图集中的每一张图片进行预处理，获得与训练图集对应的YCrCb训练图集和频率遮蔽训练图集、与测试图集对应的YCrCb测试图集和频率遮蔽测试图集；

人像头部检测模块，用于检测图集中每一张图片的人像头部位置，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息；

构造模块，用于基于全卷积网络构造头发全卷积网络HFCN；

训练模块，用于将YCrCb训练图集、频率遮蔽训练图集及训练图集的头部位置信息进行编码，输入到头发全卷积网络，同时，将头发区域遮蔽训练图集输入头发全卷积网络，对头发全卷积网络进行训练，获得训练好的头发全卷积网络；

测试模块，用于将YCrCb测试图集、频率遮蔽测试图集及测试图集的头部位置信息进行编码，并输入到训练好的头发全卷积网络，将输出的结果与头发区域遮蔽测试图集相比较，获得对头发全卷积网络的评估结果；

输出模块，用于将欲获取头发遮蔽图的图片输入头发全卷积网络，获得该图像头发区域的遮蔽图。

优选地，所述预处理模块包括：

YCrCb处理单元，用于对图集中每一张图片进行处理，生成YCrCb图，获得训练图集对应的YCrCb训练图集和测试图集对应的YCrCb测试图集；

遮蔽图生成单元，用于对图集中每一张图片进行处理，生成频率遮蔽图，获得训练图集对应的频率遮蔽训练图集和测试图集对应的频率遮蔽测试图集。

优选地，所述构造模块包括：

参数收集单元，用于确定头发全卷积网路的层数及每层的参数，获得头发全卷积网络参数信息；

构造单元，用于根据头发全卷积网络参数信息及卷积神经网络的构造原理获得头发全卷积网络。

优选地，所述训练模块包括：

参数确定单元，用于根据获得的头发全卷积网络参数信息确定网络训练参数，获得头发全卷积网络训练参数信息；

网络训练单元，用于根据头发全卷积网络训练参数信息及卷积神经网络训练网络的范式训练头发全卷积网络，获得训练好的头发全卷积网络。

优选地，所述网络训练单元还用于根据损失函数之和ε(θ)＝∑_pe(X_Θ(p)，l(p))获得误差值，其中，p是图像中像素的索引，X_θ(p)是在像素p位置、参数为θ的全卷积回归函数，损失函数e(.，.)测量回归输出与真实值l(p)之间的误差；根据误差值，利用反向传播及随机梯度下降方法，更新网络参数，获得训练好的头发全卷积网络。

在本发明实施例中，通过全新的卷积神经网络模型(头发全卷积网络模型)，并结合图片中图像中头发位置信息、头发的频率信息及头发的颜色信息，便可以准确地识别图像的头发区域；同时可以实现自动识别，无需人工参与；可以解决现有技术中在背景颜色与头发颜色相似的情况下无法准确的识别头发区域、及无法识别人脸偏转角度大和背面的问题；具有较高的识别精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例的基于卷积神经网络的图像头发识别方法的流程示意图；

图2是本发明实施例中对图集中的每一张图片进行预处理的过程示意图；

图3是本发明实施例中构造头发全卷积网络的过程示意图；

图4是本发明实施例的基于卷积神经网络的图像头发识别装置的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明实施例的基于卷积神经网络的图像头发识别方法的流程示意图，如图1所示，该方法包括：

S1，收集图集，该图集包括训练图集和测试图集；

S2，对图集中的每一张图片进行标记，获得训练图集对应的头发区域遮蔽训练图集和测试图集对应的头发区域遮蔽测试图集；

S3，对图集中的每一张图片进行预处理，获得与训练图集对应的YCrCb训练图集和频率遮蔽训练图集、与测试图集对应的YCrCb测试图集和频率遮蔽测试图集；

S4，检测图集中每一张图片的人像头部位置，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息；

S5，基于全卷积网络构造头发全卷积网络HFCN；

S6，将YCrCb训练图集、频率遮蔽训练图集及训练图集的头部位置信息进行编码，输入到头发全卷积网络，同时，将头发区域遮蔽训练图集输入头发全卷积网络，对头发全卷积网络进行训练，获得训练好的头发全卷积网络；

S7，将YCrCb测试图集、频率遮蔽测试图集及测试图集的头部位置信息进行编码，并输入到训练好的头发全卷积网络，将输出的结果与头发区域遮蔽测试图集相比较，获得对头发全卷积网络的评估结果；

S8，将欲获取头发遮蔽图的图片输入头发全卷积网络，获得该图像头发区域的遮蔽图。

在S1中，可以在网络上收集图集。在图集中，包括有人像的图片及没有人像的图片。在包括人像的图集中，包括人的正脸照、各种角度的侧脸照及人的背面照。在人像照片中，包括有头发的人像和没有头发的人像照片。在有头发的人像图片中，包含各种颜色头发的图片。收集完这些照片后，再对这些照片进行旋转和缩放，形成一个数目更大，角度、尺度各异的图片集。最后将图片集一分为二，获得训练集和测试集。具体实施中，例如：训练集有63000张，测试集有7000张，具体张数分配可根据实际情况而定。

在S2中，对两份图集中的每一张图片进行标记，先使用图割算法，通过交互的方式生成头发区域的大致位置，生成图片的tripmap，最后使用全局抠图算法进行更细致的抠图，并生成训练图集对应的头发区域遮蔽训练图集和测试图集对应的头发区域遮蔽测试图集。

进一步地，如图2所示，S3包括：

S31，对图集中每一张图片进行处理，生成YCrCb图，获得训练图集对应的YCrCb训练图集和测试图集对应的YCrCb测试图集；

S32，对图集中每一张图片进行处理，生成频率遮蔽图，获得训练图集对应的频率遮蔽训练图集和测试图集对应的频率遮蔽测试图集。

首先将图片从RGB颜色空间转变为YCrCb颜色空间，获得YCrCb图；

其次，先通过公式获得频率分布图；

其中，f₀是中心频率，σ是带宽，f_θ角度为θ的频率值。

再通过公式训练图集对应的频率遮蔽训练图集和测试图集对应的频率遮蔽测试图集。

其中，map(i，j)表示图片在(i，j)位置的频率分布函数的值。μ是指频率的平均值，σ是指频率分布的标准差。

在S4中，4先找出每张图片的头部区域，使用局部R-CNN模型和全局R-CNN模型训练出来的网络，可以为每张图片都会生成一个头部位置信息。但是考虑到头部区域可能无法覆盖全部的头发，需要将头部的区域适度扩大。以此区域对图片进行裁剪，并将最终的图片大小进行归一化，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息。

进一步地，如图3所示，S5包括：

S51，确定头发全卷积网路的层数及每层的参数，获得头发全卷积网络参数信息；

S52，根据头发全卷积网络参数信息及卷积神经网络的构造原理获得头发全卷积网络。

进一步地，S6包括：

其中，根据头发全卷积网络训练参数信息及卷积神经网络训练网络的范式训练头发全卷积网络，获得训练好的头发全卷积网络的步骤，包括：

在S7中，评估的标准为交集与并集比值(Interaction-over-Untion，IoU)，计算公式为：

相应地，本发明实施例还提供一种基于卷积神经网络的图像头发识别装置，如图4所示，该装置包括：

收集模块1，用于收集图集，该图集包括训练图集和测试图集；

标记模块2，用于对图集中的每一张图片进行标记，获得训练图集对应的头发区域遮蔽训练图集和测试图集对应的头发区域遮蔽测试图集；

预处理模块3，用于对图集中的每一张图片进行预处理，获得与训练图集对应的YCrCb训练图集和频率遮蔽训练图集、与测试图集对应的YCrCb测试图集和频率遮蔽测试图集；

人像头部检测模块4，用于检测图集中每一张图片的人像头部位置，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息；

构造模块5，用于基于全卷积网络构造头发全卷积网络HFCN；

训练模块6，用于将YCrCb训练图集、频率遮蔽训练图集及训练图集的头部位置信息进行编码，输入到头发全卷积网络，同时，将头发区域遮蔽训练图集输入头发全卷积网络，对头发全卷积网络进行训练，获得训练好的头发全卷积网络；

测试模块7，用于将YCrCb测试图集、频率遮蔽测试图集及测试图集的头部位置信息进行编码，并输入到训练好的头发全卷积网络，将输出的结果与头发区域遮蔽测试图集相比较，获得对头发全卷积网络的评估结果；

输出模块8，用于将欲获取头发遮蔽图的图片输入头发全卷积网络，获得该图像头发区域的遮蔽图。

其中，可以通过收集模块1在网络上收集图集。在图集中，包括有人像的图片及没有人像的图片。在包括人像的图集中，包括人的正脸照、各种角度的侧脸照及人的背面照。在人像照片中，包括有头发的人像和没有头发的人像照片。在有头发的人像图片中，包含各种颜色头发的图片。收集完这些照片后，再对这些照片进行旋转和缩放，形成一个数目更大，角度、尺度各异的图片集。最后将图片集一分为二，获得训练集和测试集。具体实施中，例如：训练集有63000张，测试集有7000张，具体张数分配可根据实际情况而定。

标记模块2对两份图集中的每一张图片进行标记，先使用图割算法，通过交互的方式生成头发区域的大致位置，生成图片的tripmap，最后使用全局抠图算法进行更细致的抠图，并生成训练图集对应的头发区域遮蔽训练图集和测试图集对应的头发区域遮蔽测试图集。

进一步地，预处理模块3包括：

首先将图片从RGB颜色空间转变为YCrCb颜色空间，获得YCrCb图；

其次，先通过公式获得频率分布图；

其中，f₀是中心频率，σ是带宽，f_θ角度为θ的频率值。

进一步地，人像头部检测模块4先找出每张图片的头部区域，使用局部R-CNN模型和全局R-CNN模型训练出来的网络，可以为每张图片都会生成一个头部位置信息。但是考虑到头部区域可能无法覆盖全部的头发，需要将头部的区域适度扩大。以此区域对图片进行裁剪，并将最终的图片大小进行归一化，获得训练图集对应的头部位置信息和测试图集对应的头部位置信息。

进一步地，构造模块5包括：

训练模块6包括：

网络训练单元还用于根据损失函数之和ε(θ)＝∑_pe(X_Θ(p)，l(p))获得误差值，其中，p是图像中像素的索引，X_θ(p)是在像素p位置、参数为θ的全卷积回归函数，损失函数e(.，.)测量回归输出与真实值l(p)之间的误差；根据误差值，利用反向传播及随机梯度下降方法，更新网络参数，获得训练好的头发全卷积网络。

具体地，本发明实施例的装置相关功能模块的工作原理可参见方法实施例的相关描述，这里不再赘述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、磁盘或光盘等。

另外，以上对本发明实施例所提供的基于卷积神经网络的图像头发识别方法及其装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于卷积神经网络的图像头发识别方法，其特征在于，所述方法包括：

收集图集，该图集包括训练图集和测试图集；

基于全卷积网络构造头发全卷积网络HFCN；

2.如权利要求1所述的基于卷积神经网络的图像头发识别方法，其特征在于，所述对所述图集中的每一张图片进行预处理的步骤，包括：

3.如权利要求1所述的基于卷积神经网络的图像头发识别方法，其特征在于，所述基于全卷积网络构造头发全卷积网络HFCN的步骤，包括：

4.如权利要求1所述的基于卷积神经网络的图像头发识别方法，其特征在于，所述将YCrCb训练图集、频率遮蔽训练图集及训练图集的头部位置信息进行编码，输入到头发全卷积网络，同时，将头发区域遮蔽训练图集输入头发全卷积网络，对头发全卷积网络进行训练的步骤，包括：

5.如权利要求4所述的基于卷积神经网络的图像头发识别方法，其特征在于，所述根据头发全卷积网络训练参数信息及卷积神经网络训练网络的范式训练头发全卷积网络，获得训练好的头发全卷积网络的步骤，包括：

6.一种基于卷积神经网络的图像头发识别装置，其特征在于，所述装置包括：

构造模块，用于基于全卷积网络构造头发全卷积网络HFCN；

7.如权利要求6所述的基于卷积神经网络的图像头发识别装置，其特征在于，所述预处理模块包括：

8.如权利要求6所述的基于卷积神经网络的图像头发识别装置，其特征在于，所述构造模块包括：

9.如权利要求6所述的基于卷积神经网络的图像头发识别装置，其特征在于，所述训练模块包括：

10.如权利要求9所述的基于卷积神经网络的图像头发识别装置，其特征在于，所述网络训练单元还用于根据损失函数之和ε(θ)＝∑_pe(X_θ(p)，l(p))获得误差值，其中，p是图像中像素的索引，X_θ(p)是在像素p位置、参数为θ的全卷积回归函数，损失函数e(.，.)测量回归输出与真实值l(p)之间的误差；根据误差值，利用反向传播及随机梯度下降方法，更新网络参数，获得训练好的头发全卷积网络。