CN108280397A

CN108280397A - 基于深度卷积神经网络的人体图像头发检测方法

Info

Publication number: CN108280397A
Application number: CN201711415922.9A
Authority: CN
Inventors: 孟红云; 张小华; 补婧; 田小林; 朱虎明; 曹向海; 侯彪
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2017-12-25
Filing date: 2017-12-25
Publication date: 2018-07-13
Anticipated expiration: 2037-12-25
Also published as: CN108280397B

Abstract

本发明公开了一种基于深度卷积神经网络的人体图像头发检测方法，主要解决了现有技术中检测效率低，适应性差的问题。其实现方案包括：1)获取人体图像的超像素分割图像；2)对超像素分割图像进行标记；3)从人体图像中提取图像块；4)从图像块中获取训练样本；5)构建深度卷积神经网络并通过训练样本对其进行训练；6)获取待估计头发位置的人体图像的超像素分割图像；7)提取待估计头发位置的人体图像的图像块，并用训练好的深度卷积神经网络对其进行分类；8)生成待估计头发位置的人体图像头发检测结果。本发明减小了提取特征算子复杂度和计算量，提高了鲁棒性和应用范围，可用于3D打印、虚拟试衣、人体测量学以及影视游戏模型构建。

Description

基于深度卷积神经网络的人体图像头发检测方法

技术领域

本发明属于图像处理技术领域，更进一步涉及一种人体图像中头发位置检测的方法，可应用于3D打印、虚拟试衣、人体测量学以及影视游戏模型构建。

背景技术

目标检测是计算机视觉领域中一个基础性的研究课题，它的目标是检测和识别输入图像中已知特定的某个或多个物体或者分类并定位预定义类别涵盖的所有可能区域。人体图像中头发位置估计是目标检测领域中逐渐兴起的一个分支。

目标检测是大量高级视觉任务的必备前提，包括活动或事件识别、场景内容理解等。而且目标检测也被应用到很多实际任务，例如智能视频监控，图像检索，机器人导航等。目标检测对计算机视觉领域和实际应用具有重要意义,在过去几十年里激励大批研究人员密切关注并投入研究在真实场景中，但对于检测大场景中的小目标时，因为目标通常只占据整个场景的小部分而且可能被其它物体遮挡,或者场景中伴随出现视觉上相似的背景结构，所以这些情形的出现也对目标检测任务构成极大的挑战。对人体图像中头发位置进行估计也属于这种在场景中检测小目标的情况，它的目的不仅要对输入小图像块进行细致分类，头发或者非头发，更要求对一幅整体图像上的头发进行精确定位并且描绘出头发轮廓，为后期的图像处理做准备。因为头发的纹理特征比较少，因此在提取合适特征上存在一定的难度。目前的有效的估计人体图像中头发位置的方法不是很优秀，并不能达到很高的精确度。深度学习是近年来国际上的研究热点，与现有技术中的需要人工设计的特征提取方法相比，它可以自动提取到图像中更加抽象、本质的特征，有利于图像的分类和识别。

Andrew Kae、Kihyuk Sohn、Honglak Lee、Erik Learned-Miller四人在其发表的论文“Augementing CRFs with Boltzmann Machine Shape Priors for Image Labeling”(IEEE Conference on Computer Vision and Pattern Recognition，2013，2019-2026)中提出了一种将玻尔兹曼机和条件随机场相结合的方法来对人体局部标注的方法。该方法中将深度学习中的玻尔兹曼机与条件随机场相结合，首先对人体图像上的头发、人体和背景三部分进行图像标注，形成多个标注好的图像块；然后利用条件随机场，对图像的局部边缘部分进行处理，使得分割边缘更为精准；然后利用玻尔兹曼机对图像在全局上进行处理，包括降维、分类、学习，最终得到一个可以实现对人体图像上头发进行位置估计的网络模型。该方法存在的不足之处是，其一，由于该算法需要对图像人工提取特征，在对大量图像进行处理时，每次都需人工提取特征，大大增加了该算法的复杂度，降低了效率，其二，由于人工提取图像特征，对复杂背景的人体图像处理时，不能保证提取到最合适的特征，降低了该算法的精度。

乐视控股(北京)有限公司在其申请的专利文献“发型识别方法及发型识别装置”(专利申请号：201610743694.7，申请公布号：CN106372652A)中提出一种发型识别方法及发型识别装置。该方法首先预设图像库和N种发型，图像库中都是与给出的N种发型相对应的图像，其中，每种发型对应至少2个图像；然后将待识别的图像与所述的图像库中的各图像一一对比，分别获得待识别图像与所述图像库中各图像的相似度；最终利用的到的各相似度确定待识别图像的发型。该方法存在的不足之处是，对比数据库中的发型数量有限，在实际应用中，面对各种各样的发型，不能精确的确定图像的具体发型，有极大的局限性。

发明内容

本发明的目的在于针对已有技术的不足，提出一种基于深度卷积神经网络的人体图像头发检测方法，以减小计算量，提高检测准确度和适应性。

为实现上述目的，本发明的技术方法包括训练深度卷积神经网络和估计人体图像中头发位置两个阶段：

第一个阶段，训练深度卷积神经网络的步骤如下：

(1)输入待训练的人体图像，利用基于线性迭代聚类的超像素分割算法，对人体图像进行超像素分割，得到人体图像的超像素分割图像；

(2)在所得人体图像的超像素分割图像中，对属于头发区域的所有超像素块，属于人体区域的所有超像素块和属于背景区域的所有超像素块分别进行标记；

(3)以超像素聚类中心点位置为中心，在人体图像上提取大小为33*33*3图像块；

(4)获取训练样本：

(4a)对于提取到的每一个图像块，在超像素分割图像中的相同区域内，将属于头发的像素点数目大于属于脸部及背景的像素点数目的图像块归为第1类，将属于头发的像素点数目大于属于脸部及背景的像素点数目的图像块归为第2类，其中，第1类表示头发类，第2类表示属于非头发类；

(4b)将每一个图像块和该图像块的类别组成一个样本，将所有样本作为深度卷积神经网络的训练样本；

(5)构建并训练深度卷积神经网络：

(5a)设计含有9层的深度卷积神经网络，该9层依次是卷积层Conv1、池化层Pool2、卷积层Conv3、池化层Pool4、卷积层Conv5、池化层Pool6、全连接层Fc7、全连接层Fc8和分类层Softmax9；

(5b)将训练样本输入到(5a)设计的深度卷积神经神经网络中，利用深度学习框架caffe，对深度卷积神经网络进行训练，获得训练好的深度卷积神经网络；

第二个阶段，估计人体图像中头发位置的步骤如下：

(6)输入一幅待估计头发位置的人体图像，利用基于线性迭代聚类的超像素分割算法对人体图像进行超像素分割，得到人体图像的超像素分割图像；

(7)以超像素聚类中心点位置为中心，在人体图像上提取大小为33*33*3图像块；

(8)利用训练好的深度卷积神经网络提取图像块的特征，Softmax9层根据每一个图像块的特征，输出该图像块的类别，即头发类1或者非头发类2；

(9)估计人体图像中头发的位置：

(9a)读入一幅与人体图像行数和列数相同的所有灰度值全为0的二维灰度图像；

(9b)将所有超像素聚类中心点位置与第1类图像块中心点位置相同的超像素块，标记为第1类；将所有超像素聚类中心点位置与第2类图像块中心点位置相同的超像素块，标记为第2类；

(9c)将灰度图像中与所有第1类超像素块的位置相同区域的灰度值标记为0，将灰度图像中与所有第2类超像素块的位置相同区域的灰度值标记为255，人体图像中的黑色区域即灰度值为0的像素点为头发检测结果。

本发明与现有技术相比具有以下优点：

第一，本发明采用深度卷积神经网络对人体图像中图像块提取特征，通过深度卷积神经网络自主学习特征，避免了现有技术中需要人工提取特征的过程，而且深度卷积神经网络自主学习的特征具有更高的鲁棒性，降低了复杂性，提高了分类的精度，对复杂背景具有更强的适应性。

第二，本发明采用训练好的深度卷积神经网络对人体图像中图像块进行分类，克服了现有技术中处理多幅人体图像时，耗费大量时间的问题，降低了计算量，缩短了检测所需的时间，提高了效率。

第三，本发明采用深度卷积神经网络对人体图像进行头发检测，克服了现有技术中仅能识别固定数量发型的问题，可以估计出各种各样的发型，增加了应用范围。

附图说明

图1是本发明的实现流程图；

图2是本发明中的深度卷积神经网络结构；

图3是本发明使用的人体图像示意图；

图4是本发明中对人体图像进行超像素分割所得图像；

图5是本发明中以超像素聚类中心点为中心提取的33*33*3的图像块；

图6是用本发明对人体图像进行头发检测的结果图。

具体实施方式

下面结合附图对本发明做进一步的描述。

参照图1，本发明包括两个阶段，其实现步骤如下：

第一个阶段，训练深度卷积神经网络。

步骤1，获取人体图像的超像素分割图像。

输入待训练的人体图像，利用基于线性迭代聚类的超像素分割算法，对人体图像进行超像素分割，得到人体图像的超像素分割图像，具体操作是：

(1.1)输入超像素聚类中心点的总数K；

(1.2)按照下式，计算每一个超像素聚类中心点与其四周相邻超像素聚类中心点的距离：

其中，S表示每一个超像素聚类中心点与其四周相邻超像素聚类中心点之间的距离，N表示人体图像上像素点的总数，K表示超像素聚类中心点的总数；

(1.3)利用每一个超像素聚类中心点与其四周相邻超像素聚类中心点的距离，按照人体图像上每一行的每一个超像素聚类中心点与左右两个超像素聚类中心点之间距离相等的原则和人体图像上每一列的每一个超像素聚类中心点与上下两个超像素聚类中心点之间距离相等的原则，完成对人体图像上所有超像素聚类中心点位置的初始化；

(1.4)计算每一个超像素聚类中心点3*3大小邻域内所有像素点的梯度值，用每个邻域内梯度值最小的像素点代替该邻域内现在的超像素聚类中心点，得到该邻域一个新的超像素聚类中心点；

(1.5)按照人体图像上的所有超像素聚类中心点从左到右从上到下的顺序，将第一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为0，第二个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为1，直到将最后一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为K-1，完成对人体图像上每一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记，标记的类别取值范围是[0，K-1]；

(1.6)按照下式，计算人体图像上每一个像素点与该像素点的2S*2S邻域内所有超像素聚类中心点之间的距离：

其中，d_ij表示人体图像上第i个像素点与该像素点2S*2S邻域内第j个超像素聚类中心的距离，x_i、y_i分别表示人体图像上第i个像素点在水平和垂直方向上的位置，x_j、y_j分别表示人体图像上第i个像素点2S*2S邻域内的第j个超像素聚类中心点在水平和垂直方向上的位置，l_e表示人体图像在色彩模型lab颜色空间中第e个像素点的亮度值，其取值范围是[0，100]，a_e表示人体图像在色彩模型lab颜色空间中第e个像素点从红色到绿色范围内的色彩值，其取值范围是[-128,127]，b_e表示人体图像在色彩模型lab颜色空间中第e个像素点从黄色到蓝色范围内的色彩值，其取值范围是[-128,127]，l_f表示人体图像在色彩模型Lab颜色空间中第e个像素点2S*2S邻域内第f个超像素聚类中心的亮度值，a_f表示人体图像在色彩模型Lab颜色空间中第e个像素点2S*2S邻域内第f个超像素聚类中心从红色到绿色范围内的色彩值，b_f表示人体图像在色彩模型Lab颜色空间中第e个像素点2S*2S邻域内第f个超像素聚类中心从黄色到蓝色范围内的色彩值，i的取值和e取值相等，j的取值和f取值相等，m表示一个常数，取值范围是[0,40]，本实例取值为10；

(1.7)将人体图像上每一个像素点的2S*2S邻域内与该像素点距离最小的超像素聚类中心点，作为此次计算后该像素点所属的超像素聚类中心；

(1.8)判断迭代次数是否达到10次，若是，则完成对人体图像的超像素分割，否则返回(1.4)。

步骤2，标记超像素分割图像。

在所得人体图像的超像素分割图像中，对属于头发区域的所有超像素块，属于人体区域的所有超像素块和属于背景区域的所有超像素块分别进行标记；

步骤3，以超像素聚类中心点位置为中心，在人体图像上提取大小为33*33*3图像块。

(3.1)记录人体图像的超像素分割图像上每一个超像素聚类中心点在水平方向和垂直方向上的位置；

(3.2)在人体图像上，以记录的每一个超像素聚类中心点的位置为中心，提取大小为33*33*3的图像块。

步骤4，获取训练样本。

对于提取到的每一个图像块，在超像素分割图像中的相同区域内，将属于头发的像素点数目大于属于脸部及背景的像素点数目的图像块归为第1类；将属于头发的像素点数目大于属于脸部及背景的像素点数目的图像块归为第2类，其中，第1类表示头发类，第2类表示属于非头发类；

将每一个图像块与该图像块的类别组成一个样本，将每一个图像块和该图像块的类别组成一个样本，将所有样本作为深度卷积神经网络的训练样本。

步骤5，设计深度卷积神经网络。

如图2所示，设计含有9层的深度卷积神经网络，该9层依次是卷积层Conv1，池化层Pool2,卷积层Conv3，池化层Pool4，卷积层Conv5，池化层Pool6，全连接层Fc7，全连接层Fc8和分类层Softmax9，各层的具体参数如下：

第一层卷积层Conv1，采用64个大小为9*9像素的卷积核，卷积步长为1像素；

第二层池化层Pool2，为最大值池化层，池化块的大小为2×2像素，池化步长为1像素；

第三层卷积层Conv3，采用32个大小为5*5像素的卷积核，卷积步长为1像素；

第四层池化层Pool4，为最大值池化层，池化块的大小为2×2像素，池化步长为1像素；

第五层卷积层Conv5，采用32个大小为5*5像素的卷积核，卷积步长为1像素；

第六层池化层Pool6，为最大值池化层，池化块的大小为2×2像素，池化步长为1像素；

第七层全连接层Fc7，采用500个神经元；

第八层全连接层Fc8，采用2个神经元；

第九层为分类层Softmax9，采用2个神经元。

步骤6，对深度卷积神经网络进行训练。

将训练样本输入到步骤5设计的深度卷积神经神经网络中，利用深度学习框架caffe，对深度卷积神经网络进行训练，得到深度卷积神经网络的权值和偏置值，具体操作如下：

(6.1)在向前传播阶段，信息从深度卷积神经网络输入层经过逐层的变换，传送到深度卷积神经网络的输出层；从样本集中取一个样本输入到深度卷积神经网络中，计算该传播阶段相应的实际输出，其实现如下：

(6.1a)将33*33*3大小的图像块输入到第一层卷积层Conv1，用64个大小为9*9像素的卷积核对其进行步长为1像素的卷积操作，得到64张25*25像素大小的特征图；

(6.1b)将第一层卷积层Conv1输出的64张特征图输入到第二层池化层Pool2，对其进行最大池化操作，池化块的大小为2×2像素，步长为1像素，得到64张分辨率为24*24像素大小的特征图；

(6.1c)将第二层池化层Pool2输出的64张特征图输入到第三层卷积层Conv3，用32个大小为5*5像素的卷积核对其进行步长为1像素的卷积操作，得到32张分辨率为20*20像素的特征图；

(6.1d)将第三层卷积层Conv3输出的32张特征图输入到第四层池化层Pool4，对其进行最大池化操作，池化块的大小为2×2像素，步长为1像素，得到32张分辨率为19*19像素的特征图；

(6.1e)将第四层池化层Pool4输出的32张特征图输入到第五层卷积层Conv5，用32个大小为5*5像素的卷积核对其进行步长为1像素的卷积操作，得到32张分辨率为15*15像素的特征图；

(6.1f)将第五层卷积层Conv5输出的32张特征图输入到第六层池化层Pool6，对其进行最大池化操作，池化块的大小为2×2像素，步长为1像素，得到32张分辨率为14*14像素的特征图；

(6.1g)将第六层池化层Pool6输出的32张特征图输入到第七层全连接层Fc7，按照下式，对其中每一个像素点进行激活，得到激活后的特征图的像素点的值，将激活后的特征图以列的顺序排列成1维向量，得到1×500维的特征向量：

其中，f(x)表示激活后的特征图的像素点的值，x表示激活前特征图的像素点的值，e表示一个无限不循环的自然常数，取值为2.7182；

(6.1h)将第七层全连接层Fc7输出的特征向量输入到第八层全连接层Fc8，与第八层全连接层Fc8的2个神经元进行全连接操作，输出1×2维的特征向量；

(6.1i)将第八层全连接层Fc8输出的特征向量输入到第九层分类层Softmax9，该层会计算出每种分类标签的概率，并将最大概率的对应的标签作为图像块的分类结果，其中第i个图像块softmax分类的假设函数h_w,b(α⁽ⁱ⁾)如下：

其中，α⁽ⁱ⁾表示深度卷积神经网络中全连接层Fc7输出的第i个图像块的特征向量，β⁽ⁱ⁾表示第i个图像块相对应的标签，p(β⁽ⁱ⁾＝t|α⁽ⁱ⁾；w,b)表示对于第i个图像块，特征向量为α⁽ⁱ⁾时标签β⁽ⁱ⁾等于t的概率，t∈1,2,...,k，本实例取k＝2，w和b分别表示深度卷积神经网络的权值和偏置值；

(6.2)在向后传播阶段，计算深度卷积神经网络实际输出与样本标签的差值，通过最小化如下误差函数J(w,b)调整深度卷积神经网络的权值和偏置值：

其中，M表示输入到卷积神经网络中图像块的总数量，1{·}是示性函数，其取值规则为1{值为真的表达式}＝1；

(6.3)重复(6.1)和(6.2)共800000次，得到训练好的深度卷积神经网络。

第二个阶段，估计人体图像中头发的位置：

步骤7，获取人体图像的超像素分割图像。

输入一幅如图3所示的待估计头发位置的人体图像，利用基于线性迭代聚类的超像素分割算法，对人体图像进行超像素分割，得到如图4所示的人体图像的超像素分割图像，具体操作是：

(7.1)输入超像素聚类中心点的总数K；

(7.2)按照下式，计算每一个超像素聚类中心点与其四周相邻超像素聚类中心点的距离：

(7.3)利用每一个超像素聚类中心点与其四周相邻超像素聚类中心点的距离，按照人体图像上每一行的每一个超像素聚类中心点与左右两个超像素聚类中心点之间距离相等的原则和人体图像上每一列的每一个超像素聚类中心点与上下两个超像素聚类中心点之间距离相等的原则，完成对人体图像上所有超像素聚类中心点位置的初始化；

(7.4)计算每一个超像素聚类中心点3*3大小邻域内所有像素点的梯度值，用每个邻域内梯度值最小的像素点代替该邻域内现在的超像素聚类中心点，得到该邻域一个新的超像素聚类中心点；

(7.5)按照人体图像上的所有超像素聚类中心点从左到右从上到下的顺序，将第一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为0，第二个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为1，直到将最后一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为K-1，完成对人体图像上每一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记，标记的类别取值范围是[0，K-1]；

(7.6)按照下式，计算人体图像上每一个像素点与该像素点的2S*2S邻域内所有超像素聚类中心点之间的距离：

(7.7)将人体图像上每一个像素点的2S*2S邻域内与该像素点距离最小的超像素聚类中心点，作为此次计算后该像素点所属的超像素聚类中心；

(7.8)判断迭代次数是否达到10次，若是，则完成对人体图像的超像素分割，否则返回(7.4)。

步骤8，以超像素聚类中心点位置为中心，在人体图像上提取大小为33*33*3图像块。

(8.1)记录人体图像的超像素分割图像上每一个超像素聚类中心点在水平方向和垂直方向上的位置；

(8.2)在人体图像上，以记录的每一个超像素聚类中心点的位置为中心，提取大小为33*33*3的图像块。

步骤9，对图像块进行分类。

(9.1)利用训练好的深度卷积神经网络提取图像块的特征：

(9.1a)用从人体图像中提取出的图像块组成集合:A＝{a_c|c＝1,2,...n}，其中，a_c表示集合A中第c个图像块，n表示集合A中图像块的数量；

(9.1b)从图像块集合A中，依次选取一个图像块输入到已经训练好的深度卷积神经网络中，利用训练好的深度卷积神经网络提取每一个图像块的特征；

(9.2)根据每一个图像块的特征，深度卷积神经网络将输出该图像块的类别，即头发类1或者非头发类2。

步骤10，估计人体图像中头发的位置。

(10.1)读入一幅与人体图像行数和列数相同的所有灰度值全为0的二维灰度图像；

(10.2)将所有超像素聚类中心点位置与第1类图像块中心点位置相同的超像素块，标记为第1类，将所有超像素聚类中心点位置与第2类图像块中心点位置相同的超像素块，标记为第2类；

(10.3)将灰度图像中与所有第1类超像素块的位置相同的区域，灰度值标记为0，将灰度图像中与所有第2类超像素块的位置相同的区域，灰度值标记为255，人体图像中的黑色区域即灰度值为0的像素点为头发检测结果。

下面结合仿真实验对本发明的效果做进一步的描述。

1、仿真实验条件：

本发明所用的数据库为：在收集的1000张人体图像上提取大小为33*33*3的人体图像块，形成一共140000张图像块的数据库，其中有126000张训练图和14000张测试图。硬件平台为：系统：Ubuntu 14.04，CPU:Intel(R)Core(TM)i5-4210U、4GB RAM，GPU：NVIDIAGeForce GTX960、2G显存，软件平台：Spyder,MATLAB R2014a，深度学习框架Caffe。

2、实验内容与结果：

第一步，对图3所示的待估计头发位置的人体图像进行超像素分割，其结果如图4所示，参考图3和参考图4可以看出，超像素分割图像与待估计头发位置的人体图像相比，超像素分割参考图会形成特征明显的分割图像区域，每一个区域具有相似的颜色和结构特征。

第二步，对图4所示的超像素分割图像进行中心块提取，结果如图5所示；

参考图5以看出，在人体图像中提取的每一个图像块是以每一个的超像素聚类中心为中心的33*33*3大小的图像块，通过每一个图像块的分类结果判定所在的超像素块区域的分类，可以极大地降低输入到深度卷积神经网络中进行分类的图像块的数量，降低了算法所需的时间。

第三步，将图5所示的图像块输入训练好的深度卷积神经网络进行分类，基于该分类结果对图3所示的待估计头发位置的人体图像中的头发位置进行估计，生成的头发检测结果如图6所示；

参考图6所示，属于头发的区域显示为黑色，不属于头发的区域显示为白色。

以上仿真可以看出，本发明能有效地对人体图像中的头发进行检测，同时减小了检测所需的计算量，提高了检测的效率。

Claims

1.基于深度卷积神经网络的人体图像头发检测方法，包括训练与估计两个阶段，其特征在于：

第一个阶段，训练深度卷积神经网络的步骤如下：

(4)获取训练样本：

(5)构建并训练深度卷积神经网络：

第二个阶段，估计人体图像中头发位置的步骤如下：

(8)利用训练好的深度卷积神经网络提取图像块的特征，并根据每一个图像块的特征，输出该图像块的类别，即头发类1或者非头发类2；

(9)估计人体图像中头发的位置：

2.根据权利要求1所述的方法，其特征在于：步骤(1)中利用基于线性迭代聚类的超像素分割算法，对人体图像进行超像素分割，其实现如下：

(1a)输入超像素聚类中心点的总数K；

(1b)按照下式，计算每一个超像素聚类中心点与其四周相邻超像素聚类中心点的距离：

(1c)利用每一个超像素聚类中心点与其四周相邻超像素聚类中心点的距离，按照人体图像上每一行的每一个超像素聚类中心点与左右两个超像素聚类中心点之间距离相等的原则和人体图像上每一列的每一个超像素聚类中心点与上下两个超像素聚类中心点之间距离相等的原则，完成对人体图像上所有超像素聚类中心点位置的初始化；

(1d)计算每一个超像素聚类中心点的3*3大小邻域内所有像素点的梯度值，用每个邻域内梯度值最小的像素点代替该邻域内当前的超像素聚类中心点，得到该邻域一个新的超像素聚类中心点；

(1e)按照人体图像上的所有超像素聚类中心点从左到右、从上到下的顺序，将第一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为0，第二个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为1，直到将最后一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记为K-1，完成对人体图像上每一个超像素聚类中心点的2S*2S邻域内所有像素点类别标记，标记的类别取值范围是[0，K-1]；

(1f)按照下式，计算人体图像上每一个像素点与该像素点的2S*2S邻域内所有超像素聚类中心点之间的距离：

其中，d_ij表示人体图像上第i个像素点与该像素点2S*2S邻域内第j个超像素聚类中心的距离，x_i、y_i分别表示人体图像上第i个像素点在水平和垂直方向上的位置，x_j、y_j分别表示人体图像上第i个像素点2S*2S邻域内的第j个超像素聚类中心点在水平和垂直方向上的位置，l_e表示人体图像在色彩模型lab颜色空间中第e个像素点的亮度值，其取值范围是[0，100]，a_e表示人体图像在色彩模型lab颜色空间中第e个像素点从红色到绿色范围内的色彩值，其取值范围是[-128,127]，b_e表示人体图像在色彩模型lab颜色空间中第e个像素点从黄色到蓝色范围内的色彩值，其取值范围是[-128,127]，l_f表示人体图像在色彩模型Lab颜色空间中第e个像素点2S*2S邻域内第f个超像素聚类中心的亮度值，a_f表示人体图像在色彩模型Lab颜色空间中第e个像素点2S*2S邻域内第f个超像素聚类中心从红色到绿色范围内的色彩值，b_f表示人体图像在色彩模型Lab颜色空间中第e个像素点2S*2S邻域内第f个超像素聚类中心从黄色到蓝色范围内的色彩值，i的取值和e取值相等，j的取值和f取值相等，m表示一个常数，取值范围是[0,40]；

(1g)将人体图像上每一个像素点的2S*2S邻域内与该像素点距离最小的超像素聚类中心点，作为此次计算后该像素点所属的超像素聚类中心；

(1h)判断迭代次数是否达到10次，若是，则完成对人体图像的超像素分割，否则返回(1d)。

3.根据权利要求1所述的方法，其特征在于：步骤(3)中以超像素聚类中心点位置为中心，在人体图像上提取大小为33*33*3图像块，是先记录人体图像的超像素分割图像上每一个超像素聚类中心点在水平方向和垂直方向上的位置；再在人体图像上，以记录的每一个超像素聚类中心点的位置为中心，提取出大小为33*33*3的图像块。

4.根据权利要求1所述的方法，其特征在于：步骤(5a)中设计的含9层的深度卷积神经网络，其各层的参数如下：

第七层全连接层Fc7，采用500个神经元；

第八层全连接层Fc8，采用2个神经元；

第九层为分类层Softmax9，采用2个神经元。

5.根据权利要求1所述方法，其特征在于：步骤(5b)中利用深度学习框架caffe，对深度卷积神经网络进行训练，其实现如下：

(5b1)在向前传播阶段，从样本集中取一个样本输入到深度卷积神经网络中，计算相应的实际输出，在此阶段，信息从深度卷积神经网络输入层经过逐层的变换，传送到深度卷积神经网络的输出层；

(5b2)在向后传播阶段，计算深度卷积神经网络实际输出与样本标签的差值，按最小化误差函数的方法调整深度卷积神经网络的权值和偏置值；

(5b3)重复(5b1)和(5b2)800000次，得到训练好的深度卷积神经网络。

6.根据权利要求1所述方法，其特征在于：步骤(8)中利用训练好的深度卷积神经网络提取图像块的特征，是先用从人体图像中提取的图像块组成集合：

A＝{a_c|c＝1,2,...n}，其中，a_c表示集合A中第c个图像块，n表示集合A中图像块的数量；再从集合A中，依次选取一个图像块输入到已经训练好的深度卷积神经网络中，利用训练好的深度卷积神经网络提取每一个图像块的特征。