CN108764186A

CN108764186A - 基于旋转深度学习的人物遮挡轮廓检测方法

Info

Publication number: CN108764186A
Application number: CN201810557555.4A
Authority: CN
Inventors: 谢昭; 吴克伟; 张顺然; 孙永宣
Original assignee: Hefei University of Technology
Current assignee: Hefei Jiema Intelligent Technology Co ltd
Priority date: 2018-06-01
Filing date: 2018-06-01
Publication date: 2018-11-06
Anticipated expiration: 2038-06-01
Also published as: CN108764186B

Abstract

本发明公开了一种基于旋转深度学习的人物遮挡轮廓检测方法，首先，通过对输入人物图像进行分割与合并获得图像初始分割；经过颜色和内容的区域合并，提取出目标的分割轮廓；其次，根据旋转角集合对图像进行旋转、采样、标记获得边缘图像块集合；基于卷积神经网络，构建出边缘朝向检测的深度模型；并利用旋转图像块采集集合，训练出浅层模型和深层模型；最后，使用训练后的边缘朝向检测深度模型，来检测局部轮廓朝向；并对局部轮廓朝向进行一致性评价，提取人物分割轮廓朝向。

Description

基于旋转深度学习的人物遮挡轮廓检测方法

技术领域

本发明属于人物遮挡轮廓检测领域，更为具体的讲，涉及一种基于旋转深度学习的人物遮挡轮廓检测方法。

背景技术

轮廓检测是指采用一定的技术，提取目标轮廓的过程，同时鲁棒处理背景噪声和目标内部纹理的影响。它是形状分析、目标检测、目标识别和目标跟踪等技术的重要基础。目前轮廓检测方法有两类，一类是利用传统的边缘检测算子检测目标轮廓，另一类是从人类视觉系统中提取可以使用的数学模型完成目标轮廓检测。

基于边缘检测的轮廓检测是一种比较常见的方法，它主要定义了亮度、颜色等特征的低层突变，通过标识图像中亮度变化明显的点来完成边缘检测。边缘检测通常将图像与微分算子卷积，如借助于Sobel算子、Prewitt算子、Canny算子等。申请号为201010592217.8的中国专利《一种复杂场景的物体轮廓检测方法》通过对图片进行滤波处理、一系列的图像处理，最后经过二值化处理从而得到物体的轮廓图像。申请号为201110163398.7的中国专利《一种基于多特征的目标物体轮廓检测方法》通过滤波处理、提取图像的局部特征，然后计算各个特征下的抑制权重，从而制取抑制后的轮廓图像，最后进行二值化处理得到物体的轮廓图像。申请号为201410586661.7的中国专利《一种基于宏特征点描述的行人轮廓检测方法》通过Sobel算子进行边缘检测，然后经过背景差分处理、二值化处理来得到目标区域，结合边缘图像和目标区域从而得到物体的轮廓图像。该类方法没有考虑视觉中层和高层信息，因此很难得出完整的、连续的轮廓边缘，仅仅使用这类方法很难得出完整的目标轮廓，此过程复杂且精度难以保证，甚至在含有大量噪声或者纹理的情况下，无法提取轮廓。

基于人类视觉感知模型的轮廓检测也是一种常见的方法，它主要是模拟视网膜经典感受野推导出一般性的模型从而达到轮廓检测的效果。申请号为200910022868.0的中国专利《基于水平集和分水岭相结合的图像轮廓检测方法》通过水平集方法检测目标轮廓得到初始目标与背景的二值化分割结果，然后再依次经过分水岭变换、梯度图修正、分水岭变换一系列步骤得到目标轮廓。申请号为201110163772.3的中国专利《一种目标物体轮廓检测方法》通过Gabor滤波处理得到朝向信息图，然后对图进行一系列的计算与判断，得到轮廓图，最后通过二值化处理获得最终的物体轮廓图像。申请号为201110163800.1的中国专利《一种基于相位特性的物体轮廓检测方法》通过滤波处理得到不同朝向和不同尺度下的频率响应，整合不同朝向下的特征图来获得最终的特征图，然后依次制取边缘保留平滑滤波后的特征图和制取非经典感受野抑制后的轮廓图像，最后通过对其进行二值化处理得到物体的轮廓图像。申请号为201410757813.5的中国专利《基于机器学习方法的图像轮廓检测算法》通过测试集图像计算得到的三层特征和gPb提供的图像特征，然后利用监督学习进行分类器交叉验证训练，得到预测模型。基于该模型可对新输入的图像进行预测，从而得到该图像的精确轮廓。申请号为201610846471.3的中国专利《一种基于组合感受野和朝向特征调制的轮廓检测方法》通过计算外侧膝状体细胞感受野的响应，然后经过一系列的计算，得到朝向特征差异调制下的抑制程度，最后通过非极大值抑制细化轮廓，进行滞后门限处理得到二值化的轮廓图，从而得到物体的轮廓图像。申请号为201710250081.4的中国专利《基于深度卷积神经网络的图像轮廓检测方法》通过对图片数据的提取和处理，训练出深度卷积神经网络特征提取器和结构森林轮廓检测器，然后据此提取图像特征，从而得到物体的轮廓图像。申请号为201711084042.8的中国专利《基于感受野子区域的方向选择性轮廓检测方法》通过输入灰度处理的图像，计算各像素点的经典感受野刺激响应，再构建环绕中心区域的子区域，然后计算中心区域和子区域的能量分布值和中心区域-子区域相互的抑制权重，得到各像素点的抑制权值，最后通过计算各像素点的轮廓响应从而得到物体的轮廓。以上方法可以很好的得到清晰的物体轮廓图，但是并没有分轮廓的遮挡朝向，因此，无法有效判断轮廓对应的区域是否为前景区域，不利于后续的人物检测分析。

发明内容

本发明提供一种基于旋转深度学习的人物遮挡轮廓检测方法，该方法采用多旋转方式处理，能够适应不同形变下人物轮廓的检测，并使用深度模型，能够有效提高边缘检测和边缘朝向检测的准确性。不仅克服了滤波器边缘检测的精度问题，同时，有效实现边缘上遮挡朝向的判断。

本发明采用的技术方案是：

一种基于旋转深度学习的人物遮挡轮廓检测方法，主要包括以下步骤：输入人物图像，提取图像初始分割；基于颜色和内容的区域合并，提取人物目标分割轮廓；旋转人物图像并采样，构建人物图像旋转集合；利用卷积神经网络框架，构建边缘朝向检测深度模型；根据旋转图像块采集集合，训练浅层模型；根据旋转边缘图像块采样集合，训练深层模型；使用训练后的边缘朝向检测深度模型，检测局部轮廓朝向；对局部轮廓朝向进行一致性评价，提取人物分割轮廓朝向。

所述的输入人物图像，提取图像初始分割，对图像进行Canny算子滤波，得到边缘图像，然后对边缘图像使用距离变换获得边缘距离图像，并对其使用分水岭算法，获得过分割集水盆集合，最后根据RGB颜色进行区域合并。

所述的基于颜色和内容的区域合并，提取人物目标分割轮廓，通过对其进行一系列的操作与计算，使之得到水平梯度图像和垂直梯度图像、梯度幅值图像、分割轮廓图像，然后进行区域合并得到目标区域，最后经过计算获得人物目标轮廓图像。

所述的旋转人物图像并采样，构建人物图像旋转集合，通过对灰度图像和分割轮廓图像旋转，分别得到各自旋转图像，再经过采样、边缘标记、边缘朝向标记，获得边缘图像块集合，以及所有样本对应的边缘朝向标记。

所述的利用卷积神经网络框架，构建边缘朝向检测深度模型,构建11层的边缘朝向检测的深度模型，具体操作方式为：第1层到第5层为卷积神经网络，第5层输出结果用于边缘检测，第6层到第8层为卷积神经网络，第9层到第11层为全连接神经网络，第11层输出结果用于边缘朝向检测。

所述的根据旋转图像块采集集合，训练浅层模型，使用误差反馈传播算法对边缘预测损失函数L_edge进行优化，获得最小的边缘预测损失函数，并获得该情况下的前1层到第5层训练后的神经网络模型参数

所述的根据旋转边缘图像块采样集合，训练深层模型，使用误差反馈传播算法对边缘朝向预测损失函数L_occ进行优化，获得最小的边缘预测损失函数，并获得该情况下的前6层到第8层训练后的神经网络模型参数和第9层到第11层权重w^(nla)。

所述的使用训练后的边缘朝向检测深度模型，检测局部轮廓朝向，对目标分割轮廓上的像素进行采样获得边缘图像块，然后使用训练好的边缘朝向检测的深度模型参数获得11层的输出行向量，再通过计算得到边缘朝向方向，判断不同区域的遮挡朝向关系。

所述的对局部轮廓朝向进行一致性评价，提取人物分割轮廓朝向，根据目标分割轮廓的边缘朝向记录遮挡朝向关系，然后经过遮挡投票，获得最终的遮挡关系矩阵，再经过一致性验证，得到区域间一致的遮挡关系，最后通过一致性修正获得所有目标沦落上的轮廓点的遮挡朝向关系，并且将目标轮廓上的轮廓点的遮挡朝向关系可视化输出。

所述的输入人物图像，提取图像初始分割，包括以下步骤：

步骤S1-1：输入包含人物的RGB图像I_RGB，转化为灰度图像I_gray。

步骤S1-2：对灰度图像进行分水岭分割，获得初步的过分割集水盆。

步骤S1-2-1:对灰度图像I_gray，使用Canny算子进行滤波，得到边缘图像B_dist，边缘图像中每个像素是二值标记。

步骤S1-2-2：输入边缘图像，使用距离变换，找出图像中每个像素与该像素最近边缘像素之间的距离，获得边缘距离图像I_dist。

步骤S1-2-3：对边缘距离图像I_dist，使用分水岭算法，获得过分割集水盆集合Basin＝{basin_i}，其中i＝1,...,n_basin，n_basin是过分割集水盆数量。

步骤S1-3：对过分割集水盆集合，根据RGB颜色，进行区域合并。

步骤S1-3-1：对过分割集水盆，计算每个集水盆的平均RGB颜色crgb_i，其中i＝1,...,n_basin，n_basin是过分割集水盆数量。

步骤S1-3-2：选择一个过分割集水盆basin_i，找出其在图像中邻接的其他集水盆集合，作为当前合并区域的邻接集水盆集合Bm_i＝{basin_k}。

步骤S1-3-3：选择一个邻接集水盆basin_k，判断颜色差是否小于阈值，如果颜色差小于阈值，则进行区域合并。

步骤S1-3-3-1：区域合并时，将集水盆basin_i的编号i赋值给集水盆basin_k。

步骤S1-3-3-2：区域合并时，找出集水盆basin_k的邻接的其他集水盆集合basin'_k，该其他集水盆集合不包括已经在当前合并区域过程中，已经遍历的集水盆。

步骤S1-3-3：将集水盆basin_k的邻接的其他集水盆集合basin'_k，添加到当前合并区域的邻接集水盆集合，并更新当前合并区域的邻接集水盆集合Bm_i＝{basin_k}。

步骤S1-3-4：选择一个邻接集水盆basin_k，判断颜色差是否大于阈值，如果颜色差大于阈值，则不进行区域合并。

步骤S1-3-5：重复步骤S1-3-3到步骤S1-3-4直到遍历完所有的邻接集水盆，此时获得编号为i的合并区域。

步骤S1-3-6：选择一个未遍历的集水盆，重复步骤S1-3-2到步骤S1-3-5，获得其他编号的合并区域。

步骤S1-3-7：重复步骤S1-3-6直到遍历所有集水盆，并获得所有合并区域，记录合并后的分割区域为Seg＝{seg_i}，其中i＝1,...,n_seg，n_seg是合并后区域数量。

所述的基于颜色和内容的区域合并，提取人物目标分割轮廓，包括以下步骤：

步骤S2-1：对分割区域Seg＝{seg_i}，对分割区域中各像素赋值该区域编号，获得分割编号图像I_seg。

步骤S2-2：对分割编号图像，获得分割轮廓图像。

步骤S2-2-1：对分割编号图像I_seg，计算各像素的水平梯度和垂直梯度，获得水平梯度图像I_sdx和垂直梯度图像I_sdy。

步骤S2-2-2：根据水平梯度图像I_sdx和垂直梯度图像I_sdy，计算各像素点的梯度幅值，获得梯度幅值图像I_samp。

步骤S2-2-3：根据梯度幅值图像I_samp，获得分割轮廓图像B_sdist，具体操作为：如果像素点的梯度幅值I_samp大于0，则表示该像素为轮廓点；如果像素点的梯度幅值I_samp等于0，则表示该像素不是轮廓点。

步骤S2-3：对分割区域Seg＝{seg_i}，根据图像中人物目标和区域之间的对应关系，使用手工标注方法，指出需要合并的区域对。

步骤S2-4：对合并区域，根据需要合并的区域对，进一步区域合并，获得目标区域Obj＝{obj_i}，其中i＝1,...,n_obj，n_obj是合并后区域数量。

步骤S2-5：对目标区域Obj＝{obj_i}，对目标区域中各像素赋值该区域编号，获得目标分割编号图像I_obj。

步骤S2-6：对目标分割编号图像，获得目标分割轮廓图像。

步骤S2-6-1：对目标分割编号图像I_obj，计算各像素的水平梯度和垂直梯度，获得水平梯度图像I_dx和垂直梯度图像I_dy。

步骤S2-6-2：根据水平梯度图像I_dx和垂直梯度图像I_dy，计算各像素点的梯度幅值，获得梯度幅值图像I_amp。

步骤S2-6-3：根据梯度幅值图像I_amp，获得人物目标轮廓图像B_dist，具体操作为：如果像素点的梯度幅值大于0，则表示该像素为轮廓点；如果像素点的梯度幅值等于0，则表示该像素不是轮廓点。

所述的旋转人物图像并采样，构建人物图像旋转集合，包括以下步骤：

步骤S3-1：设置旋转角集合A＝{α_i},i＝1,..,72，其中α_i的具体取值为α_i＝5·(i-1)度，具体操作为，以图像中朝向右的水平线方向为0度，逆时针旋转，每旋转5度为一个单位，共旋转71次，完成355度的旋转。

步骤S3-2：对输入灰度图像I_gray，旋转一个旋转角度α_i，以图像中心坐标点为旋转点，进行旋转，获得旋转后的图像R_i。

步骤S3-3：重复步骤S2-2，依次对旋转角集合中的旋转角A＝{α_i}进行旋转，获得旋转图像集合Rset＝{R_i}。

步骤S3-4：对输入分割轮廓图像B_sdist，旋转一个旋转角度α_i，以图像中心坐标点为旋转点，进行旋转，获得旋转后的分割图像Bs_i。

步骤S3-5：重复步骤S2-4，依次对旋转角集合中的旋转角A＝{α_i}进行旋转，获得旋转图像集合Bsset＝{Bs_i}。

步骤S3-6：对旋转后的图像R_i，以空间窗口尺寸size为25*25对图像进行一次采样，获得图像块patch(px,size)，其中px为图像块的中心像坐标，size为采样块的空间窗尺寸。

步骤S3-7：对该图像块patch(px,size)，进行边缘标记，具体操作为：

步骤S3-7-1：如果图像块patch(px,size)的采样中心位置px和尺寸size，对对应的旋转后的分割图像Bs_i进行采样，获得边缘图像块spatch(px,size)。

步骤S3-7-2：如果边缘图像块spatch(px,size)，中心像素处为分割轮廓，则记录该图像块为边缘图像块，其边缘标记为y(px,size)＝1。

步骤S3-7-3：如果边缘图像块spatch(px,size)，中心像素处不是分割轮廓，则记录该图像块为非边缘图像块，其边缘标记为y(px,size)＝0。

步骤S3-8：重复步骤S3-6和步骤S3-7，获得图像块集合Patch＝{patch(px,size)}和对应的边缘标记y(px,size)。

步骤S3-9：对图像块集合Patch＝{patch(px,size)}，将其中边缘标记为y(px,size)＝1的图像处理块组成边缘图像块集合Epatch＝{epatch(px,size)}。

步骤S3-10：对边缘图像块集合Epatch＝{epatch(px,size)}，进行边缘朝向标记，具体操作如下：

步骤S3-10-1：选择边缘图像块epatch(px,size)，计算中心像素点的切线方向。

步骤S3-10-2：根据中心像素点的切线方向，计算中心像素点的由内部指向外部的法线方向，即前景指向背景的法线方向，并将该法线方向作为边缘图像块epatch(px,size)的边缘朝向标记，记为θ(px,size)。

步骤S3-11：重复步骤S3-10，获得边缘图像块集合，以及所有样本对应的边缘朝向标记θ(px,size)。

所述的利用卷积神经网络框架，构建边缘朝向检测深度模型,包括以下步骤：

步骤S4-1：构建11层的边缘朝向检测的深度模型，具体操作方式为：第1层到第5层为卷积神经网络，第5层输出结果用于边缘检测，第6层到第8层为卷积神经网络，第9层到第11层为全连接神经网络，第11层输出结果用于边缘朝向检测。

步骤S4-2：初始化第1层到第8层的卷积神经网络权重，记为Pri＝{pri^(nla)}，其中Pri为第1层到第8层的卷积神经网络权重，pri^(nla)为第nla层的卷积神经网络权重，nla取值为1到8。

步骤S4-2-1：初始化第nla层的卷积神经网络其中为第nla层的卷积神经网络中，第i个卷积滤波器，每层64个卷积滤波器，i的取值为1到64。

步骤S4-2-1-1：初始化第nla层中，第i个卷积滤波器其中为第nla层中，第i个卷积滤波器中的第k个权重，其中每个滤波器的尺寸为3*3，k的取值为1到9。

步骤S4-2-2：初始化第9到第11层的全连接层权重，记为W＝{w^(nla)}，其中W为第9到第11层全连接层权重，w^(nla)为第nla层的全连接层权重，nla取值为9到11。

步骤S4-2-2-1：初始化nla层的全连接层权重其中表示，第nla层中第i个元素，与第nla+1层中第k个元素之间的权重。

步骤S4-3：构建第1层到第5层的浅层深度网络。

步骤S4-3-1：对旋转后的图像R_i采样，输入一个空间窗口尺寸25*25图像块patch(px,size)。

步骤S4-3-2：进行第1层卷积处理，具体操作方式为，利用第nla层的卷积神经网络权重pri^(nla)，对图像块patch(px,size)进行卷积，获得卷积后的响应图集合respone^(nla)，其中响应图集合中有64滤波器分别卷积获得的64个响应图，nla取值为1。

步骤S4-3-3：进行第2层卷积处理，利用第nla层的卷积神经网络权重pri^(nla)，对第nla-1层响应图respone^(nla-1)进行卷积，获得卷积后的响应图集合respone^(nla)，其中响应图集合中有64滤波器分别卷积获得的64个响应图，其中nla取值为2。

步骤S4-3-4：重复步骤S4-3-3，依次实现第3层，第4层，第5层卷积处理，分别依次获得第3层，第4层，第5层卷积响应图respone^(nla)，其中nla取值为3，4，5。

步骤S4-4：构建第6层到第8层的浅层深度网络。

步骤S4-4-1：进行第6层卷积处理，利用第nla层的卷积神经网络权重pri^(nla)，对第nla-1层响应图respone^(nla-1)进行卷积，获得卷积后的下采样前的响应图集合brespone^(nla)，其中nla取值为6。

步骤S4-4-2：对第6层进行池化处理，对下采样前的响应图集合brespone^(nla)中的每个响应图，以2*2的滑动窗口，以2为步长进行滑动并下采样，具体方式为，取2*2窗口中的最大值保留为该区域的下采样值，获得下采样后的响应图集合respone^(nla)，其中第6层下采样后的响应图尺寸为12*12。

步骤S4-4-3：重复步骤S4-4-1和步骤S4-4-2，依次实现第7层，第8层卷积处理，分别依次获得第7层，第8层卷积响应图集合respone^(nla)，其中第7层下采样后的响应图尺寸为6*6，第8层下采样后的响应图尺寸为3*3，其中nla取值为7，8。

步骤S4-5：构建第9层到第11层全连接层。

步骤S4-5-1：进行第8层行向量处理，将第8层卷积响应图集合respone^(nla)，按照行顺序，转化为第8层行向量vector^(nla)，其中，第8层行向量长度为64*3*3，nla取值为8。

步骤S4-5-2：进行第9层全连接处理，对第8层行向量vector^(nla-1)，利用第nla层的全连接层权重w^(nla)，进行矩阵乘法，获得第9层行向量vector^(nla)，其中9层行向量长度为64*3*3，第nla取值为9。

步骤S4-5-3：重复步骤S4-4-2，进行第10层全连接处理，对第9层行向量vector^(nla ^-1)，利用第nla层的全连接层权重w^(nla)，进行矩阵乘法，获得第10层行向量vector^(nla)，其中10层行向量长度为64*3*3，nla取值为10。

步骤S4-5-4：重复步骤S4-4-2，进行第11层全连接处理，对第9层行向量vector^(nla ^-1)，利用第nla层的全连接层权重w^(nla)，进行矩阵乘法，获得第11层行向量vector^(nla)，其中11层行向量长度为1*72，即，与旋转角度集合中的元素对应，nla取值为11。

所述的根据旋转图像块采集集合，训练浅层模型，包括以下步骤：

步骤S5-1：根据步骤S3-8获得图像块集合Patch＝{patch(px,size)}和对应的边缘标记y(px,size)。

步骤S5-2：根据步骤S4-1到步骤S4-4，将每个图像块patch(px,size)，输入边缘朝向检测的深度模型，获得第5层卷积响应图集合respone^(nla)，其中nla取值为5。

步骤S5-3：对第5层卷积响应图集合respone^(nla)中的64个响应图，抽取其中心像素的1*64行向量。

步骤S5-4：取中心像素的1*64行向量的最大值，作为该图像块的边缘预测结果y_test(px,size)。

步骤S5-5：对所有图像块，计算边缘预测损失函数L_edge为

其中，第一项计算第1层到第5层权重的2范数的和，作为损失函数的正则项，第二项为每个样本平均的预测误差。

步骤S5-6：使用误差反馈传播算法对边缘预测损失函数L_edge进行优化，获得最小的边缘预测损失函数，并获得该情况下的前1层到第5层训练后的神经网络模型参数即

其中nla取值为1到5。

所述的根据旋转边缘图像块采样集合，训练深层模型，包括以下步骤：

步骤S6-1：根据步骤S3-19到步骤S3-11，获得边缘图像块集合Epatch＝{epatch(px,size)}，以及所有样本对应的边缘朝向标记θ(px,size)。

步骤S6-2：将样本对应的边缘朝向标记θ(px,size)，转化为行向量形式vector，具体方式为，行向量形式vector为1*72行向量，将标记θ(px,size)除以5取整数获得下标编号ind，将行向量中下标编号ind位置赋值为1，其他位置赋值为0，获得行向量形式vector。

步骤S6-3：使用前1层到第5层训练后的神经网络模型参数根据步骤S4-4到步骤S4-5，将每个边缘图像块epatch(px,size)，输入边缘朝向检测的深度模型，获得第11层行向量vector_test ^(nla)，其中nla取值为11。

步骤S6-4：对所有边缘图像块，计算边缘朝向预测损失函数L_occ为

其中，第一项计算第6层到第8层权重的2范数的和，作为损失函数的正则项，第二项第9层到第11层权重的2范数的和，作为损失函数的正则项，第三项为每个样本平均的预测误差。

步骤S6-5：使用误差反馈传播算法对边缘朝向预测损失函数L_occ进行优化，获得最小的边缘预测损失函数，并获得该情况下的前6层到第8层训练后的神经网络模型参数和第9层到第11层权重w^(nla)，即

其中中nla取值为6到8，中nla取值为9到11。

所述的使用训练后的边缘朝向检测深度模型，检测局部轮廓朝向，包括以下步骤：

步骤S7-1：对输入图像，根据步骤S1和步骤S2获得人物目标分割轮廓B_dist。

步骤S7-2：对人物目标分割轮廓上的像素点进行采样，采样窗口为25*25，采样窗口的中心点为人物目标分割轮廓点，获得边缘图像块epatch(px,size)。

步骤S7-3：获得训练好的边缘朝向检测的深度模型参数，具体操作为，根据步骤S5和步骤S6获得浅层网络模型参数和深层网络模型参数。

步骤S7-4：输入缘图像块epatch(px,size)，并使用训练好的边缘朝向检测的深度模型参数，重复步骤S4-3到步骤S4-5，获得11层的网络输出行向量vector^(nla)，其中nla取值为11。

步骤S7-5：根据网络输出行向量vector^(nla)，计算当前人物目标分割轮廓点的边缘朝向方向θ(px,size)。

步骤S7-6：目标区域Obj＝{obj_i}，获得像素点边界两侧的目标区域编号j和目标区域编号k。

步骤S7-7：根据当前人物目标分割轮廓点的边缘朝向方向θ(px,size)，记录目标区域编号j和目标区域编号k的遮挡朝向关系，具体操作为，如果边缘朝向方向θ(px,size)指向目标区域编号j，则说明目标区域编号j是背景区域，目标区域编号k是前景区域，目标区域编号k遮挡目标区域编号j，则记录遮挡朝向关系为Vocc(k,j)＝1；否则，如果边缘朝向方向θ(px,size)指向目标区域编号k，则说明目标区域编号k是背景区域，目标区域编号j是前景区域，则记录遮挡朝向关系为Vocc(j,k)＝1。

所述的对局部轮廓朝向进行一致性评价，提取人物分割轮廓朝向，包括以下步骤：

步骤S8-1：对输入图像，根据步骤S1和步骤S2获得人物目标轮廓B_dist。

步骤S8-2：根据目标区域Obj＝{obj_i}，初始化目标区域之间的遮挡关系矩阵Occ(j,k)，其中j＝1,...,n_obj，k＝1,...,n_obj，j≠k，n_obj是合并后区域数量，其中Occ(j,k)的初始值都为0。

步骤S8-3：初始化区域间共享边界像素点集合Pset(j,k)，初始化时，每个边界像素点集合为空集合，其中Pset(j,k)是指目标区域编号j和目标区域编号k之间的轮廓点。

步骤S8-4：对人物目标轮廓B_dist上的轮廓点，以5像素为步长等间隔采样，获得采样点集合Px＝{px}。

步骤S8-5：重复步骤S7-2到步骤S7-5，依次分析采样点的边缘图像块的边缘朝向θ(px,size)。

步骤S8-6：重复步骤S7-6，获得像素点边界两侧的目标区域编号j和目标区域编号k。

步骤S8-7：根据像素点边界两侧的目标区域编号j和目标区域编号k，将像素点添加到区域间共享边界像素点集合Pset(j,k)＝Pset(j,k)∪px。

步骤S8-8：根据当前人物目标分割轮廓点的边缘朝向方向θ(px,size)，记录目标区域编号j和目标区域编号k的遮挡朝向关系，具体操作为，如果边缘朝向方向θ(px,size)指向目标区域编号j，则说明目标区域编号j是背景区域，目标区域编号k是前景区域，目标区域编号k遮挡目标区域编号j，则记录遮挡朝向关系为Vocc(k,j)＝1；否则，如果边缘朝向方向θ(px,size)指向目标区域编号k，则说明目标区域编号k是背景区域，目标区域编号j是前景区域，则记录遮挡朝向关系为Vocc(j,k)＝1；

步骤S8-9：根据区域编号间的投票，对遮挡关系矩阵Occ(j,k)进行统计，具体方式为，如果记录遮挡朝向关系为Vocc(k,j)＝1，则Occ(k,j)＝Occ(k,j)+Vocc(k,j)；如果记录遮挡朝向关系为Vocc(j,k)＝1，则Occ(j,k)＝Occ(j,k)+Vocc(j,k)；

步骤S8-10：重复步骤S8-4到步骤S8-7，获得最终的区域间共享边界像素点集合Pset(j,k)；

步骤8-11：重复步骤S8-8到步骤S8-9，对全部区域间朝向关系进行的遮挡投票，并更新遮挡关系，获得最终的遮挡关系矩阵Occ(j,k)；

步骤S8-12：选择目标区域编号j和目标区域编号k，并对最终的遮挡关系矩阵Occ(j,k)进行一致性验证，具体操作为，如果Occ(j,k)＞Occ(k,j)，说明目标区域编号j以更大的可能性对目标区域编号k遮挡，则记录区域间一致的遮挡关系为Pocc(j,k)＝1；如果Occ(j,k)＜Occ(k,j)目标区域编号k以更大的可能性对目标区域编号j遮挡，则记录区域间一致的遮挡关系记作Pocc(k,j)＝1；

步骤S8-13：根据最终的区域间共享边界像素点集合Pset(j,k)，找出目标区域编号j和目标区域编号k之间的轮廓点Pset(j,k)＝{px}；

步骤S8-14：根据区域间一致的遮挡关系，对区域间共享边界像素点集合进行一致性修正，具体操作为，如果区域间一致的遮挡关系Pocc(j,k)＝1，则将所有目标区域编号j和目标区域编号k之间的轮廓点Pset(j,k)＝{px}的关系赋值为Vocc(j,k)＝1；否则，如果区域间一致的遮挡关系Pocc(k,j)＝1，则将所有目标区域编号j和目标区域编号k之间的轮廓点Pset(j,k)＝{px}的关系赋值为Vocc(k,j)＝1；

步骤S8-15：重复步骤S8-13到步骤S8-14，完成所有区域间一致的遮挡关系修正，获得所有人物目标轮廓B_dist上的轮廓点的遮挡朝向关系；

步骤S8-16：将人物目标轮廓B_dist上的轮廓点的遮挡朝向关系可视化输出，作为人物遮挡轮廓检测结果，具体操作方式为：如果像素点Vocc(j,k)＝1，即边界遮挡朝向为从区域编号j朝向目标区域编号k，此时将该箭头顺时针旋转90度，并以轮廓点为箭头起点绘制箭头；如果像素点Vocc(k,j)＝1，即边界遮挡朝向为从区域编号k朝向目标区域编号j，此时将该箭头顺时针旋转90度，并以轮廓点为箭头起点绘制箭头。

本发明针对现有边缘检测模型抗干扰能力差，同时无法判定边缘遮挡朝向的问题，提出了一种基于旋转深度学习的人物遮挡轮廓检测方法，解决了图像中目标人物的遮挡轮廓检测。与已有的技术相比，本发明的主要优势如下：

1本发明能够在边缘检测的基础上，进一步分析边缘遮挡朝向特性，使用卷积神经网络对边缘遮挡朝向进行有效估计，能够有效判断边缘对应区域是否为前景区域，有利于后续人物检测分析。

2本发明使用图像旋转集合，能够有效处理不同几何形变下的边缘检测，和边缘遮挡朝向估计，提高本发明方法对几何形变处理的鲁棒性。同时，本发明在局部边缘朝向估计的基础上，进行区域一致性评价，进一步提高了边缘朝向检测的可靠性。

3本发明利用卷积神经网络，构建了统一的边缘检测和边缘遮挡朝向检测的深度模型，其中浅层是边缘检测模型，深层是边缘遮挡朝向检测模型。并利用图像中的边缘信息和边缘朝向信息，分别训练浅层边缘检测模型，和深层边缘朝向检测模型，有效控制了模型误差，提高了边缘检测和边缘朝向检测的精度。

附图说明

下面结合附图对本发明进一步说明：

图1是基于旋转深度学习的人物遮挡轮廓检测流程图。

图2是提取人物分割轮廓示意图。(a)为超像素过分割，(b)为区域合并，(c)为人物分割轮廓。

图3是构建人物旋转图像集合示意图。(a)为旋转图像集合，(b)为非边缘图像块集合，(c)为边缘朝向图像块集合，(d)为边缘朝向标记。

图4是边缘朝向检测深度模型图。

图5是检测人物分割轮廓示意图。(a)为局部轮廓，(b)为一致性轮廓朝向。

具体实施方式

下面结合附图及具体实施方式详细介绍本发明。本发明为基于旋转深度学习的人物遮挡轮廓检测方法，具体流程如图1所示，本发明的实现方案分为以下步骤：

步骤S2-2：对分割编号图像，获得分割轮廓图像。

步骤S2-6：对目标分割编号图像，获得目标分割轮廓图像。

步骤S4-3：构建第1层到第5层的浅层深度网络。

步骤S4-4：构建第6层到第8层的浅层深度网络。

步骤S4-4-2：进行第6层下采样处理，对下采样前的响应图集合brespone^(nla)中的每个响应图，以2*2的滑动窗口，以2为步长进行滑动并下采样，具体方式为，取2*2窗口中的最大值保留为该区域的下采样值，获得下采样后的响应图集合respone^(nla)，其中第6层下采样后的响应图尺寸为12*12。

步骤S4-5：构建第9层到第11层全连接层。

步骤S5-5：对所有图像块，计算边缘预测损失函数L_edge为

其中nla取值为1到5。

其中中nla取值为6到8，中nla取值为9到11。

步骤S8-8：对像素点px，根据当前人物目标分割轮廓点的边缘朝向方向θ(px,size)，记录目标区域编号j和目标区域编号k的遮挡朝向关系，具体操作为，如果边缘朝向方向θ(px,size)指向目标区域编号j，则说明目标区域编号j是背景区域，目标区域编号k是前景区域，目标区域编号k遮挡目标区域编号j，则记录遮挡朝向关系为Vocc(k,j)＝1；否则，如果边缘朝向方向θ(px,size)指向目标区域编号k，则说明目标区域编号k是背景区域，目标区域编号j是前景区域，则记录遮挡朝向关系为Vocc(j,k)＝1；

Claims

1.基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于包括：构建人物图像旋转集合，构建边缘朝向检测深度模型，训练浅层模型，训练深层模型，检测局部轮廓朝向，对局部轮廓朝向进行一致性评价并提取人物分割轮廓朝向；

所述的构建人物图像旋转集合，对输入的灰度图像进行旋转，并对其进行分割和合并，得到旋转图像集合，然后对旋转图像进行采样得到图像块，最后经过边缘标记和边缘朝向标记得到边缘图像块集合，以及所有样本对应的边缘朝向标记；所述的构建边缘朝向检测深度模型，通过构建11层的边缘朝向检测的深度模型，来实现边缘朝向检测功能；

所述的训练浅层模型，根据旋转图像块采集集合，训练浅层模型，使用误差反馈传播算法对边缘预测损失函数进行优化，获得最小的边缘预测损失函数，并获得该情况下的第1层到第5层训练后的神经网络模型参数

所述的训练深层模型，根据旋转边缘图像块采样集合，训练深层模型，使用误差反馈传播算法对边缘朝向预测损失函数进行优化，获得最小的边缘预测损失函数，并获得该情况下的第6层到第8层训练后的神经网络模型参数和第9层到第11层权重w^(nla)；

所述的检测局部轮廓朝向，使用训练后的边缘朝向检测深度模型，检测局部轮廓朝向，计算当前人物目标分割轮廓点的边缘朝向方向θ(px,size)并且记录目标区域编号j和目标区域编号k的遮挡朝向关系；

所述的对局部轮廓朝向进行一致性评价并提取人物分割轮廓朝向，根据区域间一致的遮挡关系，对区域间共享边界像素点集合进行一致性修正，获得所有人物目标轮廓B_dist上的轮廓点的遮挡朝向关系。

2.根据权利要求1所述的基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于：构建人物图像旋转集合,包括以下步骤：

步骤S3-1：设置旋转角集合A＝{α_i},i＝1,..,72，其中α_i的具体取值为α_i＝5·(i-1)度，具体操作为，以图像中朝向右的水平线方向为0度，逆时针旋转，每旋转5度为一个单位，共旋转71次，完成355度的旋转；

步骤S3-2：对输入灰度图像I_gray，旋转一个旋转角度α_i，以图像中心坐标点为旋转点，进行旋转，获得旋转后的图像R_i；

步骤S3-3：重复步骤S2-2，依次对旋转角集合中的旋转角A＝{α_i}进行旋转，获得旋转图像集合Rset＝{R_i}；

步骤S3-4：对输入分割轮廓图像B_sdist，旋转一个旋转角度α_i，以图像中心坐标点为旋转点，进行旋转，获得旋转后的分割图像Bs_i；

步骤S3-5：重复步骤S2-4，依次对旋转角集合中的旋转角A＝{α_i}进行旋转，获得旋转图像集合Bsset＝{Bs_i}；

步骤S3-6：对旋转后的图像R_i，以空间窗口尺寸size为25*25对图像进行一次采样，获得图像块patch(px,size)，其中px为图像块的中心像坐标，size为采样块的空间窗尺寸；

步骤S3-7-1：如果图像块patch(px,size)的采样中心位置px和尺寸size，对对应的旋转后的分割图像Bs_i进行采样，获得边缘图像块spatch(px,size)；

步骤S3-7-2：如果边缘图像块spatch(px,size)，中心像素处为分割轮廓，则记录该图像块为边缘图像块，其边缘标记为y(px,size)＝1；

步骤S3-7-3：如果边缘图像块spatch(px,size)，中心像素处不是分割轮廓，则记录该图像块为非边缘图像块，其边缘标记为y(px,size)＝0；

步骤S3-8：重复步骤S3-6和步骤S3-7，获得图像块集合Patch＝{patch(px,size)}和对应的边缘标记y(px,size)；

步骤S3-9：对图像块集合Patch＝{patch(px,size)}，将其中边缘标记为y(px,size)＝1的图像处理块组成边缘图像块集合Epatch＝{epatch(px,size)}；

步骤S3-10-1：选择边缘图像块epatch(px,size)，计算中心像素点的切线方向；

步骤S3-10-2：根据中心像素点的切线方向，计算中心像素点的由内部指向外部的法线方向，即前景指向背景的法线方向，并将该法线方向作为边缘图像块epatch(px,size)的边缘朝向标记，记为θ(px,size)；

3.根据权利要求1所述的基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于：构建边缘朝向检测深度模型，包括以下步骤：

步骤S4-1：构建11层的边缘朝向检测的深度模型，具体操作方式为：第1层到第5层为卷积神经网络，第5层输出结果用于边缘检测，第6层到第8层为卷积神经网络，第9层到第11层为全连接神经网络，第11层输出结果用于边缘朝向检测；

步骤S4-2：初始化第1层到第8层的卷积神经网络权重，记为Pri＝{pri^(nla)}，其中Pri为第1层到第8层的卷积神经网络权重，pri^(nla)为第nla层的卷积神经网络权重，nla取值为1到8；

步骤S4-2-1：初始化第nla层的卷积神经网络其中为第nla层的卷积神经网络中，第i个卷积滤波器，每层64个卷积滤波器，i的取值为1到64；

步骤S4-2-1-1：初始化第nla层中，第i个卷积滤波器其中为第nla层中，第i个卷积滤波器中的第k个权重，其中每个滤波器的尺寸为3*3，k的取值为1到9；

步骤S4-2-2：初始化第9到第11层的全连接层权重，记为W＝{w^(nla)}，其中W为第9到第11层全连接层权重，w^(nla)为第nla层的全连接层权重，nla取值为9到11；

步骤S4-2-2-1：初始化nla层的全连接层权重其中表示，第nla层中第i个元素，与第nla+1层中第k个元素之间的权重；

步骤S4-3：构建第1层到第5层的浅层深度网络；

步骤S4-3-1：对旋转后的图像R_i采样，输入一个空间窗口尺寸25*25图像块patch(px,size)；

步骤S4-3-2：进行第1层卷积处理，具体操作方式为，利用第nla层的卷积神经网络权重pri^(nla)，对图像块patch(px,size)进行卷积，获得卷积后的响应图集合respone^(nla)，其中响应图集合中有64滤波器分别卷积获得的64个响应图，nla取值为1；

步骤S4-3-3：进行第2层卷积处理，利用第nla层的卷积神经网络权重pri^(nla)，对第nla-1层响应图respone^(nla-1)进行卷积，获得卷积后的响应图集合respone^(nla)，其中响应图集合中有64滤波器分别卷积获得的64个响应图，其中nla取值为2；

步骤S4-3-4：重复步骤S4-3-3，依次实现第3层，第4层，第5层卷积处理，分别依次获得第3层，第4层，第5层卷积响应图respone^(nla)，其中nla取值为3，4，5；

步骤S4-4：构建第6层到第8层的浅层深度网络；

步骤S4-4-1：进行第6层卷积处理，利用第nla层的卷积神经网络权重pri^(nla)，对第nla-1层响应图respone^(nla-1)进行卷积，获得卷积后的下采样前的响应图集合brespone^(nla)，其中nla取值为6；

步骤S4-4-2：对第6层进行池化处理，对下采样前的响应图集合brespone^(nla)中的每个响应图，以2*2的滑动窗口，以2为步长进行滑动并下采样，具体方式为，取2*2窗口中的最大值保留为该区域的下采样值，获得下采样后的响应图集合respone^(nla)，其中第6层下采样后的响应图尺寸为12*12；

步骤S4-4-3：重复步骤S4-4-1和步骤S4-4-2，依次实现第7层，第8层卷积处理，分别依次获得第7层，第8层卷积响应图集合respone^(nla)，其中第7层下采样后的响应图尺寸为6*6，第8层下采样后的响应图尺寸为3*3，其中nla取值为7，8；

步骤S4-5：构建第9层到第11层全连接层；

步骤S4-5-1：进行第8层行向量处理，将第8层卷积响应图集合respone^(nla)，按照行顺序，转化为第8层行向量vector^(nla)，其中，第8层行向量长度为64*3*3，nla取值为8；

步骤S4-5-2：进行第9层全连接处理，对第8层行向量vector^(nla-1)，利用第nla层的全连接层权重w^(nla)，进行矩阵乘法，获得第9层行向量vector^(nla)，其中9层行向量长度为64*3*3，第nla取值为9；

步骤S4-5-3：重复步骤S4-4-2，进行第10层全连接处理，对第9层行向量vector^(nla-1)，利用第nla层的全连接层权重w^(nla)，进行矩阵乘法，获得第10层行向量vector^(nla)，其中10层行向量长度为64*3*3，nla取值为10；

步骤S4-5-4：重复步骤S4-4-2，进行第11层全连接处理，对第9层行向量vector^(nla-1)，利用第nla层的全连接层权重w^(nla)，进行矩阵乘法，获得第11层行向量vector^(nla)，其中11层行向量长度为1*72，即，与旋转角度集合中的元素对应，nla取值为11。

4.根据权利要求1所述的基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于：训练浅层模型,包括以下步骤：

步骤S5-1：根据步骤S3-8获得图像块集合Patch＝{patch(px,size)}和对应的边缘标记y(px,size)；

步骤S5-2：根据步骤S4-1到步骤S4-4，将每个图像块patch(px,size)，输入边缘朝向检测的深度模型，获得第5层卷积响应图集合respone^(nla)，其中nla取值为5；

步骤S5-3：对第5层卷积响应图集合respone^(nla)中的64个响应图，抽取其中心像素的1*64行向量；

步骤S5-4：取中心像素的1*64行向量的最大值，作为该图像块的边缘预测结果y_test(px,size)；

步骤S5-5：对所有图像块，计算边缘预测损失函数L_edge为

其中，第一项计算第1层到第5层权重的2范数的和，作为损失函数的正则项，第二项为每个样本平均的预测误差；

其中nla取值为1到5。

5.根据权利要求1所述的基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于：训练深层模型,包括以下步骤：

步骤S6-1：根据步骤S3-19到步骤S3-11，获得边缘图像块集合Epatch＝{epatch(px,size)}，以及所有样本对应的边缘朝向标记θ(px,size)；

步骤S6-2：将样本对应的边缘朝向标记θ(px,size)，转化为行向量形式vector，具体方式为，行向量形式vector为1*72行向量，将标记θ(px,size)除以5取整数获得下标编号ind，将行向量中下标编号ind位置赋值为1，其他位置赋值为0，获得行向量形式vector；

步骤S6-3：使用前1层到第5层训练后的神经网络模型参数根据步骤S4-4到步骤S4-5，将每个边缘图像块epatch(px,size)，输入边缘朝向检测的深度模型，获得第11层行向量vector_test ^(nla)，其中nla取值为11；

其中，第一项计算第6层到第8层权重的2范数的和，作为损失函数的正则项，第二项第9层到第11层权重的2范数的和，作为损失函数的正则项，第三项为每个样本平均的预测误差；

其中中nla取值为6到8，中nla取值为9到11。

6.根据权利要求1所述的基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于：检测局部轮廓朝向,包括以下步骤：

步骤S7-1：对输入图像，根据步骤S1和步骤S2获得人物目标分割轮廓B_dist；

步骤S7-2：对人物目标分割轮廓上的像素点进行采样，采样窗口为25*25，采样窗口的中心点为人物目标分割轮廓点，获得边缘图像块epatch(px,size)；

步骤S7-3：获得训练好的边缘朝向检测的深度模型参数，具体操作为，根据步骤S5和步骤S6获得浅层网络模型参数和深层网络模型参数；

步骤S7-4：输入缘图像块epatch(px,size)，并使用训练好的边缘朝向检测的深度模型参数，重复步骤S4-3到步骤S4-5，获得11层的网络输出行向量vector^(nla)，其中nla取值为11；

步骤S7-5：根据网络输出行向量vector^(nla)，计算当前人物目标分割轮廓点的边缘朝向方向θ(px,size)；

步骤S7-6：目标区域Obj＝{obj_i}，获得像素点边界两侧的目标区域编号j和目标区域编号k；

7.根据权利要求6所述的基于旋转深度学习的人物遮挡轮廓检测方法，其特征在于：对局部轮廓朝向进行一致性评价并提取人物分割轮廓朝向,包括以下步骤：

步骤S8-1：对输入图像，根据步骤S1和步骤S2获得人物目标轮廓B_dist；

步骤S8-2：根据目标区域Obj＝{obj_i}，初始化目标区域之间的遮挡关系矩阵Occ(j,k)，其中j＝1,...,n_obj，k＝1,...,n_obj，j≠k，n_obj是合并后区域数量，其中Occ(j,k)的初始值都为0；

步骤S8-3：初始化区域间共享边界像素点集合Pset(j,k)，初始化时，每个边界像素点集合为空集合，其中Pset(j,k)是指目标区域编号j和目标区域编号k之间的轮廓点；

步骤S8-4：对人物目标轮廓B_dist上的轮廓点，以5像素为步长等间隔采样，获得采样点集合Px＝{px}；

步骤S8-5：重复步骤S7-2到步骤S7-5，依次分析采样点的边缘图像块的边缘朝向θ(px,size)；

步骤S8-6：重复步骤S7-6，获得像素点边界两侧的目标区域编号j和目标区域编号k；

步骤S8-7：根据像素点边界两侧的目标区域编号j和目标区域编号k，将像素点添加到区域间共享边界像素点集合Pset(j,k)＝Pset(j,k)∪px；