CN107341811B

CN107341811B - 基于深度图像的利用MeanShift算法进行手部区域分割的方法

Info

Publication number: CN107341811B
Application number: CN201710471608.6A
Authority: CN
Inventors: 邹耀; 应忍冬; 金柯; 马燕辉; 鄢青山
Original assignee: Shanghai Data Miracle Intelligent Technology Co ltd
Current assignee: Shanghai Data Miracle Intelligent Technology Co ltd
Priority date: 2017-06-20
Filing date: 2017-06-20
Publication date: 2020-11-13
Anticipated expiration: 2037-06-20
Also published as: CN107341811A

Abstract

本发明公开的基于深度图像的利用MeanShift算法进行手部区域分割的方法，包括以下步骤：1、读取深度图像；2、对深度图像进行预处理并初步提取包含冗余轮廓的手部区域；3、在初步提取得到的手部区域中选取初始迭代点并计算迭代半径；4、利用MeanShift算法对初始迭代点和迭代半径进行迭代运算，获取最接近手掌区域的圆形区域；5、根据最接近手掌区域的圆形区域将初步提取到的手部区域上的冗余轮廓剔除，更新得到精确的手部区域轮廓。本发明利用MeanShift算法进行手部区域分割的方法可以有效去除手臂等其他冗余轮廓信息，为后续的特征提取、分类学习等步骤的提供更为准确的输入数据源，提高最终手势识别和交互系统的稳定性和准确性。

Description

基于深度图像的利用MeanShift算法进行手部区域分割的方法

技术领域

本发明涉及计算机模式识别和计算机视觉技术领域，尤其涉及一种基于深度图像的利用MeanShift算法进行手部区域分割的方法。

背景技术

手势交互是新型人机交互研究中一种重要的交互方式，这种交互是非接触性的、自然的交互，更符合人们的自然行为，因此基于手势的交互方式将是未来人机交互发展的趋势。手势识别技术涉及人工智能、模式识别、机器学习、计算机图像学等众多学科。另外，手势的研究设计到数学、计算机图形学、机器人运动学、医学等诸多学科。因此，手势识别的研究具有非常重要的研究价值与研究意义。当前基于手势交互的研究主要集中在基于RGB光学图像的处理上，包括人手检测、目标跟踪、手势识别三部分。

手势检测用于检测获取控制权的手势，主要分为静态手势和动态手势两种方式，静态手势的检测应用的是基于区域特征的目标检测方法，比如Haar特征、HOG特征、肤色特征、形状特征等，动态手势的检测主要基于运动的检测算法，根据运动区域的特征检测某种预定义的手势。目前手势检测研究较为成熟，但受光照、背景等的影响。

例如，专利申请号为201510282688.1的中国专利申请公开的一种基于深度图的手部特征点检测方法，包括以下步骤：(1)手部分割：利用Kinect采集到人体运动视频序列来提取手部，通过深度图利用OPENNI得到人体手部位置信息，通过设定搜索区域及深度阈值方法，初步获得手心点；利用OPENCV的find_contours函数得到手部轮廓；通过找到手轮廓内最大内接圆圆心，精确确定手部手心点，通过计算所有手部内部点到轮廓点之间的最短距离m，在最短距离中找到最大值M，M所代表的手部内部点为手心点，内接圆半径R＝M；(2)特征点提取：通过不断对手部轮廓进行高斯平滑，并结合曲率阈值从而得到CSS曲率图，根据图中CSS轮廓分析极限值得出手部指尖点及指谷点坐标，同时需要补全根据CSS曲率图无法得到的手部指谷点；(3)补全缺失手指：利用角度阈值和深度跳变结合的方式来补全缺失手指，从而找到弯曲手指的指尖点。

然而，这种基于设定搜索区域及深度阈值方法得到的手部轮廓会附带手臂或其他障碍物的轮廓信息，这些冗余轮廓信息会对后续的特征提取、分类学习等步骤产生干扰，造成最终手势识别和交互系统的不稳定。为此，申请人进行了有益的探索和尝试，找到了解决上述问题的办法，下面将要介绍的技术方案便是在这种背景下产生的。

发明内容

本发明所要解决的技术问题：针对现有技术的不足而提供一种基于深度图像的利用MeanShift算法进行手部区域分割的方法，该方法保证最终处理得到的手部区域由手腕处起始，去除手臂和其他障碍物造成的冗余轮廓信息，确保手势识别和交互系统的稳定性。

本发明所解决的技术问题可以采用以下技术方案来实现：

基于深度图像的利用MeanShift算法进行手部区域分割的方法，包括以下步骤：

步骤S10，读取深度图像；

步骤S20，对深度图像进行预处理并初步提取包含冗余轮廓的手部区域；

步骤S30，在初步提取得到的手部区域中选取初始迭代点并计算迭代半径；

步骤S40，利用MeanShift算法对初始迭代点和迭代半径进行迭代运算，获取最接近手掌区域的圆形区域；

步骤S50，根据获取到的最接近手掌区域的圆形区域将初步提取到的手部区域上的冗余轮廓剔除，更新得到精确的手部区域轮廓。

在本发明的一个优选实施例中，在所述步骤S20中，所述对深度图像进行预处理是指利用深度图像预处理模块对深度图像进行深度切割、图形学滤波并计算最大连通区域。

在本发明的一个优选实施例中，所述利用深度图像预处理模块对深度图像进行深度切割、图形学滤波并计算最大连通区域，包括以下步骤：

步骤S21，利用深度图像预处理模块对深度图像进行深度切割，并根据深度阈值提取包含冗余轮廓的手部区域，并将提取到的手部区域映射成二值图像，其中手部区域为白色，背景区域为黑色；

步骤S22，利用图形学对二值图像进行运算，先做开运算，平滑二值图像的轮廓并去除二值图像的背景噪声，再做闭运算，填充二值图像内的细小孔洞；

步骤S23，在经过图形学运算后的二值图像上寻找最大面积轮廓，并认为该轮廓为包含冗余轮廓的手部区域轮廓，同时填补该轮廓内的孔洞。

在本发明的一个优选实施例中，在所述步骤S30中，所述在初步提取得到的手部区域中选取初始迭代点并计算迭代半径，包括以下步骤：

步骤S31，将初步提取到的手部区域以多边形表示，并修复含有内环的多边形情况；

步骤S32，计算多边形的最小外接矩形，并与图像边界进行比较，根据两者的重合边数情况进行如下分类讨论：

(1)若重合边数大于或等于3，则表明手离镜头过近，图像无法显示完整的手部区域，算法终止；

(2)若重合边数为2且重合的两条边是平行边，则表明手横向或纵向贯穿镜头，图像无法显示完整的手部区域，算法终止；

(3)若重合边数为0，则表明没有手臂部分轮廓与图像边界相交，冗余轮廓不存在，此时返回的初始迭代点为手部区域的质心，初始迭代半径根据实际手掌经验值选取；

(4)若重合边数为1或重合边数为2且重合的两条边是相交边，则进入步骤S33；

步骤S33，在多边形的最小外接矩形的四个顶点中，计算距离多边形最近的顶点，且要保证该顶点是有效的且使得该顶点不与图像边界相交，再计算得到该顶点在多边形上的投影点，即该顶点距离多边性最近的点；

步骤S34，取投影点与多边形质心的连线中点作为初始迭代点，连线长度的一半作为初始迭代半径，若初始迭代点在多边形外部，则取该点在多边形上的投影点作为新的初始迭代点。

在本发明的一个优选实施例中，在所述步骤S40中，所述利用MeanShift算法对初始迭代点和迭代半径进行迭代运算，包括以下子步骤：

步骤S41，根据初始迭代点与初始迭代半径得到初始圆形区域；

步骤S42，寻找初始圆形区域与手部区域多边形的相交区域，并计算该相交区域的质心；

步骤S43，比较相交区域质心与圆心的位置，若两者之间的距离超过MeanShift算法的迭代门限，则进入步骤S44；若两者之间的距离在MeanShift算法的迭代门限内，则进入步骤S45；

步骤S44，调整当前圆形区域的圆心为相交区域的质心，半径为相交区域的质心到手部区域多边形边界的最小距离，并返回步骤S42；

步骤S45，若相交区域面积/圆形面积超过有效面积像素门限*1.1，则增加圆半径，并返回步骤S42；若相交区域面积/圆形面积低于有效面积像素门限*0.9，则减小圆半径,并返回步骤S42；否则终止迭代，输出迭代结束时的圆形区域的圆心c和半径r。

在本发明的一个优选实施例中，在所述步骤S50中，所述更新得到精确的手部区域轮廓，包括以下步骤：

步骤S51，根据迭代后的圆形区域与手部区域多边形的相交情况，将手部区域多边形分成相交区域I和不相交区域P，其中不相交区域P是由多个独立多边形p构成的；

步骤S52，针对不相交区域P中的每个独立多边形p，计算p与边界的重合线段的长度。若重合线段长度大于重合段门限值，则在原手部区域多边形中剪除该独立多边形p的部分，并进入步骤S54；若没有一个独立多边形p与边界的重合线段长度大于重合段门限值，则进入步骤S53；

步骤S53，针对不相交区域P中的每个独立多边形p，计算p的质心，以迭代后圆形区域的圆心c为起点，作cp延长线直至图像边界，计算p与cp延长线的重合线段的长度。若重合线段长度>0.4*cp延长线的长度，则在原手部区域多边形中剪除该独立多边形p的部分；

步骤S54，判断得到的手部区域多边形是否包含多个独立的多边形部分，若是，则将其中面积最大的多边形部分作为最终得到的手部区域多边形。返回最终得到的手部区域多边形外轮廓。

由于采用了如上的技术方案，本发明的有益效果在于：相比于传统的手部区域分割算法，本发明利用MeanShift算法进行手部区域分割的方法可以有效去除手臂等其他冗余轮廓信息，为后续的特征提取、分类学习等步骤的提供更为准确的输入数据源，提高最终手势识别和交互系统的稳定性和准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的总体算法流程框图。

图2是本发明的深度图像预处理的流程框图。

图3是本发明的计算初始迭代点和初始迭代半径的流程框图。

图4是本发明的根据MeanShift算法迭代寻找最优手掌区域的流程框图。

图5是本发明的手部区域轮廓更新的流程框图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体图示，进一步阐述本发明。

参见图1，图中给出的是本发明的一种基于深度图像的利用MeanShift算法进行手部区域分割的方法，包括以下步骤：

步骤S10，读取深度图像；

在步骤S20中，对深度图像进行预处理是指利用深度图像预处理模块对深度图像进行深度切割、图形学滤波并计算最大连通区域。具体地，参见图2，对深度图像进行预处理包括以下步骤：

在步骤S30中，参见图3，在初步提取得到的手部区域中选取初始迭代点并计算迭代半径，包括以下步骤：

在步骤S40中，参见图4，利用MeanShift算法对初始迭代点和迭代半径进行迭代运算，包括以下子步骤：

在步骤S50中，参见图5，更新得到精确的手部区域轮廓的方法包括以下步骤：

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于深度图像的利用MeanShift算法进行手部区域分割的方法，其特征在于，包括以下步骤：

步骤S10，读取深度图像；

2.如权利要求1所述的基于深度图像的利用MeanShift算法进行手部区域分割的方法，其特征在于，在所述步骤S20中，所述对深度图像进行预处理是指利用深度图像预处理模块对深度图像进行深度切割、图形学滤波并计算最大连通区域。

3.如权利要求2所述的基于深度图像的利用MeanShift算法进行手部区域分割的方法，其特征在于，所述利用深度图像预处理模块对深度图像进行深度切割、图形学滤波并计算最大连通区域，包括以下步骤：

4.如权利要求3所述的基于深度图像的利用MeanShift算法进行手部区域分割的方法，其特征在于，在所述步骤S30中，所述在初步提取得到的手部区域中选取初始迭代点并计算迭代半径，包括以下步骤：

步骤S33，在多边形的最小外接矩形的四个顶点中，计算距离多边形最近的顶点，且要保证该顶点是有效的且使得该顶点不与图像边界相交，再计算得到该顶点在多边形上的投影点，即该顶点距离多边形最近的点；

5.如权利要求4所述的基于深度图像的利用MeanShift算法进行手部区域分割的方法，其特征在于，在所述步骤S40中，所述利用MeanShift算法对初始迭代点和迭代半径进行迭代运算，包括以下子步骤：

6.如权利要求5所述的基于深度图像的利用MeanShift算法进行手部区域分割的方法，其特征在于，在所述步骤S50中，所述更新得到精确的手部区域轮廓，包括以下步骤：

步骤S52，针对不相交区域P中的每个独立多边形p，计算p与边界的重合线段的长度；若重合线段长度大于重合段门限值，则在原手部区域多边形中剪除该独立多边形p的部分，并进入步骤S54；若没有一个独立多边形p与边界的重合线段长度大于重合段门限值，则进入步骤S53；

步骤S53，针对不相交区域P中的每个独立多边形p，计算p的质心，以迭代后圆形区域的圆心c为起点，作cp延长线直至图像边界，计算p与cp 延长线的重合线段的长度；若重合线段长度>0.4*cp延长线的长度，则在原手部区域多边形中剪除该独立多边形p的部分；

步骤S54，判断得到的手部区域多边形是否包含多个独立的多边形部分，若是，则将其中面积最大的多边形部分作为最终得到的手部区域多边形，返回最终得到的手部区域多边形外轮廓。