WO2018072483A1

WO2018072483A1 - 图像分割方法、图像分割系统和存储介质及包括其的设备

Info

Publication number: WO2018072483A1
Application number: PCT/CN2017/091986
Authority: WO
Inventors: 赵骥伯; 唐小军
Original assignee: 京东方科技集团股份有限公司
Priority date: 2016-10-17
Filing date: 2017-07-06
Publication date: 2018-04-26
Also published as: US10650523B2; EP3537375B1; EP3537375A1; EP3537375A4; CN107958458A; CN107958458B; US20190043199A1

Abstract

一种图像分割方法、图像分割系统和存储介质及包括其的设备，该图像分割方法包括：从深度图像中获取目标物体所在的连通域；通过主成分分析方法确定所述连通域的主方向或次方向；以及根据所述目标物体的形态与所述主方向或次方向之间的关系，从所述连通域中获取所述目标物体的图像。本发明实施例可以获取高质量的目标物体的图像。

Description

图像分割方法、图像分割系统和存储介质及包括其的设备

技术领域

本发明的实施例涉及一种图像分割方法、图像分割系统和存储介质及包括其的设备。

背景技术

随着人机交互技术的发展，基于计算机视觉的手势识别技术因具有使人能够以自然的方式进行人机交互的优点而成为人机交互技术中重要的研究方向之一。

例如，可以将手势识别应用到例如AR眼镜等智能设备中，通过该智能设备中的摄像头捕捉包括人手的图像，对该图像进行手分割处理以获取只具有手的图像，之后对该只具有手的图像进行分析可以得知人手的动作(即手势)或提取指尖信息。在该过程中，手分割处理的效果会直接影响到后续特征提取以及识别的准确率。

发明内容

本发明的实施例提供一种图像分割方法、图像分割系统和存储介质及包括其的设备，本发明实施例可以获得高质量的目标物体的图像。

本发明的至少一个实施例提供一种图像分割方法，其包括：从深度图像中获取目标物体所在的连通域；通过主成分分析方法确定所述连通域的主方向或次方向；以及根据所述目标物体的形态与所述主方向或次方向之间的关系，从所述连通域中获取所述目标物体的图像。

例如，所述从深度图像获取目标物体所在的连通域包括：检测所述深度图像中的所有的连通域和每个连通域的同一参数；以及将具有设定参数的连通域作为所述目标物体所在的连通域。

例如，所述同一参数为最小深度值，所述设定参数为最小的最小深度值。

例如，所述图像分割方法还包括：步骤S11，将所述深度图像中的设定像素点作为初始点并添加到设定队列中；步骤S12，确定与所述初始点在空间上相邻的相邻像素点；步骤S13，计算所述相邻像素点与所述初始点之间的深度差的绝对值，其中，在所述深度差的绝对值小于或等于设定深度差的情况下，将所述相邻像素点添加到所述初始点所在的连通域中；步骤S14，将所述相邻像素点作为下一个初始点并添加到所述设定队列中；以及重复上述步骤S12至步骤S14，以确定所述初始点所在的连通域。

例如，所述设定深度差为10mm～15mm。

例如，所述获取目标物体的图像包括：确定所述连通域中的多个位置处的像素点的数量沿所述主方向的变化趋势，其中，每个位置处的像素点沿所述连通域的次方向依次排列，所述次方向垂直于所述主方向；将所述变化趋势与所述目标物体的形态沿所述主方向的变化趋势进行比较；以及根据比较结果在所述连通域中确定用于获取所述目标物体的图像的分割位置。

例如，所述获取目标物体的图像包括：确定所述连通域在多个位置中的每个位置处沿次方向的真实宽度，其中，所述次方向垂直于所述主方向，所述多个位置沿所述主方向依次排列，每个位置处的像素点沿所述次方向依次排列；以及将所述真实宽度与参考宽度进行比较，以在所述连通域中确定用于获取所述目标物体的图像的分割位置。

例如，所述目标物体为人手，所述参考宽度为40mm～100mm。

例如，根据所述每个位置处的像素点的数量、所述每个位置处的像素点的平均深度值以及获取所述深度图像的摄像头的焦距比，确定所述连通域在所述每个位置处的真实宽度。

例如，所述获取目标物体的图像还包括：确定所述多个位置中的每个位置到所述连通域的顶点之间的真实距离；以及将所述真实距离与参考长度进行比较以确定所述分割位置。

例如，所述目标物体为人手，所述参考长度为40mm～200mm。

例如，根据所述每个位置到所述连通域的顶点之间的每相邻的两个位置之间的平均深度的差和沿所述主方向的真实距离，计算所述每个位置到所述连通域的顶点的真实距离。

例如，所述获取目标物体的图像还包括：在所述多个位置中获取多个参考位置；计算每个参考位置处相距最远的两个像素点之间的坐标的差值；以及根据所述差值与所述每个参考位置处的像素点的数量之间的大小关系，确定所述分割位置。

例如，所述多个参考位置包括第一参考位置和第二参考位置，所述第一参考位置处相距最远的两个像素点之间的坐标的差值为大于0的ΔX1，所述第一参考位置处的像素点的数量为N1，在(ΔX1-N1)/N1小于或等于设定值并且所述设定值为10％～15％的情况下，将所述第一参考位置作为所述分割位置。

例如，在所述第二参考位置处相距最远的两个像素点之间的坐标的差值为大于0的ΔX2，所述第二参考位置处的像素点的数量为N2，在(ΔX2-N2)/N2大于所述设定值的情况下，所述分割位置到所述第二参考位置的距离大于设定距离，所述设定距离为24mm～26mm。

本发明的至少一个实施例还提供一种图像分割系统，其包括：第一图像分割装置，其被配置为对深度图像进行处理，以从所述深度图像中获取目标物体所在的连通域；分析装置，其与所述第一图像分割装置连接，并且被配置为通过主成分分析方法确定所述第一图像分割装置获取的所述连通域的主方向或次方向；以及第二图像分割装置，其与所述分析装置连接，并且被配置为根据所述目标物体的形态与所述主方向或次方向之间的关系从所述连通域中获取所述目标物体的图像。

例如，所述第二图像分割装置包括：计算装置，其与所述分析装置连接，并且被配置为计算所述连通域中的多个位置处的像素点的数量、以及确定所述像素点的数量沿所述主方向的变化趋势，其中，每个位置处的像素点沿所述连通域的次方向依次排列，所述次方向垂直于所述主方向；以及比较装置，其与所述计算装置连接，并且被配置为将所述变化趋势与所述目标物体的形态沿所述主方向的变化趋势进行比较，以在所述连通域中确定用于获取所述目标物体的图像的分割位置。

例如，所述第二图像分割装置包括：计算装置，其与所述分析装置连接，并且被配置为计算所述连通域在多个位置中的每个位置处沿次方向的真实宽度，其中，所述次方向垂直于所述主方向，所述多个位置沿所述主方向依次排列，每个位置处的像素点沿所述次方向依次排列；以及比较装置，其与所述计算装置连接，并且被配置为将所述真实宽度与参考宽度进行比较，以在所述连通域中确定用于获取所述目标物体的图像的分割位置。

例如，所述计算装置还被配置为计算所述多个位置中的每个位置到所述连通域的顶点的真实距离，所述比较装置还被配置为将所述真实距离与参考长度进行比较以确定所述分割位置。

本发明的至少一个实施例还提供一种图像分割系统，其包括处理器、存储器、以及存储在所述存储器中的计算机程序指令，在所述计算机程序指令被所述处理器运行时执行：从深度图像中获取目标物体所在的连通域；通过主成分分析方法确定所述连通域的主方向或次方向；以及根据所述目标物体的形态与所述主方向或次方向之间的关系，获取所述目标物体图像。

本发明的至少一个实施例还提供一种存储介质，其中存储有计算机程序指令，所述计算机程序指令适于由处理器加载并执行：从深度图像中获取目标物体所在的连通域；通过主成分分析方法确定所述连通域的主方向或次方向；以及根据所述目标物体的形态与所述主方向或次方向之间的关系，获取所述目标物体图像。

本发明的至少一个实施例还提供一种设备，其包括以上任一项所述的图像分割系统或者以上所述的存储介质。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例的附图作简单地介绍，显而易见地，下面描述中的附图仅仅涉及本发明的一些实施例，而非对本发明的限制。

图1为本发明实施例提供的图像分割方法的流程图；

图2为本发明实施例中深度图像中的像素点p及其邻域的分布示意图；

图3a示意性地示出了本发明实施例中深度摄像头与用户的正面相对的情况下拍摄的深度图像；

图3b示意性地示出了本发明实施例中深度摄像头朝向与用户的正面朝向相同的情况下拍摄的深度图像；

图4为根据本发明实施例得到的手所在连通域的示意图；

图5示意性地示出了根据本发明实施例得到的手所在连通域的边界；

图6示意性地示出了根据本发明实施例得到的手所在连通域的主方向；

图7为本发明实施例中根据手所在连通域的主方向旋转深度图像的坐标系之后得到的新坐标系的示意图；

图8为本发明实施例中的多个参考位置的示意图；

图9为本发明另一实施例中的多个参考位置的示意图；

图10为根据发明实施例得到的手部图像的示意图；

图11为本发明实施例提供的图像分割方法的流程图；

图12为本发明实施例提供的一种图像分割系统的结构框图；

图13为本发明实施例提供的另一种图像分割系统的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例的附图，对本发明实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另外定义，本公开使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

本发明实施例提供一种图像分割方法、图像分割系统和存储介质以及包括该图像分割系统或存储介质的设备。在本发明实施例提供的图像分割方法中，通过从深度图像中获取目标物体所在的连通域，然后通过主成分分析方法确定该连通域的主方向，之后根据该目标物体的形态与该主方向或次方向之间的关系从该连通域中获取该目标物体的图像，能够将目标物体的图像从深度图像中提取出来并且获得高质量的目标物体的图像。

例如，本发明实施例可以用于手势识别中的手分割，在这种情况下，上述目标物体为人手，从而本发明实施例可以获取高质量的手部图像，从而既能使指尖提取的扫描范围缩小并且错误率降低，又能为基于机器学习的手势识别提供精准的测试样本。当然，本发明实施例也可以用于除手势识别之外的任何其他图像分割情况，本发明实施例仅以用于手势识别中的手分割为例进行说明。

如图1所示，本发明的至少一个实施例提供一种图像分割方法，其包括：步骤S1，从深度图像中获取目标物体所在的连通域；步骤S2，通过主成分分析方法确定该连通域的主方向或次方向；以及步骤S3，根据目标物体的形态与该主方向或次方向之间的关系，从所述连通域中获取目标物体的图像，以将目标物体的图像从深度图像中提取出来。

下面结合图2至图5，对步骤S1所述的从深度图像中获取目标物体所在的连通域进行详细说明。

在步骤S1中，深度图像为深度摄像头获取的二维深度图像，该二维深度图像中每个像素点的取值是该像素点到深度摄像头的距离(即深度值)，通常用毫米(mm)作为单位。需要说明的是，深度图像中有的像素点处没有物体，则该像素点的深度值用0表示。对于不为零的深度值，深度值越大，则表示像素点距离摄像头越远。

深度图像的分辨率可以根据实际需要进行设置，这里不做限定。例如，深度图像的分辨率可以为320×240。例如，为了简化计算，可以对深度图像的分辨率进行缩小，例如缩小为160×120。

在步骤S1中，连通域是由相互连通的多个像素点构成的，也就是说，连通域中的每个像素点和在空间上与其相邻的相邻像素点满足相似性规则，例如，该相似性规则为每个像素点和该相邻像素点之间的深度差的绝对值小于或等于设定深度差。例如，在关于目标物体的在空间上相邻的像素点的深度值之间不发生突变的情况下，该设定深度差为10mm～15mm，以获取高质量的目标物体的连通域。以目标物体为人手为例，对于手的连通域而言，在空间上相邻的像素点之间的深度值通常不会发生突变，因此，将设定深度差设置为10mm～15mm，有利于获取高质量的手的连通域。当然，设定深度差的实施例包括但不限于10mm～15mm。

关于两个像素点在空间上相邻，下面结合图2进行说明。

例如，如图2所示，以xoy坐标系中的坐标为(x，y)的像素点p为例，在水平和垂直方向上，像素点p具有4个与其在空间上相邻的相邻像素点，即坐标分别为正上方(x，y+1)、正下方(x，y-1)、正左方(x-1，y)和正右方(x+1，y)的像素点，这4个水平和垂直方向上的相邻像素点构成像素点p的4邻域；在对角方向上，像素点p具有4个与其在空间上相邻的相邻像素点，即坐标分别为左上角(x-1，y+1)、右上角(x+1，y+1)、左下角(x-1，y-1)和右下角(x+1，y-1)的像素点，这4个对角方向上的相邻像素点构成像素点p的对角邻域；此外，上述4邻域和对角邻域构成像素点p的8邻域。像素点p与其4邻域、对角邻域和8邻域中的每个像素点在空间上相邻。

例如，在深度图像包括多个物体并且目标物体距离深度摄像头最近的情况下，步骤S1中的从深度图像中获取目标物体所在的连通域包括：检测深度图像中的所有的连通域和每个连通域的同一参数；以及将具有设定参数的连通域作为目标物体所在的连通域。

例如，所述同一参数为最小深度值，所述设定参数为最小的最小深度值。也就是说，步骤S1中的从深度图像中获取目标物体所在的连通域包括：检测深度图像中的所有的连通域和每个连通域的最小深度值；以及将具有最小的最小深度值的连通域作为目标物体所在的连通域。需要说明的是，每个连通域的最小深度值是指，在该连通域中的所有像素点中，深度值最小的像素点的深度值。

以目标物体为人手为例。图3a示出了深度摄像头与用户的正面相对的情况下拍摄的深度图像；图3b示出了深度摄像头朝向与用户的正面朝向相同的情况下拍摄的深度图像。如图3a和图3b所示，深度图像一般包括多个连通域，由于手距离深度摄像头最近，因此，在深度图像中，手所在的连通域是深度值最小的连通域。据此，可以检测深度图像中的所有的连通域和每个连通域的最小深度值，之后将具有最小的最小深度值的连通域作为手所在的连通域。例如，对于如图3b所示的深度图像，获取的手所在的连通域可以如图4中手的图像所示。

在其它实施例中，也可以根据连通域的除最小深度值之外的其它参数(例如连通域的轮廓形状、长度、面积等)提取目标物体所在的连通域。

例如，本公开的至少一个实施例提供的图像分割方法可以包括以下步骤S11至步骤S14，下面进行详细说明。

步骤S11：将深度图像中的设定像素点作为初始点并添加到设定队列中。

例如，在步骤S11中，该设定像素点由深度图像的处理者选定，或者通过图像处理算法定位。

例如，在步骤S11中，该设定队列为FIFO(First Input First Output)队列，即先入先出队列，在该队列中，先进入的指令先完成并引退，之后才执行第二条指令，以此类推。

步骤S12：确定与该初始点在空间上相邻的相邻像素点。

例如，在该步骤S12中，可以检测该初始点的4邻域或8邻域，以确定与其在空间上相邻的相邻像素点。

步骤S13：计算相邻像素点与初始点之间的深度差的绝对值，并且在深度差的绝对值小于或等于设定深度差的情况下，将该相邻像素点添加到该初始点所在的连通域中。

例如，在步骤S13中，该设定深度差可以为10mm～15mm，例如10mm，13mm或15mm等。

步骤S14：将该相邻像素点作为下一个初始点并添加到该设定队列中，以便于后续对其邻域进行检查。

重复上述步骤S12至步骤S14，直至该设定队列中的每个像素点都处理完毕，从而确定出初始点所在的连通域。按照类似方法检测出深度图像中的所有连通域之后，选出具有最小的最小深度值的连通域，从而检测出目标物体所在的连通域。

例如，在得到目标物体所在的连通域之后，为了简化后续的计算，可以将深度图像的除该连通域内的像素点之外的其余像素点的深度值都设置为空值0。以目标物体为人手为例，如图4所示，除了手所在的连通域内的像素点之外，其余的像素点的深度值都被设置为0。

例如，在检测深度图像中的所有的连通域的同时，也可以检测每个连通域的上、下、左、右边界，之后选出目标物体所在的连通域；也可以在检测出手所在的连通域之后，检测出手所在连通域的边界。以目标物体为人手为例，目标物体所在连通域的边界如图5中的白色矩形框所示。为了简化后续的计算，可以使后续步骤中的计算只在目标物体所在的连通域的边界内进行，而不需对整个深度图像内的像素点进行处理。

下面对步骤S2中所述的通过主成分分析方法确定连通域的主方向或次方向进行详细说明。

主成分分析(Principle Component Analysis，PCA)方法是一种多元统计分析方法，通过线性变换将数据变换到一个新的坐标系中，使在第一个坐标轴上数据的方差达到最大，在第二个坐标轴上数据的方差次大，以此类推；其中，第一坐标轴的方向为主方向(也就是说，主方向为数据的方差最大的方向)，其它坐标轴的方向为次方向(即次方向为数据的方差不是最大的方向)。

例如，以目标物体为人手为例，步骤S1中获取的连通域采用PCA方法获得的主方向可以如图6中的白色直线所示。

下面对步骤S3中所述的根据目标物体的形态与主方向或次方向之间的关系从目标物体所在的连通域中获取目标物体的图像进行详细说明。

目标物体的形态可以是目标物体或者包括该目标物体的物体的轮廓形状、轮廓变化趋势、尺寸、面积或其它参数。以目标物体为人手为例，人手的形态可以为从手臂到手腕逐渐变窄并且从手腕开始向上逐渐变宽这一轮廓变化趋势。因此，可以将手腕位置作为分割位置以从连通域中提取手的图像并去除手臂的图像。在目标物体为其它物体的情况下，可以根据该物体的具体形态寻找合适的分割位置。例如，目标物体为人头，由于人头与人的头部以下的部分在轮廓形状、轮廓变化趋势、长度和面积上都有明显差别，因此，人头的形态可以为人头的轮廓形状、轮廓变化趋势、长度或者面积。

以目标物体为人头为例，目标物体的形态与次方向之间的关系例如为：在从人体的左手侧到右手侧这一次方向上，人体的肩部宽度最大。因此，可以以肩部作为分割位置将人头的图像从人体所在的连通域中提取出来。

下面以目标物体为人手，以根据目标物体的形态与主方向之间的关系从目标物体所在的连通域中获取目标物体的图像为例，对步骤S3进行详细说明。

基于以上人手的形态为从手臂到手腕逐渐变窄并且从手腕开始向上逐渐变宽这一发现，例如，步骤S3中所述的获取目标物体的图像包括：确定目标物体所在的连通域中的多个不同位置处的像素点的数量沿主方向的变化趋势，每个位置处的像素点沿连通域的次方向依次排列，次方向垂直于主方向；将该变化趋势与目标物体的形态沿主方向的变化趋势进行比较；以及根据比较结果在连通域中确定用于获取目标物体的图像的分割位置。由于不同位置处像素点的数量沿主方向的变化趋势反映目标物体的形态沿主方向的变化趋势，因此通过将二者进行比较，可以用于寻找合适的分割位置，以根据该分割位置从连通域中提取只包括目标物体的图像。

像素点的数量沿着主方向的变化趋势并不能反映连通域的实际宽度，为了更准确地确定出分割位置，例如，在至少一个实施例中，步骤S3中所述的获取目标物体的图像可以包括：确定连通域在多个位置中的每个位置处沿次方向的真实宽度，该次方向垂直于主方向，该多个位置沿主方向依次排列，每个位置处的像素点沿次方向依次排列；以及将真实宽度与参考宽度进行比较以在连通域中确定用于获取目标物体的图像的分割位置。

例如，可以先确定出像素点的数量沿着主方向的变化趋势，之后计算出连通域在每个位置处的真实宽度，以确定分割位置；例如，也可以省略确定像素点的数量沿主方向的变化趋势的步骤，根据连通域在所述多个位置处的真实宽度来判断连通域沿主方向的粗细变化趋势并选择真实宽度在参考宽度范围内的位置，以确定分割位置。

例如，在目标物体为人手的情况下，手腕的宽度约为40mm～100mm，因此参考宽度可以设置为40mm～100mm，例如40mm、60mm、80mm或100mm。例如，可以根据每个位置处的像素点的数量、每个位置处的像素点的平均深度值以及获取深度图像的摄像头的焦距比，确定连通域在每个位置处的真实宽度。

例如，为了更准确地确定出分割位置，步骤S3中所述的获取目标物体的图像还包括：确定上述多个位置中的每个位置到连通域的顶点之间的真实距离；以及将该真实距离与参考长度进行比较以确定分割位置。需要说明的是，例如，连通域的顶点可以根据该顶点的坐标与主方向之间的位置关系确定。

例如，在目标物体为人手的情况下，由于人手的长度(从指尖到手腕的长度)为40mm～200mm，因此，参考长度可以设置为40mm～200mm。在真实宽度位于参考宽度范围内的情况下，真实距离在该参考长度范围内的位置可以作为分割位置。

例如，可以根据每个位置到连通域的顶点之间的每相邻的两个位置之间的平均深度的差和该每相邻的两个位置之间的沿主方向的真实距离，计算所述每个位置到连通域的顶点的真实距离。

以目标物体为人手为例，步骤S3所述的获取目标物体的图像例如包括以下步骤S31至步骤S35，下面以结合图7至图10进行说明。

步骤S31：确定手所在的连通域中的多个不同位置处的像素点的数量，该多个不同位置沿主方向依次排列，每个位置处的像素点沿连通域的次方向依次排列，次方向垂直于主方向。

例如，为了简化数据的计算，在确定出手所在的连通域的主方向(例如，定义该主方向大致从上向下，如图7中的白色箭头所示)之后，以该主方向为基准旋转深度图像的原坐标系直到新坐标系(参见如图7所示的直角坐标系XOY)的Y轴与该主方向平行(Y轴的朝向可以与主方向的朝向相同或相反)，在这种情况下，X轴平行于上述次方向(如图7中的白色直线所示)，原深度图像中的所有像素点在新坐标系下都被赋予了一个新的坐标值。

以新坐标系为准，在如图7所示的Y轴的朝向与主方向的朝向相反的情况下，从Y坐标最大的像素点(即连通域的顶点，如图7中圆圈标注的点所示)开始，沿Y坐标减小的方向(如箭头方向所示)，依次统计Y＝k的像素点的数量，例如，k＝k0、k0-1、k0-2、……，其中，k0为连通域的顶点的Y坐标。也就是说，依次统计第一位置Y＝k0的像素点的数量、第二位置Y＝k0-1的像素点的数量、第三位置Y＝k0-2的像素点的数量，以此类推，从而得出多个不同位置处的像素点的数量沿Y轴(即主方向)的变化趋势。在统计出连通域中沿箭头方向所有符合Y＝k位置处的像素点的数量之后，将这些位置处像素点的数量存入数组disData(k)中。disData(k)代表手所在连通域中Y＝k位置处的像素点的数量，例如，disData(k0)代表Y＝k0位置处的像素点的数量，disData(k0-1)代表Y＝k0-1位置处的像素点的数量，以此类推。

简单地说，disData(k)这个数组可以代表二维深度图像中手所在连通域沿主方向的粗细变化趋势，根据该粗细变化趋势，再结合人手的形态沿主方向的变化趋势，可以为寻找手腕、去除手臂提供依据。

步骤S32：确定手所在的连通域在每个位置处沿次方向的真实宽度。

通过步骤S31获取的disData(k)代表的是不同位置处的像素点的数量沿着主方向上的变化，但disData(k)并不能反映手所在连通域的实际宽度。因此，为了更准确地确定出手腕位置，可以计算出手所在连通域在Y＝k处的真实宽度。

例如，为了计算出手所在连通域在Y＝k处的真实宽度，首先计算出手所在连通域内符合Y＝k的所有像素点的深度值的平均值，并将计算出的平均值存入数组aveDepth(k)中。数组aveDepth(k)代表disData(k)中Y＝k位置处的像素点的平均深度值，这个平均深度值可以用来近似代替在Y＝k位置处的像素点到摄像头的平均距离。之后，可以根据以下公式计算出手所在连通域在Y＝k处的真实宽度realDis(k)：

realDis(k)的单位是毫米(mm)。需要说明的是，ratio为摄像头的焦距比，根据摄像头本身确定。

通过realDis(k)的计算公式可以看出，可以根据步骤S31中得到的每个位置处的像素点的数量disData(k)、每个位置处的像素点的平均深度值aveDepth(k)以及获取深度图像的摄像头的焦距比ratio，确定连通域在每个位置处的真实宽度realDis(k)。

例如，通过realDis(k0-1)可以计算出在连通域在Y＝k0-1位置处的真实宽度，通过realDis(k0-2)可以计算出连通域在Y＝k0-2位置处的真实宽度，以此类推，从而可以获取物体沿主方向的真实宽度的变化情况。

步骤S33：确定上述多个位置中的每个位置到连通域的顶点之间的真实距离。

为了进一步准确地获取手腕位置，在通过步骤S32获得代表真实宽度的数组realDis(k)之后，在本步骤S33中还可以获取代表真实长度的数组realLenth(n)。realLength(n)代表Y＝k＝k0-n位置到Y＝k0位置(即连通域的顶点)的真实距离(该距离为3D距离，即在3维空间中的距离)，也就是说，从连通域的顶点开始，在深度图像中沿主方向的长度n对应的真实距离为realLength(n)，其中，设在Y＝k0位置，n＝k0-k0＝0且realLenth(0)＝0。下面对 realLength(n)的计算方法进行如下说明。

计算出每相邻的两个位置Y＝k与Y＝k-1的沿主方向的真实距离(该距离为2D距离)dy(k)：

其中，Y(k)和Y(k-1)分别表示在新坐标系下相邻的沿主方向的两个像素点的Y坐标，即Y(k)为位置Y＝k处像素点的在Y坐标，Y(k-1)为位置Y＝k-1处像素点的在Y坐标。

由于人手的真实长度在很大程度上受深度变化的影响，因此，手所在连通域的真实长度的计算方式不同于其真实宽度的计算方式，需要计算出Y＝k和Y＝k-1这两个相邻位置之间的平均深度的差，即z轴差dz(k)：

dz(k)＝aveDepth(k)-aveDepth(k-1)，

之后，可以通过以下公式计算出连通域中的每个位置到该连通域的顶点的真实距离realLenth(n)数组中的所有元素：

其中，n＝k0-k。

通过以上realLenth(n)的计算公式可以看出，可以根据每个位置到连通域的顶点之间的每相邻的两个位置之间的平均深度的差dz(k)和每相邻的两个位置之间的沿主方向的真实距离dy(k)，得到该每个位置到连通域的顶点的真实距离realLenth(n)；并且，通过以上dy(k)的计算公式可以看出，每相邻的两个位置之间的沿主方向的真实距离dy(k)可以根据各位置处的像素点的平均深度值aveDepth(k)以及获取深度图像的摄像头的焦距比ratio得到。

步骤S34：将步骤S32中得到的每个位置处的真实宽度与手的参考宽度进行比较并结合连通域沿主方向的粗细变化趋势(例如根据将步骤S31中得到的像素点的数量或者步骤S32中得到的真实宽度来确定该变化趋势)，以及将步骤S33中得到的每个位置到连通域的顶点的真实距离与手的参考长度进行比较，以确定出手腕位置(分割位置的一个示例)。

例如，手腕的参考宽度可以设置为40mm～100mm，例如40mm、80mm或100mm。例如，手的参考长度可以设置为40mm～200mm。

在至少一个实施例中，在手的参考长度和参考宽度范围内可能得到多个满足手腕条件的位置(以下称为参考位置)。例如，如图8所示，上方的白色直线所表示的参考位置不适合作为分割位置，下方的白色直线所表示的参考位置可以作为分割位置，这两个参考位置都具备接近手腕宽度和从下至上逐渐变宽的特性且手的截取长度都在手的最小值和最大值范围之内。在这种情况下，可能导致分割错误，例如，可能根据图8中上方的参考位置只得到4个手指。

在研究中，本申请的发明人发现：对于人手来说，在不适合作为分割位置的参考位置(例如图8中上方的参考位置)处，部分相邻的像素点之间存在空值；因此，在计算像素点的数量时，在不适合作为分割位置的参考位置处，手所在连通域中的两个相距最远像素点的坐标相减得到的差值(该差值为正值)明显大于该参考位置处的像素点的数量；然而，在分割位置(如图8中下方的参考位置所示)处，手所在连通域中相距最远的两个像素点的坐标相减得到的差值大致等于该参考位置处的像素点的数量。

基于以上发现，在本发明的至少一个实施例中，步骤S3所述的获取目标物体的图像还包括：在所述多个位置中获取多个参考位置；计算每个参考位置处相距最远的两个像素点之间的坐标的差值(该差值为正值)；以及根据该差值与该每个参考位置处的像素点的数量之间的大小关系，确定分割位置。

例如，所述多个参考位置包括第一参考位置和第二参考位置，第一参考位置处相距最远的两个像素点之间的坐标的差值为ΔX1(ΔX1＞0)，第一参考位置处的像素点的数量为N1，在(ΔX1-N1)/N1小于或等于设定值并且该设定值为10％～15％的情况下，将该第一参考位置作为分割位置。通过这种方式可以从第一、二参考位置中选出分割位置。例如，通过这种方式得出图8中下方的参考位置为分割位置，而上方的参考位置不能作为分割位置。当然，所述的设定值的实施例包括但不限于10％～15％，可以根据实际需要进行设置。

在研究中，本申请的发明人还发现：对于人手来说，在得到至少3个参考位置的情况下，例如第一、二、三参考位置，在通过上述坐标差值与像素点的数量之间的大小关系确定出第二参考位置不适合作为分割位置之后，如果第三参考位置沿主方向到第二参考位置的距离小于或等于设定距离(例如24mm～26mm)，则第三参考位置也不适宜作为分割位置。

也就是说，例如，在本发明的至少一个实施例中，对于上述不能作为分割位置的第二参考位置，假设该第二参考位置处相距最远的两个像素点之间的坐标的差值为ΔX2(ΔX2＞0)，该第二参考位置处的像素点的数量为N2，在(ΔX2-N2)/N2大于上述设定值(例如大于15％)的情况下，沿主方向，到该第二参考位置的距离小于或等于设定距离的第三参考位置(该第三参考位置位于连通域的顶点与第二参考位置之间或者位于该第二参考位置的远离顶点的一侧)不会被选为分割位置，即正确的分割位置到该第二参考位置的距离大于该设定距离。例如，在目标物体为人手的情况下，该设定距离可以为24mm～26mm，例如24mm、25mm或26mm。

以图9为例，图9中示出了4个参考位置，将该4个参考位置从上到下依次编号为1、2、3、4，其中，参考位置1-3都不适合作为分割位置，参考位置4可以作为分割位置。在确定参考位置的过程中，可以沿主方向(即从连通域的顶点开始)，依次对每个参考位置进行判断。例如，可以通过像素点之间的坐标的差值与像素点的数量之比的大小关系确定出参考位置1不适宜作为分割位置；然后，根据参考位置2到参考位置1的距离与设定值之间的大小关系判断出参考位置2也不适宜作为分割位置；之后，根据坐标差值与像素点的数量之间的大小关系判断出参考位置3不适宜作为分割位置，从而得出参考位置4可以作为分割位置。

步骤S35：在通过步骤S34确定出手腕位置之后，根据手腕位置，从手所在的连通域中获取手的图像并去除手臂的图像。例如，可以得到如图11所示的效果较好的手部图像。

综上所述，对于手所在的连通域，例如，本发明的至少一个实施例提供的方法的流程图可概括为图11，即该方法包括：从深度图像中提取连通域，然后通过PCA方法分析出该连通域的主方向，之后计算该连通域的真实宽度和真实长度，最后通过启发性特征判断分割位置以根据该分割位置从连通域中提出手的图像。例如，对于人手来说，如上所述，该启发性特征可以包括：手的参考宽度、手的参考长度、手的连通域沿主方向的粗细变化趋势、不适宜作为分割位置的参考位置处因存在空值而使得在该参考位置处相距最远的像素点的坐标差值与像素点的数量相差较大、到不适宜作为分割位置的参考位置的距离小于或等于设定距离(例如24mm～26mm)的参考位置也不适宜作为分割位置，等等。

本发明的至少一个实施例还提供一种图像分割系统，如图12所示，该系统包括：第一图像分割装置，其被配置为对深度图像进行处理，以从深度图像中获取目标物体所在的连通域；分析装置，其与第一图像分割装置连接，并且被配置为通过主成分分析方法确定第一图像分割装置获取的连通域的主方向或次方向；以及第二图像分割装置，其与分析装置连接，并且被配置为根据目标物体的形态与主方向或次方向之间的关系获取手的图像。

例如，继续如图12所示，第二图像分割装置包括与分析装置连接的计算装置、以及与计算装置连接的比较装置。

例如，计算装置被配置为计算连通域中的多个位置处的像素点的数量、以及确定像素点的数量沿主方向的变化趋势，其中，每个位置处的像素点沿连通域的次方向依次排列，次方向垂直于主方向；相应地，比较装置被配置为将变化趋势与目标物体的形态沿主方向的变化趋势进行比较，以在连通域中确定用于获取目标物体的图像的分割位置。

例如，计算装置被配置为计算连通域在多个位置中的每个位置处沿次方向的真实宽度，该次方向垂直于主方向，该多个位置沿主方向依次排列，每个位置处的像素点沿次方向依次排列；相应地，比较装置被配置为将所述真实宽度与参考宽度进行比较，以在连通域中确定用于获取目标物体的图像的分割位置。例如，在目标物体为人手的情况下，参考宽度可以设置为40mm～100mm，例如40mm、80mm或100mm。

例如，计算装置也可以被配置为既可以确定像素点的数量沿主方向的变化趋势，又可以确定出连通域在每个位置处的沿次方向的真实宽度；相应地，比较装置可以被配置为既将像素点的数量沿主方向的变化趋势与目标物体的形态沿主方向的变化趋势进行比较，又将连通域在每个位置处的真实宽度与参考宽度进行比较，以确定分割位置。

例如，计算装置还被配置为计算所述多个位置中的每个位置到连通域的顶点的真实距离；相应地，比较装置可以将该真实距离与参考长度进行比较，以确定分割位置。例如，在目标物体为人手的情况下，参考长度可以设置为 40mm～200mm。

例如，该图像分割系统还可以包括深度摄像头，其被配置为获取深度图像并且将该深度图像输出给第一图像分割装置。

本发明实施例的图像分割系统中各器件的功能，可参照前述图像分割方法的实施例中的相关描述。

例如，图像分割系统中的第一图像分割装置、分析装置、第二图像分割装置、计算装置和比较装置的具体结构均可对应于处理器，例如，该处理器可以为中央处理器(CPU，Central Processing Unit)、微处理器(MCU，Micro Controller Unit)、数字信号处理器(DSP，Digital Signal Processing)或可编程逻辑器件(PLC，Programmable Logic Controller)等具有处理功能的电子元器件或电子元器件的集合。

另外，在本发明实施例中的上述装置可以全部集成在一个处理器中，或者分别通过不同的处理器实现，或者任意两个或两个以上的装置集成在一个处理器中；上述各装置既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本发明的至少一个实施例还提供另一种图像分割系统，如图12所示，该系统包括：处理器；存储器；以及存储在存储器中的计算机程序指令，在计算机程序指令被处理器运行时执行：从深度图像中获取目标物体所在的连通域；通过主成分分析方法确定连通域的主方向或次方向；以及根据目标物体的形态与主方向或次方向之间的关系，从连通域中获取目标物体的图像。

存储器可以包括只读存储器和随机存取存储器中的至少一个，并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器(NVRAM)。

处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者任何常规的处理器等。

本发明的至少一个实施例还提供一种存储介质，其中存储有计算机程序指令，计算机程序指令适于由处理器加载并执行：从深度图像中获取目标物体所在的连通域；通过主成分分析方法确定所述连通域的主方向或次方向；以及根据目标物体的形态与主方向或次方向之间的关系，获取目标物体图像。

例如，该存储介质可以是半导体存储器、磁表面存储器、激光存储器、随机存储器、只读存储器、串行访问存储器、非永久记忆的存储器、永久性记忆的存储器或者本领域熟知的任何其它形式的存储介质。

例如，处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者任何常规的处理器等。

本发明的至少一个实施例还提供一种设备，其包括以上任一实施例提供的图像分割系统或者以上所述的存储介质。

例如，该设备可以为AR智能眼镜、显示器等人机交互设备，该设备利用其包括的图像分割系统获取包括用户的指令的图像(例如目标物体的图像)，并且通过对该图像进行分析处理，实现人机交互。

上述图像分割方法、图像分割系统和存储介质及包括其的设备的实施例可以互相参照。此外，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。

以上所述仅是本发明的示范性实施方式，而非用于限制本发明的保护范围，本发明的保护范围由所附的权利要求确定。

本申请要求于2016年10月17日递交的中国专利申请第201610905435.X号的优先权，在此全文引用上述中国专利申请公开的内容以作为本申请的一部分。

Claims

一种图像分割方法，包括：

从深度图像中获取目标物体所在的连通域；

通过主成分分析方法确定所述连通域的主方向或次方向；以及

根据所述目标物体的形态与所述主方向或次方向之间的关系，从所述连通域中获取所述目标物体的图像。
根据权利要求1所述的方法，其中，所述从深度图像获取目标物体所在的连通域包括：

检测所述深度图像中的所有的连通域和每个连通域的同一参数；以及

将具有设定参数的连通域作为所述目标物体所在的连通域。
根据权利要求2所述的方法，其中，所述同一参数为最小深度值，所述设定参数为最小的最小深度值。
根据权利要求1至3中任一项所述的方法，还包括：

步骤S11：将所述深度图像中的设定像素点作为初始点并添加到设定队列中；

步骤S12：确定与所述初始点在空间上相邻的相邻像素点；

步骤S13：计算所述相邻像素点与所述初始点之间的深度差的绝对值，其中，在所述深度差的绝对值小于或等于设定深度差的情况下，将所述相邻像素点添加到所述初始点所在的连通域中；

步骤S14：将所述相邻像素点作为下一个初始点并添加到所述设定队列中；以及

重复上述步骤S12至步骤S14，以确定所述初始点所在的连通域。
根据权利要求4所述的方法，其中，所述设定深度差为10mm～15mm。
根据权利要求1至5中任一项所述的方法，其中，所述获取目标物体的图像包括：

确定所述连通域中的多个位置处的像素点的数量沿所述主方向的变化趋势，其中，每个位置处的像素点沿所述连通域的次方向依次排列，所述次方向垂直于所述主方向；

将所述变化趋势与所述目标物体的形态沿所述主方向的变化趋势进行比较；以及

根据比较结果在所述连通域中确定用于获取所述目标物体的图像的分割位置。
根据权利要求1至5中任一项所述的方法，其中，所述获取目标物体的图像包括：

确定所述连通域在多个位置中的每个位置处沿次方向的真实宽度，其中，所述次方向垂直于所述主方向，所述多个位置沿所述主方向依次排列，每个位置处的像素点沿所述次方向依次排列；以及

将所述真实宽度与参考宽度进行比较，以在所述连通域中确定用于获取所述目标物体的图像的分割位置。
根据权利要求7所述的方法，其中，所述目标物体为人手，所述参考宽度为40mm～100mm。
根据权利要求7或8所述的方法，其中，根据所述每个位置处的像素点的数量、所述每个位置处的像素点的平均深度值以及获取所述深度图像的摄像头的焦距比，确定所述连通域在所述每个位置处的真实宽度。
根据权利要求6或7所述的方法，其中，所述获取目标物体的图像还包括：

确定所述多个位置中的每个位置到所述连通域的顶点之间的真实距离；以及

将所述真实距离与参考长度进行比较以确定所述分割位置。
根据权利要求10所述的方法，其中，所述目标物体为人手，所述参考长度为40mm～200mm。
根据权利要求10或11所述的方法，其中，根据所述每个位置到所述连通域的顶点之间的每相邻的两个位置之间的平均深度的差和沿所述主方向的真实距离，计算所述每个位置到所述连通域的顶点的真实距离。
根据权利要求7-12中任一项所述的方法，其中，所述获取目标物体的图像还包括：

在所述多个位置中获取多个参考位置；

计算每个参考位置处相距最远的两个像素点之间的坐标的差值；以及

根据所述差值与所述每个参考位置处的像素点的数量之间的大小关系，确定所述分割位置。
根据权利要求13所述的方法，其中，

所述多个参考位置包括第一参考位置和第二参考位置，所述第一参考位置处相距最远的两个像素点之间的坐标的差值为大于0的ΔX1，所述第一参考位置处的像素点的数量为N1，在(ΔX1-N1)/N1小于或等于设定值并且所述设定值为10％～15％的情况下，将所述第一参考位置作为所述分割位置。
根据权利要求14所述的方法，其中，

在所述第二参考位置处相距最远的两个像素点之间的坐标的差值为大于0的ΔX2，所述第二参考位置处的像素点的数量为N2，在(ΔX2-N2)/N2大于所述设定值的情况下，所述分割位置到所述第二参考位置的距离大于设定距离，所述设定距离为24mm～26mm。
一种图像分割系统，包括：

第一图像分割装置，其被配置为对深度图像进行处理，以从所述深度图像中获取目标物体所在的连通域；

分析装置，其与所述第一图像分割装置连接，并且被配置为通过主成分分析方法确定所述第一图像分割装置获取的所述连通域的主方向或次方向；以及

第二图像分割装置，其与所述分析装置连接，并且被配置为根据所述目标物体的形态与所述主方向或次方向之间的关系从所述连通域中获取所述目标物体的图像。
根据权利要求16所述的系统，其中，所述第二图像分割装置包括：

计算装置，其与所述分析装置连接，并且被配置为计算所述连通域中的多个位置处的像素点的数量、以及确定所述像素点的数量沿所述主方向的变化趋势，其中，每个位置处的像素点沿所述连通域的次方向依次排列，所述次方向垂直于所述主方向；以及

比较装置，其与所述计算装置连接，并且被配置为将所述变化趋势与所述目标物体的形态沿所述主方向的变化趋势进行比较，以在所述连通域中确定用于获取所述目标物体的图像的分割位置。
根据权利要求16所述的系统，其中，所述第二图像分割装置包括：

计算装置，其与所述分析装置连接，并且被配置为计算所述连通域在多个位置中的每个位置处沿次方向的真实宽度，其中，所述次方向垂直于所述主方向，所述多个位置沿所述主方向依次排列，每个位置处的像素点沿所述次方向依次排列；以及

比较装置，其与所述计算装置连接，并且被配置为将所述真实宽度与参考宽度进行比较，以在所述连通域中确定用于获取所述目标物体的图像的分割位置。
根据权利要求17或18所述的系统，其中，所述计算装置还被配置为计算所述多个位置中的每个位置到所述连通域的顶点的真实距离，所述比较装置还被配置为将所述真实距离与参考长度进行比较以确定所述分割位置。
一种图像分割系统，包括：

处理器；

存储器；以及

存储在所述存储器中的计算机程序指令，在所述计算机程序指令被所述处理器运行时执行：

从深度图像中获取目标物体所在的连通域；

通过主成分分析方法确定所述连通域的主方向或次方向；以及

根据所述目标物体的形态与所述主方向或次方向之间的关系，获取所述目标物体图像。
一种存储介质，其中存储有计算机程序指令，所述计算机程序指令适于由处理器加载并执行：

从深度图像中获取目标物体所在的连通域；

通过主成分分析方法确定所述连通域的主方向或次方向；以及

根据所述目标物体的形态与所述主方向或次方向之间的关系，获取所述目标物体图像。
一种设备，包括根据权利要求16-19中任一项所述的图像分割系统或权利要求20所述的图像分割系统或权利要求21所述的存储介质。