WO2019192205A1

WO2019192205A1 - 图像中肢体表示信息的识别方法、装置、设备以及计算机可读存储介质

Info

Publication number: WO2019192205A1
Application number: PCT/CN2018/119083
Authority: WO
Inventors: 闫桂新; 张�浩; 陈丽莉; 楚明磊; 孙剑; 苗京花; 田文红; 董瑞君; 赵斌; 郭子强
Original assignee: 京东方科技集团股份有限公司; 北京京东方光电科技有限公司
Priority date: 2018-04-02
Filing date: 2018-12-04
Publication date: 2019-10-10
Also published as: CN108491820A; US20210365675A1; CN108491820B; US11354925B2

Abstract

一种图像中肢体表示信息的识别方法，包括，对带有肢体的图像，确定出图像中肢体的类骨骼线，再根据该类骨骼线，进行肢体表示信息的识别。还提供了一种图像中肢体表示信息的识别装置、设备以及存储介质。

Description

图像中肢体表示信息的识别方法、装置、设备以及计算机可读存储介质

技术领域

本公开实施例涉及一种图像中肢体表示信息的识别方法、装置、设备以及计算机可读存储介质。

背景技术

随着虚拟现实技术的快速发展，人们在生活中看到的虚拟现实设备越来越多。每一种设备都有其独到的特点，或是着重沉浸感，或是着重交互性等。

对于人机交互，人们也在不断探索着更符合人类交流习惯的交互方式。常见的人机交互设备有：鼠标、键盘、打印机、素描版等。这些是借助硬件设备实现。

发明内容

根据本公开的至少一个实施例，提供了一种图像中肢体表示信息的识别方法，包括：确定出图像中肢体的类骨骼线；根据所述类骨骼线，进行肢体表示信息的识别。

例如，所述肢体表示信息包括：躯干、肢体、头颈、手、足之一的姿势状态或组合而成的姿势状态。

例如，所述确定出图像中肢体的类骨骼线，包括：确定出图像中肢体的中线，根据所述中线确定所述肢体的类骨骼线。

例如，所述确定出图像中肢体的类骨骼线，包括：获取图像中肢体的二值图的轮廓；根据方向梯度和所述肢体的二值图的轮廓，确定出图像中肢体的类骨骼线。

例如，所述获取图像中肢体的二值图的轮廓，包括：根据肢体的颜色特征选取相应的色度分量进行分割，确定图像中肢体的二值图；从所述肢体的二值图中提取肢体的二值图的轮廓。

例如，在所述根据肢体的颜色特征选取相应的色度分量进行分割前，将图像从RGB颜色表示方法转换为YCrCb颜色表示方法。

例如，所述肢体包括手，所述获取图像中肢体的二值图的轮廓还包括：对图像进行降噪处理；通过掌心识别，确定图像中存在手。

例如，所述根据方向梯度和所述肢体的二值图的轮廓，确定出图像中肢体的类骨骼线，包括：基于所述肢体的二值图的轮廓中的每个轮廓点(x,y)，确定类骨骼线中的点；基于所述类骨骼线中的点确定所述类骨骼线。

例如，基于所述肢体的二值图的轮廓中的每个轮廓点(x,y)，确定类骨骼线中的点包括：确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点；在两个轮廓点均是边界点的情况下，确定这两个边界点的中点；确定所述中点是否在所述肢体的二值图的轮廓内；在所述中点在所述肢体的二值图的轮廓内的情况下，确定所述中点为类骨骼线中的点。

例如，确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点包括：对所述肢体的二值图的轮廓中的每个轮廓点(x,y)，按照y值进行归类，对轮廓中相同的y值，归类为序列seq _y(x ₁,x ₂,...)，得到：

S(y)＝{seq _yi(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}；

每个序列按照x值的大小进行排列，得到

S'(y)＝{seq _yi(x _yi,1’,x _yi,2’,...)|yi∈(1,...,h),x _i’∈(1,...,w)}；

在相同y值所对应的序列中，基于序列中的两个点的方向梯度，判断这两个点是否是边界点。

例如，在相同y值所对应的序列中，基于序列中的两个点的方向梯度，判断这两个点是否是边界点包括：在相同y值所对应的序列中，取前两个点x _yi,1’，x _yi,2’，按照x _yi,1’和x _yi,2’两点的方向梯度，判断这两个点是否为边界点；若两点都不是边界点，则将这两点从序列中去除并重新取点；若有一点不是边界点，则将这一点从序列中去除并重新取点；直到判断两者皆为边界点。

例如，确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点还包括：在相同y值所对应的序列中，删除少于两个点的序列。

例如，当两个轮廓点均是边界点时，确定这两个边界点的中点包括：基于公式x _yi,med1＝(x _yi,1’+x _yi,2’)/2确定两个点的中点；确定所述中点是否在所述肢体的二值图的轮廓内包括：若所述中点在肢体的二值图的轮廓内，则将此点记录到新的序列lines_seq中，删除x _yi,1’和x _yi,2’，若所述中点不在肢体的二值图的轮廓内，则重新取点。

例如，所述根据所述类骨骼线，进行肢体表示信息的识别，包括：剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体；根据图像中通过类骨骼线表示的肢体，进行肢体表示信息的识别。

例如，所述剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，包括：确定每条类骨骼线中的像素点个数；将像素个数小于设定阈值的类骨骼线去除，得到通过类骨骼线表示的肢体。

例如，确定每条类骨骼线中的像素点个数包括：所有类骨骼线的集合表示为：

skeLines(L)＝{L ₁:{(x _y1,1,y1)},L ₂:{(x _y1,2,y1)},...}，

其中，L ₁,L ₂,...分别表示一条类骨骼线，(x _y1,1,y1),(x _y1,1,y1),...分别表示组成该条类骨骼线的像素点；

类骨骼线的所有点表示为：

ske(y)＝{lines_seq(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}

对ske(y)中每个序列，统计skeLines(L)中类骨骼线的个数N，统计每条类骨骼线像素点的个数P，确定每条类骨骼线的像素个数p ₁,p ₂,...,p _N，每条类骨骼线最后一个像素点表示为L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)。

例如，所述剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，还包括：取ske(y)第一个序列，将其中的点作为类骨骼线的起点，起点数与序列中元素数相同，从ske(y)第二个序列开始遍历所有序列。

例如，遍历序列包括：从当前序列第一个元素开始，遍历当前序列，获取L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)中与当前元素距离最近的点(x ^*,y ^*)，相应的类骨骼线记为L _*(p _*)，(x ^*,y ^*)和L _*(p _*)的距离小于设定值时，将(x ^*,y ^*)增加到类骨骼线L _*的末尾；(x ^*,y ^*)和L _*(p _*)的距离不小于设定值时，将(x ^*,y ^*)作为新的类骨骼线起点，为skeLines(L)增加新的类骨骼线。

根据本公开的至少一个实施例，提供了一种图像中肢体表示信息的识别装置，包括：确定单元，配置成确定出图像中肢体的类骨骼线；识别单元，配置成根据所述类骨骼线，进行肢体表示信息的识别。

根据本公开的至少一个实施例，提供了一种图像中肢体表示信息的识别设备，包括处理器和存储器；其中：所述存储器包含可由所述处理器执行的指令，所述处理器执行所述指令时执行前述方法。

根据本公开的至少一个实施例，提供了一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现前述方法。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1为本公开实施例提供的图像中肢体表示信息的识别方法流程图；

图2为本公开实施例提供的待识别图像示意图；

图3为本公开实施例提供的手势二值图示意图；

图4为本公开实施例提供的手势二值图轮廓示意图；

图5为本公开实施例提供的类骨骼线示意图；

图6为本公开实施例提供的类骨骼线表示的手势图示意图；

图7为本公开实施例提供的图像中肢体表示信息的识别装置结构示意图；

图8为本公开实施例提供的图像中肢体表示信息的识别设备结构示意图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与发明相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

本公开的发明人意识到，对于便携性来说，传统的鼠标、键盘等设备难于满足实时性使用要求。对于虚拟现实来说，其操作方式也不方便。

与之相比，基于视觉的肢体表示信息的识别有效的克服了上述缺点。在虚拟现实设备上安置摄像头可以实现肢体识别交互，降低了硬件成本和软件成本。

表征肢体对肢体表示信息识别是重要的。肢体表示本质上其实是一种特征的表示。以手势为例，在双目摄像头的识别中将手势表征为26个自由度，硬件和软件开发成本较高。

在发明人所知的技术中，肢体表示信息的识别多为通过对视频帧进行外轮廓提取来进行，使用轮廓的周长和面积作为判别依据来识别肢体表示信息。这种方法的误差较大，当肢体在镜头前向四周及前后运动时，识别率也比较低。

请参考图1，本公开实施例提供的图像中肢体表示信息的识别方法，包括：

步骤S101、确定出图像中肢体的类骨骼线；

步骤S102、根据所述类骨骼线，进行肢体表示信息的识别。

例如，肢体表示信息包括：躯干、肢体、头颈、手以及足中之一的姿势状态或任意组合而成的姿势状态。

该方法通过识别类骨骼线来实现肢体表示信息的识别，无需通过轮廓的周长和面积进行肢体表示信息的识别，其识别误差较小，识别率较高，而且通过单一摄像头即可实现该肢体表示信息的识别，对设备要求较低。

通过该方法，可以较好的识别出用户的肢体语言表达的信息，从而可以进一步根据肢体语言表达的信息执行命令或者翻译成其它语言。

在一些实施例中，所述方法用来对视频帧的图像中的肢体进行识别。通过多个视频帧识别出肢体的变化，从而从肢体变化中识别出肢体表示的信息。

对于一段视频来讲，可以对每个视频帧进行识别，也可以对其中明显具有肢体的视频帧进行识别，还可以每隔设定数量个视频帧进行一次识别，当然，对每个视频帧进行识别时，其准确率较高，计算量也较大。

本公开的实施例中的类骨骼线，可以是模拟类比身体或身体部位内部的骨骼的线条。

在一些实施例中，类骨骼线为简洁单线条，例如，每根手指、每只手臂、每个躯干只对应一条类骨骼线。

在一些实施例中，通过确定肢体的中线的方式，确定类骨骼线。

例如，步骤S101中，确定出图像中肢体的类骨骼线，包括：

确定出图像中肢体的中线，根据所述中线确定所述肢体的类骨骼线。

在一些实施例中，步骤S101中，确定出图像中肢体的类骨骼线，包括：

获取图像中肢体的二值图的轮廓；

根据方向梯度和所述肢体的二值图的轮廓，确定出图像中肢体的类骨骼线。

例如，在提取肢体的二值图轮廓时，可以根据图像中肢体的颜色来选取对应的相应的色度分量进行分割，确定图像中肢体的二值图，选取跟肢体的颜色相接近的颜色的相应的色度分量，可以使得二值图轮廓的提取准确率更高。

在一些实施例中，步骤S101，获取图像中肢体的二值图的轮廓，包括：

根据肢体的颜色特征选取相应的色度分量进行分割，确定图像中肢体的二值图；

从肢体的二值图中提取肢体的二值图的轮廓。

例如，对于手势来讲，可以根据图像的Cr通道进行ostu分割，确定手势二值图，进而提取手势二值图轮廓，由于Cr通道适合表示人体肤色，所以通过对Cr通道进行ostu分割，确定手势二值图，再提取手势二值图轮廓，其准确率较高。

通常，视频帧的图像格式为RGB格式，为了把手的区域分割出来，使用适合不同肤色和不同光照条件的可靠的肤色模型较佳，而常用的RGB表示方法并不适合于皮肤模型。

在一些实施例，选用YCrCb空间作为肤色分布统计的映射空间，该空间的优点是受亮度变化的影响较小，而且是两维独立分布，能较好地限制肤色分布区域，此时，在根据肢体的颜色特征选取相应的色度分量进行分割前，还需要对图像进行颜色转换，颜色转换可以采用下面公式：

将YCrCb格式的图像进行色彩通道分割，即可分别得到Y、Cr和Cb三个通道的图像。其中“Y”表示明亮度(Luminance或Luma)，也就是灰阶值；Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异。而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之间的差异。考虑到人的肤色纹理特性更接近红色，因此选用Cr分量用作分割，使用otsu算法(即大津法或最大类间方差法)对Cr通道进行分割，得到二值图。手势作为前景以白色表示，背景以黑色表示，如图2所示的图像，即可得到如图3所示的二值图，本公开实施例中，使用otsu算法是因为其对图像二值化处理的较好。

对得到的二值图进行轮廓查找，根据掌心位置筛选出最大的轮廓作为手势轮廓，如图4所示。

在一些实施例中，肢体为手，为提高识别准确度，以及避免对不存在手的图像进行识别，减小系统工作量。在获取图像中肢体的二值图的轮廓之前，还包括：

对图像进行降噪处理；

通过掌心识别，确定图像中存在手。

同样的，当肢体为手臂、下肢或身体时，也可以通过相应的识别，预先确定图像中存在该肢体，再进一步进行识别，从而减少计算量。

对于降噪处理的图像，过滤了例如的噪声，更有利于肢体的识别，提高识别准确度，降噪处理时，可以根据图像中噪声的类型，选择合适的方式降噪，例如，对于一般图像中的椒盐噪声，可以通过中值滤波来去除，降噪处理后的图像为：

使用中值滤波去除椒盐噪声。公式为

f(x,y)＝med{I(x-k,y-l),(k,l∈W)}

例如，f(x,y)表示处理后的图像，W一般为3*3或5*5的二维模板。

进而再通过掌心检测判断图像f(x,y)中是否存在掌心，若存在掌心，则可以确定图像中存在手，获取例如手势二值图的轮廓，否则可以确定图像中不存在手，则进行下一帧图像的判断。

例如，根据方向梯度和肢体的二值图的轮廓，确定出图像中肢体的类骨骼线可以包括，基于肢体的二值图的轮廓中的每个轮廓点(x,y)，确定类骨骼线中的点；基于类骨骼线中的点确定所述类骨骼线。

例如，基于所述肢体的二值图的轮廓中的每个轮廓点(x,y)，确定类骨骼线中的点包括：确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点；当两个轮廓点均是边界点时，确定这两个边界点的中点；确定所述中点是否在所述肢体的二值图的轮廓内；当所述中点在所述肢体的二值图的轮廓内，则确定所述中点为类骨骼线中的点。

S(y)＝{seq _yi(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}；

每个序列按照x值的大小进行排列，得到

例如，在相同y值所对应的序列中，基于序列中的两个点的方向梯度，判断这两个点是否是边界点包括：在相同y值所对应的序列中，取前两个点x _yi,1’，x _yi,2’，按照x _yi,1’和x _yi,2’两点的方向梯度，判断这两个点是否为边界点，若两点都不是边界点，则将这两点从序列中去除并重新取点，若有一点不是边界点，则将这一点从序列中去除并重新取点，直到判断两者皆为边界点。

例如，确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点还包括：在相同y值所对应的序列中，若序列中的点少于两个则删除此序列。

例如，当两个轮廓点均是边界点时，确定这两个边界点的中点包括：基于公式x _yi,med1＝(x _yi,1’+x _yi,2’)/2确定两个点的中点。确定所述中点是否在所述肢体的二值图的轮廓内包括：若所述中点在肢体的二值图的轮廓内，则将此点记录到新的序列lines_seq中，删除x _yi,1’和x _yi,2’，若所述中点不在肢体的二值图的轮廓内，则重新取点。

基于上述，在一些实施例中，根据方向梯度和肢体的二值图的轮廓，确定出图像中肢体的类骨骼线包括：

对肢体的二值图的轮廓中的每个轮廓点(x,y)按照y值进行归类，对轮廓中相同的y值，归类为序列seq _y(x ₁,x ₂,...)，得到：

S(y)＝{seq _yi(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}；

每个序列按照x值的大小进行排列，得到

S'(y)＝{seq _yi(x _yi,1’,x _yi,2’,...)|yi∈(1,...,h),x _i’ ∈(1,...,w)}；

在任意y _i值所对应的序列中，若序列中的点少于两个则删除此序列，否则，取前两个点x _yi,1’，x _yi,2’，按照x _yi,1’和x _yi,2’两点的方向梯度，判断这两个点是否为边界点，若两点都不是边界点，则将这两点从序列中去除并重新取点，若有一点不是边界点，则将这一点从序列中去除并重新取点，直到判断两者皆为边界点，确定两个点的中点x _yi,med1＝(x _yi,1’+x _yi,2’)/2，若中点在肢体的二值图的轮廓内，则将此点记录到新的序列lines_seq中，删除x _yi,1’和x _yi,2’，若中点不在肢体的二值图的轮廓内，则重新取点；

若lines_seq存在元素，则表示此y _i对应的序列存在类骨骼线的点，保存此y _i，若没有元素，则删除此y _i；

遍历y _i的所有值，即可得到类骨骼线的所有点：

ske(y)＝{lines_seq(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}。

如图2所示的图像，其类骨骼线如图5所示。

例如，在步骤S102，进行肢体表示信息的识别前，可以剔除类骨骼线中不符合预设要求的点，从而避免不符合预设要求的点造成干扰而进行误判，进而使得肢体表示信息的识别更加准确。

例如，在步骤S102，根据所述类骨骼线，进行肢体表示信息的识别，包括：剔除类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体；根据各个图像帧中通过类骨骼线表示的肢体，进行肢体表示信息的识别。

在一些实施例中，剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体包括：确定每条类骨骼线中的像素点个数；将像素个数小于设定阈值的类骨骼线去除，得到通过类骨骼线表示的肢体。

例如，确定每条类骨骼线中的像素点个数可以以下述方式实现。所有类骨骼线的集合表示为：

skeLines(L)＝{L ₁:{(x _y1,1,y1)},L ₂:{(x _y1,2,y1)},...}，

对每个序列，统计skeLines(L)中类骨骼线的个数N，统计每条类骨骼线像素点的个数P，确定每条类骨骼线的像素个数p ₁,p ₂,...,p _N，每条类骨骼线最后一个像素点表示为L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)。

在一些实施例中，所述剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，还包括：取ske(y)第一个序列，将其中的点作为类骨骼线的起点，起点数与序列中元素数相同，从ske(y)第二个序列开始遍历所有序列。

在一些实施例中，遍历序列可以包括：从当前序列第一个元素开始，遍历当前序列，获取L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)中与当前元素距离最近的点(x ^*,y ^*)，相应的类骨骼线记为L _*(p _*)，(x ^*,y ^*)和L _*(p _*)的距离小于设定值时，将(x ^*,y ^*)增加到类骨骼线L _*的末尾，否则，将(x ^*,y ^*)作为新的类骨骼线起点，为skeLines(L)增加新的类骨骼线。

一些实施例，剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，包括：

取ske(y)第一个序列，将例如的点作为类骨骼线的起点，起点数与序列中元素数相同，每条类骨骼线是一组像素点的集合，则所有类骨骼线的集合表示为：

skeLines(L)＝{L ₁:{(x _y1,1,y1)},L ₂:{(x _y1,2,y1)},...}，

例如，L ₁,L ₂,...分别表示一条类骨骼线，(x _y1,1,y1),(x _y1,1,y1),...分别表示组成该条类骨骼线的像素点；

从ske(y)第二个序列开始遍历所有序列，对每个序列，统计skeLines(L)中类骨骼线的个数N，统计每条类骨骼线像素点的个数P，确定每条类骨骼线的像素个数p ₁,p ₂,...,p _N，每条类骨骼线最后一个像素点表示为L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)；

从当前序列第一个元素开始，遍历当前序列，获取L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)中与当前元素距离最近的点(x ^*,y ^*)，相应的类骨骼线记为L _*(p _*)，(x ^*,y ^*)和L _*(p _*)的距离小于设定值时，将(x ^*,y ^*)增加到类骨骼线L _*的末尾，否则，将(x ^*,y ^*)作为新的类骨骼线起点，为skeLines(L)增加新的类骨骼线；

去除skeLines(L)中像素个数小于设定阈值的类骨骼线，得到通过类骨骼线表示的肢体：

x _ik∈(1,...,w),j∈(1,...,h)。

如图2所示的图像，其手势图如图6所示。

可见，本公开实施例识别出图像中的类骨骼线，可以通过类骨骼线较清楚的表示各种肢体，特征更为丰富，识别率大大提升，为进一步识别肢体表示信息提供可靠依据。

应当注意，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。相反，流程图中描绘的步骤可以改变执行顺序。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本公开实施例还提供一种图像中肢体表示信息的识别装置，该装置与前述实施例中的识别方法对应，为了说明书的简洁，以下仅作简要描述，具体实施方式参见前述实施例。如图7所示，识别装置包括：

确定单元701，用于确定出图像中肢体的类骨骼线；

识别单元702，用于根据类骨骼线，进行肢体表示信息的识别。

上述确定单元701和识别单元702是功能实体，可以通过软件，硬件或固件来实现，例如通过处理器执行程序代码或被设计为执行对应功能的可编程逻辑电路来实现。

例如，肢体表示信息包括：躯干、肢体、头颈、手以及足之一的姿势状态或任意组合而成的姿势状态。

例如，确定单元701具体用于：

获取图像中肢体的二值图的轮廓；

根据方向梯度和肢体的二值图的轮廓，确定出图像中肢体的类骨骼线。

例如，确定单元701获取图像中肢体的二值图的轮廓，包括：

从所述肢体的二值图中提取肢体的二值图的轮廓。

例如，当肢体具体为手时，确定单元701还用于：

获取图像中肢体的二值图的轮廓之前，对图像进行降噪处理；以及

通过掌心识别，确定图像中存在手。

例如，确定单元701根据方向梯度和所述肢体的二值图的轮廓，确定出图像中肢体的类骨骼线，包括：

S(y)＝{seq _yi(x _yi,1’,x _yi,2’,...)|yi∈(1,...,h),x _i∈(1,...,w)}；

每个序列按照x值的大小进行排列，得到

遍历y _i的所有值，即可得到类骨骼线的所有点：

ske(y)＝{lines_seq(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}。

例如，识别单元702具体用于：

剔除类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体；

根据各个图像帧中通过类骨骼线表示的肢体，进行肢体表示信息的识别。

例如，识别单元702剔除类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，包括：

取ske(y)第一个序列，将例如的点作为类骨骼线的起点，起点数与序列中元素数相同，则所有类骨骼线的集合表示为：

skeLines(L)＝{L ₁:{(x _y1,1,y1)},L ₂:{(x _y1,2,y1)},...}，

例如，x _ik∈(1,...,w),j∈(1,...,h)。

应当理解，该装置中记载的诸单元或模块与参考图1描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作和特征同样适用于该装置及其中包含的单元，在此不再赘述。该装置可以预先实现在电子设备的浏览器或其他安全应用中，也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。该装置中的相应单元可以与电子设备中的单元相互配合以实现本公开实施例的方案。

此外，在本公开实施例中，还提供了一种图像中肢体表示信息的识别设备，包括处理器和存储器；所述存储器包含可由所述处理器执行的指令，所述处理器执行所述指令时执行前述实施例任一所述的方法。

下面参考图8，其示出了适于用来实现本公开实施例的终端设备或服务器的计算机系统的结构示意图。

如图8所示，计算机系统包括处理器801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有系统操作所需的各种程序和数据。处理器801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本公开的实施例，上文参考图1描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行图1的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中，例如，可以描述为：一种处理器包括XX单元、YY单元以及ZZ单元。例如，这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定，例如，XX单元还可以被描述为“用于XX的单元”。

作为另一方面，本公开还提供了一种计算机可读存储介质，在存储介质中的指令被执行时实现前述实施例中的方法。该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质；也可以是单独存在，未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序，所述程序被一个或者一个以上的处理器用来执行描述于本公开的公式输入方法。

在本公开的实施例中，处理器可以是中央处理单元(CPU)或者现场可编程逻辑阵列(FPGA)或者单片机(MCU)或者数字信号处理器(DSP)或者专用集成电路(ASIC)等具有数据处理能力和/或程序执行能力的逻辑运算器件。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

本申请要求于2018年4月2日递交的中国专利申请第201810283309.4号的优先权，在此全文引用上述中国专利申请公开的内容以作为本公开的一部分。

Claims

一种图像中肢体表示信息的识别方法，包括：

确定出图像中肢体的类骨骼线；

根据所述类骨骼线，进行肢体表示信息的识别。
根据权利要求1所述的方法，其中，所述肢体表示信息包括：躯干、肢体、头颈、手、足之一的姿势状态或组合而成的姿势状态。
如权利要求1或2所述的方法，其中，所述确定出图像中肢体的类骨骼线，包括：

确定出图像中肢体的中线，根据所述中线确定所述肢体的类骨骼线。
如权利要求1-2任一所述的方法，其中，所述确定出图像中肢体的类骨骼线，包括：

获取图像中肢体的二值图的轮廓；

根据方向梯度和所述肢体的二值图的轮廓，确定出图像中肢体的类骨骼线。
如权利要求4所述的方法，其中，所述获取图像中肢体的二值图的轮廓，包括：

根据肢体的颜色特征选取相应的色度分量进行分割，确定图像中肢体的二值图；

从所述肢体的二值图中提取肢体的二值图的轮廓。
根据权利要求5所述的方法，其中，在所述根据肢体的颜色特征选取相应的色度分量进行分割前，将图像从RGB颜色表示方法转换为YCrCb颜色表示方法。
如权利要求5或6所述的方法，其中，所述肢体包括手，所述获取图像中肢体的二值图的轮廓还包括：

对图像进行降噪处理；

通过掌心识别，确定图像中存在手。
如权利要求4-7任一所述的方法，其中，所述根据方向梯度和所述肢体的二值图的轮廓，确定出图像中肢体的类骨骼线，包括：

基于所述肢体的二值图的轮廓中的每个轮廓点(x,y)，确定类骨骼线中的点；

基于所述类骨骼线中的点确定所述类骨骼线。
根据权利要求8所述的方法，其中，基于所述肢体的二值图的轮廓中的每个轮廓点(x,y)，确定类骨骼线中的点包括：

确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点；

在两个轮廓点均是边界点的情况下，确定这两个边界点的中点；

确定所述中点是否在所述肢体的二值图的轮廓内；

在所述中点在所述肢体的二值图的轮廓内的情况下，确定所述中点为类骨骼线中的点。
根据权利要求9所述的方法，其中，确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点包括：

对所述肢体的二值图的轮廓中的每个轮廓点(x,y)，按照y值进行归类，对轮廓中相同的y值，归类为序列seq _y(x ₁,x ₂,...)，得到：

S(y)＝{seq _yi(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}；

每个序列按照x值的大小进行排列，得到

S'(y)＝{seq _yi(x _yi,1’,x _yi,2’,...)|yi∈(1,...,h),x _i’∈(1,...,w)}；

在相同y值所对应的序列中，基于序列中的两个点的方向梯度，判断这两个点是否是边界点。
根据权利要求10所述的方法，其中，在相同y值所对应的序列中，基于序列中的两个点的方向梯度，判断这两个点是否是边界点包括：

在相同y值所对应的序列中，取前两个点x _yi,1’，x _yi,2’，按照x _yi,1’和x _yi,2’两点的方向梯度，判断这两个点是否为边界点；

若两点都不是边界点，则将这两点从序列中去除并重新取点；

若有一点不是边界点，则将这一点从序列中去除并重新取点；

直到判断两者皆为边界点。
根据权利要求10或11所述的方法，其中，确定所述肢体的二值图的轮廓中的所有轮廓点中的两个轮廓点是否均是边界点还包括：

在相同y值所对应的序列中，删除少于两个点的序列。
根据权利要求9-12任一权利要求所述的方法，其中，当两个轮廓点均是边界点时，确定这两个边界点的中点包括：

基于公式x _yi,med1＝(x _yi,1’+x _yi,2’)/2确定两个点的中点；

确定所述中点是否在所述肢体的二值图的轮廓内包括：

若所述中点在肢体的二值图的轮廓内，则将此点记录到新的序列lines_seq中，删除x _yi,1’和x _yi,2’，若所述中点不在肢体的二值图的轮廓内，则重新取点。
如权利要求8-13任一所述的方法，其中，所述根据所述类骨骼线，进行肢体表示信息的识别，包括：

剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体；

根据图像中通过类骨骼线表示的肢体，进行肢体表示信息的识别。
如权利要求14所述的方法，其中，所述剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，包括：

确定每条类骨骼线中的像素点个数；

将像素个数小于设定阈值的类骨骼线去除，得到通过类骨骼线表示的肢体。
根据权利要求15所述的方法，其中，确定每条类骨骼线中的像素点个数包括：所有类骨骼线的集合表示为：

skeLines(L)＝{L ₁:{(x _y1,1,y1)},L ₂:{(x _y1,2,y1)},...}，

其中，L ₁,L ₂,...分别表示一条类骨骼线，(x _y1,1,y1),(x _y1,1,y1),...分别表示组成该条类骨骼线的像素点；

类骨骼线的所有点表示为：

ske(y)＝{lines_seq(x _yi,1,x _yi,2,...)|yi∈(1,...,h),x _i∈(1,...,w)}

对ske(y)中每个序列，统计skeLines(L)中类骨骼线的个数N，统计每条类骨骼线像素点的个数P，确定每条类骨骼线的像素个数p ₁,p ₂,...,p _N，每条类骨骼线最后一个像素点表示为L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)。
根据权利要求16所述的方法，其中，所述剔除所述类骨骼线中不符合预设要求的点，得到通过类骨骼线表示的肢体，还包括：

取ske(y)第一个序列，将其中的点作为类骨骼线的起点，起点数与序列中元素数相同，从ske(y)第二个序列开始遍历所有序列。
根据权利要求17所述的方法，其中，遍历序列包括：

从当前序列第一个元素开始，遍历当前序列，获取L ₁(p ₁),L ₂(p ₂),...,L _N(p _N)中与当前元素距离最近的点(x ^*,y ^*)，相应的类骨骼线记为L _*(p _*)；

(x ^*,y ^*)和L _*(p _*)的距离小于设定值时，将(x ^*,y ^*)增加到类骨骼线L _*的末尾；

(x ^*,y ^*)和L _*(p _*)的距离不小于设定值时，将(x ^*,y ^*)作为新的类骨骼线起点，为skeLines(L)增加新的类骨骼线。
一种图像中肢体表示信息的识别装置，包括：

确定单元，配置成确定出图像中肢体的类骨骼线；

识别单元，配置成根据所述类骨骼线，进行肢体表示信息的识别。
根据权利要求19所述的装置，其中，所述肢体表示信息包括：躯干、肢体、头颈、手、足之一的姿势状态或组合而成的姿势状态。
一种图像中肢体表示信息的识别设备，包括处理器和存储器；其中：

所述存储器包含可由所述处理器执行的指令，所述处理器执行所述指令时执行如权利要求1-18任一所述的方法。
一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求1-18任一所述的方法。