WO2020037594A1

WO2020037594A1 - 一种基于高光谱成像的手势识别方法及装置

Info

Publication number: WO2020037594A1
Application number: PCT/CN2018/101917
Authority: WO
Inventors: 王星泽; 李梓彤; 蒲庆; 舒远; 阮思纯; 徐炜文
Original assignee: 合刃科技（深圳）有限公司
Priority date: 2018-08-23
Filing date: 2018-08-23
Publication date: 2020-02-27
Also published as: CN109196518A; CN109196518B

Abstract

一种基于高光谱成像的手势识别方法及装置，其中，手势识别方法包括：通过高光谱成像系统(30)采集处于可见光源(10)和红外光源(20)共同照射下的手势的图像，获得高光谱图像(S100)；对多通道高光谱图像进行目标特征融合，形成单通道图像(S200)；对单通道图像去噪处理，得到去噪图像(S300)；通过图像识别和动作追踪算法对去噪图像进行识别，获取手势识别结果(S400)。通过同时采集可见光波段和红外光波段的手势图像信息，在手势识别中对多通道高光谱图像进行目标特征的有效融合，使得目标特征区域对比度增强，从而有效地进行图像分割，提取手的轮廓信息进行后续的手势识别，有助于提高手势识别的准确性和有效性。

Description

一种基于高光谱成像的手势识别方法及装置

技术领域

本发明属于手势识别技术领域，具体涉及一种基于高光谱成像的手势识别方法，同时涉及一种基于高光谱成像的手势识别装置。

背景技术

在计算机科学中，手势识别是通过数学算法来识别人类手势的一个议题。用户可以使用简单的手势来控制设备或与设备交互，让计算机理解人类的行为。其核心技术为手势分割算法、手势分析算法以及手势识别算法。

随着图像识别和动作追踪的技术的不断成熟，越来越多的设备都可以通过手势进行操作和交互。相比于传统鼠标键盘输入，手势操作更加方便，交互种类更加多样，交互过程更加直观。当今市场已出现多款通过手势控制的商用产品，比如微软的Kinect，谷歌的Google Glass，Leap Motion。用户对交互多样性的要求正在不断提升，手势识别的引用范围也会越来越广。

一般的手势识别过程为：图像采集，特征提取，分类匹配。目前常见产品大多都是基于可见光的识别系统，缺少其他波段光的成像结果，一旦使用场景过暗或者背景与手比较相似，信噪比较高，其识别的准确性和有效性都大大下降。即使使用主动红外成像设备，也有可能因为采集设备敏感程度过高而产生过曝和噪点的问题，影响之后识别效果。

技术问题

为解决现有技术中基于可见光的识别系统准确性和有效性不足的问题，本发明公开了一种基于高光谱成像的手势识别方法，以提高准确性和有效性；同时相应公开一种基于高光谱成像的手势识别装置。

技术解决方案

本发明公开的一种基于高光谱成像的手势识别方法，包括以下步骤：

通过高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像；

对所述高光谱图像进行目标特征融合处理，形成单通道图像；

对所述单通道图像去噪处理，得到去噪图像；

通过图像识别和动作追踪算法对所述去噪图像进行识别，获取手势识别结果。

进一步方案中，对所述高光谱图像进行目标特征融合处理，形成单通道图像的步骤包括：将所述高光谱图像中不同波段的图像依据目标特征的匹配机制执行，剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

进一步方案中，所述匹配机制采用经过训练的卷积神经网络算法，所述匹配机制基于卷积神经网络算法将所述高光谱图像中不同波段图像的目标特征与训练集中各波段图像的目标特征做匹配。

进一步方案中，所述卷积神经网络算法的训练包括：将输入的各波段图像的目标特征与训练集中预置的各波段图像的目标特征作匹配，将匹配度大于预设匹配度阈值的图像更新至训练集中。

进一步方案中，所述图像识别和动作追踪算法具体采用卷积神经网络算法。当然，也可以采用其他适合手势图像识别或动作追踪的算法。

本发明相应公开的一种基于高光谱成像的手势识别装置，包括可见光源、红外光源、高光谱成像系统、图像处理单元以及手势识别单元；其中，

所述可见光源和红外光源共同照射目标手势；

所述高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像；

所述图像处理单元对所述高光谱图像进行目标特征融合处理，形成单通道图像，以及对所述单通道图像去噪处理，得到去噪图像；

所述手势识别单元通过图像识别和动作追踪算法对所述去噪图像进行识别，获取手势识别结果。

进一步方案中，还包括数据库单元，所述数据库单元存储有卷积神经网络算法训练集。

进一步方案中，所述图像处理单元基于卷积神经网络算法将所述高光谱图像中不同波段的图像依据目标特征与训练集中各波段图像的目标特征做匹配，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

进一步方案中，所述高光谱成像系统为单个高光谱相机。

进一步方案中，所述高光谱成像系统为多个高光谱相机，分别采集不同波段的高光谱图像。

有益效果

本发明至少具备以下有益效果：

（1）本发明可以同时采集可见光波段和红外光波段的手势图像信息，在手势识别中对多通道高光谱图像进行目标特征的有效融合，使得目标特征区域对比度增强，从而有效地进行图像分割，提取手的轮廓信息进行后续的手势识别，有助于提高手势识别的准确性和有效性。

（2）通过目标特征融合处理，可以消除遮挡或暗斑，减少环境的干扰。

附图说明

图1是本发明实施例一公开的基于高光谱成像的手势识别方法整体流程示意图。

图2是图1步骤S100至步骤S300的一种原理示意图。

图3是图1步骤S400的一种原理示意图。

图4是图2中目标特征融合步骤的一种原理示意图。

图5是本发明实施例一公开的基于高光谱成像的手势识别方法中卷积神经网络算法训练原理示意图。

图6是本发明实施例二公开的基于高光谱成像的手势识别方法整体流程示意图。

图7是本发明实施例三公开的基于高光谱成像的手势识别方法整体流程示意图。

图8是本发明实施例四公开的基于高光谱成像的手势识别方法整体流程示意图。

图9是本发明实施例五公开的基于高光谱成像的手势识别装置结构框图。

本发明的最佳实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例一

请参阅图1至图5所示，本实施例公开的一种基于高光谱成像的手势识别方法，主要包括以下步骤S100至S400：

S100、通过高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像。

步骤S100如图2所示，用户的手部处于带有背景影响的环境中，使用可见光源和红外光源共同照射，而后通过高光谱成像系统进行图像采集，得到高光谱图像（即具有多个通道的图像）。

S200、将高光谱图像做目标特征融合处理，形成单通道图像。

步骤S200同样如图2所示，其包括：将高光谱图像中不同波段的图像依据目标特征的匹配机制执行（匹配机制如图4所示），剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

本实施例中，目标特征可选取目标特征，匹配机制可采用经过训练的卷积神经网络算法（CNN），该匹配机制基于卷积神经网络算法将高光谱图像中不同波段图像的目标特征与训练集中各波段图像的目标特征做匹配，而后剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

如图4所示的一种目标特征融合示意图中：剔除不符合匹配机制的可见光波段1图像和可见光波段2图像，将符合匹配机制的红外波段图像与紫外波段图像融合成单通道图像。

如图5所示，卷积神经网络算法的训练包括：将输入的各波段图像的目标特征与训练集中预置的各波段图像的目标特征作匹配，将匹配度大于预设匹配度阈值的图像更新至训练集中。

S300、对单通道图像去噪处理，得到去噪图像。

S400、通过图像识别和动作追踪算法对去噪图像进行识别，获取手势识别结果。

步骤S400的图像识别和动作追踪算法同样可采用卷积神经网络算法，当然，也可以采用其他适合手势图像识别或动作追踪的算法。

因此，本实施例至少具备以下有益效果：

（1）可以同时采集可见光波段和红外光波段的手势图像信息，在手势识别中除了可以使用可见光波段的图像信息之外还可以使用红外光波段的图像信息进行识别，有助于提高手势识别的准确性和有效性。

实施例二

随着智能显示设备在交互式技术方向的发展越来越先进，目前有许多电视或电脑等显示可通过手势来控制，包括可以控制电视的频道切换、音量调节、菜单设置，或者屏幕画面中人物或物体的动作等等。实施例二公开的一种基于高光谱成像的手势识别方法将以此类智能显示设备的手势识别为例，采集手势图像在可见光波段和红外光波段下展现的图像信息，以及通过对图像的目标特征融合处理，提高其识别的准确性和有效性。

请参阅图6，实施例二公开的一种基于高光谱成像的手势识别方法，主要包括以下步骤S110至S710：

S110、智能显示设备进行初始化，并开启高光谱成像系统、可见光源和红外光源。

S210、检测是否存在用户手势，若无则在预设时间内重新检测。

S310、检测到用户手势，通过高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像。

S410、将高光谱图像中不同波段的图像依据目标特征的匹配机制执行，剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

S510、对单通道图像去噪处理，得到去噪图像。

S610、通过图像识别和动作追踪算法对去噪图像进行识别，获取手势识别结果。

S710、根据手势识别结果控制智能显示设备执行对应的预设动作。

步骤S710中的预设动作包括频道切换、音量调节、菜单设置，或者屏幕画面中人物或物体的动作等等。

实施例三

不少电子游戏都支持体感操作，在游戏场景下，应用实施例三的一种基于高光谱成像的手势识别方法，可使用高光谱系统（高光谱像机）捕捉用户手部动作的视频串流；对于每一帧视频，先剔除亮度过低的频段图片，再使用SVD降低数据大小，之后使用卷积神经网络算法进行识别，选出最佳的分类；若出现环境光过暗的情况，则可见光波段的图片有可能会被剔除；再经SVD处理后，非可见光波段的图片信息会保留更多，卷积神经网络算法的输入的特征会更加明显，识别准确性会更高。

如图7所示，实施例三公开的一种基于高光谱成像的手势识别方法，主要包括以下步骤S120至S720：

S120、电子游戏画面进行初始化，并开启高光谱成像系统、可见光源和红外光源。

S220、捕捉用户手部动作的视频串流，分析是否存在用户手势，若无则在预设时间内重新捕捉。

S320、捕捉到用户手势，通过高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像。

S420、基于卷积神经网络算法将高光谱图像中不同波段图像的目标特征与训练集中各波段图像的目标特征做匹配，而后剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

S520、对单通道图像去噪处理，得到去噪图像。

S620、通过卷积神经网络算法对去噪图像进行识别，获取手势识别结果。

S720、根据手势识别结果控制电子游戏画面执行对应的预设动作。

步骤S720中的预设动作包括与预设手势对应的人物或物体的动作等等。

实施例四

用户在对电子游戏进行手势控制时，假如手上戴着手套，由于手套的可见光目标特征和裸露的人手特征大不相同，现有产品的识别率难以令人满意，要提高准确率则需使用新的识别算法或者训练新的模型，成本会大幅增加。而应用实施例四的一种基于高光谱成像的手势识别方法，可以对部分穿过手套的人体红外辐射进行识别，结合卷积神经网络算法以及训练集中已包含红外谱的目标特征，可以准确对手势进行识别。

如图8所示，实施例四公开的一种基于高光谱成像的手势识别方法，主要包括以下步骤S130至S730：

S130、电子游戏画面进行初始化，并开启高光谱成像系统、可见光源和红外光源。

S230、捕捉用户手部动作的视频串流，分析是否存在用户手势，若无则在预设时间内重新捕捉。

S330、捕捉到戴着手套的用户手势，通过高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像。

S430、基于卷积神经网络算法将高光谱图像中不同波段图像的目标特征与训练集中各波段图像的目标特征做匹配，剔除手套目标特征图像，并将目标特征符合匹配机制的波段的手部图像融合成单通道图像。

S530、对单通道图像去噪处理，得到剔除了手套目标特征后的去噪图像。

S630、通过卷积神经网络算法对去噪图像进行识别，获取手势识别结果。

S730、根据手势识别结果控制电子游戏画面执行对应的预设动作。

步骤S730中的预设动作包括与预设手势对应的人物或物体的动作等等。

实施例五

如图9所示，实施例五相应公开的一种基于高光谱成像的手势识别装置，包括可见光源10、红外光源20、高光谱成像系统30、图像处理单元40以及手势识别单元50。

其中，可见光源10和红外光源20用于共同照射目标手势；高光谱成像系统30用于采集处于可见光源10和红外光源20共同照射下的手势的图像，获得高光谱图像。即用户的手部处于带有背景影响的环境中，使用可见光源10和红外光源20共同照射，而后通过高光谱成像系统30进行图像采集，得到高光谱图像（即具有多个通道的图像）。

本实施例中，高光谱成像系统30可以是单个高光谱相机，也可以是多个高光谱相机，多个高光谱相机可以分别采集不同波段的高光谱图像。

图像处理单元40将高光谱图像做目标特征融合处理，形成单通道图像，以及对单通道图像去噪处理，得到去噪图像。所述目标特征融合处理是指将高光谱图像中不同波段的图像依据目标特征的匹配机制执行，剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

本实施例中，匹配机制可采用经过训练的卷积神经网络算法（CNN），该匹配机制基于卷积神经网络算法将高光谱图像中不同波段图像的目标特征与训练集中各波段图像的目标特征做匹配，而后剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。所述卷积神经网络算法的训练包括：将输入的各波段图像的目标特征与训练集中预置的各波段图像的目标特征作匹配，将匹配度大于预设匹配度阈值的图像更新至训练集中。因此，图像处理单元40可基于卷积神经网络算法将高光谱图像中不同波段的图像依据目标特征与训练集中各波段图像的目标特征做匹配，并将目标特征符合匹配机制的波段的图像融合成单通道图像。

手势识别单元50用于通过图像识别和动作追踪算法对所述去噪图像进行识别，获取手势识别结果。具体的，图像识别和动作追踪算法同样可采用卷积神经网络算法，当然，也可以采用其他适合手势图像识别或动作追踪的算法。

进一步方案中，实施例五的一种基于高光谱成像的手势识别装置还包括数据库单元60，数据库单元60存储有卷积神经网络算法训练集。

综上所述，以上实施例二至实施例五同样具有以下有益效果：

以上所述实施例尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

一种基于高光谱成像的手势识别方法，其特征在于，包括以下步骤：

通过高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像；

对所述高光谱图像进行目标特征融合处理，形成单通道图像；

对所述单通道图像去噪处理，得到去噪图像；

通过图像识别和动作追踪算法对所述去噪图像进行识别，获取手势识别结果。
根据权利要求1所述的基于高光谱成像的手势识别方法，其特征在于，对所述高光谱图像进行目标特征融合处理，形成单通道图像：将所述高光谱图像中不同波段的图像依据目标特征的匹配机制执行，剔除目标特征不符合匹配机制的波段的图像，并将目标特征符合匹配机制的波段的图像融合成单通道图像。
根据权利要求2所述的基于高光谱成像的手势识别方法，其特征在于，所述匹配机制采用经过训练的卷积神经网络算法，所述匹配机制基于卷积神经网络算法将所述高光谱图像中不同波段图像的目标特征与训练集中各波段图像的目标特征做匹配。
根据权利要求3所述的基于高光谱成像的手势识别方法，其特征在于，所述卷积神经网络算法的训练包括：将输入的各波段图像的目标特征与训练集中预置的各波段图像的目标特征作匹配，将匹配度大于预设匹配度阈值的图像更新至训练集中。
根据权利要求1-4任一项所述的基于高光谱成像的手势识别方法，其特征在于，所述图像识别和动作追踪算法具体采用卷积神经网络算法。
一种基于高光谱成像的手势识别装置，其特征在于，包括可见光源、红外光源、高光谱成像系统、图像处理单元以及手势识别单元；其中，

所述可见光源和红外光源共同照射目标手势；

所述高光谱成像系统采集处于可见光源和红外光源共同照射下的手势的图像，获得高光谱图像；

所述图像处理单元对所述高光谱图像进行目标特征融合处理，形成单通道图像，以及对所述单通道图像去噪处理，得到去噪图像；

所述手势识别单元通过图像识别和动作追踪算法对所述去噪图像进行识别，获取手势识别结果。
根据权利要求所6述的基于高光谱成像的手势识别装置，其特征在于，还包括数据库单元，所述数据库单元存储有卷积神经网络算法训练集。
根据权利要求所7述的基于高光谱成像的手势识别装置，其特征在于，所述图像处理单元基于卷积神经网络算法将所述高光谱图像中不同波段的图像依据目标特征与训练集中各波段图像的目标特征做匹配，并将目标特征符合匹配机制的波段的图像融合成单通道图像。
根据权利要求6-8任一项所述的基于高光谱成像的手势识别装置，其特征在于，所述高光谱成像系统为单个高光谱相机。
根据权利要求6-8任一项所述的基于高光谱成像的手势识别装置，其特征在于，所述高光谱成像系统为多个高光谱相机，分别采集不同波段的高光谱图像。