CN109522795A

CN109522795A - 一种通过手势进行编程的方法

Info

Publication number: CN109522795A
Application number: CN201811188668.8A
Authority: CN
Inventors: 张霄扬
Original assignee: Shenzhen Qian Qian Programming Technology Co Ltd
Current assignee: Shenzhen Qian Qian Programming Technology Co Ltd
Priority date: 2018-10-12
Filing date: 2018-10-12
Publication date: 2019-03-26

Abstract

本发明公开了一种通过手势进行编程的方法，包括以下步骤：S1：设置指令录入；S2：编程匹配；S3：拍摄；S4：图片平滑处理；S5：卷积系数计算；S6：图片色度理论分割；S7：图片几何特性分割；S8：图片交点间隔分割；S9比对；S10：建表。本发明利用图片进行平滑和分割处理，对于复杂环境下的手势与背景分割效果好，提取的手势轮廓分明而且比较完整，为手持和编程提供了便捷，通过将手势识别与编程进行了结合，实现了对生活场景下许多小制作的编程控制。应用范围广，操作便利，易于学习掌握。对于儿童编程的学习体系进行了补充，相对于以往的技术应用更加精细化，更贴近生活，更具有趣味性，也降低了学习成本和使用门槛。

Description

一种通过手势进行编程的方法

技术领域

本发明涉及手势编程技术领域，具体为一种通过手势进行编程的方法。

背景技术

在计算机科学中，手势识别是通过数学算法来识别人类手势的一个议题。手势识别可以来自人的身体各部位的运动，但一般是指脸部和手的运动。在VR和智能手机上已经有成熟的应用。

现有技术存在的问题主要是高度依赖于机器学习。识别引擎会记录，处理，和重用当前帧数据，所以随着时间的推移，手势识别精度会逐步提高。系统能够更好的识别出你想要表达的具体手势。这种方法能够比较容易的识别出新的手势，而且较其他两种方法能够更好的处理比较复杂的手势。但是建立这样一个系统也不容易。首先，系统依赖于大量的样本数据。数据越多，识别精度越高。所以系统需要大量的存储资源和CPU时间的来进行查找和匹配。其次系统需要不同高度，不同胖瘦，不同穿着(穿着会影响景深数据提取身体轮廓)的样本来进行某一个手势。这种方式过于复杂，在实际应用种需要不断丰富样本，以提高识别率和完善识别场景，而且手势识别受到环境背景场景的影响，在复杂条件下，手势提取的轮廓较差，识别率较低，影响手势和编程结合时的准确性。

发明内容

本发明的目的在于提供一种通过手势进行编程的方法，提取的手势轮廓分明而且比较完整，为手势和编程提供了便捷，静态识别率超过98％，动态识别率超过97％，通过将手势识别与编程进行了结合，实现了对生活场景下许多小制作的编程控制。应用范围广，操作便利，易于学习掌握。对于儿童编程的学习体系进行了补充，相对于以往的技术应用更加精细化，更贴近生活，更具有趣味性，也降低了学习成本和使用门槛，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种通过手势进行编程的方法，包括以下步骤：

S1：设置指令录入，将手势与脸部动作定义为输入指令和输出指令，录入系统数据库中并备份；

S2：编程匹配，通过计算机进行编程，并在系统数据库中录入编程对象，将手势与编程对象进行匹配；

S3：拍摄，通过摄像头采集手势信号,使用摄像机直接拍摄手势的运动过程，从手势图像序列中分割出人手；

S4：图片平滑处理，通过对摄像头拍出来的图片进行低通滤波处理；

S5：卷积系数计算，对图片卷积系数乘以最小公倍数得到新的卷积核，用新的卷积核进行卷积操作，将结果除以原卷积核各卷积系数的最小公倍数，得出卷积结果；

S6：图片色度理论分割，根据手的肤色与背景的不同来进行分割，通过手的颜色来获取到手颜色的聚类空间，判断是否可以通过颜色来进行分割；

S7：图片几何特性分割，采用八连通判别算法从左至右，从上至下逐个像素进行扫描，若发现像素点值为零，则依次检测该点右上、正上、左上和左前四个点的像素值，根据八连通判别原则对像素进行标号，最后达到对整个连通区域进行标号，标记结束后，对各个连通区域进行像素点总和统计，最后通过面积阈值对图像进行分割；

S8：图片交点间隔分割，通过矩形左右四分之一处的竖线进行切割，标记竖线颜色变化处的点，计算黑色区域的交点间隔宽度选定手指宽度阈值，交点间隔在阈值范围允许范围内，即得到手势区域图片；

S9：比对，将采集的手势区域图片信号发送到数据库与手势数据库进行比对，确认手势；

S10：建表，根据手势情况建立可识别手势列表和识别脸部动作列表。

优选的，所述步骤S1中系统数据库中包括数据存储模块，所述数据存储模块采用ROM存储。

优选的，所述步骤S3中图像拍摄的格式为24bit，图片大小为768×576。

优选的，所述步骤S4中图片平滑处理时采用的低通滤波处理方式包括平均领域法、中值滤波、高斯平滑和卷积滤波。

优选的，所述步骤S4中的图片平滑处理次数为2-3次。

优选的，所述步骤S6图片色度理论分割中过滤无用信息比例超过80％。

优选的，所述步骤S7图片几何特性分割中面积阈值过滤的无用信息比例超过10％。

与现有技术相比，本发明的有益效果是：本发明严格控制该手势进行编程的方法，通过摄像头采集手势信号，将手势与编程进行结合，通过手势识别技术建立模块指令间的联系，作为模块化编程的补充，利用图片进行平滑和分割处理，对于复杂环境下的手势与背景分割效果好，提取的手势轮廓分明而且比较完整，为手持和编程提供了便捷，静态识别率超过98％，动态识别率超过97％，通过将手势识别与编程进行了结合，实现了对生活场景下许多小制作的编程控制。应用范围广，操作便利，易于学习掌握。对于儿童编程的学习体系进行了补充，相对于以往的技术应用更加精细化，更贴近生活，更具有趣味性，也降低了学习成本和使用门槛。

附图说明

图1为本发明一种通过手势进行编程的方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合具体实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参阅图1，本发明提供一种通过手势进行编程的方法，包括以下步骤：

具体的，所述步骤S1中系统数据库中包括数据存储模块，所述数据存储模块采用ROM存储。

具体的，所述步骤S3中图像拍摄的格式为24bit，图片大小为768×576。

具体的，所述步骤S4中图片平滑处理时采用的低通滤波处理方式包括平均领域法、中值滤波、高斯平滑和卷积滤波。

具体的，所述步骤S4中的图片平滑处理次数为2-3次。

具体的，所述步骤S6图片色度理论分割中过滤无用信息比例超过80％。

具体的，所述步骤S7图片几何特性分割中面积阈值过滤的无用信息比例超过10％。

本发明提供的一种手势进行编程的方法中，对于图片平滑和分割处理后的识别率和普通的图片处理方式相比较，见下表：

综上所述：本发明严格控制该手势进行编程的方法，通过摄像头采集手势信号，将手势与编程进行结合，通过手势识别技术建立模块指令间的联系，作为模块化编程的补充，利用图片进行平滑和分割处理，对于复杂环境下的手势与背景分割效果好，提取的手势轮廓分明而且比较完整，为手持和编程提供了便捷，静态识别率超过98％，动态识别率超过97％，通过将手势识别与编程进行了结合，实现了对生活场景下许多小制作的编程控制。应用范围广，操作便利，易于学习掌握。对于儿童编程的学习体系进行了补充，相对于以往的技术应用更加精细化，更贴近生活，更具有趣味性，也降低了学习成本和使用门槛。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种通过手势进行编程的方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种通过手势进行编程的方法，其特征在于：所述步骤S1中系统数据库中包括数据存储模块，所述数据存储模块采用ROM存储。

3.根据权利要求1所述的一种通过手势进行编程的方法，其特征在于：所述步骤S3中图像拍摄的格式为24bit，图片大小为768×576。

4.根据权利要求1所述的一种通过手势进行编程的方法，其特征在于：所述步骤S4中图片平滑处理时采用的低通滤波处理方式包括平均领域法、中值滤波、高斯平滑和卷积滤波。

5.根据权利要求1所述的一种通过手势进行编程的方法，其特征在于：所述步骤S4中的图片平滑处理次数为2-3次。

6.根据权利要求1所述的一种通过手势进行编程的方法，其特征在于：所述步骤S6图片色度理论分割中过滤无用信息比例超过80％。

7.根据权利要求1所述的一种通过手势进行编程的方法，其特征在于：所述步骤S7图片几何特性分割中面积阈值过滤的无用信息比例超过10％。