CN111460933A

CN111460933A - 一种实时识别连续手写图形的方法

Info

Publication number: CN111460933A
Application number: CN202010189394.5A
Authority: CN
Inventors: 杜国铭; 李文越; 冯大志
Original assignee: Harbin Tuobo Technology Co ltd
Current assignee: Harbin Tuobo Technology Co ltd
Priority date: 2020-03-18
Filing date: 2020-03-18
Publication date: 2020-07-28
Anticipated expiration: 2040-03-18
Also published as: CN111460933B

Abstract

本发明提出一种实时识别连续手写图形的方法，所述方法对采集后的图像进行关键点手势的识别，利用关键点坐标和数据队列形成一个矩阵，并将矩阵输入到两个长短期记忆网络中，从而根据不稳态图形和概率分布输出判断出的图形。所述方法速度快，实时性强，完整写完第一个图形后，即可输出，无需像其他方法需要等待所有轨迹写完才能识别，并且准确率高。

Description

一种实时识别连续手写图形的方法

技术领域

本发明属于手写识别技术领域，特别是涉及一种实时识别连续手写图形的方法。

背景技术

图形识别领域属于手写识别领域的范畴。在手写识别的领域中，已经成熟的技术有单汉字手写识别，字母识别，数字识别。手写识别领域中从单一的多笔画单字识别增强到连笔画单字识别，并在手机上广泛应用，手写字母识别，但没有较为优秀的手写单词识别。手写数字识别则是学习机器学习的入门课程，可以用许多的方法解决。基于图像的手写图形识别基本上可以解释为从图像中符合要求的手势中找到关键点，根据连续图像的关键点轨迹合成图像后进行判断，这和触摸屏上的手写图形识别有类似的的原理。但实际应用当中，触摸屏上的手写识别是写完一个图形后有一个抬起笔的操作的判断，从而确定一个字已经写完，并进行识别。图像上则不同，因为在手势不切换的情况下，图像关键点一般为连续的，单一图形识别可以进行传统的识别方法。

而连续图形的识别，困难点有如下几项：

若分割后逐一识别：采用内部分割出图形，然后识别图形组成结果进行输出，因为在连续输入的情况下，需要算法自己去判断分割点，分割点过早或过晚都有可能造成识别偏差。

若整体识别，则会因为排列组合的问题导致状态空间过于庞大，无法通过算法进行较好的模拟，算法实现难度非常大。

识别时机若是在整个手势结束后进行，则有可能出现手势持续时间过长导致的算法消耗过大，无法识别的问题，并且实时性差，需要在所有图形写完后才能出现结果。

发明内容

本发明目的是为了解决现有技术中的问题，提出了一种实时识别连续手写图形的方法。

本发明是通过以下技术方案实现的，本发明提出一种实时识别连续手写图形的方法，初始化准备：建立一个数据队列，队列内容为数据关键点的图像坐标，初始化状态为等待状态；所述方法包括以下步骤：

步骤1、通过图像采集工具采集图像；

步骤2、通过图像处理方法在图像中识别出手势为可识别关键点的手势，此时设置当前状态为识别状态，执行步骤3；

步骤3、获取手势中关键点坐标，若当前所述关键点的图像坐标与上一点的坐标的距离超过第一阈值，则将所述关键点存储到数据队列中，否则，舍弃识别结果并返回步骤1；

步骤4、将数据队列中的所有关键点形成一条不规则的曲线，并将曲线平滑处理；

步骤5、判断数据队列中的关键点所形成的曲线长度是否超过第二阈值，若超过则执行步骤6，否则执行步骤1；

步骤6、将曲线等比例压缩到一个固定大小的正方形区域内；

步骤7、将曲线进行等自定义长度的分割，并重新确定所有关键点坐标，组成新的数据队列；

步骤8、若新生成的数据队列关键点个数小于第三阈值，则在新生成的数据队列中填充与最后一个有效关键点相同的点，直至填满个数至第三阈值，截取整个数据队列中的关键点数据，若新生成的数据队列关键点个数大于等于第三阈值，则截取n个关键点数据，n等于第三阈值；

步骤9、将截取后的关键点数据整合为一个矩阵，识别当前状态，若当前状态处于识别状态，则将所述矩阵输入到第一长短期记忆网络，获得N个手势图形加上不稳态图形共N+1个图形的离散型概率分布，若不稳态图形的概率持续小于第六阈值且概率最大的图形持续为同一图形，且持续过程中有效关键点增长数大于第七阈值，则判断当前书写的图形为概率最大的图形，并将数据队列中在稳定起始点前的数据删除，输出判断出的图形，返回步骤1，否则返回步骤1；若当前状态处于停止状态，则将所述矩阵输入到第二长短期记忆网络，获得N个手势图形共N个图形的离散型概率分布，若概率最高的图形的概率大于第八阈值时，则输出判断出的图形，返回步骤1，否则直接返回步骤1。

进一步地，在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前处于识别状态下，则计算第一帧未识别手势到当前的时间，若一直丢失手势，且丢失事件持续时间超过第四阈值，则设置当前状态为停止状态，执行步骤3，否则返回步骤1。

进一步地，在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前没有处于识别状态的同时上一帧状态为停止状态，则设置当前状态为等待状态，返回步骤1。

进一步地，在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前没有处于识别状态的同时上一帧状态为等待状态，则返回步骤1。

本发明提出的方法适合在需要连续输入图形手势轨迹(连续图像)的情况下的图形识别。所述方法速度快，实时性强，完整写完第一个图形后，即可输出，无需像其他方法需要等待所有轨迹写完才能识别，并且准确率高，测试，分割准确率高达95％以上，判断准确率在99％以上，而且延展性好，本发明所述方法在不同的领域同样可以适用。

附图说明

图1为本发明所述的实时识别连续手写图形的方法流程图。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

结合图1，本发明提出一种实时识别连续手写图形的方法，初始化准备：建立一个数据队列，队列内容为数据关键点的图像坐标，初始化状态为等待状态；所述方法包括以下步骤：

步骤1、通过图像采集工具采集图像；

步骤6、将曲线等比例压缩到一个固定大小的正方形区域内；

在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前处于识别状态下，则计算第一帧未识别手势到当前的时间，若一直丢失手势，且丢失事件持续时间超过第四阈值，则设置当前状态为停止状态，执行步骤3，否则返回步骤1。

在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前没有处于识别状态的同时上一帧状态为停止状态，则设置当前状态为等待状态，返回步骤1。

在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前没有处于识别状态的同时上一帧状态为等待状态，则返回步骤1。

本发明所述方法属于轨迹识别，所以不仅仅是手势图像，点光源移动、触摸屏、画板等同样可以输出轨迹点数据的输出设备都可以适用于本发明所述方法的输入。

实施例1-手势输入控制升降桌

利用本发明所述方法仅仅需要一个较小的相机，在视场区域内伸出一指，利用算法判断关键点为指尖，在视场区域内空中书写数字图形即可。后台接收指尖轨迹，判断出连续书写的数字图形，将数字图形序列转化为指令传到控制装置中，进行指定高度的升降。此外还可以伸出两指进行操作，算法会识别出两个不同的关键点，当同时出现两个不同的关键点时，两指向前或向后分别对应两个关键点生成的两个轨迹的向前向后，可转化为上升和下降的控制信号。

同时可以将摄像头替换为一个小的触摸板，用一指或两指在触摸板上进行书写，识别书写轨迹，转化为控制信号。

实施例2-手势输入控制电梯升降

利用本发明所述方法仅仅需要一个较小的相机，在视场区域内伸出一指，利用算法判断关键点为指尖，在视场区域内空中书写数字图形即可。后台接收指尖轨迹，判断出连续书写的数字图形，将数字图形序列转化为指令传到控制装置中。从而进行楼层的升降，双手食指伸出比划开门关门的动作，可以识别出两只手的左右滑动的相对运动，进行开关门命令的转化。

以上对本发明所提出的一种实时识别连续手写图形的方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种实时识别连续手写图形的方法，其特征在于：初始化准备：建立一个数据队列，队列内容为数据关键点的图像坐标，初始化状态为等待状态；所述方法包括以下步骤：

步骤1、通过图像采集工具采集图像；

步骤6、将曲线等比例压缩到一个固定大小的正方形区域内；

2.根据权利要求1所述的方法，其特征在于：在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前处于识别状态下，则计算第一帧未识别手势到当前的时间，若一直丢失手势，且丢失事件持续时间超过第四阈值，则设置当前状态为停止状态，执行步骤3，否则返回步骤1。

3.根据权利要求2所述的方法，其特征在于：在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前没有处于识别状态的同时上一帧状态为停止状态，则设置当前状态为等待状态，返回步骤1。

4.根据权利要求3所述的方法，其特征在于：在步骤2中，若通过图像处理方法在图像中未识别出手势为可识别关键点的手势，且当前没有处于识别状态的同时上一帧状态为等待状态，则返回步骤1。