CN106599842A - 空中手写识别方法及装置 - Google Patents
空中手写识别方法及装置 Download PDFInfo
- Publication number
- CN106599842A CN106599842A CN201611154296.8A CN201611154296A CN106599842A CN 106599842 A CN106599842 A CN 106599842A CN 201611154296 A CN201611154296 A CN 201611154296A CN 106599842 A CN106599842 A CN 106599842A
- Authority
- CN
- China
- Prior art keywords
- feature set
- classifier
- sub
- grader
- gesture path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供一种空中手写识别方法及装置,应用于用户终端。所述方法包括:采集待识别的手势轨迹;获取待识别的手势轨迹的坐标序列,提取坐标序列的多个方向的特征集;对坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集;将预设维度的特征集输入至分类器,其中,分类器包括有多个子分类器;分类器计算预设维度的特征集在分类器中的各个子分类器的稀疏编码系数;根据稀疏编码系数和与稀疏编码系数对应的子分类器,得到预设维度的特征集与各个子分类器之间的重构误差;对重构误差进行排序,输出识别结果。本发明能够实现在线的空中手写识别,计算简单,识别效率高。
Description
技术领域
本发明涉及智能人机交互领域,具体而言,涉及一种空中手写识别方法及装置。
背景技术
随着三维体感交互技术的发展,空中手写汉字识别正在变为智能人机交互研究领域的一个新热点。相比于传统的在线手写,通过使用动作传感设备,空中手写显得更加自然和方便。然而,空中手写汉字的结构变化比传统手写更加丰富,这也使得对空中手写的在线识别更具挑战性。
现有技术中,由于在线汉字识别的类别数太多,造成对空中手写的在线识别过程中的计算量非常大,使得识别效率很低,从而很难实现在线的空中手写识别。
发明内容
为了克服现有技术中的上述不足,本发明的目的在于提供一种空中手写识别方法及装置,其能够实现在线的空中手写识别。
为了实现上述目的,本发明较佳实施例所采用的技术方如下所示:
本发明较佳实施例提供一种空中手写识别方法,应用于用户终端,所述方法包括:
采集待识别的手势轨迹;
获取所述待识别的手势轨迹的坐标序列,提取所述坐标序列的多个方向的特征集;
对所述坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集;
将所述预设维度的特征集输入至分类器,其中,所述分类器包括有多个子分类器;
所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数;
根据所述稀疏编码系数和与所述稀疏编码系数对应的子分类器,得到所述预设维度的特征集与各个子分类器之间的重构误差;
对所述重构误差进行排序,输出识别结果。
在本发明较佳实施例中,上述方法还包括训练分类器的步骤,所述步骤包括:
获取训练手势轨迹的坐标序列,提取所述训练手势轨迹的坐标序列的多个方向的特征集;
对所述训练手势轨迹的坐标序列的多个方向的特征集进行降维,得到预设维度的特征集;
根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量;
将处于预设特征值范围内的特征向量作为分类器中的子分类器。
在本发明较佳实施例中,上述根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量的步骤包括:
采用主成分分析方法对所述特征集进行计算,得到所述特征集的协方差矩阵;
利用奇异值分解方法对所述协方差矩阵进行计算,得到所述训练手势轨迹的特征向量。
在本发明较佳实施例中,上述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数的步骤包括:
将所述预设维度的特征集与所述分类器中的各个子分类器的均值向量相减得到向量差值;
根据所述向量差值计算得到所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
在本发明较佳实施例中,上述对所述重构误差进行排序,输出识别结果的步骤包括:
将处于预设数值范围的重构误差所对应的子分类器作为所述手势轨迹的识别结果。
本发明较佳实施例还提供一种空中手写识别装置,应用于用户终端,所述装置包括:
采集模块,用于采集待识别的手势轨迹;
提取模块,用于获取所述待识别的手势轨迹的坐标序列,提取所述坐标序列的多个方向的特征集;
降维模块,用于对所述坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集;
输入模块,用于将所述预设维度的特征集输入至分类器,其中,所述分类器包括有多个子分类器;
编码系数计算模块,用于所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数;
重构误差计算模块,用于根据所述稀疏编码系数和与所述稀疏编码系数对应的子分类器,得到所述预设维度的特征集与各个子分类器之间的重构误差;
识别模块,用于对所述重构误差进行排序,输出识别结果。
相对于现有技术而言,本发明具有以下有益效果:
本发明提供的空中手写识别方法及装置,其通过提取出输入的手势轨迹的特征集,依据稀疏编码分类的方式求取出所述手势轨迹的特征集与每个分类器的重构误差对空中手写的汉字进行识别,计算简单,识别效率高,能够实现在线的空中手写识别。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明较佳实施例提供的用户终端的方框示意图;
图2为本发明较佳实施例提供的空中手写识别方法的一种流程示意图;
图3为本发明较佳实施例提供的空中手写识别方法的另一种流程示意图;
图4为图3中步骤S209的子步骤的流程示意图;
图5为图3中步骤S250的子步骤的流程示意图;
图6为本发明较佳实施例提供的空中手写识别装置的一种功能模块图;
图7为本发明较佳实施例提供的空中手写识别装置的另一种功能模块图;
图8为图7中训练模块的子模块的功能模块图。
图标:100-用户终端;110-存储器;120-处理器;130-通信单元;140-存储控制器;150-体感控制器;200-空中手写识别装置;209-训练模块;2091-获取子模块;2092-降维子模块;2093-特征向量计算子模块;2094-子分类器训练子模块;210-采集模块;220-提取模块;230-降维模块;240-输入模块;250-编码系数计算模块;260-重构误差计算模块;270-识别模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本发明较佳实施例提供的用户终端100的方框示意图。本发明实施例中所述用户终端100可以为用于识别空中手写的汉字的电子设备,例如,所述用户终端100可以是,但不限于,智能手机、个人电脑(Personal Computer,PC)、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、移动上网设备(Mobile Internet Device,MID)等。所述用户终端100的操作系统可以是,但不限于,安卓(Android)系统、iOS(iPhoneOperating System)系统、Windows Phone系统、Windows系统等。优选地,在本实施例中,所述用户终端100的操作系统为Windows系统。
如图1所示,所述用户终端100包括存储器110、处理器120、通信单元130、存储控制器140以及体感控制器150。所述存储器110、处理器120、通信单元130、存储控制器140以及体感控制器150相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器110中存储有空中手写识别装置200,所述空中手写识别装置200包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器110中的软件功能模块,所述处理器120通过运行存储在存储器110内的软件程序以及模块,如本发明实施例中的空中手写识别装置200,从而执行各种功能应用以及数据处理,即实现本发明实施例中的空中手写识别方法。
其中,所述存储器110可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器110用于存储程序,所述处理器120在接收到执行指令后,执行所述程序。进一步地,通信单元130将各种输入/输入装置耦合至处理器120以及存储器110,上述存储器110内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通讯,从而提供其他软件组件的运行环境。
所述处理器120可以是一种集成电路芯片,具有信号的处理能力。上述的处理器120可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器120也可以是任何常规的处理器等。
所述通信单元130用于建立所述用户终端100与所述空中手写识别装置200二者之间的通信连接。
所述体感控制器150用于跟踪手指指尖的运动轨迹,从而采集到待识别的手势轨迹。
可以理解,图1所示的结构仅为示意,所述用户终端100还可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参阅图2,图2为本发明较佳实施例提供的空中手写识别方法的流程示意图。所述方法的具体流程如下:
步骤S210,采集待识别的手势轨迹。
在本实施例中,可以通过设置在所述用户终端100上的体感控制器150对用户手写的轨迹进行采集。所述手写的轨迹可以是用户输入一个或者多个中文文字、标点符号、英文字母等形式,优选地,本实施例中的待识别的手势轨迹以中文文字作为主要识别对象。
所述体感控制器150用于监控一定范围内的空间区域,并能够跟踪手指在所述空间区域中的运动轨迹,具体地,所述体感控制器150从不同角度捕捉手势的运动画面,重建出手指在真实世界三维空间的运动轨迹从而对所述手势轨迹进行采集。
步骤S220,获取所述待识别的手势轨迹的坐标序列,提取所述坐标序列的多个方向的特征集。
所述体感控制器150识别到靠近所述识别区域的手指的手势轨迹,从而获取到执行所述手势轨迹的手指指尖的坐标序列。在本实施例中,所述坐标序列为二维坐标序列。
根据获取到的所述二维坐标序列,提取所述二维坐标序列的多个方向的特征集,优选地,本实施例可以提取所述二维坐标序列的八个方向的特征集。
请再次参阅图3,步骤S230,对所述坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集。
具体地,本实施例采用主成分分析方法(PCA)及线性判别式分析方法(LDA)对所述坐标序列的八个方向的特征集进行降维,得到预设维度的特征集。所述预设维度可以根据实际需求进行设定,优选地,在本实施例中,所述预设维度可以为160维。
步骤S240,将所述预设维度的特征集输入至分类器,其中,所述分类器包括有多个子分类器。
在本实施例中,所述预设维度的特征集作为分类器的输入信号进行输入。所述分类器中包括有多个子分类器,每个子分类器即对应为本实施例中的一个汉字。
请参阅图3,图3是本发明较佳实施例提供的空中手写识别的另一种流程示意图。所述方法还包括:
步骤S209,训练分类器。
请参阅图4,所述步骤S209包括子步骤S2091、子步骤S2092、子步骤S2093和子步骤S2094,所述步骤S209的子步骤的具体流程如下:
子步骤S2091,获取训练手势轨迹的坐标序列,提取所述训练手势轨迹的坐标序列的多个方向的特征集。
在本实施例中,所述训练手势轨迹可以选择日常使用频率较高的中文汉字。所述体感控制器150采集多个训练手势轨迹并获取到所述训练手势轨迹对应的坐标序列,从而在所述坐标序列中提取到多个方向的特征集。其中,所述方向可以进行设定,优选地,本实施例提取所述训练手势轨迹的坐标序列的八个方向的特征集。
子步骤S2092,对所述训练手势轨迹的坐标序列的多个方向的特征集进行降维,得到预设维度的特征集。
同样地,采用主成分分析方法(PCA)及线性判别式分析方法(LDA)对所述坐标序列的多个方向的特征集进行降维,具体过程跟上述步骤S220类似,在此不再赘述。
子步骤S2093,根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量。
下面结合具体的示例对上述实施例的技术方案进行简要说明。
假设所述训练第c个手势轨迹的坐标序列的多个方向的特征集为xc={x1,x2,...,xNc},其中xc为第c个手势轨迹的特征集。通过公式可以计算出所述特征集的均值向量μc。
将上述计算得到的所述特征集的均值向量μc代入公式中可以求得所述特征集的协方差矩阵∑c。
接下来采用奇异值分解方法对所述特征集的协方差矩阵∑c进行计算,求出构成所述特征集的基向量,所述的基向量即为本实施例中的所述训练手势轨迹的特征向量。
子步骤S2094,将处于预设特征值范围内的特征向量作为分类器中的子分类器。
根据上述求得的所述训练手势轨迹的特征向量,对所述特征向量进行筛选,选取其中预设特征值范围内的特征向量来作为分类器中的一个子分类器。所述预设特征值范围可以进行设定,优选地,在本实施例中,可以选取其中特征值大小排序为前十五对应的特征向量作为分类器中的一个子分类器。
步骤S250,所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
具体地,请参阅图5,所述步骤S250包括子步骤S251和子步骤S252。
所述子步骤S251,将所述预设维度的特征集与所述分类器中的各个子分类器的均值向量相减得到向量差值。
具体地,假设所述预设维度的特征集为y,所述子分类器的均值向量为μc,则所述向量差值为y-μc。如此,则可以计算得到所述预设维度的特征集与所述分类器中各个子分类器的均值向量的若干个向量差值。
所述步骤S252,根据所述向量差值计算得到所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
计算到所述预设维度的特征集与所述分类器中各个子分类器的均值向量的若干个向量差值之后,通过目标函数
进行优化最终得到所述预设维度的特征集在第c类子分类器的编码系数αc,通过采用最小二乘方法,上式可以简化成
αc=(1+λ)-1Dc T(y-μc)
其中,Dc由所述分类器的单位正交基向量构成。如此得到了所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
请再次参阅图3,步骤S260,根据所述稀疏编码系数和与所述稀疏编码系数对应的子分类器,得到所述预设维度的特征集与各个子分类器之间的重构误差。
具体地,为了获取所述预设维度的特征集在所述分类器中的所在子分类器,需要计算所述特征集与各个子分类器的相似性,即重构误差。设所述特征集与第c类子分类器之间的重构误差为rc,则计算所述重构误差的公式如下:
通过上式可以计算得到所述预设维度的特征集与各个子分类器之间的重构误差。
步骤S270,对所述重构误差进行排序,输出识别结果。
在计算完所述预设维度的特征集与各个子分类器之间的重构误差之后,对所述重构误差进行排序,将处于预设数值范围内的重构误差所对用的子分类器作为所述手势轨迹的识别结果。其中所述预设数值范围可以进行设定,具体地,在本实施例中,可以设置重构误差最小的五个子分类器作为所述手势轨迹的识别结果。
请参阅图6,所述空中手写识别装置200包括采集模块210、提取模块220、降维模块230、输入模块240、编码系数计算模块250、重构误差计算模块260和识别模块270。
采集模块210,用于采集待识别的手势轨迹.
提取模块220,用于获取所述待识别的手势轨迹的坐标序列,提取所述坐标序列的多个方向的特征集。
降维模块230,用于对所述坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集。
输入模块240,用于将所述预设维度的特征集输入至分类器,其中,所述分类器包括有多个子分类器。
编码系数计算模块250,用于所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
重构误差计算模块260,用于根据所述稀疏编码系数和与所述稀疏编码系数对应的子分类器,得到所述预设维度的特征集与各个子分类器之间的重构误差。
识别模块270,用于对所述重构误差进行排序,输出识别结果。
请参阅图7,所述空中手写识别装置200还包括训练模块209,所述训练模块209用于训练分类器。
请参阅图8,所述训练模块209包括获取子模块2091、降维子模块2092、特征向量计算子模块2093以及子分类器训练子模块2094。
获取子模块2091,用于获取训练手势轨迹的坐标序列,提取所述训练手势轨迹的坐标序列的多个方向的特征集.
降维子模块2092,用于对所述训练手势轨迹的坐标序列的多个方向的特征集进行降维,得到预设维度的特征集。
特征向量计算子模块2093,用于根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量。
子分类器训练子模块2094,用于将处于预设特征值范围内的特征向量作为分类器中的子分类器。
综上所述,本发明提供的空中手写识别方法及装置,其通过提取出输入的手势轨迹的特征集,依据稀疏编码分类的方式求取出所述手势轨迹的特征集与每个分类器的重构误差对空中手写的汉字进行识别,计算简单,识别效率高,能够实现在线的空中手写识别。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种空中手写识别方法,应用于用户终端,其特征在于,所述方法包括:
采集待识别的手势轨迹;
获取所述待识别的手势轨迹的坐标序列,提取所述坐标序列的多个方向的特征集;
对所述坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集;
将所述预设维度的特征集输入至分类器,其中,所述分类器包括有多个子分类器;
所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数;
根据所述稀疏编码系数和与所述稀疏编码系数对应的子分类器,得到所述预设维度的特征集与各个子分类器之间的重构误差;
对所述重构误差进行排序,输出识别结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括训练分类器的步骤,所述步骤包括:
获取训练手势轨迹的坐标序列,提取所述训练手势轨迹的坐标序列的多个方向的特征集;
对所述训练手势轨迹的坐标序列的多个方向的特征集进行降维,得到预设维度的特征集;
根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量;
将处于预设特征值范围内的特征向量作为分类器中的子分类器。
3.根据权利要求2所述的方法,其特征在于,所述根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量的步骤包括:
采用主成分分析方法对所述特征集进行计算,得到所述特征集的协方差矩阵;
利用奇异值分解方法对所述协方差矩阵进行计算,得到所述训练手势轨迹的特征向量。
4.根据权利要求1所述的方法,其特征在于,所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数的步骤包括:
将所述预设维度的特征集与所述分类器中的各个子分类器的均值向量相减得到向量差值;
根据所述向量差值计算得到所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
5.根据权利要求1所述的方法,其特征在于,所述对所述重构误差进行排序,输出识别结果的步骤包括:
将处于预设数值范围的重构误差所对应的子分类器作为所述手势轨迹的识别结果。
6.一种空中手写识别装置,应用于用户终端,其特征在于,所述装置包括:
采集模块,用于采集待识别的手势轨迹;
提取模块,用于获取所述待识别的手势轨迹的坐标序列,提取所述坐标序列的多个方向的特征集;
降维模块,用于对所述坐标序列的多个方向的特征集进行降维,得到降维后的预设维度的特征集;
输入模块,用于将所述预设维度的特征集输入至分类器,其中,所述分类器包括有多个子分类器;
编码系数计算模块,用于所述分类器计算所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数;
重构误差计算模块,用于根据所述稀疏编码系数和与所述稀疏编码系数对应的子分类器,得到所述预设维度的特征集与各个子分类器之间的重构误差;
识别模块,用于对所述重构误差进行排序,输出识别结果。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
训练模块,用于训练分类器,所述训练模块包括:
获取子模块,用于获取训练手势轨迹的坐标序列,提取所述训练手势轨迹的坐标序列的多个方向的特征集;
降维子模块,用于对所述训练手势轨迹的坐标序列的多个方向的特征集进行降维,得到预设维度的特征集;
特征向量计算子模块,用于根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量;
子分类器训练子模块,用于将处于预设特征值范围内的特征向量作为分类器中的子分类器。
8.根据权利要求7所述的装置,其特征在于,所述根据得到的预设维度的特征集计算得到所述训练手势轨迹的特征向量的步骤包括:
采用主成分分析装置对所述特征集进行计算,得到所述特征集的协方差矩阵;
利用奇异值分解装置对所述协方差矩阵进行计算,得到所述训练手势轨迹的特征向量。
9.根据权利要求6所述的装置,其特征在于,所述编码系数计算模块计算所述稀疏编码系数的方式包括:
将所述预设维度的特征集与所述分类器中的各个子分类器的均值向量相减得到向量差值;
根据所述向量差值计算得到所述预设维度的特征集在所述分类器中的各个子分类器的稀疏编码系数。
10.根据权利要求6所述的装置,其特征在于,所述识别模块输出识别结果的方式包括:
将处于预设数值范围的重构误差所对应的子分类器作为所述手势轨迹的识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611154296.8A CN106599842B (zh) | 2016-12-14 | 2016-12-14 | 空中手写识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611154296.8A CN106599842B (zh) | 2016-12-14 | 2016-12-14 | 空中手写识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106599842A true CN106599842A (zh) | 2017-04-26 |
CN106599842B CN106599842B (zh) | 2019-01-11 |
Family
ID=58802416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611154296.8A Active CN106599842B (zh) | 2016-12-14 | 2016-12-14 | 空中手写识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599842B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886299A (zh) * | 2019-01-16 | 2019-06-14 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN111738141A (zh) * | 2020-06-19 | 2020-10-02 | 首都师范大学 | 一种硬笔书法作品评判方法 |
CN118196910A (zh) * | 2024-05-17 | 2024-06-14 | 江西求是高等研究院 | 一种手势交互方法、系统、计算机及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103257711A (zh) * | 2013-05-24 | 2013-08-21 | 河南科技大学 | 空间手势输入方法 |
CN104915009A (zh) * | 2015-06-25 | 2015-09-16 | 深圳先进技术研究院 | 手势预判的方法及系统 |
CN104933408A (zh) * | 2015-06-09 | 2015-09-23 | 深圳先进技术研究院 | 手势识别的方法及系统 |
-
2016
- 2016-12-14 CN CN201611154296.8A patent/CN106599842B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103257711A (zh) * | 2013-05-24 | 2013-08-21 | 河南科技大学 | 空间手势输入方法 |
CN104933408A (zh) * | 2015-06-09 | 2015-09-23 | 深圳先进技术研究院 | 手势识别的方法及系统 |
CN104915009A (zh) * | 2015-06-25 | 2015-09-16 | 深圳先进技术研究院 | 手势预判的方法及系统 |
Non-Patent Citations (1)
Title |
---|
刘威: "基于后验HOG特征的多姿态行人检测", 《电子学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886299A (zh) * | 2019-01-16 | 2019-06-14 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN109886299B (zh) * | 2019-01-16 | 2024-05-24 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN111738141A (zh) * | 2020-06-19 | 2020-10-02 | 首都师范大学 | 一种硬笔书法作品评判方法 |
CN111738141B (zh) * | 2020-06-19 | 2023-07-07 | 首都师范大学 | 一种硬笔书法作品评判方法 |
CN118196910A (zh) * | 2024-05-17 | 2024-06-14 | 江西求是高等研究院 | 一种手势交互方法、系统、计算机及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106599842B (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Deep convolutional BiLSTM fusion network for facial expression recognition | |
Ko | A brief review of facial emotion recognition based on visual information | |
Fan et al. | A dynamic framework based on local Zernike moment and motion history image for facial expression recognition | |
Lee et al. | Kinect-based Taiwanese sign-language recognition system | |
CN110796031A (zh) | 基于人工智能的表格识别方法、装置及电子设备 | |
Siddiqi et al. | Facial expression recognition using active contour-based face detection, facial movement-based feature extraction, and non-linear feature selection | |
Qiu et al. | Hierarchical context features embedding for object detection | |
CN106056082B (zh) | 一种基于稀疏低秩编码的视频动作识别方法 | |
CN111461174B (zh) | 多层次注意力机制的多模态标签推荐模型构建方法及装置 | |
CN104915658B (zh) | 一种基于情感分布学习的情感成分分析方法及其系统 | |
Kaluri et al. | A framework for sign gesture recognition using improved genetic algorithm and adaptive filter | |
CN106599842A (zh) | 空中手写识别方法及装置 | |
Vaegae et al. | Design of an efficient distracted driver detection system: deep learning approaches | |
CN111144130A (zh) | 一种基于上下文感知的混合神经网络的细粒度情感分类方法 | |
CN111209811A (zh) | 一种实时检测眼球注意力位置的方法及系统 | |
CN113793256A (zh) | 基于用户标签的动漫人物生成方法、装置、设备及介质 | |
CN113408321A (zh) | 一种轻量级图像、视频数据的实时目标检测方法及装置 | |
CN108932533A (zh) | 识别模型构建方法及装置、字符识别方法及装置 | |
Veres et al. | Application of Methods of Machine Learning for the Recognition of Mathematical Expressions. | |
CN112733645A (zh) | 手写签名校验方法、装置、计算机设备及存储介质 | |
CN116935449A (zh) | 指纹图像匹配模型训练方法、指纹匹配方法及相关介质 | |
Yao et al. | Depth-based human activity recognition via multi-level fused features and fast broad learning system | |
CN113723077B (zh) | 基于双向表征模型的句向量生成方法、装置及计算机设备 | |
Kakizaki et al. | Dynamic Japanese Sign Language Recognition Throw Hand Pose Estimation Using Effective Feature Extraction and Classification Approach | |
Cambuim et al. | An efficient static gesture recognizer embedded system based on ELM pattern recognition algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |