CN111104886A - 手势识别方法、装置、设备和存储介质 - Google Patents

手势识别方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111104886A
CN111104886A CN201911261691.XA CN201911261691A CN111104886A CN 111104886 A CN111104886 A CN 111104886A CN 201911261691 A CN201911261691 A CN 201911261691A CN 111104886 A CN111104886 A CN 111104886A
Authority
CN
China
Prior art keywords
information
gesture
track
ratio
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911261691.XA
Other languages
English (en)
Inventor
闫俊超
姜鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipone Technology Beijing Co Ltd
Original Assignee
Chipone Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipone Technology Beijing Co Ltd filed Critical Chipone Technology Beijing Co Ltd
Priority to CN201911261691.XA priority Critical patent/CN111104886A/zh
Publication of CN111104886A publication Critical patent/CN111104886A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本申请提供一种手势识别方法、装置、设备和存储介质,方法包括:获取输入的手势轨迹信息;根据所述手势轨迹信息,生成所述手势轨迹的特征点集;选取预设手势库中对应于所述特征点集的字符信息。本申请实现了根据用户输入的手势轨迹信息,识别该手势轨迹对应的字符信息。

Description

手势识别方法、装置、设备和存储介质
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种手势识别方法、装置、设备和存储介质。
背景技术
手势识别是计算机科学和语言技术中的一个主题,目的是通过数学算法来识别人类手势。
现有的手势识别算法中,一般可分为两类:
第一类:基于图像数据的手势识别,如采用摄像头拍摄图像,大量处理图像数据,进行识别,该类手势识别算法较多,可以采用较为复杂的算法,如神经网络,机器学习等算法,且较为成熟;但这些算法常用在电脑等具备高处理性能的设备中。
第二类:是基于传感器数据的手势识别,如用在触摸屏中的手势识别,这类算法由于设备(处理)性能较低,不能使用以上高端算法,且对信息处理响应实时性较高,因此需要合理优化算法,以达到精度高、响应快的目的。该方案一般采用方向码匹配法,对手势字符进行识别,具体的:对人的手指触摸信息进行坐标、方向的解析,然后与预设手势库进行匹配,若与预设手势对应的字符完全匹配,则视为手势识别成功。
但是,上述第二类识别方式判断维度较为单一,常出现误判、漏判等情况。
发明内容
本申请实施例的目的在于提供一种手势识别方法、装置、设备和存储介质,用以实现根据用户输入的手势轨迹信息,识别该手势轨迹对应的字符信息。
本申请实施例第一方面提供了一种手势识别方法,包括:获取输入的手势轨迹信息;根据所述手势轨迹信息,生成所述手势轨迹的特征点集;选取预设手势库中对应于所述特征点集的字符信息。
于一实施例中,所述获取输入的手势轨迹信息,包括:在所述手势轨迹信息的输入过程中,分别获取所述手势轨迹的起点信息、中间点信息和终点信息。
于一实施例中,所述中间点信息包括:所述手势轨迹的多个中间轨迹点信息和拐点信息;所述分别获取所述手势轨迹的起点信息、中间点信息和终点信息,包括:记录所述手势轨迹的起点信息;每隔预设帧数,记录所述手势轨迹的多个中间轨迹点信息;于所述中间轨迹点中,提取所述手势轨迹的所有拐点信息;记录所述手势轨迹的终点信息。
于一实施例中,所述根据所述手势轨迹信息,生成所述手势轨迹的特征点集,包括:统计每个所述起点信息、中间点信息和终点信息的位置信息,生成初始点集;于所述初始点集中,分别计算每对相邻点之间的相邻距离;判断所有所述相邻距离中,是否存在小于距离阈值的相邻距离;当存在小于所述距离阈值的所述相邻距离时,删除构成所述小于所述距离阈值的所述相邻距离的末点,并生成所述特征点集。
于一实施例中,在所述分别计算每对相邻点之间的相邻距离之后,还包括:于多个所述相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值;判断所述比值是否小于第一比值阈值;当所述比值小于所述第一比值阈值时,从所述初始点集中,剔除构成所述前一个相邻距离的末点后,生成所述特征点集;当所述比值大于或等于所述第一比值阈值时,判断所述比值是否大于第二比值阈值;当所述比值大于第二比值阈值时,从所述初始点集中,剔除构成所述当前相邻距离的末点后,生成所述特征点集。
于一实施例中,所述选取预设手势库中对应于所述特征点集的字符信息,包括:将所述特征点集中的特征点,按照所述手势轨迹输入顺序,依次连接,生成特征轨迹;选取预设手势库中对应于所述特征轨迹的字符信息。
本申请实施例第二方面提供了一种手势识别装置,包括:获取模块,用于获取输入的手势轨迹信息;生成模块,用于根据所述手势轨迹信息,生成所述手势轨迹的特征点集;选取模块,用于选取预设手势库中对应于所述特征点集的字符信息。
于一实施例中,获取模块用于:在所述手势轨迹信息的输入过程中,分别获取所述手势轨迹的起点信息、中间点信息和终点信息。
于一实施例中,所述中间点信息包括:所述手势轨迹的多个中间轨迹点信息和拐点信息;所述获取模块用于:记录所述手势轨迹的起点信息;每隔预设帧数,记录所述手势轨迹的多个中间轨迹点信息;于所述中间轨迹点中,提取所述手势轨迹的所有拐点信息;记录所述手势轨迹的终点信息。
于一实施例中,所述生成模块用于:统计每个所述起点信息、中间点信息和终点信息的位置信息,生成初始点集;于所述初始点集中,分别计算每对相邻点之间的相邻距离;判断所有所述相邻距离中,是否存在小于距离阈值的相邻距离;当存在小于所述距离阈值的所述相邻距离时,删除构成所述小于所述距离阈值的所述相邻距离的末点,并生成所述特征点集。
于一实施例中,在所述分别计算每对相邻点之间的相邻距离之后,所述生成模块还用于:于多个所述相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值;判断所述比值是否小于第一比值阈值;当所述比值小于所述第一比值阈值时,从所述初始点集中,剔除构成所述前一个相邻距离的末点后,生成所述特征点集;当所述比值大于或等于所述第一比值阈值时,判断所述比值是否大于第二比值阈值;当所述比值大于第二比值阈值时,从所述初始点集中,剔除构成所述当前相邻距离的末点后,生成所述特征点集。
于一实施例中,所述选取模块用于:将所述特征点集中的特征点,按照所述手势轨迹输入顺序,依次连接,生成特征轨迹;选取预设手势库中对应于所述特征轨迹的字符信息。
本申请实施例第三方面提供了一种电子设备,包括:存储器,用以存储计算机程序;处理器,用以执行本申请实施例第一方面及其任一实施例的方法。
本申请实施例第四方面提供了一种非暂态电子设备可读存储介质,包括:程序,当其藉由电子设备运行时,使得所述电子设备执行本申请实施例第一方面及其任一实施例的方法。
本申请提供的手势识别方法、装置、设备和存储介质,通过对用户输入的手势轨迹信息进行特征点集提取,生成对应于手势轨迹的特征点集,并根据特征点集选取合适的字符信息,进而实现对手势轨迹的识别。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例的电子设备的结构示意图;
图2为本申请一实施例的手势识别方法的流程示意图;
图3A为本申请一实施例的手势识别方法的流程示意图;
图3B为本申请一实施例的冗余轨迹的示意图;
图4为本申请一实施例的手势识别方法的流程示意图;
图5为本申请一实施例的手势识别装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如图1所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图1中以一个处理器为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行。
于一实施例中,电子设备1可以是手机、笔记本电脑等设备,电子设备1可以具有触摸屏,用于接收用户通过触摸该触摸屏输入的手势轨迹信息。并根据手势轨迹信息,生成手势轨迹的特征点集,从预设手势库中选取对应于特征点集的字符信息。
于一实施例中,电子设备1还可以具有非触摸探测器,例如体感控制(motionsensing control)用于接收用户隔空输入的手势轨迹信息。
请参看图2,其为本申请一实施例的手势识别方法,该方法可由图1所示的电子设备1来执行,以实现根据用户输入的手势轨迹信息,识别该手势轨迹对应的字符信息。该方法包括如下步骤:
步骤201:获取输入的手势轨迹信息。
在本步骤中,手势轨迹的输入可以在各种触摸屏或手写屏的使用场景中,也可以是隔空采集手势轨迹信息。以智能手机输入手机轨迹为例,通过触摸屏实时采集用户输入的手势轨迹信息,比如用户在触摸屏上写下的字符轨迹信息、图画轨迹信息等。
于一实施例中,步骤201具体包括:在手势轨迹信息的输入过程中,分别获取手势轨迹的起点信息、中间点信息和终点信息。
在本步骤中,手势轨迹信息包含但不限于手势轨迹的起点信息、中间点信息和终点信息,手势轨迹的起点和终点可以保证手势轨迹的完整性。中间点位于起点和终点之间,可以表征手势轨迹的变化过程,以便于更加准确的识别该手势轨迹所表征的实际信息。在手势轨迹输入的过程中,实时采集上述点信息,点信息可以是各个点的位置信息和/或者像素信息等。
步骤202:根据手势轨迹信息,生成手势轨迹的特征点集。
在本步骤中,手势轨迹信息中包含了一个手势轨迹的各种要素信息,从中提取可以表征该手势轨迹的特征点,并将多个特征点组成该手势轨迹的特征点集,该特征点集可以完整的表征该手势轨迹。如此,不必要的点信息不计入计算,可以降低手势识别中的计算量。
步骤203:选取预设手势库中对应于特征点集的字符信息。
在本步骤中,可以结合方向码分类器进行手势轨迹的识别,预设手势库中存储了特征点集与字符信息的对应关系,确定了特征点集后,将特征点集与预设手势库进行匹配,从中可以选取对应于该特征点集的特定字符信息,则该字符信息也就是用户输入的手势轨迹对应的字符信息,如此完成了手势轨迹的识别。
上述手势识别方法,通过对用户输入的手势轨迹的起点、终点和中间点信息进行特征点集提取,生成对应于手势轨迹的特征点集,并根据特征点集选取合适的字符信息,进而实现对手势轨迹的识别。该方案可以应用在所有的触摸手势识别场景中,可以实现对复杂字符,如汉字的识别。
请参看图3,其为本申请一实施例的手势识别方法,该方法可由图1所示的电子设备1来执行,以实现根据用户输入的手势轨迹信息,识别该手势轨迹对应的字符信息。该方法包括如下步骤:
步骤301:记录手势轨迹的起点信息。
在本步骤中,比如当手机进入手势侦测模式时,在手势轨迹信息的输入过程中,记录手势轨迹的起点坐标(x1,y1)。
步骤302:每隔预设帧数,记录手势轨迹的多个中间轨迹点信息。
在本步骤中,在步骤301之后,每隔预设帧数,依次记录手势轨迹的中间轨迹点信息(xi,yi),其中,xi为第i个中间轨迹点的横坐标,yi为第i个中间轨迹点的纵坐标,i为大于1的正整数。
步骤303:于中间轨迹点中,提取手势轨迹的所有拐点信息。
在本步骤中,除起点和终点外的轨迹点,都可以称为中间轨迹点,中间轨迹点中除去拐点剩余的部分,可以称之为中间点。拐点表征手势轨迹发生轨迹弯折、笔划方向转换等信息,比如汉字中笔划横折
Figure BDA0002311763960000072
其中笔划弯折处的点就可以称为拐点。当然,拐点还可以是其他情况,并不局限于笔划。依次从中间轨迹点中提取拐点信息,并记录拐点信息为(xm,ym),其中xm为第m个拐点的横坐标,ym为第m个拐点的纵坐标,m为正整数。
步骤304:记录手势轨迹的终点信息。
在本步骤中,在用户输入手势轨迹信息的过程中,将手势轨迹停止处的点称为终点,记录轨迹的终点坐标为(xn,yn),其中,n为i的最后一个取值。
步骤305:统计每个起点信息、中间点信息和终点信息的位置信息,生成初始点集。
在本步骤中,对步骤301至步骤304中记录的点信息进行统计,得到初始点集A={(x1,y1),(x1+N,y1+N),…,(xm,ym),…,(xn-N,yn-N),(xn,yn)},其中N表示记录两次点信息之间间隔的预设帧数。
步骤306:于初始点集中,分别计算每对相邻点之间的相邻距离。
在本步骤中,初始点集中依次记录轨迹点的信息,每对相邻点之间存在一定相邻距离,此处可以采用两点之间的欧氏距离表征相邻距离,可以采用如下公式计算每对相邻点之间的相邻距离:
Figure BDA0002311763960000071
其中,假设点A、点B、点C为初始点集中依次排列的三个轨迹点,xi为初始点集中第i个中间轨迹点C的横坐标,yi为第i个中间轨迹点C的纵坐标,i为大于1的正整数。xi-1为初始点集中第i-1个中间轨迹点B的横坐标,yi-1为第i-1个中间轨迹点B的纵坐标。ρi为点C与点B之间的欧式距离。
步骤307:于多个相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值。
在本步骤中,可以采用如下公式计算:
Figure BDA0002311763960000081
其中,假设点A、点B、点C为初始点集中依次排列的三个轨迹点,ρi为点C与点B之间的欧式距离,设ρi为上述的当前相邻距离,ρi-1为点B与点A之间的欧式距离,即上述前一个相邻距离,δi为上述的比值。
步骤308:判断比值是否小于第一比值阈值。如果是,进入步骤309,否则进入步骤310。
在本步骤中,第一比值阈值可以根据人的书写习惯进行数据分析所得的结果来进行预先设定,主要可以针对一些特殊笔划,如收笔习惯、字体偏斜习惯等,统计出大多数人的熟悉习惯,然后设定第一比值阈值。δi表征了相邻笔划段之间的比例大小,如果该比值δi过小,说明ρi-1表征的笔划段是由书写习惯带来的冗余笔划,如图3B所示,字符“V”的一种手势轨迹,其中起笔和收笔的冗余轨迹300就是冗余笔划,字母V的起笔冗余笔划对应的δi会很小。该冗余笔划并不是构成字符的必要信息,第一比值阈值可用于判别是否属于冗余笔划。
步骤309:从初始点集中,剔除构成前一个相邻距离的末点后,生成特征点集。进入步骤313。
在本步骤中,当比值δi小于第一比值阈值时,说明ρi-1表征的笔划段是由书写习惯带来的冗余笔划,该冗余笔划并不是构成字符的必要信息,因此,可以剔除构成ρi-1的末点,比如图3B所示,可以剔除冗余轨迹300的末点,剩余的轨迹点信息组成特征点集。并进入步骤313。
步骤310:判断比值是否大于第二比值阈值。如果是,进入步骤311,否则进入步骤312。
在本步骤中,同样的,第二比值阈值也可以根据人的书写习惯进行数据分析所得的结果来进行预先设定,主要可以针对一些特殊笔划,如收笔习惯等,统计出大多数人的熟悉习惯,然后设定第二比值阈值。当比值δi大于或等于第一比值阈值,且该比值δi大于第二比值阈值时,说明ρi表征的笔划段是由书写习惯带来的冗余笔划,比如图3B所示的字母V的收笔冗余轨迹300对应的δi会很大。
步骤311:从初始点集中,剔除构成当前相邻距离的末点后,生成特征点集。进入步骤313。
在本步骤中,当比值δi大于第二比值阈值时,说明ρi表征的笔划段是由书写习惯带来的冗余笔划,该冗余笔划并不是构成字符的必要信息,因此,可以剔除构成ρi的末点,比如图3B所示,可以剔除字母V的收笔冗余轨迹300的末点,剩余的轨迹点信息组成特征点集。并进入步骤313。
步骤312:将初始点集作为手势轨迹的特征点集。
在本步骤中,当比值δi大于或等于第一比值阈值,且小于或等于第二比值阈值时,说明初始点集中的轨迹点信息不仅可以表征手势轨迹的特征信息,而且不存在无效或者冗余的轨迹点信息,因此,可以将其直接作为该手势轨迹的特征点集。
步骤313:将特征点集中的特征点,按照手势轨迹输入顺序,依次连接,生成特征轨迹。
在本步骤中,确定了手势轨迹的特征点集后,可以直接将特征点集中的轨迹点按照输入顺序,依次连接成笔划,并最终生成特征轨迹。
步骤314:选取预设手势库中对应于特征轨迹的字符信息。详细参见上述实施例中对步骤203的描述。
请参看图4,其为本申请一实施例的手势识别方法,该方法可由图1所示的电子设备1来执行,以实现根据用户输入的手势轨迹信息,识别该手势轨迹对应的字符信息。该方法包括如下步骤:
步骤401:记录手势轨迹的起点信息。详细参见上述实施例中对步骤301的描述。
步骤402:每隔预设帧数,记录手势轨迹的多个中间轨迹点信息。详细参见上述实施例中对步骤302的描述。
步骤403:于中间轨迹点中,提取手势轨迹的所有拐点信息。详细参见上述实施例中对步骤303的描述。
步骤404:记录手势轨迹的终点信息。详细参见上述实施例中对步骤304的描述。
步骤405:统计每个起点信息、中间点信息和终点信息的位置信息,生成初始点集。详细参见上述实施例中对步骤305的描述。
步骤406:于初始点集中,分别计算每对相邻点之间的相邻距离。详细参见上述实施例中对步骤306的描述。
步骤407:判断所有相邻距离中,是否存在小于距离阈值的相邻距离,如果存在,进入步骤408,否则进入步骤409。
在本步骤中,距离阈值可以预先根据大量数据的采集分析获得,比如根据人的手势书写习惯,一般人的书写习惯起笔存在很小的无效笔划,这部分起笔习惯造成的无效笔划一般远小于实际字符的笔划,其并不是字符的组成部分,为了去除这些无效笔划,可以根据大多数人的书写习惯,统计出这些起笔习惯的无效笔划的轨迹点之间的相邻距离信息,由此确定距离阈值的大小。
步骤408:删除构成小于距离阈值的相邻距离的末点,并生成特征点集。进入步骤413。
在本步骤中,当存在小于距离阈值的ρi时,说明构成小于距离阈值的ρi的两个相邻轨迹点连起来的笔划,是由于人的书写习惯带来的无效笔划,为了提高手势识别的准确性,删除这两个点中的末点,此处,末点是构成无效笔划末端的点。剩余的轨迹点信息依次组成手势轨迹的特征点集,然后进入步骤413。
步骤409:于多个相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值。
在本步骤中,当多个相邻距离中不存在小于距离阈值的ρi时,分别计算两个相邻的相邻距离之间的比值,比如可以采用如下公式计算:
Figure BDA0002311763960000111
其中,假设点A、点B、点C为初始点集中依次排列的三个轨迹点,ρi为点C与点B之间的欧式距离,设ρi为上述的当前相邻距离,ρi-1为点B与点A之间的欧式距离,即上述前一个相邻距离,δi为上述的比值。
步骤410:判断比值是否小于第一比值阈值。详细参见上述实施例中对步骤308的描述。如果是,进入步骤411,否则进入步骤412。
步骤411:从初始点集中,剔除构成前一个相邻距离的末点后,生成特征点集。并进入步骤415。详细参见上述实施例中对步骤309的描述。
步骤412:判断比值是否大于第二比值阈值。如果是,进入步骤413,否则进入步骤414。详细参见上述实施例中对步骤310的描述。
步骤413:从初始点集中,剔除构成当前相邻距离的末点后,生成特征点集。进入步骤415。详细参见上述实施例中对步骤311的描述步骤414:将初始点集作为手势轨迹的特征点集。
在本步骤中,当多个相邻距离中不存在小于距离阈值的ρi,并且比值δi大于或小于第一比值阈值,且小于或等于第二比值阈值时,说明初始点集中的轨迹点信息不仅可以表征手势轨迹的特征信息,而且不存在无效或者冗余的轨迹点信息,因此,可以将其直接作为该手势轨迹的特征点集。
步骤415:将特征点集中的特征点,按照手势轨迹输入顺序,依次连接,生成特征轨迹。详细参见上述实施例中对步骤311的描述。
步骤416:选取预设手势库中对应于特征轨迹的字符信息。详细参见上述实施例中对步骤203的描述。
请参看图5,其为本申请一实施例的手势识别装置500,该装置可应用于图1所示的电子设备,以实现根据用户输入的手势轨迹信息,识别该手势轨迹对应的字符信息。该装置包括:获取模块501,生成模块502和选取模块503,各个模块的原理关系如下:
获取模块501,用于获取输入的手势轨迹信息。详细参见上述实施例中对步骤201的描述。
生成模块502,用于根据手势轨迹信息,生成手势轨迹的特征点集。详细参见上述实施例中对步骤202的描述。
选取模块503,用于选取预设手势库中对应于特征点集的字符信息。详细参见上述实施例中对步骤203的描述。
于一实施例中,获取模块501用于:在手势轨迹信息的输入过程中,分别获取手势轨迹的起点信息、中间点信息和终点信息。详细参见上述实施例中对步骤201的描述。
于一实施例中,中间点信息包括:手势轨迹的多个中间轨迹点信息和拐点信息。获取模块501用于:记录手势轨迹的起点信息。每隔预设帧数,记录手势轨迹的多个中间轨迹点信息。于中间轨迹点中,提取手势轨迹的所有拐点信息。记录手势轨迹的终点信息。详细参见上述实施例中对步骤301至步骤304的描述。
于一实施例中,生成模块502用于:统计每个起点信息、中间点信息和终点信息的位置信息,生成初始点集。于初始点集中,分别计算每对相邻点之间的相邻距离。判断所有相邻距离中,是否存在小于距离阈值的相邻距离。当存在小于距离阈值的相邻距离时,删除构成小于距离阈值的相邻距离的末点,并生成特征点集。详细参见上述实施例中对步骤305至步骤306以及步骤407至步骤408的描述。
于一实施例中,在分别计算每对相邻点之间的相邻距离之后,生成模块502还用于:于多个相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值。判断比值是否小于第一比值阈值。当比值小于第一比值阈值时,从初始点集中,剔除构成前一个相邻距离的末点后,生成特征点集。当比值大于或等于第一比值阈值时,判断比值是否大于第二比值阈值;当比值大于第二比值阈值时,从初始点集中,剔除构成当前相邻距离的末点后,生成特征点集。详细参见上述实施例中对步骤307至步骤312的描述。
于一实施例中,选取模块503用于:将特征点集中的特征点,按照手势轨迹输入顺序,依次连接,生成特征轨迹。选取预设手势库中对应于特征轨迹的字符信息。详细参见上述实施例中对步骤311至步骤312的描述。
上述手势识别装置500的详细描述,请参见上述实施例中相关方法步骤的描述。
本发明实施例还提供了一种非暂态电子设备可读存储介质,包括:程序,当其在电子设备上运行时,使得电子设备可执行上述实施例中方法的全部或部分流程。其中,存储介质可为磁盘、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等。存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (14)

1.一种手势识别方法,其特征在于,包括:
获取输入的手势轨迹信息;
根据所述手势轨迹信息,生成所述手势轨迹的特征点集;
选取预设手势库中对应于所述特征点集的字符信息。
2.根据权利要求1所述的方法,其特征在于,所述获取输入的手势轨迹信息,包括:
在所述手势轨迹信息的输入过程中,分别获取所述手势轨迹的起点信息、中间点信息和终点信息。
3.根据权利要求2所述的方法,其特征在于,所述中间点信息包括:所述手势轨迹的多个中间轨迹点信息和拐点信息;所述分别获取所述手势轨迹的起点信息、中间点信息和终点信息,包括:
记录所述手势轨迹的起点信息;
每隔预设帧数,记录所述手势轨迹的多个中间轨迹点信息;
于所述中间轨迹点中,提取所述手势轨迹的所有拐点信息;
记录所述手势轨迹的终点信息。
4.根据权利要求2所述的方法,其特征在于,所述根据所述手势轨迹信息,生成所述手势轨迹的特征点集,包括:
统计每个所述起点信息、中间点信息和终点信息的位置信息,生成初始点集;
于所述初始点集中,分别计算每对相邻点之间的相邻距离;
判断所有所述相邻距离中,是否存在小于距离阈值的相邻距离;
当存在小于所述距离阈值的所述相邻距离时,删除构成所述小于所述距离阈值的所述相邻距离的末点,并生成所述特征点集。
5.根据权利要求4所述的方法,其特征在于,在所述分别计算每对相邻点之间的相邻距离之后,还包括:
于多个所述相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值;
判断所述比值是否小于第一比值阈值;
当所述比值小于所述第一比值阈值时,从所述初始点集中,剔除构成所述前一个相邻距离的末点后,生成所述特征点集;
当所述比值大于或等于所述第一比值阈值时,判断所述比值是否大于第二比值阈值;
当所述比值大于第二比值阈值时,从所述初始点集中,剔除构成所述当前相邻距离的末点后,生成所述特征点集。
6.根据权利要求1所述的方法,其特征在于,所述选取预设手势库中对应于所述特征点集的字符信息,包括:
将所述特征点集中的特征点,按照所述手势轨迹输入顺序,依次连接,生成特征轨迹;
选取预设手势库中对应于所述特征轨迹的字符信息。
7.一种手势识别装置,其特征在于,包括:
获取模块,用于获取输入的手势轨迹信息;
生成模块,用于根据所述手势轨迹信息,生成所述手势轨迹的特征点集;
选取模块,用于选取预设手势库中对应于所述特征点集的字符信息。
8.根据权利要求7所述的装置,其特征在于,所述获取模块用于:
在所述手势轨迹信息的输入过程中,分别获取所述手势轨迹的起点信息、中间点信息和终点信息。
9.根据权利要求8所述的装置,其特征在于,所述中间点信息包括:所述手势轨迹的多个中间轨迹点信息和拐点信息;所述获取模块用于:
记录所述手势轨迹的起点信息;
每隔预设帧数,记录所述手势轨迹的多个中间轨迹点信息;
于所述中间轨迹点中,提取所述手势轨迹的所有拐点信息;
记录所述手势轨迹的终点信息。
10.根据权利要求8所述的装置,其特征在于,所述生成模块用于:
统计每个所述起点信息、中间点信息和终点信息的位置信息,生成初始点集;
于所述初始点集中,分别计算每对相邻点之间的相邻距离;
判断所有所述相邻距离中,是否存在小于距离阈值的相邻距离;
当存在小于所述距离阈值的所述相邻距离时,删除构成所述小于所述距离阈值的所述相邻距离的末点,并生成所述特征点集。
11.根据权利要求10所述的装置,其特征在于,在所述分别计算每对相邻点之间的相邻距离之后,所述生成模块还用于:
于多个所述相邻距离中,分别计算前一个相邻距离与当前相邻距离的比值;
判断所述比值是否小于第一比值阈值;
当所述比值小于所述第一比值阈值时,从所述初始点集中,剔除构成所述前一个相邻距离的末点后,生成所述特征点集;
当所述比值大于或等于所述第一比值阈值时,判断所述比值是否大于第二比值阈值;
当所述比值大于第二比值阈值时,从所述初始点集中,剔除构成所述当前相邻距离的末点后,生成所述特征点集。
12.根据权利要求7所述的装置,其特征在于,所述选取模块用于:
将所述特征点集中的特征点,按照所述手势轨迹输入顺序,依次连接,生成特征轨迹;
选取预设手势库中对应于所述特征轨迹的字符信息。
13.一种电子设备,其特征在于,包括:
存储器,用以存储计算机程序;
处理器,用以执行如权利要求1至6中任一项所述的方法。
14.一种非暂态电子设备可读存储介质,其特征在于,包括:程序,当其藉由电子设备运行时,使得所述电子设备执行权利要求1至6中任一项所述的方法。
CN201911261691.XA 2019-12-10 2019-12-10 手势识别方法、装置、设备和存储介质 Pending CN111104886A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911261691.XA CN111104886A (zh) 2019-12-10 2019-12-10 手势识别方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911261691.XA CN111104886A (zh) 2019-12-10 2019-12-10 手势识别方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN111104886A true CN111104886A (zh) 2020-05-05

Family

ID=70423467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911261691.XA Pending CN111104886A (zh) 2019-12-10 2019-12-10 手势识别方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111104886A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598424A (zh) * 2020-12-29 2021-04-02 武汉天喻聚联科技有限公司 一种基于动作口令的鉴权方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102854982A (zh) * 2012-08-01 2013-01-02 华平信息技术(南昌)有限公司 一种识别自定义手势轨迹的方法
CN104793724A (zh) * 2014-01-16 2015-07-22 北京三星通信技术研究有限公司 空中书写处理方法及装置
CN108965575A (zh) * 2018-05-02 2018-12-07 普联技术有限公司 一种手势动作识别方法、装置和终端设备
US20190087654A1 (en) * 2017-09-15 2019-03-21 Huazhong University Of Science And Technology Method and system for csi-based fine-grained gesture recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102854982A (zh) * 2012-08-01 2013-01-02 华平信息技术(南昌)有限公司 一种识别自定义手势轨迹的方法
CN104793724A (zh) * 2014-01-16 2015-07-22 北京三星通信技术研究有限公司 空中书写处理方法及装置
US20190087654A1 (en) * 2017-09-15 2019-03-21 Huazhong University Of Science And Technology Method and system for csi-based fine-grained gesture recognition
CN108965575A (zh) * 2018-05-02 2018-12-07 普联技术有限公司 一种手势动作识别方法、装置和终端设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598424A (zh) * 2020-12-29 2021-04-02 武汉天喻聚联科技有限公司 一种基于动作口令的鉴权方法及系统

Similar Documents

Publication Publication Date Title
TWI607387B (zh) 字符辨識系統及其字符辨識方法
JP7073522B2 (ja) 空中手書きを識別するための方法、装置、デバイス及びコンピュータ読み取り可能な記憶媒体
JP5211334B2 (ja) 手書き記号の認識方法及び装置
US9904847B2 (en) System for recognizing multiple object input and method and product for same
US9052755B2 (en) Overlapped handwriting input method
CN107609489B (zh) 书法书写路径评价装置、方法及电子设备
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
CN104350509B (zh) 快速姿势检测器
TWI382352B (zh) 視訊手寫文字輸入裝置及其方法
CN111507330B (zh) 习题识别方法、装置、电子设备及存储介质
US11402923B2 (en) Input method, apparatus based on visual recognition, and electronic device
US11482001B2 (en) Image processing device, image processing method, and image processing system
CN112329663B (zh) 一种基于人脸图像序列的微表情时刻检测方法及装置
JP4817297B2 (ja) 文字検索装置
WO2019153587A1 (zh) 用户身份验证方法、装置、计算机设备和存储介质
CN115461792A (zh) 手写文本识别方法、装置和系统,手写文本搜索方法和系统,以及计算机可读存储介质
WO2012085923A1 (en) Method and system for classification of moving objects and user authoring of new object classes
US20150139547A1 (en) Feature calculation device and method and computer program product
CN111104886A (zh) 手势识别方法、装置、设备和存储介质
CN115131693A (zh) 文本内容识别方法、装置、计算机设备和存储介质
Teja et al. A ballistic stroke representation of online handwriting for recognition
JP2014078168A (ja) 文字認識装置及びプログラム
JP2013025390A (ja) 手書き入力方法
CN114359919A (zh) 书写文字的识别方法、计算机设备及存储介质
CN116959007A (zh) 书写轨迹确定方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination