CN112016346A - 手势的识别方法、装置、系统以及信息的处理方法 - Google Patents

手势的识别方法、装置、系统以及信息的处理方法 Download PDF

Info

Publication number
CN112016346A
CN112016346A CN201910453590.6A CN201910453590A CN112016346A CN 112016346 A CN112016346 A CN 112016346A CN 201910453590 A CN201910453590 A CN 201910453590A CN 112016346 A CN112016346 A CN 112016346A
Authority
CN
China
Prior art keywords
image
target gesture
target
gesture
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910453590.6A
Other languages
English (en)
Inventor
谢宏伟
李博韧
古鉴
李名杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910453590.6A priority Critical patent/CN112016346A/zh
Publication of CN112016346A publication Critical patent/CN112016346A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种手势的识别方法、装置、系统以及信息的处理方法。其中,该方法包括:获取待处理的第一图像,其中,第一图像包括目标手势;确定目标手势在第一图像中指示的位置;获取第一图像对应的第二图像,其中,第二图像为预存的标准图像;根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。本申请解决了现有技术中在进行书本的点读时需要对书本本身进行改造,导致只能读取固定的改造过的书本的技术问题。

Description

手势的识别方法、装置、系统以及信息的处理方法
技术领域
本申请涉及智能交互领域,具体而言,涉及一种手势的识别方法、装置、系统以及信息的处理方法。
背景技术
互联网技术的发展给人们的生活、工作以及学习等方面带来了许多便利。例如,儿童在读书时,可以通过点读笔阅读书本上不认识的字词语句。
虽然目前存在许多辅助儿童读书和读绘本的产品,但现有的书本点读产品主要是通过点读笔对书本的内容进行读取。点读笔主要是通过识别书本中特定的微型“二维码”来确定笔尖点读的位置,以及确定读的哪本书的哪一页。该方式比较死板,只能读固定的书本。另外,由于点读笔只能读取特定的微型“二维码”的书本,因此,在生产书本时需要对书本本身进行改造,例如,在书本的特定位置加上上述的微型“二维码”,增加了书本的生产成本。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种手势的识别方法、装置、系统以及信息的处理方法,以至少解决现有技术中在进行书本的点读时需要对书本本身进行改造,导致只能读取固定的改造过的书本的技术问题。
根据本申请实施例的一个方面,提供了一种手势的识别方法,包括:获取待处理的第一图像,其中,第一图像包括目标手势;确定目标手势在第一图像中指示的位置;获取第一图像对应的第二图像,其中,第二图像为预存的标准图像;根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
根据本申请实施例的另一方面,还提供了一种手势的识别系统,包括:图像采集装置,用于获取待处理的第一图像,其中,第一图像包括目标手势;处理器,用于确定第一图像对应的第二图像,和目标手势在第一图像中指示的位置,其中,第二图像为预存的标准图像,第二图像与第一图像包括相同的内容;处理器还用于根据目标手势在第一图像中指示的位置,确定目标手势所指示的内容。
根据本申请实施例的另一方面,还提供了一种台灯,该台灯包括上述的手势的识别系统。
根据本申请实施例的另一方面,还提供了一种信息的处理方法,包括:采集待处理的图像信息,其中,图像信息包括指向目标内容的目标手势;根据图像信息确定目标手势所指示的目标内容;播放目标内容对应的多媒体信息。
根据本申请实施例的另一方面,还提供了一种信息的处理装置,包括:获取模块,用于获取待处理的第一图像,其中,第一图像包括目标手势;第一确定模块,用于确定目标手势在第一图像中指示的位置;获取第一图像对应的第二图像,其中,第二图像为预存的标准图像;第二确定模块,用于根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的手势的识别方法。
根据本申请实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述的手势的识别方法。
在本申请实施例中,采用手势识别的方式,在获取到包含目标手势的待处理的第一图像之后,确定目标手势在第一图像中指示的位置以及第一图像对应的第二图像,最后根据目标手势在第一图像中指示的位置和第二图像来确定目标手势所指示的内容。容易注意到的是,本申请主要是通过图像识别来识别用户的目标手势,进而确定目标手势所指示的内容,无需对书本本身进行改造,节省了书本改造的成本,提高了书本内容识别的灵活性。
由此可见,本申请所提供的方案达到了无需对书本进行改造即可对书本进行点读的目的,从而实现了节省书本改造成本,提高书本点读的灵活性的技术效果,进而解决了现有技术中在进行书本的点读时需要对书本本身进行改造,导致只能读取固定的改造过的书本的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种可选的计算机终端的硬件结构框图;
图2是根据本申请实施例的一种手势的识别方法的流程图;
图3是根据本申请实施例的一种可选的第一图像的示意图;
图4是根据本申请实施例的一种可选的图像识别的示意图;
图5是根据本申请实施例的一种可选的图像变换的示意图;
图6是根据本申请实施例的一种可选的预设关键点的运行轨迹的确定流程图;
图7是根据本申请实施例的一种可选的手势的识别方法流程图;
图8是根据本申请实施例的一种手势的识别系统示意图;
图9是根据本申请实施例的一种信息的处理方法的流程图;
图10是根据本申请实施例的一种手势的识别装置示意图;以及
图11是根据本申请实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本申请实施例,还提供了一种手势的识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现手势的识别方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的手势的识别方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的手势的识别方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在上述运行环境下,本申请提供了如图2所示的手势的识别方法。图2是根据本申请实施例一的手势的识别方法的流程图,由图2可知,该方法包括如下步骤:
步骤S202,获取待处理的第一图像,其中,第一图像包括目标手势。
在步骤S202中,待处理的第一图像为用户正在阅读的书本所对应的图像,其中,图像采集装置可以采集上述第一图像,图像采集装置可以为摄像头,摄像头可以安装在点读设备上,点读设备可以由书本和识别系统两部分组成,识别系统可以包括图像采集装置和处理器。另外,上述第一图像包括目标手势,其中,目标手势为点读手势,点读手势为预先定义的一种带有指向性的手势,例如,手指伸出,如图3所示的第一图像的示意图中,右手的手势为点读手势。
可选的,目标手势包括:人或动物的手的姿态;或者,包括:人或动物的脚的姿态;或者,包括:机器的手的姿态;或者,包括:机器的脚的姿态。
在一种可选的实施例中,上述识别系统可以集成在具有一定高度的物体上,例如,识别系统集成在台灯、加湿器、水杯上。现以识别系统集成在台灯上为例进行说明,台灯的灯头集成有图像采集装置。在需要对书本进行点读时,用户启动台灯上的图像采集装置,此时,图像采集装置可以采集第一图像,如图3所示的第一图像。可选的,为了保证图像采集装置能够准确的采集到第一图像,用户打开台灯,并将书本放置在台灯发出的光能够照射到的区域内,该区域为图像采集装置能够采集图像的区域。
通过步骤S202可以获取包括目标手势的第一图像,进而对第一图像的目标手势进行识别,可以达到对书本内容的识别的效果。
步骤S204,确定目标手势在第一图像中指示的位置。
在一种可选的实施例中,在得到包含目标手势的第一图像之后,识别系统对第一图像中的目标手势进行识别,主要对手指的各个关节点进行识别,如在图3中,每个黑点表示识别到的目标手势的关节点,然后根据关节点的位置来确定目标手势在第一图像中指示的位置。同时,识别系统还将第一图像在数据库中进行匹配,得到第二图像,以确定第一图像对应的页码,即识别系统还可执行步骤S206。
步骤S206,获取第一图像对应的第二图像,其中,第二图像为预存的标准图像。
在步骤S206中,第二图像可以存储在数据库中,其中,第二图像为书本的每一页内容所对应的图像,该图像可以通过图像扫描或拍摄的方式存储在数据库中,其中,数据库可以集成在识别系统中。
需要说明的是,书本的页数通常比较多,为了使识别系统能够准确识别出目标手势所指示的内容,需要确定第一图像所对应的书本中的页码。在本申请中,由于第二图像为标准图像,每个第二图像均与其在书本中的页码相对应,因此,在得到第一图像之后,确定与第一图像对应的第二图像,即可确定第一图像对应的书本页码。在确定了第一图像对应的书本页码之后,在进一步地对目标手势在第一图像中所指示的内容进行识别,可以达到节省识别时间,提高识别准确度的效果。
可选的,在获取待处理的第一图像之前,数据库中可能未存储用户需要进行点读的书本,此时,用户需要录入预设主体中至少一个内容对应的标准图像,其中,第二图像为预设主体中任意一个内容对应的标准图像,预设主体为上述书本中的至少一页。具体的,用户可将需要进行点读的书本进行扫描或者拍摄,得到需要进行点读的书本的图像,并将该图像作为标准图像上传至数据库中。识别系统还可获取到用户输入的书本的相关信息,然后根据相关信息来确定书本对应的音频,或者,识别系统对标准图像中的文字进行识别,自动生成音频。之后,用户即可对该书本进行点读。另外,如果用户不想再读数据库中存储的书本,则用户还可对数据库中存储的书本的标准图像进行删除操作。由此可见,本申请所提供的方案无需对书本进行改造,即可对多个书本进行点读,不限于数据库中存储的书本,从而实现了灵活的对书本进行点读的效果。
步骤S208,根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
在步骤S208中,通过第二图像可以确定目标手势所指示的内容所在的页码,通过目标手势在第一图像中指示的位置可以确定上述内容在页码中的具体位置,进而根据该位置确定对应的内容,并对该内容进行音频播放。可选的,目标手势所指示的内容为文本信息,也可以为图片信息。其中,在目标手势所指示的内容文本信息的情况下,识别系统可以播放该文本内容;在上述内容为图片信息的情况下,识别系统可以播放该图片信息所对应的音频,例如,在图3中,识别系统检测到用户的手指指向了加拿大对应的图片,则识别系统将播放有关加拿大的相关介绍的音频。
基于上述步骤S202至步骤S208所限定的方案,可以获知,采用手势识别的方式,在获取到包含目标手势的待处理的第一图像之后,确定目标手势在第一图像中指示的位置以及第一图像对应的第二图像,最后根据目标手势在第一图像中指示的位置和第二图像来确定目标手势所指示的内容。
容易注意到的是,本申请主要是通过图像识别来识别用户的目标手势,进而确定目标手势所指示的内容,无需对书本本身进行改造,节省了书本改造的成本,提高了书本内容识别的灵活性。由此可见,本申请所提供的方案达到了无需对书本进行改造即可对书本进行点读的目的,从而实现了节省书本改造成本,提高书本点读的灵活性的技术效果,进而解决了现有技术中在进行书本的点读时需要对书本本身进行改造,导致只能读取固定的改造过的书本的技术问题。
在一种可选的实施例中,图像采集装置采集到的图像中不一定包括目标手势,但点读设备是通过对用户的手势进行识别来得到点读的目的的,因此,在识别系统在进行手势识别之前,需要采集图像,并对图像进行检测。具体的,识别系统通过图像采集装置采集候选第一图像,然后检测候选第一图像中是否包括目标手势,如果候选第一图像包括目标手势,则确定候选第一图像为待处理的第一图像。
可选的,用户在需要进行点读时,开启点读设备的点读功能。在点读功能开启之后,图像采集装置持续采集书本的图像,例如,图像采集装置每隔0.1秒采集一次图像,得到上述候选第一图像。容易注意到的是,由于图像采集装置持续采集图像,因此,候选第一图像中可能不包含目标手势,甚至也不包含用户的手部。此时,识别系统对采集到的候选第一图像进行识别,检测候选第一图像中是否包含手部。如果检测到候选第一图像中包含手部,则进一步检测手部的手势是否与目标手势相匹配,例如,目标手势为图3中右手所示的手势,候选第一图像中的手势为握拳手势,则确定候选第一图像中不包含目标手势,此时,确定候选第一图像不是待处理的第一图像。如果候选第一图像中的手势与目标手势相匹配,则确定候选第一图像为待处理的第一图像。
需要说明的是,在上述过程中,目标手势可以由用户自定义设置。另外,在检测候选第一图像中的手部与目标手势是否相匹配的过程中,可以采用比对轮廓的方式,例如,数据库中存储目标手势的轮廓,识别系统通过检测候选第一图像中的手部的轮廓是否与目标手势的轮廓相匹配,来确定候选第一图像中的手部是否与目标手势相匹配。识别系统还可通过检测关节点信息的方式进行匹配,例如,数据库中存储有目标手势的关节点信息(例如,能过显示的目标手势的关节点的个数,以及各个手指的关节点之间的相对位置关系),识别系统可获取到候选第一图像中的手部的关节点信息,并比对候选第一图像中的手部的关节点信息是否与目标手势的关节点信息相匹配,根据匹配结果来确定候选第一图像中的手部是否与目标手势相匹配。
在一种可选的实施例中,在获取了待处理的第一图像之后,识别系统进一步确定第一图像对应的第二图像。具体的,识别系统将第一图像与至少一个内容对应的标准图像进行匹配,然后确定与第一图像匹配成功的标准图像为第二图像。
可选的,识别系统可以获取到第一图像中文本区域的个数以及位置,然后从数据库中检测到文本区域的个数以及位置与第一图像相匹配的图像为第二图像,例如,在图4所示的图像识别的示意图中,左侧的图像为书本的某一页的内容,右侧为对左侧的图像进行文本区域的提取所得到的图像,其中,在图4的右侧部分,每一个矩形条表示一个文本区域,不同灰度值的文本区域代表了该文本区域在图像中的具体位置。可选的,数据库中除存储有该标准图像之外,还存储由标准图像中文本区域的信息(例如,文本区域的数量以及位置)。在识别系统获取到第一图像的文本区域的信息之后,通过比对第一图像的文本区域的信息与标准图像的文本区域的信息来确定第二图像。
另外,识别系统还可通过计算差值的方式从标准图像中确定第二图像。例如,在得到第一图像之后,识别系统将第一图像与标准图像进行图像相减,即对两幅图像之间对应的像素进行减法运算。然后将差值最小的标准图像作为第一图像。
在一种可选的实施例中,在获取了待处理的第一图像之后,识别系统还需要确定目标手势在第一图像中指示的位置。具体的,识别系统识别第一图像中目标手势的预设关键点,然后确定预设关键点的位置为目标手势在第一图像中指示的位置。其中,预设关键点可以为指尖,例如,在图3中,确定用户有手段食指指尖所指示的位置为预设关键点的位置。
进一步地,在确定了目标手势在第一图像中指示的位置以及第二图像之后,识别系统根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。具体的,识别系统首先获取预设关键点的位置映射至第二图像的映射位置,然后根据映射位置确定目标手势所指示的内容。
需要说明的是,图像采集装置所采集到的图像可能与数据库中存储的标准图像存在差异,例如,在图5所示的图像变换的示意图中,左侧的图像为数据库中存储的标准图像,右侧的图像为图像采集装置采集到的图像。在确定了目标手势在第一图像中指示的位置之后,如果直接将该位置映射到第二图像中,则可能会出现偏差。为了将第一图像中指示的位置映射到第二图像中,识别系统首先获取第一图像对应的单应性矩阵,然后基于单应性矩阵,对预设关键点的位置进行变换,得到映射位置。其中,单应性矩阵用于表示第一图像与第二图像的对应关系。在图5中,单应性矩阵为H,Xw和Yw为标准图像的坐标轴,其中,标准图像的z轴Zw=0,同样,u和v为第一图像的坐标轴。
另外,在本申请中,图像采集装置为摄像头,该摄像头为普通摄像头,由于本申请没有采用深度摄像头,因此,无法获取到深度信息,也无法判断目标手势是否与书面接触。对此,在本申请中通过判断目标手势的静止时间来确定目标手指是否与书面接触。具体的,识别系统检测目标手势是否保持预设时间,如果目标手势保持预设时间,确定映射位置在第二图像中所指示的内容为目标手势所指示的内容。
可选的,识别系统采集的图像采集装置采集图像的时间间隔是相同的,如果识别系统检测到连续预设数量的图像中目标手势所指示的位置没有发生变化,或者,识别系统检测到连续预设数量的图像之间的差值均小于预设数值,则检测预设数量是否大于数量阈值。如果预设数量大于数量阈值,则确定目标手势保持了预设时间,并将映射位置在第二图像中所指示的内容为目标手势所指示的内容。
在一种可选的实施例中,识别系统获取第二图像中的预设的目标区域,如果确定映射位置属于任意一个目标区域,则确定映射位置所属的目标区域包含的内容为目标手势所指示的内容。如果确定映射位置不属于任意一个目标区域,则获取目标手势所指向的目标区域,并确定目标手势所指向的目标区域包含的内容,为目标手势所指示的内容。其中,根据多个预设关键点确定目标手势的指向。
在上述过程中,目标区域用于表示允许被选中的内容所在的区域,如图4中的文本区域。上述预设关键点可以为手部的关节点,如图3中右手的关节点(如图3中的黑点)。
可选的,识别系统可以通过文本检测的方式来确定目标区域。如果识别系统检测到映射位置属于任意一个目标区域,例如,用户的手指在图4中的“I'm from the UK”的文本区域中,则识别系统确定该文本区域中的文本内容即为目标手势所指示的内容。如果识别系统检测到映射位置不属于任意一个目标区域,例如,在图3中,用户的食指指尖所在的位置并不属于文本区域,则识别系统根据目标手势所对应的关节点来确定用户手指的指向,例如,在图3中,根据右手的关节点可确定用户指向了Canada这个文本区域,则识别系统确定该文本区域中的文本内容即为目标手势所指示的内容。
需要说明的是,在本申请中,识别系统除可以对静止的目标手势进行识别来确定目标手势所指向的内容之外,还可通过识别动态手势来确定目标手势所指向的内容。
具体的,在检测目标手势是否保持预设时间之后,如果目标手势未保留预设时间,则识别系统检测预设关键点的运行轨迹,如果预设关键点的运行轨迹呈封闭图形,则根据封闭图形包含的目标区域确定目标手势所指示的内容。
可选的,图6示出了预设关键点的运行轨迹的确定流程图。在图6中,RGB Frame_0代表第1帧图像,RGB Frame_2代表第2帧图像,RGB Frame_N代表第N帧图像。具体的,识别系统首先检测对多帧连续的图像中是否存在手部,如果存在手部,则继续检测多帧连续图像中的手势是否为目标手势。在检测到手势为目标手势之后,识别系统对进一步定位目标手势的关节点(即上述预设关键点),获取到关节点信息,并将关节点信息输入至动作识别单元。在动作识别单元对关节点信息进行识别之后,输出识别结果,该识别结果表征了目标手势对应的动作,例如,点击动作、画圈动作、静止不动。在确定了目标手势对应的动作之后,识别系统对该动作对应的目标区域的内容进行识别。
另外,在检测到目标手势的动作为画圈动作的情况下,还可检测到该画圈动作对应的封闭图形,并获取该封闭图形所包含的目标区域,该目标区域对应的内容即为目标手势所指示的内容。
需要说明的是,通过对目标手势的预设关键点的运行轨迹进行检测,可以实现对多个目标区域进行同时选择,实现了对多个目标区域的内容进行一次点读的效果。
在一种可选的实施例中,在根据目标手势在第一图像中指示的位置,确定目标手势所指示的内容之后,识别系统还查找内容对应的音频信息,并播放音频信息。
可选的,识别系统对应的数据库中存储由内容对应的音频,在确定了目标手势所指示的内容之后,识别系统根据该内容对应的标识信息来查找到对应的音频信息,并通过扬声器进行音频信息的播放。在上述过程中,内容对应的标识信息可以由该内容对应的书本页码以及目标区域在书本页面上的位置信息确定。
可选的,识别系统还可与网络进行连接,通过互联网查找到与该内容对应的音频信息。识别系统还内嵌文本识别的应用程序,该应用程序可以对内容对应的文本信息进行朗读。
在一种可选的实施例中,图7示出了一种可选的手势的识别方法。由图7可知,该识别方法主要包括两部分,即书页识别以及手势识别。具体的,用户通过手指点读书本,点读设备控制摄像头采集图像,并不断获取摄像头采集到的图像。然后点读设备按照一定频率识别书页,确定该图像对应的书页标识,并基于书页标识以及书本标识和变换矩阵得到书页信息。同时,点读设备还对用户的手势进行识别,并获取目标手势对应的关节点位置,根据用户的手势以及关节点位置来判断用户是否有点读意图,例如,如果检测到用户的手势为图3中右手的手势,并且,根据关节点位置可确定手指的指向,则确定用户具有点读意识。进一步地,点读设备根据上述得到的书页信息以及手势信息(例如,指尖位置以及手指指向)确定目标手势所指向的目标区域。最后,识别系统根据目标区域所对应的内容来确定音频信息,并通过扬声器播放音频信息。
由上述内容可知,本申请所提供的方案采用了通用的图像识别技术,因此,只需将书本内容录入数据库即可,无需对书本本身进行改造,节省了书本生产的成本。另外,本申请通过对目标手势的预设关键点进行定位,能够计算出准确的目标手势的点击位置,提高了书本点读的准确性。最后,通过对目标手势的动作序列进行识别,能够在不添加深度摄像头(例如,RGBD摄像头)的情况下,也能进行点击意图的识别,节省了点读设备的生产成本。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的手势的识别方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种用于实施上述手势的识别方法的手势的识别系统,如图8所示,该系统包括:图像采集装置801以及处理器803。
其中,图像采集装置801,用于获取待处理的第一图像,其中,第一图像包括目标手势;处理器803,用于确定第一图像对应的第二图像,和目标手势在第一图像中指示的位置,其中,第二图像为预存的标准图像,第二图像与第一图像包括相同的内容;处理器还用于根据目标手势在第一图像中指示的位置,确定目标手势所指示的内容。
需要说明的是,待处理的第一图像为用户正在阅读的书本所对应的图像,图像采集装置可以为摄像头,摄像头可以安装在点读设备上,点读设备可以由书本和识别系统两部分组成,识别系统可以包括图像采集装置和处理器。另外,上述第一图像中的目标手势为点读手势,点读手势为预先定义的一种带有指向性的手势,例如,手指伸出。
另外,第二图像可以存储在数据库中,其中,第二图像为书本的每一页内容所对应的图像,该图像可以通过图像扫描或拍摄的方式存储在数据库中,其中,数据库可以集成在识别系统中。
在一种可选的实施例中,在需要对书本进行点读时,用户启动图像采集装置,此时,图像采集装置可以采集第一图像。在得到包含目标手势的第一图像之后,处理器对第一图像中的目标手势进行识别,主要对手指的各个关节点进行识别,如在图3中,每个黑点表示识别到的目标手势的关节点,然后根据关节点的位置来确定目标手势在第一图像中指示的位置。同时,处理器还将第一图像在数据库中进行匹配,得到第二图像,以确定第一图像对应的页码。然后处理器通过第二图像确定目标手势所指示的内容所在的页码,通过目标手势在第一图像中指示的位置确定上述内容在页码中的具体位置,进而根据该位置确定对应的内容,并对该内容进行音频播放。可选的,目标手势所指示的内容为文本信息,也可以为图片信息。其中,在目标手势所指示的内容文本信息的情况下,处理器可以播放该文本内容;在上述内容为图片信息的情况下,识别系统可以播放该图片信息所对应的音频,例如,在图3中,处理器检测到用户的手指指向了Canada对应的图片,则识别系统将播放有关加拿大的相关介绍的音频。
需要说明的是,由图8所示,上述识别系统还包括扬声器805,用于播放内容对应的音频信息。
由上可知,采用手势识别的方式,在获取到包含目标手势的待处理的第一图像之后,确定目标手势在第一图像中指示的位置以及第一图像对应的第二图像,最后根据目标手势在第一图像中指示的位置和第二图像来确定目标手势所指示的内容。
容易注意到的是,本申请主要是通过图像识别来识别用户的目标手势,进而确定目标手势所指示的内容,无需对书本本身进行改造,节省了书本改造的成本,提高了书本内容识别的灵活性。由此可见,本申请所提供的方案达到了无需对书本进行改造即可对书本进行点读的目的,从而实现了节省书本改造成本,提高书本点读的灵活性的技术效果,进而解决了现有技术中在进行书本的点读时需要对书本本身进行改造,导致只能读取固定的改造过的书本的技术问题。
需要说明的是,本实施例中的处理器还可执行实施例1中所提供的手势的识别方法,相关内容已在实施例1中进行说明,在此不再赘述。
实施例3
根据本申请实施例,还提供了一种台灯,该台灯包括上述的手势的识别系统。
可选的,该台灯的灯头集成有图像采集装置。在需要对书本进行点读时,用户启动台灯上的图像采集装置,此时,图像采集装置可以采集第一图像。可选的,为了保证图像采集装置能够准确的采集到第一图像,用户打开台灯,并将书本放置在台灯发出的光能够照射到的区域内,该区域为图像采集装置能够采集图像的区域。
实施例4
根据本申请实施例,还提供了一种信息的处理方法,如图9所示,该方法包括:
步骤S902,采集待处理的图像信息,其中,图像信息包括指向目标内容的目标手势。
在步骤S902中,待处理的图像信息为用户正在阅读的书本所对应的图像,其中,图像采集装置可以采集上述图像信息,图像采集装置可以为摄像头,摄像头可以安装在点读设备上,点读设备可以由书本和识别系统两部分组成,识别系统可以包括图像采集装置和处理器。另外,上述目标手势为点读手势,点读手势为预先定义的一种带有指向性的手势,例如,手指伸出,如图3中,右手的手势为点读手势。
在一种可选的实施例中,上述识别系统可以集成在具有一定高度的物体上,例如,识别系统集成在台灯、加湿器、水杯上。现以识别系统集成在台灯上为例进行说明,台灯的灯头集成有图像采集装置。在需要对书本进行点读时,用户启动台灯上的图像采集装置,此时,图像采集装置可以采集图像信息。
通过步骤S902可以获取包括目标手势的图像信息,进而对图像信息的目标手势进行识别,可以达到对书本内容的识别的效果。
步骤S904,根据图像信息确定目标手势所指示的目标内容。
可选的,识别系统可确定目标手势在第一图像中指示的位置以及第一图像对应的第二图像,根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。其中,第一图像为步骤S902中的图像信息,第二图像为预存的标准图像。
需要说明的是,第二图像可以存储在数据库中,其中,第二图像为书本的每一页内容所对应的图像,该图像可以通过图像扫描或拍摄的方式存储在数据库中,其中,数据库可以集成在识别系统中。
可选的,在获取待处理的第一图像之前,数据库中可能未存储用户需要进行点读的书本,此时,用户需要录入预设主体中至少一个内容对应的标准图像,其中,第二图像为预设主体中任意一个内容对应的标准图像,预设主体为上述书本中的至少一页。具体的,用户可将需要进行点读的书本进行扫描或者拍摄,得到需要进行点读的书本的图像,并将该图像作为标准图像上传至数据库中。识别系统还可获取到用户输入的书本的相关信息,然后根据相关信息来确定书本对应的音频,或者,识别系统对标准图像中的文字进行识别,自动生成音频。之后,用户即可对该书本进行点读。另外,如果用户不想再读数据库中存储的书本,则用户还可对数据库中存储的书本的标准图像进行删除操作。由此可见,本申请所提供的方案无需对书本进行改造,即可对多个书本进行点读,不限于数据库中存储的书本,从而实现了灵活的对书本进行点读的效果。
在一种可选的实施例中,在得到包含目标手势的第一图像之后,识别系统对第一图像中的目标手势进行识别,主要对手指的各个关节点进行识别,如在图3中,每个黑点表示识别到的目标手势的关节点,然后根据关节点的位置来确定目标手势在第一图像中指示的位置。同时,识别系统还将第一图像在数据库中进行匹配,得到第二图像,以确定第一图像对应的页码。在通过第二图像确定目标手势所指示的内容所在的页码,以及通过目标手势在第一图像中指示的位置确定上述内容在页码中的具体位置之后,识别系统根据该位置确定对应的内容,并对该内容进行音频播放。
步骤S906,播放目标内容对应的多媒体信息。
需要说明的是,上述多媒体信息可以为音频信息,上述识别系统还包括播放设备,该播放设备可以为扬声器。
可选的,在确定目标手势所指示的内容之后,识别系统还查找内容对应的音频信息,并播放音频信息。识别系统对应的数据库中存储由内容对应的音频,在确定了目标手势所指示的内容之后,识别系统根据该内容对应的标识信息来查找到对应的音频信息,并通过扬声器进行音频信息的播放。在上述过程中,内容对应的标识信息可以由该内容对应的书本页码以及目标区域在书本页面上的位置信息确定。
由上可知,采用手势识别的方式,在采集包含指向目标内容的目标手势的待处理的图像信息之后,根据图像信息确定目标手势所指示的目标内容,并播放目标内容对应的多媒体信息。
容易注意到的是,本申请主要是通过图像识别来识别用户的目标手势,进而确定目标手势所指示的内容,无需对书本本身进行改造,节省了书本改造的成本,提高了书本内容识别的灵活性。由此可见,本申请所提供的方案达到了无需对书本进行改造即可对书本进行点读的目的,从而实现了节省书本改造成本,提高书本点读的灵活性的技术效果,进而解决了现有技术中在进行书本的点读时需要对书本本身进行改造,导致只能读取固定的改造过的书本的技术问题。
在一种可选的实施例中,图像采集装置采集候选图像信息,然后检测候选图像信息中是否包括目标手势,如果候选图像信息包括目标手势,确定候选图像信息为待处理的图像信息。
需要说明的是,图像采集装置采集到的图像中不一定包括目标手势,但点读设备是通过对用户的手势进行识别来得到点读的目的的,因此,在识别系统在进行手势识别之前,需要采集图像,并对图像进行检测。
进一步地,在得到待处理的图像信息之后,识别系统将图像信息与至少一个内容对应的标准图像进行匹配,并确定与图像信息匹配成功的标准图像为目标图像。同时,识别系统还识别图像信息中目标手势的预设关键点,并确定预设关键点的位置为目标手势在图像信息中指示的位置。
更进一步的,识别系统获取预设关键点的位置映射至目标图像的映射位置,然后根据映射位置确定目标手势所指示的内容。
具体的,识别系统获取图像信息对应的单应性矩阵,并基于单应性矩阵,对预设关键点的位置进行变换,得到映射位置。然后,识别系统检测目标手势是否保持预设时间,如果目标手势保持预设时间,确定映射位置在目标图像中所指示的内容为目标手势所指示的内容。其中,单应性矩阵用于表示图像信息与目标图像的对应关系。
在上述过程中,识别系统可通过如下方式确定映射位置在目标图像中所指示的内容为目标手势所指示的内容。具体的,识别系统获取目标图像中的预设的目标区域,如果确定映射位置属于任意一个目标区域,则确定映射位置所属的目标区域包含的内容为目标手势所指示的内容。如果确定映射位置不属于任意一个目标区域,则获取目标手势所指向的目标区域,并确定目标手势所指向的目标区域包含的内容,为目标手势所指示的内容。其中,根据多个预设关键点确定目标手势的指向。
需要说明的是,在本申请中,识别系统除可以对静止的目标手势进行识别来确定目标手势所指向的内容之外,还可通过识别动态手势来确定目标手势所指向的内容。
具体的,在检测目标手势是否保持预设时间之后,如果目标手势未保留预设时间,则识别系统检测预设关键点的运行轨迹,如果预设关键点的运行轨迹呈封闭图形,则根据封闭图形包含的目标区域确定目标手势所指示的内容。
实施例5
根据本申请实施例,还提供了一种用于实施上述手势的识别方法的手势的识别装置,如图10所示,该装置100包括:第一获取模块1001、第一确定模块1003、第二获取模块1005以及第二确定模块1007。
其中,第一获取模块1001,用于获取待处理的第一图像,其中,第一图像包括目标手势;第一确定模块1003,用于确定目标手势在第一图像中指示的位置;第二获取模块1005,用于和第一图像对应的第二图像,其中,第二图像为预存的标准图像;第二确定模块1007,用于根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
此处需要说明的是,上述获取模块1001、第一确定模块1003、第二获取模块1005以及第二确定模块1007对应于实施例1中的步骤S202至步骤S208,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。
在一种可选的实施例中,获取模块包括:采集模块、第一检测模块以及第三确定模块。其中,采集模块,用于通过图像采集装置采集候选第一图像;第一检测模块,用于检测候选第一图像中是否包括目标手势;第三确定模块,用于如果候选第一图像包括目标手势,确定候选第一图像为待处理的第一图像。
在一种可选的实施例中,手势的识别装置还包括:录入模块。其中,录入模块,用于录入预设主体中至少一个内容对应的标准图像,其中,第二图像为预设主体中任意一个内容对应的标准图像。
在一种可选的实施例中,第一确定模块包括:匹配模块以及第四确定模块。其中,匹配模块,用于将第一图像与至少一个内容对应的标准图像进行匹配;第四确定模块,用于确定与第一图像匹配成功的标准图像为第二图像。
在一种可选的实施例中,第一确定模块包括:识别模块以及第五确定模块。其中,识别模块,用于识别第一图像中目标手势的预设关键点;第五确定模块,用于确定预设关键点的位置为目标手势在第一图像中指示的位置。
在一种可选的实施例中,第二确定模块包括:第一获取模块以及第六确定模块。其中,第一获取模块,用于获取预设关键点的位置映射至第二图像的映射位置;第六确定模块,用于根据映射位置确定目标手势所指示的内容。
在一种可选的实施例中,第一获取模块包括:第二获取模块以及变换模块。其中,第二获取模块,用于获取第一图像对应的单应性矩阵,其中,单应性矩阵用于表示第一图像与第二图像的对应关系;变换模块,用于基于单应性矩阵,对预设关键点的位置进行变换,得到映射位置。
在一种可选的实施例中,第六确定模块包括:第二检测模块以及第七确定模块。其中,第二检测模块,用于检测目标手势是否保持预设时间;第七确定模块,用于如果目标手势保持预设时间,确定映射位置在第二图像中所指示的内容为目标手势所指示的内容。
在一种可选的实施例中,第七确定模块包括:第三获取模块、第八确定模块以及第九确定模块。其中,第三获取模块,用于获取第二图像中的预设的目标区域,其中,目标区域用于表示允许被选中的内容所在的区域;第八确定模块,用于确定映射位置属于任意一个目标区域;第九确定模块,用于确定映射位置所属的目标区域包含的内容为目标手势所指示的内容。
在一种可选的实施例中,手势的识别装置还包括:第十确定模块、第四获取模块以及第十一确定模块。其中,第十确定模块,用于确定映射位置不属于任意一个目标区域;第四获取模块,用于获取目标手势所指向的目标区域,其中,根据多个预设关键点确定目标手势的指向;第十一确定模块,用于确定目标手势所指向的目标区域包含的内容,为目标手势所指示的内容。
在一种可选的实施例中,手势的识别装置还包括:第三检测模块以及第十二确定模块。其中,第三检测模块,用于如果目标手势未保留预设时间,检测预设关键点的运行轨迹;第十二确定模块,用于如果预设关键点的运行轨迹呈封闭图形,则根据封闭图形包含的目标区域确定目标手势所指示的内容。
在一种可选的实施例中,手势的识别装置还包括:查找模块以及播放模块。其中,查找模块,用于查找内容对应的音频信息;播放模块,用于播放音频信息。
实施例6
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行手势的识别方法中以下步骤的程序代码:获取待处理的第一图像,其中,第一图像包括目标手势;确定目标手势在第一图像中指示的位置;获取第一图像对应的第二图像,其中,第二图像为预存的标准图像;根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
可选地,图11是根据本申请实施例的一种计算机终端的结构框图。如图11所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1102、存储器1104以及外设接口1106。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的手势的识别方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的手势的识别方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取待处理的第一图像,其中,第一图像包括目标手势;确定目标手势在第一图像中指示的位置;获取第一图像对应的第二图像,其中,第二图像为预存的标准图像;根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
可选的,上述处理器还可以执行如下步骤的程序代码:通过图像采集装置采集候选第一图像;检测候选第一图像中是否包括目标手势;如果候选第一图像包括目标手势,确定候选第一图像为待处理的第一图像。
可选的,上述处理器还可以执行如下步骤的程序代码:录入预设主体中至少一个内容对应的标准图像,其中,第二图像为预设主体中任意一个内容对应的标准图像。
可选的,上述处理器还可以执行如下步骤的程序代码:将第一图像与至少一个内容对应的标准图像进行匹配;确定与第一图像匹配成功的标准图像为第二图像。
可选的,上述处理器还可以执行如下步骤的程序代码:识别第一图像中目标手势的预设关键点;确定预设关键点的位置为目标手势在第一图像中指示的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:获取预设关键点的位置映射至第二图像的映射位置;根据映射位置确定目标手势所指示的内容。
可选的,上述处理器还可以执行如下步骤的程序代码:获取第一图像对应的单应性矩阵,其中,单应性矩阵用于表示第一图像与第二图像的对应关系;基于单应性矩阵,对预设关键点的位置进行变换,得到映射位置。
可选的,上述处理器还可以执行如下步骤的程序代码:检测目标手势是否保持预设时间;如果目标手势保持预设时间,确定映射位置在第二图像中所指示的内容为目标手势所指示的内容。
可选的,上述处理器还可以执行如下步骤的程序代码:获取第二图像中的预设的目标区域,其中,目标区域用于表示允许被选中的内容所在的区域;确定映射位置属于任意一个目标区域;确定映射位置所属的目标区域包含的内容为目标手势所指示的内容。
可选的,上述处理器还可以执行如下步骤的程序代码:确定映射位置不属于任意一个目标区域;获取目标手势所指向的目标区域,其中,根据多个预设关键点确定目标手势的指向;确定目标手势所指向的目标区域包含的内容,为目标手势所指示的内容。
可选的,上述处理器还可以执行如下步骤的程序代码:如果目标手势未保留预设时间,检测预设关键点的运行轨迹;如果预设关键点的运行轨迹呈封闭图形,则根据封闭图形包含的目标区域确定目标手势所指示的内容。
可选的,上述处理器还可以执行如下步骤的程序代码:查找内容对应的音频信息;播放音频信息。
本领域普通技术人员可以理解,图11所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,计算机终端A还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例7
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的手势的识别方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取待处理的第一图像,其中,第一图像包括目标手势;确定目标手势在第一图像中指示的位置;获取第一图像对应的第二图像,其中,第二图像为预存的标准图像;根据目标手势在第一图像中指示的位置和第二图像,确定目标手势所指示的内容。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过图像采集装置采集候选第一图像;检测候选第一图像中是否包括目标手势;如果候选第一图像包括目标手势,确定候选第一图像为待处理的第一图像。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:录入预设主体中至少一个内容对应的标准图像,其中,第二图像为预设主体中任意一个内容对应的标准图像。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将第一图像与至少一个内容对应的标准图像进行匹配;确定与第一图像匹配成功的标准图像为第二图像。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:识别第一图像中目标手势的预设关键点;确定预设关键点的位置为目标手势在第一图像中指示的位置。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取预设关键点的位置映射至第二图像的映射位置;根据映射位置确定目标手势所指示的内容。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取第一图像对应的单应性矩阵,其中,单应性矩阵用于表示第一图像与第二图像的对应关系;基于单应性矩阵,对预设关键点的位置进行变换,得到映射位置。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:检测目标手势是否保持预设时间;如果目标手势保持预设时间,确定映射位置在第二图像中所指示的内容为目标手势所指示的内容。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取第二图像中的预设的目标区域,其中,目标区域用于表示允许被选中的内容所在的区域;确定映射位置属于任意一个目标区域;确定映射位置所属的目标区域包含的内容为目标手势所指示的内容。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:确定映射位置不属于任意一个目标区域;获取目标手势所指向的目标区域,其中,根据多个预设关键点确定目标手势的指向;确定目标手势所指向的目标区域包含的内容,为目标手势所指示的内容。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:如果目标手势未保留预设时间,检测预设关键点的运行轨迹;如果预设关键点的运行轨迹呈封闭图形,则根据封闭图形包含的目标区域确定目标手势所指示的内容。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:查找内容对应的音频信息;播放音频信息。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (20)

1.一种手势的识别方法,其特征在于,包括:
获取待处理的第一图像,其中,所述第一图像包括目标手势;
确定所述目标手势在所述第一图像中指示的位置;
获取所述第一图像对应的第二图像,其中,所述第二图像为预存的标准图像;
根据所述目标手势在所述第一图像中指示的位置和所述第二图像,确定所述目标手势所指示的内容。
2.根据权利要求1所述的方法,其特征在于,在根据所述目标手势在所述第一图像中指示的位置和所述第二图像,确定所述目标手势所指示的内容之后,所述方法还包括:
查找所述内容对应的音频信息;
播放所述音频信息。
3.根据权利要求1所述的方法,其特征在于,获取待处理的第一图像,包括:
通过图像采集装置采集候选第一图像;
检测所述候选第一图像中是否包括所述目标手势;
如果所述候选第一图像包括所述目标手势,确定所述候选第一图像为所述待处理的第一图像。
4.根据权利要求1所述的方法,其特征在于,在获取待处理的第一图像之前,所述方法还包括:
录入预设主体中至少一个内容对应的标准图像,其中,所述第二图像为所述预设主体中任意一个内容对应的标准图像。
5.根据权利要求4所述的方法,其特征在于,确定所述第一图像对应的第二图像,包括:
将所述第一图像与所述至少一个内容对应的标准图像进行匹配;
确定与所述第一图像匹配成功的标准图像为所述第二图像。
6.根据权利要求5所述的方法,其特征在于,确定所述目标手势在所述第一图像中指示的位置,包括:
识别所述第一图像中所述目标手势的预设关键点;
确定所述预设关键点的位置为所述目标手势在所述第一图像中指示的位置。
7.根据权利要求6所述的方法,其特征在于,根据所述目标手势在所述第一图像中指示的位置和所述第二图像,确定所述目标手势所指示的内容,包括:
获取所述预设关键点的位置映射至所述第二图像的映射位置;
根据所述映射位置确定所述目标手势所指示的内容。
8.根据权利要求7所述的方法,其特征在于,获取所述预设关键点的位置映射至所述第二图像的映射位置,包括:
获取所述第一图像对应的单应性矩阵,其中,所述单应性矩阵用于表示所述第一图像与所述第二图像的对应关系;
基于所述单应性矩阵,对所述预设关键点的位置进行变换,得到所述映射位置。
9.根据权利要求7所述的方法,其特征在于,根据所述映射位置确定所述目标手势所指示的内容,包括:
检测所述目标手势是否保持预设时间;
如果所述目标手势保持预设时间,确定所述映射位置在所述第二图像中所指示的内容为所述目标手势所指示的内容。
10.根据权利要求9所述的方法,其特征在于,确定所述映射位置在所述第二图像中所指示的内容为所述目标手势所指示的内容,包括:
获取所述第二图像中的预设的目标区域,其中,所述目标区域用于表示允许被选中的内容所在的区域;
确定所述映射位置属于任意一个所述目标区域;
确定所述映射位置所属的目标区域包含的内容为所述目标手势所指示的内容。
11.根据权利要求10所述的方法,其特征在于,在获取所述第二图像中的预设的目标区域之后,所述方法还包括:
确定所述映射位置不属于任意一个所述目标区域;
获取所述目标手势所指向的目标区域,其中,根据多个预设关键点确定所述目标手势的指向;
确定所述目标手势所指向的目标区域包含的内容,为所述目标手势所指示的内容。
12.根据权利要求9所述的方法,其特征在于,在检测所述目标手势是否保持预设时间之后,所述方法还包括:
如果所述目标手势未保留预设时间,检测所述预设关键点的运行轨迹;
如果所述预设关键点的运行轨迹呈封闭图形,则根据所述封闭图形包含的目标区域确定所述目标手势所指示的内容。
13.根据权利要求1所述的方法,其特征在于:
所述目标手势包括:人或动物的手的姿态;或者
所述目标手势包括:人或动物的脚的姿态;或者
所述目标手势包括:机器的手的姿态;或者
所述目标手势包括:机器的脚的姿态。
14.一种手势的识别系统,其特征在于,包括:
图像采集装置,用于获取待处理的第一图像,其中,所述第一图像包括目标手势;
处理器,用于确定所述第一图像对应的第二图像,和所述目标手势在所述第一图像中指示的位置,其中,所述第二图像为预存的标准图像,所述第二图像与所述第一图像包括相同的内容;
所述处理器还用于根据所述目标手势在所述第一图像中指示的位置,确定所述目标手势所指示的内容。
15.根据权利要求14所述的系统,其特征在于,所述系统还包括:
扬声器,用于播放所述内容对应的音频信息。
16.一种台灯,其特征在于,所述台灯包括权利要求13或14所述的手势的识别系统。
17.一种信息的处理方法,其特征在于,包括:
采集待处理的图像信息,其中,所述图像信息包括指向目标内容的目标手势;
根据所述图像信息确定所述目标手势所指示的所述目标内容;
播放所述目标内容对应的多媒体信息。
18.一种手势的识别装置,其特征在于,包括:
第一获取模块,用于获取待处理的第一图像,其中,所述第一图像包括目标手势;
第一确定模块,用于确定所述目标手势在所述第一图像中指示的位置;
第二获取模块,用于获取所述第一图像对应的第二图像,其中,所述第二图像为预存的标准图像;
第二确定模块,用于根据所述目标手势在所述第一图像中指示的位置和所述第二图像,确定所述目标手势所指示的内容。
19.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至13中任意一项所述的手势的识别方法。
20.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至13中任意一项所述的手势的识别方法。
CN201910453590.6A 2019-05-28 2019-05-28 手势的识别方法、装置、系统以及信息的处理方法 Pending CN112016346A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910453590.6A CN112016346A (zh) 2019-05-28 2019-05-28 手势的识别方法、装置、系统以及信息的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910453590.6A CN112016346A (zh) 2019-05-28 2019-05-28 手势的识别方法、装置、系统以及信息的处理方法

Publications (1)

Publication Number Publication Date
CN112016346A true CN112016346A (zh) 2020-12-01

Family

ID=73501374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910453590.6A Pending CN112016346A (zh) 2019-05-28 2019-05-28 手势的识别方法、装置、系统以及信息的处理方法

Country Status (1)

Country Link
CN (1) CN112016346A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112839172A (zh) * 2020-12-31 2021-05-25 深圳瞬玩科技有限公司 基于手部识别的拍摄主体识别方法和系统
CN113220125A (zh) * 2021-05-19 2021-08-06 网易有道信息技术(北京)有限公司 手指交互方法、装置、电子设备及计算机存储介质
WO2022194180A1 (zh) * 2021-03-19 2022-09-22 华为技术有限公司 一种识别点读文字的方法及电子设备
WO2023272656A1 (zh) * 2021-06-30 2023-01-05 东莞市小精灵教育软件有限公司 绘本识别方法、装置、家教机及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112839172A (zh) * 2020-12-31 2021-05-25 深圳瞬玩科技有限公司 基于手部识别的拍摄主体识别方法和系统
WO2022194180A1 (zh) * 2021-03-19 2022-09-22 华为技术有限公司 一种识别点读文字的方法及电子设备
CN113220125A (zh) * 2021-05-19 2021-08-06 网易有道信息技术(北京)有限公司 手指交互方法、装置、电子设备及计算机存储介质
WO2023272656A1 (zh) * 2021-06-30 2023-01-05 东莞市小精灵教育软件有限公司 绘本识别方法、装置、家教机及存储介质

Similar Documents

Publication Publication Date Title
CN112016346A (zh) 手势的识别方法、装置、系统以及信息的处理方法
CN107885430B (zh) 一种音频播放方法、装置、存储介质及电子设备
CN111124888B (zh) 录制脚本的生成方法和装置及电子装置
CN111371988B (zh) 内容操作方法、装置、终端及存储介质
CN108781252B (zh) 一种图像拍摄方法及装置
WO2022174605A1 (zh) 一种手势识别方法、手势识别装置及智能设备
CN108875667B (zh) 目标识别方法、装置、终端设备和存储介质
CN114138121B (zh) 用户手势识别方法、装置、系统、存储介质及计算设备
CN113011403B (zh) 手势识别方法、系统、介质及设备
CN105335198A (zh) 字体添加方法及装置
CN110021062B (zh) 一种产品特征的获取方法及终端、存储介质
CN111860082A (zh) 信息处理方法、装置以及系统
CN107239202B (zh) 控制指令识别方法和装置
CN111400539A (zh) 语音问卷的处理方法、装置和系统
CN107992872B (zh) 一种对图片进行文本识别的方法及移动终端
CN111367402A (zh) 任务触发方法、交互设备及计算机设备
CN112083858A (zh) 控件的显示位置调整方法及装置
CN112560554A (zh) 基于唇语的活体检测方法、装置以及存储介质
CN111077993A (zh) 一种学习场景的切换方法、电子设备及存储介质
CN111027353A (zh) 一种搜索内容的提取方法及电子设备
CN113271379B (zh) 图像处理方法、装置及电子设备
CN111258413A (zh) 虚拟对象的控制方法和装置
CN115061577A (zh) 手部投影交互方法、系统及存储介质
CN111711758B (zh) 多指定位的试题拍摄方法、装置、电子设备和存储介质
CN107704175B (zh) 一种图像收藏方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination