CN105205454A - 自动捕捉目标物的系统和方法 - Google Patents

自动捕捉目标物的系统和方法 Download PDF

Info

Publication number
CN105205454A
CN105205454A CN201510537481.4A CN201510537481A CN105205454A CN 105205454 A CN105205454 A CN 105205454A CN 201510537481 A CN201510537481 A CN 201510537481A CN 105205454 A CN105205454 A CN 105205454A
Authority
CN
China
Prior art keywords
gesture
user
recognition result
image recognition
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510537481.4A
Other languages
English (en)
Inventor
刘国华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN GUOHUA IDENTIFICATION TECHNOLOGY DEVELOPMENT Co Ltd
Original Assignee
SHENZHEN GUOHUA IDENTIFICATION TECHNOLOGY DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN GUOHUA IDENTIFICATION TECHNOLOGY DEVELOPMENT Co Ltd filed Critical SHENZHEN GUOHUA IDENTIFICATION TECHNOLOGY DEVELOPMENT Co Ltd
Priority to CN201510537481.4A priority Critical patent/CN105205454A/zh
Publication of CN105205454A publication Critical patent/CN105205454A/zh
Priority to EP16838447.7A priority patent/EP3333759A4/en
Priority to US15/755,602 priority patent/US20190026545A1/en
Priority to PCT/CN2016/090628 priority patent/WO2017032187A1/zh
Priority to JP2018510809A priority patent/JP2018534649A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Abstract

本发明涉及一种自动捕捉目标物的系统和方法,所述系统包括:图像采集模块,用于采集包含有用户手势和目标物的图像;手势识别模块,用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;图像识别模块,用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;交互模块,用于根据所述图像识别结果与用户进行交互。本发明可以提高识别准确度和交互性能。

Description

自动捕捉目标物的系统和方法
技术领域
本发明涉及计算机识别技术,特别是涉及一种自动捕捉目标物的系统和方法。
背景技术
人工智能(ArtificialIntelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着计算机科学的发展,越来越多的智能产品开始问世。
然而,现有的智能产品还局限于对简单的图像、语音进行识别,当需要对多个目标物中的某一个或对一个目标物中的某一个部位进行识别时,识别的准确率会大大地降低,也影响了智能产品与用户的交互性能。比如,在人机交互时,人问智能产品“这是什么?”、“看这里”,智能产品不理解“这”、“这里”是什么意思,即不能准备捕捉“这”所指代的目标物。
发明内容
基于此,有必要提供一种可以提高识别准确度和交互性能的自动捕捉目标物的系统和方法。
一种自动捕捉目标物的系统,包括:
图像采集模块,用于采集包含有用户手势和目标物的图像;
手势识别模块,用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;
图像识别模块,用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;
交互模块,用于根据所述图像识别结果与用户进行交互。
在其中一个实施例中,所述图像识别模块包括:
目标物捕捉单元,用于根据所述手势识别结果确定目标物的位置;
图像处理单元,用于提取目标物的图像特征;
图像识别单元,用于将目标物的图像特征与预存的模版特征进行比较以获取目标物信息;
结果输出单元,用于输出所述目标物信息作为图像识别结果。
在其中一个实施例中,所述目标物为单独个体或为单独个体中的一个部分。
在其中一个实施例中,还包括:
语音采集模块,用于采集用户语音;
语音识别模块,用于识别用户的语音并输出语音识别结果;
所述交互模块还用于根据所述图像识别结果和所述语音识别结果与用户进行交互。
在其中一个实施例中,所述交互模块包括显示单元和/或语音播放单元;其中,
所述显示单元用于显示所述图像识别结果;
所述语音播放单元用于播放所述图像识别结果。
一种自动捕捉目标物的方法,包括:
采集包含有用户手势和目标物的图像;
识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;
根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;
根据所述图像识别结果与用户进行交互。
在其中一个实施例中,所述根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果的步骤,包括:
根据所述手势识别结果确定目标物的位置;
提取目标物的图像特征;
将目标物的图像特征与预存的模版特征进行比较以获取目标物信息;
输出所述目标物信息作为图像识别结果。
在其中一个实施例中,所述目标物为单独个体或为单独个体中的一个部分。
在其中一个实施例中,还包括:
采集用户语音;
识别用户的语音并输出语音识别结果;
所述根据所述图像识别结果与用户进行交互的步骤具体为:
根据所述图像识别结果和所述语音识别结果与用户进行交互。
在其中一个实施例中,所述根据所述图像识别结果与用户进行交互的步骤包括显示所述图像识别结果的步骤和/或包括播放所述图像识别结果的步骤。
上述自动捕捉目标物的系统和方法,通过图像采集模块采集包含有用户手势和目标物的图像,手势识别模块识别用户手势并输出手势识别结果,图像识别模块根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果,交互模块根据所述图像识别结果与用户进行交互,这样即使需要对多个目标物中的一个或对一个目标物中的某一个部位进行识别,也可以根据用户的手势准确地捕捉到目标物,然后再对目标物进行识别并与用户进行交互,提高了识别的准确率和交互性能。
附图说明
图1为一实施例中自动捕捉目标物的系统的模块图;
图2为用户手势的示意图之一;
图3为用户手势的示意图之二;
图4为用户手势的示意图之三;
图5为另一实施例中自动捕捉目标物的系统模块图;
图6为一实施例中自动捕捉目标物的方法的流程图;
图7为另一实施例中自动捕捉目标物的方法的流程图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳的实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参照图1,为一实施例中自动捕捉目标物的系统的模块图。
该自动捕捉目标物的系统可应用于机器人、电视机等任意智能产品中,包括图像采集模块110、手势识别模块120、图像识别模块130以及交互模块140。其中,图像采集模块110用于采集包含有用户手势和目标物的图像。手势识别模块120用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势。图像识别模块130用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果。交互模块140用于根据所述图像识别结果与用户进行交互。
图像采集模块110为摄像头,用于采集包含有用户手势和目标物的图像信息。在一个实施例中,用户的手势可以是如图2所示的五指呈收拢状,也可以是图3所示的手指呈指向状。目标物为单独个体或为单独个体中的一个部分。这里的单独个体可以是任何物体(如苹果、杯子、书本等),也可以是人,那么单独个体的一部分就是指杯子的杯盖、书本的封面、人的某个器官或部位等。
比如,用户需要识别一个苹果,那么只需要手握苹果或手指着苹果出现在摄像头可视的范围内即可,这时图像采集模块110便会采集到包含有用户手势和苹果的图像信息。
手势识别模块120用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指物体的手势。具体地,用户需要识别放置在不同位置的物体时,就会做出不同的手势。当用户在图像采集模块110的可视范围内做出相应手势时,手势识别模块120会输出一个手势识别结果。可以理解,手势识别结果还可以为其他手势,如双手抱物体等,这里不作严格限制。
在一个实施例中,如果用户做出如图2所示的手势,手势识别模块120将该手势与预设手势模版进行对比,输出手势识别结果为手拿物体的手势;如果用户做出如图3所示的手势,手势识别模块120将该手势与预设手势模版进行对比,输出手势识别结果为手指向物体的手势。
进一步地,用户还可以设置图3所示的手势为指向目标物的一个部分,设置图4所示的手势为指向目标物的整体。
其中,预设手势模版可以自定义设置。
图像识别模块130用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果。手势识别结果无论是手拿物体的手势还是手指向物体的手势,图像识别模块130都能根据手势识别结果确定目标物的位置。
在一个实施例中,图像识别模块130包括目标物捕捉单元、图像处理单元、图像识别单元以及结果输出单元。其中,所述目标物捕捉单元用于根据所述手势识别结果确定目标物的位置,所述图像处理单元用于提取目标物的图像特征,所述图像识别单元用于将目标物的图像特征与预存的模版特征进行比较以获取目标物信息,所述结果输出单元用于输出所述目标物信息作为图像识别结果。
比如,用户手拿一个苹果,手势识别结果为手拿物体的手势,那么所述目标物捕捉单元便会确定用户手中的苹果即是目标物,所述图像处理单元便会提取苹果的图像特征(如颜色特征及纹理特征等),然后所述图像识别单元用于将目标物的图像特征与预存的模版特征进行比较,预存的模版特征可能包括各种水果的模版特征、各种学习用品的模版特征等等,经过比较就可以识别该目标物为苹果,从而获取到目标物信息并输出。
比如,用户手指着嘴巴,手势识别结果为手指物体的手势,那么所述目标物捕捉单元便会确定用户手指向的嘴巴即是目标物,所述图像处理单元便会将目标物的图像特征与预存的模版特征进行比较,经过比较就可以识别该目标物为人的嘴巴,从而获取到目标物信息并输出。
在一个实施例中,目标物信息包括目标物的中文名称、英文名称等。可以理解,目标物信息还可以包括目标物的一些典故或造句等。如上述例中,所述结果输出单元输出的图像识别结果为苹果(apple),图像识别结果还可以包括苹果的典故如牛顿的万有引力,还可以包括apple的造句,如妈妈给了我一个苹果(Mumgavemeanapple)。
交互模块140用于根据所述图像识别结果与用户进行交互。在一个实施例中,交互模块140包括显示单元和/或语音播放单元。其中,所述显示单元用于显示所述图像识别结果,所述语音播放单元用于播放所述图像识别结果。即交互模块140可以以显示图像识别结果的方式与用户交互,也可以以播放图像识别结果的方式与用户交互,还可以同时显示和播放图像识别结果。
比如,图像识别模块130输出的图像识别结果为苹果(apple),那么交互模块140就会显示苹果的图片、汉字及英语单词,还可以同时播放苹果的读音。
请参照图5,为另一实施例中自动捕捉目标物的系统的模块图。
该自动捕捉目标物的系统包括图像采集模块210、手势识别模块220、语音采集模块230、语音识别模块240、图像识别模块250及交互模块260。
图像采集模块210用于采集包含有用户手势和目标物的图像。具体地,图像采集模块210为摄像头,用于采集包含有用户手势和目标物的图像信息。在一个实施例中,用户的手势可以是如图2所示的五指呈收拢状,也可以是图3所示的手指呈指向状。目标物为单独个体或为单独个体中的一个部分。这里的单独个体可以是任何物体(如苹果、杯子、书本等),也可以是人,那么单独个体的一部分就是指杯子的杯盖、书本的封面、人的器官等。
手势识别模块220用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势。具体地,用户需要识别放置在不同位置的物体时,就会做出不同的手势。当用户在图像采集模块210的可视范围内做出相应手势时,手势识别模块220会输出一个手势识别结果。
语音采集模块230用于采集用户语音。具体地,在一个实施例中,用户在启动图像采集模块210的同时会自动启动语音采集模块230,用户也可以在启动图像采集模块210后,通过一个手势来启动语音采集模块230。
语音识别模块240用于识别用户的语音并输出语音识别结果。具体地,用户输出的语音识别结果包括交互句型。比如,用户手拿一个苹果问智能产品“这是什么”,那么语音识别模块240输出来的语音识别结果会包含“这是XX”这个交互句型,如这是苹果。如果用户指着爸爸的鼻子问“这是爸爸的什么”,那么语音识别模块240输出来的语音识别结果会包含“这是爸爸的XX”这个交互句型,如这是爸爸的鼻子。
图像识别模块250用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果。
交互模块260用于根据所述图像识别结果和所述语音识别结果与用户进行交互。
比如,图像识别模块250输出的图像识别结果为杯子(cup),语音识别模块240输出的语音识别结果包括“这是XX”的句型,那么交互模块260与用户交互时就会显示和/或播放“这是杯子”、“thisisacup”。这样非常有利于小孩子的学习。
请参考图6,为一实施例中自动捕捉目标物的方法的流程图。
该自动捕捉目标物的方法包括:
步骤S110:采集包含有用户手势和目标物的图像。
在一个实施例中,目标物为单独个体或为单独个体中的一个部分。这里的单独个体可以是任何物体(如苹果、杯子、书本等),也可以是人,那么单独个体的一部分就是指杯子的杯盖、书本的封面、人的器官等。
步骤S120:识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势。
步骤S130:根据手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果。
步骤S140:根据图像识别结果与用户进行交互。
请参考图7,为另一实施例中自动捕捉目标物的方法的流程图。
该自动捕捉目标物的方法包括:
步骤S210:采集包含有用户手势和目标物的图像。
步骤S220:识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势。
步骤S230:根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果。
步骤S240:采集用户语音。
步骤S250:识别用户的语音并输出语音识别结果。
在一个实施例中,步骤S240和步骤S250可以在步骤S210之前执行,也可以在步骤S210之后执行。
步骤S260:根据图像识别结果和语音识别结果与用户进行交互。
上述自动捕捉目标物的系统,通过图像采集模块采集包含有用户手势和目标物的图像,手势识别模块识别用户手势并输出手势识别结果,图像识别模块根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果,交互模块根据所述图像识别结果与用户进行交互,这样即使需要对多个目标物中的一个或对一个目标物中的某一个部位进行识别,也可以根据用户的手势准确地捕捉到目标物,然后再对目标物进行识别并与用户进行交互,提高了识别的准确率和交互性能。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种自动捕捉目标物的系统,其特征在于,包括:
图像采集模块,用于采集包含有用户手势和目标物的图像;
手势识别模块,用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;
图像识别模块,用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;
交互模块,用于根据所述图像识别结果与用户进行交互。
2.根据权利要求1所述的自动捕捉目标物的系统,其特征在于,所述图像识别模块包括:
目标物捕捉单元,用于根据所述手势识别结果确定目标物的位置;
图像处理单元,用于提取目标物的图像特征;
图像识别单元,用于将目标物的图像特征与预存的模版特征进行比较以获取目标物信息;
结果输出单元,用于输出所述目标物信息作为图像识别结果。
3.根据权利要求1所述的自动捕捉目标物的系统,其特征在于,所述目标物为单独个体或为单独个体中的一个部分。
4.根据权利要求1所述的自动捕捉目标物的系统,其特征在于,还包括:
语音采集模块,用于采集用户语音;
语音识别模块,用于识别用户的语音并输出语音识别结果;
所述交互模块还用于根据所述图像识别结果和所述语音识别结果与用户进行交互。
5.根据权利要求1所述的自动捕捉目标物的系统,其特征在于,所述交互模块包括显示单元和/或语音播放单元;其中,
所述显示单元用于显示所述图像识别结果;
所述语音播放单元用于播放所述图像识别结果。
6.一种自动捕捉目标物的方法,其特征在于,包括:
采集包含有用户手势和目标物的图像;
识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;
根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;
根据所述图像识别结果与用户进行交互。
7.根据权利要求6所述的自动捕捉目标物的方法,其特征在于,所述根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果的步骤,包括:
根据所述手势识别结果确定目标物的位置;
提取目标物的图像特征;
将目标物的图像特征与预存的模版特征进行比较以获取目标物信息;
输出所述目标物信息作为图像识别结果。
8.根据权利要求6所述的自动捕捉目标物的方法,其特征在于,所述目标物为单独个体或为单独个体中的一个部分。
9.根据权利要求6所述的自动捕捉目标物的方法,其特征在于,还包括:
采集用户语音;
识别用户的语音并输出语音识别结果;
所述根据所述图像识别结果与用户进行交互的步骤具体为:
根据所述图像识别结果和所述语音识别结果与用户进行交互。
10.根据权利要求6所述的自动捕捉目标物的方法,其特征在于,所述根据所述图像识别结果与用户进行交互的步骤包括显示所述图像识别结果的步骤和/或包括播放所述图像识别结果的步骤。
CN201510537481.4A 2015-08-27 2015-08-27 自动捕捉目标物的系统和方法 Pending CN105205454A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201510537481.4A CN105205454A (zh) 2015-08-27 2015-08-27 自动捕捉目标物的系统和方法
EP16838447.7A EP3333759A4 (en) 2015-08-27 2016-07-20 METHOD AND DEVICE FOR AUTOMATIC CAPTURE OF TARGET OBJECT, AND INFORMATION CARRIER
US15/755,602 US20190026545A1 (en) 2015-08-27 2016-07-20 Method and device for automatically capturing target object, and storage medium
PCT/CN2016/090628 WO2017032187A1 (zh) 2015-08-27 2016-07-20 自动捕捉目标物的方法、装置及存储介质
JP2018510809A JP2018534649A (ja) 2015-08-27 2016-07-20 対象物を自動的に取り込むための方法及び装置、並びに記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510537481.4A CN105205454A (zh) 2015-08-27 2015-08-27 自动捕捉目标物的系统和方法

Publications (1)

Publication Number Publication Date
CN105205454A true CN105205454A (zh) 2015-12-30

Family

ID=54953126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510537481.4A Pending CN105205454A (zh) 2015-08-27 2015-08-27 自动捕捉目标物的系统和方法

Country Status (5)

Country Link
US (1) US20190026545A1 (zh)
EP (1) EP3333759A4 (zh)
JP (1) JP2018534649A (zh)
CN (1) CN105205454A (zh)
WO (1) WO2017032187A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106200396A (zh) * 2016-08-05 2016-12-07 易晓阳 一种基于运动识别的家居控制方法
CN106200395A (zh) * 2016-08-05 2016-12-07 易晓阳 一种多维识别家居控制方法
WO2017032187A1 (zh) * 2015-08-27 2017-03-02 深圳市国华识别科技开发有限公司 自动捕捉目标物的方法、装置及存储介质
CN107150347A (zh) * 2017-06-08 2017-09-12 华南理工大学 基于人机协作的机器人感知与理解方法
CN107817799A (zh) * 2017-11-03 2018-03-20 北京光年无限科技有限公司 结合虚拟迷宫进行智能交互的方法及系统
CN108427910A (zh) * 2018-01-30 2018-08-21 浙江凡聚科技有限公司 深层神经网络ar手语翻译学习方法、客户端及服务器
CN110335607A (zh) * 2019-08-19 2019-10-15 北京安云世纪科技有限公司 一种语音指令的执行方法、装置及电子设备
CN110348446A (zh) * 2019-06-24 2019-10-18 西安艾润物联网技术服务有限责任公司 图片处理方法及装置
CN111107259A (zh) * 2018-10-25 2020-05-05 阿里巴巴集团控股有限公司 图像获取方法、装置及电子设备
CN111415461A (zh) * 2019-01-08 2020-07-14 虹软科技股份有限公司 物品识别方法及系统、电子设备
CN111638783A (zh) * 2020-05-18 2020-09-08 广东小天才科技有限公司 一种人机交互方法及电子设备
CN112233505A (zh) * 2020-09-29 2021-01-15 浩辰科技(深圳)有限公司 一种新型盲童交互学习系统
CN112307865A (zh) * 2020-02-12 2021-02-02 北京字节跳动网络技术有限公司 基于图像识别的交互方法及装置
CN112698716A (zh) * 2019-10-23 2021-04-23 上海博泰悦臻电子设备制造有限公司 基于手势识别的车内设置、控制方法、系统、介质及设备
CN113936233A (zh) * 2021-12-16 2022-01-14 北京亮亮视野科技有限公司 一种手指指定目标的识别方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429512B (zh) * 2020-04-22 2023-08-25 北京小马慧行科技有限公司 图像处理方法和装置、存储介质及处理器
CN115476366B (zh) * 2021-06-15 2024-01-09 北京小米移动软件有限公司 足式机器人的控制方法、装置、控制设备及存储介质
CN113780083A (zh) * 2021-08-10 2021-12-10 新线科技有限公司 一种手势识别方法、装置、设备及存储介质
CN115079818A (zh) * 2022-05-07 2022-09-20 北京聚力维度科技有限公司 一种手部捕捉方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115167675A (zh) * 2011-09-19 2022-10-11 视力移动技术有限公司 增强现实设备
CN104049721B (zh) * 2013-03-11 2019-04-26 联想(北京)有限公司 信息处理方法及电子设备
CN103500335A (zh) * 2013-09-09 2014-01-08 华南理工大学 一种基于手势识别的照片拍摄与浏览的方法及其装置
CN104090648B (zh) * 2014-05-21 2017-08-25 中兴通讯股份有限公司 数据录入方法及终端
CN104202640B (zh) * 2014-08-28 2016-03-30 深圳市国华识别科技开发有限公司 基于图像识别的智能电视交互控制系统和方法
CN105205454A (zh) * 2015-08-27 2015-12-30 深圳市国华识别科技开发有限公司 自动捕捉目标物的系统和方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017032187A1 (zh) * 2015-08-27 2017-03-02 深圳市国华识别科技开发有限公司 自动捕捉目标物的方法、装置及存储介质
CN106200396A (zh) * 2016-08-05 2016-12-07 易晓阳 一种基于运动识别的家居控制方法
CN106200395A (zh) * 2016-08-05 2016-12-07 易晓阳 一种多维识别家居控制方法
CN107150347A (zh) * 2017-06-08 2017-09-12 华南理工大学 基于人机协作的机器人感知与理解方法
CN107817799A (zh) * 2017-11-03 2018-03-20 北京光年无限科技有限公司 结合虚拟迷宫进行智能交互的方法及系统
CN107817799B (zh) * 2017-11-03 2021-06-15 北京光年无限科技有限公司 结合虚拟迷宫进行智能交互的方法及系统
CN108427910A (zh) * 2018-01-30 2018-08-21 浙江凡聚科技有限公司 深层神经网络ar手语翻译学习方法、客户端及服务器
CN111107259A (zh) * 2018-10-25 2020-05-05 阿里巴巴集团控股有限公司 图像获取方法、装置及电子设备
CN111107259B (zh) * 2018-10-25 2021-10-08 阿里巴巴集团控股有限公司 图像获取方法、装置及电子设备
CN111415461A (zh) * 2019-01-08 2020-07-14 虹软科技股份有限公司 物品识别方法及系统、电子设备
US11335092B2 (en) 2019-01-08 2022-05-17 Arcsoft Corporation Limited Item identification method, system and electronic device
CN110348446A (zh) * 2019-06-24 2019-10-18 西安艾润物联网技术服务有限责任公司 图片处理方法及装置
CN110335607A (zh) * 2019-08-19 2019-10-15 北京安云世纪科技有限公司 一种语音指令的执行方法、装置及电子设备
CN112698716A (zh) * 2019-10-23 2021-04-23 上海博泰悦臻电子设备制造有限公司 基于手势识别的车内设置、控制方法、系统、介质及设备
CN112307865A (zh) * 2020-02-12 2021-02-02 北京字节跳动网络技术有限公司 基于图像识别的交互方法及装置
CN111638783A (zh) * 2020-05-18 2020-09-08 广东小天才科技有限公司 一种人机交互方法及电子设备
CN112233505A (zh) * 2020-09-29 2021-01-15 浩辰科技(深圳)有限公司 一种新型盲童交互学习系统
CN113936233A (zh) * 2021-12-16 2022-01-14 北京亮亮视野科技有限公司 一种手指指定目标的识别方法及装置

Also Published As

Publication number Publication date
WO2017032187A1 (zh) 2017-03-02
EP3333759A1 (en) 2018-06-13
JP2018534649A (ja) 2018-11-22
US20190026545A1 (en) 2019-01-24
EP3333759A4 (en) 2019-03-27

Similar Documents

Publication Publication Date Title
CN105205454A (zh) 自动捕捉目标物的系统和方法
US10664060B2 (en) Multimodal input-based interaction method and device
US10725552B2 (en) Text input method and device based on gesture recognition, and storage medium
US20160042228A1 (en) Systems and methods for recognition and translation of gestures
EP3258423A1 (en) Handwriting recognition method and apparatus
CN104914989B (zh) 姿势辨识装置以及姿势辨识装置的控制方法
US10564712B2 (en) Information processing device, information processing method, and program
CN109710727A (zh) 用于自然语言处理的系统和方法
Madhuri et al. Vision-based sign language translation device
EP3276484A1 (en) Information processing system and information processing method
Kumarage et al. Real-time sign language gesture recognition using still-image comparison & motion recognition
CN106293085A (zh) 应用于电子终端的试题搜索方法和装置
CN111722700A (zh) 一种人机交互方法及人机交互设备
CN109739353A (zh) 一种基于手势、语音、视线追踪识别的虚拟现实交互系统
KR101567154B1 (ko) 다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치
CN109871128B (zh) 一种题型识别方法及装置
US10971148B2 (en) Information providing device, information providing method, and recording medium for presenting words extracted from different word groups
CN108628454B (zh) 基于虚拟人的视觉交互方法及系统
Challa et al. Recent advances in sign language detection: A brief survey
CN114663920A (zh) 手势识别的方法、装置、服务器和计算机可读存储介质
CN105989132A (zh) 图像文件处理及语音控制方法
Jamaludin et al. Dynamic hand gesture to text using leap motion
Jadhav et al. GoogLeNet application towards gesture recognition for ASL character identification
JP6886663B2 (ja) 動作指示生成システム、方法およびプログラム
CN111931510A (zh) 一种基于神经网络的意图识别方法及装置、终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151230