CN102236413A - 接口装置和手势识别方法 - Google Patents

接口装置和手势识别方法 Download PDF

Info

Publication number
CN102236413A
CN102236413A CN2011101125867A CN201110112586A CN102236413A CN 102236413 A CN102236413 A CN 102236413A CN 2011101125867 A CN2011101125867 A CN 2011101125867A CN 201110112586 A CN201110112586 A CN 201110112586A CN 102236413 A CN102236413 A CN 102236413A
Authority
CN
China
Prior art keywords
operand
information
benchmark
interface arrangement
operation signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101125867A
Other languages
English (en)
Inventor
中野正隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Electronics Corp
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Publication of CN102236413A publication Critical patent/CN102236413A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality

Abstract

本发明涉及接口装置和手势识别方法。接口装置被构造为将操作信号输出到根据手势命令来操作的目标装置。在该接口装置中,基准对象检测单元从由图像捕捉单元捕捉的图像中检测具有与预定的基准特征值类似的特征的基准对象,并且生成标识基准对象的基准信息;基于基准信息,操作对象标识单元将包括在图像中并且在与基准对象的相对关系方面满足预定的标识条件的特征对象标识为操作对象,并且提取标识操作对象的操作对象信息。操作信号生成单元根据标识的操作对象的位置变化而开始检测手势命令,并且生成对应于手势命令的操作信号。

Description

接口装置和手势识别方法
相关申请的交叉引用
在此通过引用将2010年4月26日提出的日本专利申请No.2010-101485的包括说明书、权利要求、附图和摘要的公开内容全部并入。
技术领域
本发明涉及接口装置和手势识别方法,更具体地说,涉及被构造为生成操作信号,以向根据人的动作而操作的目标装置下达命令的接口装置和手势识别方法。
背景技术
近年来,已经开发了一种接口装置,其允许操作者无需诸如键盘、鼠标等等的输入装置而容易地操作设备。例如,日本未审专利公开No.H08-044490公开了一种接口装置,包括图像拾取单元、被构造为识别由图像拾取单元所获取的图像中的对象的形状和动作的动作识别单元,以及被构造为显示由动作识别单元所识别的形状和动作的显示单元。更具体地说,在日本未审专利公开No.H08-044490中公开的接口装置中,识别操作者的手并且根据手的动作来识别操作。在该日本未审专利公开No.H08-044490中公开的该接口装置中,根据由操作者所做的手势选择在显示屏上显示的虚拟开关(virtual switch)等等。
发明内容
在日本未审专利公开No.H08-044490中公开的接口装置中,为获得标识(identify)操作者的信息,需要从捕捉的图像识别特定对象。为此目的,在日本未审专利公开No.H08-044490中公开的接口装置中,识别操作者的手作为对象。为以上述方式标识操作者,要求高的计算能力以识别操作者和该操作者所做的手势。
更具体地说,手的形状和/或颜色取决于操作者而改变。除此之外,取决于拍摄手的图像的方向,手具有不同的形状。因此,为了基于手的形状从捕捉的图像中检测手,需要高度复杂的信息处理。在图像包括能作为操作者的侯选的两个或更多人的情况下,可能难以从两个或更多候选中标识真正的操作者。除此之外,除发出操作命令所做的手势外,操作者还可能做出许多动作。因此,需要始终监视操作者的动作以检测命令手势的开始,并且由此要求高的计算能力来执行监视。在日本未审专利公开No.H08-044490中公开的技术具有不能避免上述情形的问题。
根据本发明的方面,接口装置被构造为将操作信号输出到根据手势命令来操作的目标装置,并且该接口装置包括:基准对象检测单元,其被构造为从由图像拾取单元拍摄的图像中检测具有与预定的基准特征值类似的特征的基准对象,并且生成标识基准对象的基准信息;操作对象标识单元,其被构造为基于基准信息,将包括在图像中并且在与基准对象的相对关系方面满足预定标识条件的特征对象标识为操作对象,并且提取标识操作对象的操作对象信息;以及操作信号生成单元,其被构造为根据标识的操作对象的位置变化而开始检测手势命令,并且生成对应于手势命令的操作信号。
根据本发明的另一方面,接口装置中的手势识别方法被构造为将操作信号输出到根据手势命令来操作的目标装置,并且该手势识别方法包括:从由图像拾取单元拍摄的图像中检测具有与预定的基准特征值类似的特征的基准对象,并且生成标识基准对象的基准信息;基于图像和基准信息,将在与基准对象的相对关系方面满足预定是标识条件的特征对象标识为操作对象;提取标识操作对象的操作对象信息;基于标识的操作对象的位置变化而开始检测手势命令;以及根据手势命令来生成操作信号。
在根据本发明的上述方面的接口装置和手势识别方法中,基于具有预先定义的特定特征的基准对象,将一个特征对象检测为操作对象。基于检测到的操作对象,检测手势命令。即,在根据本发明的接口装置和手势识别方法中,将在与容易识别的基准对象的相对关系方面满足标识条件的对象确定为操作对象。由此,在根据本发明的接口装置和手势识别方法中,能够经由简单的计算处理来识别操作者和操作对象。
由此,在根据本发明的接口装置和手势识别方法中,能够经由简单的处理来识别手势。
附图说明
图1是示出根据本发明的第一实施例的手势控制系统的框图;
图2是示出根据本发明的第一实施例的接口装置的框图;
图3是示出根据本发明的第一实施例的接口装置的操作的流程图;
图4是示出根据本发明的第二实施例的接口装置的操作的流程图;以及
图5是根据本发明的第三实施例的接口装置的框图。
具体实施方式
第一实施例
在下文中,参考附图,描述本发明的实施例。图1是示出包括根据第一实施例的接口装置的手势控制系统1的框图。在图1中所示的示例中,根据手势命令来控制电视机。注意,手势命令是指通过人的动作下达的控制待控的目标装置(在下文中,简称为目标装置)的命令。目标装置不限于电视机,而是可以根据本实施例控制许多其他装置,诸如视频播放装置、个人计算机(PC)、音频设备和空调。如图1中所示,手势控制系统1包括接口装置10、图像拾取单元20和目标装置30。
图像拾取单元20可以是例如被构造为在操作者操作目标装置30的区域中拍摄图像的照相机。图像拾取单元20以预定间隔拍摄图像。在每一拍照时刻获得的图像被称为帧。
接口装置10逐帧地捕捉由图像拾取单元20拍摄的图像,并且基于捕获的图像来识别由操作者发出的手势命令。然后,接口装置10基于识别的手势命令而输出操作信号CNT。
目标装置30包括目标装置控制单元31和显示单元32。目标装置30基于操作信号CNT生成变化的显示控制信号VP。显示单元32显示根据显示控制信号VP生成的图像。注意,显示在显示单元32上的图像能被操作者看到。
根据操作者的动作,手势控制系统1改变在显示单元32上显示的图像。例如,在手势控制系统1中,在显示单元32上显示操作菜单,并且根据操作者的动作来控制与操作菜单相关联的操作,由此改变操作菜单,移动操作光标以指向操作菜单中的条目,改变电视频道,以及调节音量级别。
在根据第一实施例的手势控制系统1中,通过如下所述的独特方法,由接口装置10执行手势识别。在根据第一实施例的接口装置10中,举例假定由硬件实现手势识别功能。注意,可以由通用微型计算机上的软件(手势识别程序)来实现手势识别功能。
图2是接口装置10的框图。如图2中所示,接口装置10包括帧存储器11、基准对象检测单元12、基准特征值存储单元13、操作对象标识单元14、操作信号生成单元15、操作对象信息存储单元16、以及位置历史信息存储单元17。注意,不需要为帧存储器11、基准特征值存储单元13、操作对象信息存储单元16和位置历史信息存储单元17中的每一个提供专用存储区,而是可以将单个存储器中的特定区域用于这些存储单元。例如,在由微型计算机实现接口装置10的情况下,上述存储单元可以在由微型计算机使用的存储器中实现。
帧存储器11逐帧地存储捕捉的图像CP。注意,在帧存储器11中存储的捕捉的图像CP包括当前帧的捕捉的图像CP和先前帧的捕捉的图像CP。
基准对象检测单元12从存储在帧存储器11中的图像读取当前帧的图像作为基准图像FP。基准对象检测单元12分析读取的图像以检测具有与预定基准特征值SE1类似的特征的基准对象,并且基准对象检测单元12生成标识基准对象的基准信息P1。注意,从基准特征值存储单元13读取基准特征值SE1。在根据第一实施例的接口装置10中,举例假定将人的面部用作基准对象。因此,在第一实施例中,基准特征值SE1包括与允许识别人的面部的特征有关的信息。可用于本目的的特征的示例包括人的面部的颜色、形状、浓度分布等等。注意,基准对象不限于人的面部,而是图像区中的固定对象可以用作基准对象。还注意,假定基准信息P1包括与基准对象有关的位置信息。
基于基准图像FP和基准信息P1,操作对象标识单元14检测在与基准对象的位置关系方面满足预定标识条件的特征对象并且操作对象标识单元14将检测到的特征对象标识为操作对象。然后,操作对象标识单元14提取标识操作对象的操作对象信息P2。在第一实施例中,标识条件是对象应当覆盖由基准信息指定的基准对象的至少一部分。即,在第一实施例中,当操作对象标识单元14找到覆盖基准对象的至少一部分的对象候选时,操作对象标识单元14将其标识为操作对象。更具体地说,在该标识处理中,当对象位于图像拾取单元20和基准对象之间并且从图像拾取单元20看时其覆盖基准对象的至少一部分时,将该对象标识为操作对象。当通过将覆盖基准对象的至少一部分的特征对象简单地视为操作对象来执行标识时,如果存在将不是真正的操作对象的对象错误地标识为操作对象的可能性,则可以除了与操作对象有关的基本标识条件之外还定义进一步要求的条件。更具体地说,例如,当检测到满足基本标识条件的对象时,将该对象视为用于操作对象的候选,并且对该候选进行进一步评估以检查其是否进一步在位置改变(例如左右摆动的移动)方面满足特定的条件。如果其满足该进一步的条件,那么将其标识为操作对象。
为执行上述处理,操作对象标识单元14读取当前帧的图像和先前帧的图像作为基准图像FP。然后,操作对象标识单元14将当前帧的图像中的基准对象与先前帧的图像中的基准对象进行比较,并且识别覆盖基准对象的一部分的对象。例如,可以如下进行有关该对象是否覆盖基准对象的一部分的确定。在基准对象为面部的情况下,具有圆形形状和肉色的对象被识别为基准对象。因此,如果面部被手部分地覆盖,那么具有覆盖面部的手的形状和颜色的对象被识别为操作对象。然后,操作对象标识单元14从基准图像FP提取标识被识别为操作对象的对象的操作对象信息P2。在上述示例中,操作对象信息P2包括与被识别为操作对象的部分的形状和颜色相关的信息。
如果标识了操作对象,那么操作信号生成单元15基于操作对象的位置变化来开始检测发出到目标装置控制单元31的手势命令,并且操作信号生成单元15将基于检测到的手势命令的操作信号CNT输出到目标装置控制单元31。更具体地说,如果操作信号生成单元15从操作对象标识单元14接收到操作对象信息P2,那么操作信号生成单元15将操作对象信息P2注册在操作对象信息存储单元16中,并且操作信号生成单元15读取当前帧的图像作为基准图像FP。然后,基于操作对象信息P2,操作信号生成单元15从基准图像FP提取与操作对象相关联的位置信息并生成位置历史信息CH。此外,操作信号生成单元15基于位置历史信息CH来生成操作信号CNT。更具体地说,操作信号生成单元15基于与基准图像FP中的当前帧中的操作对象相关联的位置信息和在位置历史信息存储单元17中存储的位置历史信息CH之间的差来提取与操作对象相关联的位置改变信息,并且操作信号生成单元15将获得的位置改变信息作为操作信号CNT输出到目标装置控制单元31。在生成操作信号CNT后,操作信号生成单元15基于从基准图像FP提取的与操作对象相关联的位置信息来更新位置历史信息CH。注意,可以按时间序列来存储位置历史信息CH,以表示操作对象的位置随时间的变化,或可以仅存储与前一帧相关联的位置信息。
操作信号生成单元15基于操作对象信息P2来跟踪操作对象。在跟踪中,如果满足预定注销条件,则注销操作对象的注册。注销条件的示例是在比超时时段长的时段上未检测到对应于操作对象的特征;在比超时时段长的时段上未检测到操作对象的一部分的变化;以及检测到操作对象进行的特定动作(诸如在预定时段中用手画出十字的动作)。例如,可以通过清除在操作对象信息存储单元16中存储的操作对象信息P2来执行通过操作信号生成单元15的操作对象的注册的注销。注意,操作信号生成单元15包括测量未检测到操作对象的时间的计数器(未示出),并且还包括用于存储指定超时时段的值的存储单元。
如上所述,接口装置10基于操作对象的位置改变来生成操作信号CNT,并且目标装置控制单元31根据操作信号CNT来改变显示控制信号VP。例如,目标装置控制单元31根据诸如与操作对象相关联的位置改变矢量信息的操作信号CNT来执行诸如操作光标的移动的操作。此外,目标装置控制单元31可以由操作信号CNT的历史信息来生成操作对象的移动轨迹,并且可以基于有关移动轨迹的信息来切换电视选择频道。
在下文中,将进一步详细地描述接口装置10的操作。图3是示出接口装置10的操作的流程图。注意,在图3中所示的示例中,仅将操作对象覆盖基准对象的一部分的条件用作标识条件,并且仅将操作对象在长于超时时段的时段没有位置改变的条件用作注销条件。然而,标识条件和注销条件不限于上述,而是可以采用其他条件。
如图3中所示,在接口装置10的操作中,在紧接开始操作后的第一步骤S1中,进行关于是否已经更新了帧存储器11中存储的图像(即,是否已经更新了最新帧的图像)的确定。例如,通过基准对象检测单元12执行步骤S1中的处理。重复步骤S1中的处理直到确定已经更新了图像为止(即,只要步骤S1的回答为否,就重复步骤S1)。如果在步骤S1中确定已经更新了图像(即,步骤S1的回答为是),那么处理流程前进到步骤S2。
在步骤S2,进行关于经由前处理是否已经标识操作对象以及是否已经注册与该操作对象相关联的操作对象信息的确定。例如,通过参考操作对象信息存储单元16,由基准对象检测单元12执行步骤S2中的处理。在步骤S2中确定还未注册与操作对象相关联的操作对象信息的情况下(即,如果步骤S2的回答为否),那么处理流程前进到步骤S3,并且进一步到后续步骤S4和S5,以标识基准对象和操作对象。另一方面,如果在步骤S2中确定已经注册与操作对象相关联的操作对象信息(即,如果步骤S2的回答为是),那么处理流程前进到步骤S6,并进一步到步骤S6至S12,以跟踪操作对象。
在标识基准对象和操作对象的处理中,首先,基准对象检测单元12基于基准图像FP和基准特征值SE1来生成标识基准对象的基准信息P1(步骤S3)。通过基准对象检测单元12来执行步骤S3中的该处理。如果在步骤S3中在图像中没有找到对象作为基准对象(例如,人的面部)(即如果步骤S3的回答为否),那么处理流程返回到步骤S1。另一方面,在步骤S3中找到用作基准对象的对象的情况下(即如果步骤S3的回答为是),那么处理流程前进到步骤S4。
在步骤S4,标识操作对象并且生成标识操作对象的操作对象信息P2。更具体地说,在步骤S4,基于基准图像FP和基准信息P1,将在与基准对象的相对关系方面满足预定标识条件的特征对象标识为操作对象,并且提取标识操作对象的操作对象信息。在第一实施例中,将覆盖基准对象的一部分的对象标识为操作对象,并且因此,在该步骤S4中,进行关于是否存在满足这样的标识条件的对象的确定。通过操作对象标识单元14来执行步骤S4中的处理。在步骤S4中确定在基准图像FP中不存在被标识为操作对象的对象的情况下(即,如果步骤S4的回答为否),处理流程返回到步骤S1。另一方面,如果在步骤S4中确定在基准图像FP中存在被标识为操作对象的对象(即,如果步骤S4的回答为是),那么处理流程前进到步骤S5。
在步骤S5,将在步骤S4中提取的操作对象信息P2注册在操作对象信息存储单元16中。通过操作信号生成单元15来执行步骤S5中的处理。从操作对象标识单元14接收到操作对象信息P2被用作使操作信号生成单元15开始跟踪操作对象(步骤S6至S12)的触发器。
通过操作信号生成单元15来执行跟踪操作对象的处理。在跟踪操作对象的处理中,首先,在步骤S6中,参考已经注册的操作对象信息P2,并且从基准图像FP(图像的当前帧)提取与操作对象相关联的位置信息。在跟踪操作对象的处理中,在步骤S7中进行关于在基准图像FP中是否存在用作操作对象的对象的确定。在步骤S7中确定没有被视为操作对象的对象的情况下(即,如果步骤S7的回答为否),那么处理流程前进到步骤S11,在步骤S11中,进行关于未检测到操作对象的未检测到时段是否已经超过超时时段的确定。在步骤S11中确定未检测到时段已经超出超时时段的情况下(即,如果步骤S11的回答为是),处理流程前进到步骤S12。在步骤S12中,操作对象标识单元14清除在操作对象信息存储单元16中存储的操作对象信息P2。然后,处理流程返回到步骤S1。另一方面,在步骤S11中确定未检测到时段还未超出超时时段的情况下(即,如果步骤S11的回答为否),那么处理流程返回到步骤S1。
在步骤S7中确定了存在操作对象的情况下(即,步骤S7的回答为是),那么处理流程前进到步骤S8,在步骤S8中,操作信号生成单元15清除未检测到时段。然后,在步骤S9,基于在位置历史信息存储单元17中存储的位置历史信息CH和在步骤S6中提取的位置信息,生成操作信号CNT,并且输出所获得的操作信号CNT。然后,处理流程前进到步骤S10,在步骤S10中,操作信号生成单元15基于在步骤S6中提取的操作对象信息P2来更新位置历史信息CH。然后,处理流程返回到步骤S1。
因此,在第一实施例中,如上所述,接口装置10检测在与基准对象的相对关系方面满足标识条件的对象,并且将其标识为操作对象。指定作为基准对象的对象的示例是具有比操作对象所具有的特征变化少的特征变化的对象,或具有比操作对象所具有的特征更有力的特征(或更多的特征)的对象。因为基于与易于识别的与基准对象的相对关系来执行可能在识别中要求复杂的处理的操作对象的识别,这使得接口装置10能够经由不太复杂的处理来识别操作对象。
在接口装置10中,如上所述,将在与基准对象的相对关系方面满足标识条件的对象识别为操作对象。因此,在接口装置10中,不需要始终监视操作对象,即,能够减少跟踪操作对象的处理。
在接口装置10中,直到标识了操作对象才开始通过操作信号生成单元15的跟踪操作对象的处理。这意味着在接口装置10中,不执行跟踪处理中的操作信号CNT的生成,除非操作者有意地做出手势。这使得接口装置10能够容易地确定手势命令开始的时间。
在接口装置10中,如上所述,通过检测具有特定的与基准对象的相对关系的对象来执行操作对象的识别。这使得即使当操作对象的诸如形状、颜色等等的特征具有大的变化时,接口装置10也能容易地识别操作对象,手的情况正是如此。此外,在接口装置10中,因为基于识别的操作对象而生成标识操作对象的操作对象信息,因此,不需要预先定义诸如操作对象的形状的特征。即,在接口装置10中,对用作操作对象的对象无特别的限制,这允许以更灵活的方式发出手势命令。
此外,在接口装置10中,因为基于与基准对象的相对关系来标识操作对象,因此,不需要单独地识别不同操作者中的每一个。因为足以简单地将操作者的一般特征定义为与基准对象有关的基准特征值,这使得能够使用接口装置10实现高度通用的系统。
此外,在接口装置10中,能够标识操作对象,而不必始终监视具有以复杂方式变化的形状的操作对象。这允许接口装置10最小化执行复杂处理的时段,这导致手势识别处理中消耗的功率减少。
第二实施例
在下述公开的第二实施例中,标识操作对象的方法与根据第一实施例的方法的不同之处如下。在根据第二实施例的标识操作对象的方法中,将操作对象和基准对象之间的位置关系用作用于标识操作对象的标识条件。即,在第二实施例中,操作对象不需要覆盖基准对象,而是操作对象满足与基准对象的特定位置关系就足够了。
更具体地说,当能够作为用于操作对象的候选的特征对象与基准对象的距离在预定范围内,并且从特征对象延伸到基准对象的线的相对于拾取单元20的图像区的水平方向的角度处于预定范围内时,将特征对象标识为操作对象。例如,在基准对象为人的面部并且操作对象为人的手的情况下,当人举起他/她的手时,脸和手开始具有特定的位置关系。在这种情况下,如果检测到具有这样的位置关系的特征对象,那么能够将其标识为操作对象。
在根据第二实施例的接口装置中,预先定义期望用作操作对象的对象的特征作为特征对象候选的特征。预定的用于操作对象的候选的特征可以包括例如能够用于操作对象的颜色、形状(简化形状)、浓度分布等等。此外,在根据第二实施例的接口装置中,可以如下地执行操作对象的标识。即,当特征对象候选具有与基准对象的预定位置关系时,如果在预定时段中在位置的变化(诸如左右摆动的移动)方面满足预定条件,那么将该特征对象候选标识为操作对象。
图4是示出根据第二实施例的接口装置的操作的流程图。如图4中所示,在第二实施例中,接口装置的操作与根据第一实施例的接口装置10的操作类似,不同之处在于步骤S4a中的处理。在根据第二实施例的接口装置的操作中,执行步骤S4a中的处理以基于操作对象候选与基准对象之间的位置关系来标识操作对象。在步骤S4a中,如果找到具有与基准对象的特定位置关系的特征对象候选,那么监视该特征对象的后续移动。如果特征对象候选进行预定的动作,那么将该特征对象候选标识为操作对象。
在根据本发明的实施例的标识操作对象的方法中,如上所述,基于基准对象和可能是操作对象的特征对象之间的相对关系来标识操作对象。相对关系可以取决于系统的规范、使用系统的方式或其他因素而改变。
第三实施例
在下述第三实施例中,公开了用于接口装置的构造的另一示例。图5示出了根据第三实施例的接口装置40。该接口装置40被构造为将操作者的个人信息(例如,基准特征值SE2)与操作信号CNT一并输出。
为上述目的,接口装置40具有代替基准特征值存储单元13的基准特征值存储单元41、代替操作对象标识单元14的操作对象标识单元42、以及代替操作信号生成单元15的操作信号生成单元43。基准特征值存储单元41存储与对应于可能是操作者的各候选的特征相关联的多个基准特征值SE1。如果操作对象标识单元42标识了操作对象,那么根据基准特征值SE1,操作对象标识单元42提取与基于其标识操作对象的基准对象相关联的基准特征值SE2。然后,操作对象标识单元42与基准特征值SE2一并输出操作对象信息P2。操作信号生成单元43与从操作对象标识单元42接收的基准特征值SE2一并输出操作信号CNT。
能使用基于其标识操作对象的基准对象的基准特征值SE2来标识操作者。通过将基准特征值SE2输入到目标装置控制单元31,目标装置控制单元31能够根据基准特征值SE2而取决于操作者来执行不同的操作。例如,在操作者为儿童的情况下,目标装置控制单元31可以呈现具有家长控制(parental guard)的操作菜单。另一方面,在操作者为成人的情况下,目标装置控制单元31可以呈现无家长控制的操作菜单。在操作者为老人的情况下,目标装置控制单元31可以呈现以大的字符显示的操作菜单。
如上所述,根据第三实施例的接口装置40能够标识操作者,并且使用根据第三实施例的接口装置的手势控制系统能为各个操作者提供不同的操作。在以上述方式标识操作者时,接口装置40能够基于与基准对象的相对关系经由简单的处理来标识操作者。
本发明不限于上述实施例,而是在不偏离本发明的精神和范围的情况下,许多改进是可能的。例如,接口装置和目标装置中的目标装置控制单元可以由单个微型计算机实现。接口装置可以与目标装置集成或可以与目标装置分离地形成。

Claims (12)

1.一种接口装置,所述接口装置被构造为将操作信号输出到根据手势命令来操作的目标装置,所述接口装置包括:
基准对象检测单元,所述基准对象检测单元被构造为从由图像拾取单元拍摄的图像中检测具有与预定的基准特征值类似的特征的基准对象,并且生成标识所述基准对象的基准信息;
操作对象标识单元,所述操作对象标识单元被构造为基于所述基准信息,将包括在图像中并且在与所述基准对象的相对关系方面满足预定的标识条件的特征对象标识为操作对象,并且提取标识所述操作对象的操作对象信息;以及
操作信号生成单元,所述操作信号生成单元被构造为根据标识的操作对象的位置变化而开始检测手势命令,并且生成对应于所述手势命令的所述操作信号。
2.如权利要求1所述的接口装置,其中,所述操作信号生成单元注册所述操作对象信息,基于所述操作对象信息从所述图像中提取与操作对象相关联的位置信息,基于提取的位置信息来生成或更新位置历史信息,并且基于所述位置历史信息来生成所述操作信号。
3.如权利要求1所述的接口装置,其中,当所述操作对象满足预定的注销条件时,所述操作信号生成单元注销操作对象的注册。
4.如权利要求1所述的接口装置,其中,基准对象是可能作为操作者的多个候选,
其中,所述基准特征值包括与各候选的特征相关联的多个基准特征值,
其中,所述操作对象标识单元将基于其标识所述操作对象的所述基准对象的所述基准特征值以及与所述操作对象相关联的所述操作对象信息一并告知所述操作信号生成单元,以及
其中,所述操作信号生成单元将所述基准特征值以及从所述操作信号生成单元告知的所述基准特征值一并输出。
5.如权利要求1所述的接口装置,进一步包括:
帧存储器,所述帧存储器被构造为逐帧地存储所述图像;
位置历史信息存储单元,所述位置历史信息存储单元被构造为存储所述位置历史信息;以及
操作对象信息存储单元,所述操作对象信息存储单元被构造为存储所述操作对象信息,
其中,所述基准对象检测单元基于在所述帧存储器中存储的所述图像来检测所述基准对象,
其中,所述操作对象标识单元标识所述操作对象,并且基于在所述帧存储器中存储的在时间上不同前/后位置的多个图像来提取与所述操作对象相关联的所述操作对象信息,以及
其中,对于每帧,所述操作信号生成单元基于所述操作对象信息来更新所述位置历史信息,并且基于所述位置历史信息来生成所述操作信号。
6.如权利要求1所述的接口装置,其中,所述基准对象检测单元和所述操作对象标识单元基于所述图像中的颜色信息来分别提取所述基准信息和所述操作对象信息。
7.如权利要求1所述的接口装置,其中,所述操作对象标识单元将覆盖所述基准对象的至少一部分的特征对象候选标识为所述操作对象。
8.如权利要求1所述的接口装置,其中,所述操作对象标识单元基于与所述操作对象相关联的预定的候选值,从所述图像中提取至少一个或多个特征对象候选作为用于所述操作对象的候选,并且如果特征对象候选中的一个在与所述基准对象的位置关系方面满足标识条件,则所述操作对象标识单元将所述特征对象候选中的所述一个标识为所述操作对象。
9.如权利要求7所述的接口装置,其中,如果所述特征对象候选中的一个在位置变化方面满足预定条件,则所述操作对象标识单元将所述特征对象候选中的所述一个最终标识为操作对象。
10.如权利要求1所述的接口装置,其中,所述基准对象是人的面部并且所述操作对象是人的手。
11.如权利要求1所述的接口装置,其被提供在目标装置中,所述目标装置包括目标装置控制单元和显示单元,所述显示单元被构造为在所述目标装置控制单元的控制下显示用户界面图像。
12.一种接口装置中的手势识别方法,所述接口装置被构造为将操作信号输出到根据手势命令来操作的目标装置,所述方法包括:
从由图像拾取单元拍摄的图像中检测具有与预定的基准特征值类似的特征的基准对象,并且生成标识所述基准对象的基准信息;
基于所述图像和所述基准信息,将在与所述基准对象的相对关系方面满足预定的标识条件的特征对象标识为操作对象;
提取标识所述操作对象的操作对象信息;
基于标识的操作对象的位置变化而开始检测手势命令;以及
根据所述手势命令来生成所述操作信号。
CN2011101125867A 2010-04-26 2011-04-26 接口装置和手势识别方法 Pending CN102236413A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010101485A JP2011232894A (ja) 2010-04-26 2010-04-26 インタフェース装置、ジェスチャ認識方法及びジェスチャ認識プログラム
JP2010-101485 2010-04-26

Publications (1)

Publication Number Publication Date
CN102236413A true CN102236413A (zh) 2011-11-09

Family

ID=44815818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101125867A Pending CN102236413A (zh) 2010-04-26 2011-04-26 接口装置和手势识别方法

Country Status (3)

Country Link
US (1) US20110262006A1 (zh)
JP (1) JP2011232894A (zh)
CN (1) CN102236413A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103375880A (zh) * 2012-04-27 2013-10-30 珠海格力电器股份有限公司 空调器的遥控装置和方法
CN104023645A (zh) * 2012-02-29 2014-09-03 株式会社东芝 超声波诊断装置、医用图像诊断装置及超声波诊断装置控制程序
CN104063041A (zh) * 2013-03-21 2014-09-24 联想(北京)有限公司 一种信息处理方法及电子设备
CN104246659A (zh) * 2012-03-31 2014-12-24 微软公司 可实例化的手势对象
CN104536561A (zh) * 2014-12-10 2015-04-22 金硕澳门离岸商业服务有限公司 采用可穿戴设备控制终端设备操作的方法及可穿戴设备
CN106369737A (zh) * 2016-08-19 2017-02-01 珠海格力电器股份有限公司 空调控制处理方法及装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9857868B2 (en) 2011-03-19 2018-01-02 The Board Of Trustees Of The Leland Stanford Junior University Method and system for ergonomic touch-free interface
US8840466B2 (en) 2011-04-25 2014-09-23 Aquifi, Inc. Method and system to create three-dimensional mapping in a two-dimensional game
US8854433B1 (en) 2012-02-03 2014-10-07 Aquifi, Inc. Method and system enabling natural user interface gestures with an electronic system
JP5830653B2 (ja) * 2012-04-27 2015-12-09 パナソニックIpマネジメント株式会社 空気調和機
US9111135B2 (en) 2012-06-25 2015-08-18 Aquifi, Inc. Systems and methods for tracking human hands using parts based template matching using corresponding pixels in bounded regions of a sequence of frames that are a specified distance interval from a reference camera
US8934675B2 (en) 2012-06-25 2015-01-13 Aquifi, Inc. Systems and methods for tracking human hands by performing parts based template matching using images from multiple viewpoints
JP2014048936A (ja) 2012-08-31 2014-03-17 Omron Corp ジェスチャ認識装置、その制御方法、表示機器、および制御プログラム
US8836768B1 (en) 2012-09-04 2014-09-16 Aquifi, Inc. Method and system enabling natural user interface gestures with user wearable glasses
US9129155B2 (en) 2013-01-30 2015-09-08 Aquifi, Inc. Systems and methods for initializing motion tracking of human hands using template matching within bounded regions determined using a depth map
US9092665B2 (en) 2013-01-30 2015-07-28 Aquifi, Inc Systems and methods for initializing motion tracking of human hands
US9298266B2 (en) 2013-04-02 2016-03-29 Aquifi, Inc. Systems and methods for implementing three-dimensional (3D) gesture based graphical user interfaces (GUI) that incorporate gesture reactive interface objects
US9798388B1 (en) 2013-07-31 2017-10-24 Aquifi, Inc. Vibrotactile system to augment 3D input systems
CN103795918A (zh) * 2013-11-29 2014-05-14 深圳市中兴移动通信有限公司 一种拍摄方法和拍摄装置
US9507417B2 (en) 2014-01-07 2016-11-29 Aquifi, Inc. Systems and methods for implementing head tracking based graphical user interfaces (GUI) that incorporate gesture reactive interface objects
US9619105B1 (en) 2014-01-30 2017-04-11 Aquifi, Inc. Systems and methods for gesture based interaction with viewpoint dependent user interfaces
KR102167289B1 (ko) * 2014-06-03 2020-10-19 엘지전자 주식회사 영상 표시 기기 및 그의 동작 방법
CN108647647B (zh) * 2018-05-14 2022-09-20 邯郸美的制冷设备有限公司 空调器的控制方法、控制装置及空调器
KR20210061638A (ko) 2019-11-20 2021-05-28 삼성전자주식회사 전자 장치 및 그 제어 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090079813A1 (en) * 2007-09-24 2009-03-26 Gesturetek, Inc. Enhanced Interface for Voice and Video Communications
CN101667059A (zh) * 2008-09-03 2010-03-10 黑龙江大学 基于手势识别的无线智能裁判系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804396B2 (en) * 2001-03-28 2004-10-12 Honda Giken Kogyo Kabushiki Kaisha Gesture recognition system
DE602004006190T8 (de) * 2003-03-31 2008-04-10 Honda Motor Co., Ltd. Vorrichtung, Verfahren und Programm zur Gestenerkennung
JP2004298988A (ja) * 2003-03-31 2004-10-28 Honda Motor Co Ltd 移動ロボットの画像送信装置
JP4479194B2 (ja) * 2003-08-29 2010-06-09 富士ゼロックス株式会社 動作識別装置、及び対象物の姿勢識別装置
US8305188B2 (en) * 2009-10-07 2012-11-06 Samsung Electronics Co., Ltd. System and method for logging in multiple users to a consumer electronics device by detecting gestures with a sensory device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090079813A1 (en) * 2007-09-24 2009-03-26 Gesturetek, Inc. Enhanced Interface for Voice and Video Communications
CN101667059A (zh) * 2008-09-03 2010-03-10 黑龙江大学 基于手势识别的无线智能裁判系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104023645A (zh) * 2012-02-29 2014-09-03 株式会社东芝 超声波诊断装置、医用图像诊断装置及超声波诊断装置控制程序
CN104246659A (zh) * 2012-03-31 2014-12-24 微软公司 可实例化的手势对象
US9575652B2 (en) 2012-03-31 2017-02-21 Microsoft Technology Licensing, Llc Instantiable gesture objects
CN104246659B (zh) * 2012-03-31 2017-09-22 微软技术许可有限责任公司 可实例化的手势对象
CN103375880A (zh) * 2012-04-27 2013-10-30 珠海格力电器股份有限公司 空调器的遥控装置和方法
CN103375880B (zh) * 2012-04-27 2016-10-05 珠海格力电器股份有限公司 空调器的遥控装置和方法
CN104063041A (zh) * 2013-03-21 2014-09-24 联想(北京)有限公司 一种信息处理方法及电子设备
CN104063041B (zh) * 2013-03-21 2018-02-27 联想(北京)有限公司 一种信息处理方法及电子设备
CN104536561A (zh) * 2014-12-10 2015-04-22 金硕澳门离岸商业服务有限公司 采用可穿戴设备控制终端设备操作的方法及可穿戴设备
CN104536561B (zh) * 2014-12-10 2018-02-23 金硕澳门离岸商业服务有限公司 采用可穿戴设备控制终端设备操作的方法及可穿戴设备
CN106369737A (zh) * 2016-08-19 2017-02-01 珠海格力电器股份有限公司 空调控制处理方法及装置

Also Published As

Publication number Publication date
US20110262006A1 (en) 2011-10-27
JP2011232894A (ja) 2011-11-17

Similar Documents

Publication Publication Date Title
CN102236413A (zh) 接口装置和手势识别方法
US10095033B2 (en) Multimodal interaction with near-to-eye display
US9870684B2 (en) Information processing apparatus, information processing method, program, and information processing system for achieving a surveillance camera system
KR102465532B1 (ko) 객체 인식 방법 및 장치
US10074186B2 (en) Image search system, image search apparatus, and image search method
US20180024643A1 (en) Gesture Based Interface System and Method
KR101603017B1 (ko) 제스처 인식 장치 및 제스처 인식 장치의 제어 방법
EP3037917B1 (en) Monitoring
CN102200830A (zh) 基于静态手势识别的非接触控制系统和控制方法
US8897490B2 (en) Vision-based user interface and related method
CN105229582A (zh) 基于近距离传感器和图像传感器的手势检测
CN106426081A (zh) 用于电力物资仓储的助手机器人及机器人系统
CN103179359A (zh) 控制视频终端的方法及装置、视频终端
KR20150038877A (ko) 사용자 입력에 대응되는 이벤트를 이용한 유저 인터페이싱 장치 및 방법
JP6575845B2 (ja) 画像処理システム、画像処理方法及びプログラム
JP6103765B2 (ja) 行動認識装置、方法及びプログラム並びに認識器構築装置
CN111986229A (zh) 视频目标检测方法、装置及计算机系统
US11605224B2 (en) Automated media editing operations in consumer devices
CN111783600B (zh) 一种人脸识别模型训练方法、装置、设备及介质
JP2021196741A (ja) 画像処理装置、画像処理方法、及びプログラム
KR101286750B1 (ko) 제스처를 이용한 패스워드 판단시스템
US9761009B2 (en) Motion tracking device control systems and methods
WO2014122879A1 (ja) 解析処理システム
CN115421591A (zh) 手势控制装置和摄像设备
CN109725722B (zh) 有屏设备的手势控制方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111109