CN103135759A - 多媒体播放控制方法和系统 - Google Patents

多媒体播放控制方法和系统 Download PDF

Info

Publication number
CN103135759A
CN103135759A CN2012100329344A CN201210032934A CN103135759A CN 103135759 A CN103135759 A CN 103135759A CN 2012100329344 A CN2012100329344 A CN 2012100329344A CN 201210032934 A CN201210032934 A CN 201210032934A CN 103135759 A CN103135759 A CN 103135759A
Authority
CN
China
Prior art keywords
attitude
play instruction
marked region
instruction
play
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100329344A
Other languages
English (en)
Other versions
CN103135759B (zh
Inventor
周雷
雷敏娟
师丹玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Taishan Sports Technology Co.,Ltd.
Original Assignee
SHENZHEN TOL TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN TOL TECHNOLOGY Co Ltd filed Critical SHENZHEN TOL TECHNOLOGY Co Ltd
Priority to CN201210032934.4A priority Critical patent/CN103135759B/zh
Publication of CN103135759A publication Critical patent/CN103135759A/zh
Application granted granted Critical
Publication of CN103135759B publication Critical patent/CN103135759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种多媒体播放控制方法,包括以下步骤:通过包含标记区域的交互设备产生姿态;采集包含所述标记区域的图像;识别所述标记区域的姿态;生成所述姿态对应的播放指令;根据所述播放指令控制多媒体的播放。上述方法不需要用户操作多个操控部件,只需要挥动交互设备产生姿态即可,减少了操作步骤,操作起来更为简单和灵活,另外还可以将人体部位本身作为交互设备产生姿态,操作起来更为方便和人性化,因而该方法加强了用户的体验,提高了用户的操作便利性。此外,还提供一种多媒体播放控制系统。

Description

多媒体播放控制方法和系统
【技术领域】
本发明涉及人机交互技术领域,特别涉及一种多媒体播放控制方法和系统。
【背景技术】
多媒体播放系统通过输入装置接收用户的指令,根据用户输入的指令控制多媒体的播放,其中,输入装置也称为交互设备。传统的多媒体播放系统的交互设备,如鼠标、键盘、操作盘等,一般都设置有多个操控部件,如按键、按钮或操作手柄等,供用户操作以输入指令。多媒体播放系统的控制菜单一般分为多层,用户需要操作交互设备上的多个操控部件,逐层地进入子菜单,直到进入到目标菜单页面后,再输入多媒体播放控制指令。
因此,传统的多媒体播放系统的播放控制一般需要操作多个操控部件,且操作步骤较为繁琐,从而降低了用户体验,给用户操作造成不便。
【发明内容】
基于此,有必要提供一种能提高用户操作便利性的多媒体播放控制方法。
基于此,还有必要提供一种能提高用户操作便利性的多媒体播放控制系统。
一种多媒体播放控制方法,包括以下步骤:通过包含标记区域的交互设备产生姿态;采集包含所述标记区域的图像;识别所述标记区域的姿态;生成所述姿态对应的播放指令;根据所述播放指令控制多媒体的播放。
优选的,所述生成所述姿态对应的播放指令的步骤包括:获取当前帧图像中的所述标记区域的姿态;根据预设的姿态与播放指令之间的映射关系生成与所述姿态对应的播放指令。
优选的,所述根据预设的姿态与播放指令之间的映射关系生成与所述姿态对应的播放指令的步骤包括:根据预设的姿态与播放指令类型之间的映射关系获取所述姿态对应的播放指令类型;根据预设的姿态与播放调整幅度之间的映射关系获取所述姿态对应的播放调整幅度;根据所述姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
进一步优选的,所述采集的包含标记区域的图像为图像序列;所述生成所述姿态对应的播放指令的步骤包括:获取当前帧图像中的所述标记区域的姿态与前预设帧图像中的所述标记区域的姿态之间的相对姿态;根据预设的相对姿态与播放指令之间的映射关系生成与所述相对姿态对应的播放指令。
优选的,所述根据预设的相对姿态与播放指令之间的映射关系生成与所述相对姿态对应的播放指令的步骤包括:根据预设的相对姿态与播放指令类型之间的映射关系获取所述相对姿态对应的播放指令类型;根据预设的相对姿态与播放调整幅度之间的映射关系获取所述相对姿态对应的播放调整幅度;根据所述相对姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
一种多媒体播放控制系统,包括交互设备、姿态识别器、多媒体播放设备,所述姿态识别器包括图像采集模块、姿态识别模块、指令生成模块,其中:交互设备用于通过标记区域产生姿态;图像采集模块用于采集所述包含标记区域的图像;姿态识别模块用于识别标记区域的姿态;指令生成模块用于生成所述姿态对应的播放指令;多媒体播放设备用于根据所述播放指令控制多媒体的播放。
优选的,所述指令生成模块包括:第一姿态获取模块,用于获取当前帧图像中的所述标记区域的姿态;第一指令查找模块,用于根据预设的姿态与播放指令之间的映射关系生成与所述姿态对应的播放指令。
优选的,所述第一指令查找模块包括:第一指令类型获取单元,用于根据预设的姿态与播放指令类型之间的映射关系获取所述姿态对应的播放指令类型;第一调整幅度获取单元,用于根据预设的姿态与播放调整幅度之间的映射关系获取所述姿态对应的播放调整幅度;第一指令生成单元用于根据所述姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
进一步优选的,所述采集的包含标记区域的图像为图像序列;所述指令生成模块包括:第二姿态获取模块,用于获取当前帧图像中的所述标记区域的姿态与前预设帧图像中的所述标记区域的姿态之间的相对姿态;第二指令查找模块,用于根据预设的相对姿态与播放指令之间的映射关系生成与所述相对姿态对应的播放指令。
优选的,所述第二指令查找模块包括:第二指令类型获取单元,用于根据预设的相对姿态与播放指令类型之间的映射关系获取所述相对姿态对应的播放指令类型;第二调整幅度获取单元,用于根据预设的相对姿态与播放调整幅度之间的映射关系获取所述相对姿态对应的播放调整幅度;第二指令生成单元,用于根据所述相对姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
上述多媒体播放控制方法和系统,根据采集到的包含标记区域的图像识别出标记区域所产生的姿态,并生成姿态对应的播放指令,进一步的根据播放指令控制多媒体的播放。这种方式不需要用户操作多个操控部件,只需要挥动交互设备产生姿态即可,减少了操作步骤,操作起来更为简单和灵活,另外还可以将人体部位本身作为交互设备产生姿态,操作起来更为方便和人性化,因而这种方式加强了用户的体验,提高了用户的操作便利性。
【附图说明】
图1为一个实施例中的多媒体播放控制方法的流程示意图;
图2为一个实施例中步骤S30的流程示意图;
图3为一个实施例中交互设备的结构示意图;
图4为一个实施例中构建二维坐标系的示意图;
图5为另一个实施例中的交互设备的结构示意图;
图6为又一个实施例中的交互设备的结构示意图;
图7为另一个实施例中步骤S30的流程示意图;
图8为一个实施例中构建三维坐标系的示意图;
图9为一个实施例中步骤S40的流程示意图;
图10为一个实施例中步骤S404的流程示意图;
图11为另一个实施例中步骤S40的流程示意图;
图12为一个实施例中步骤S420的流程示意图;
图13为一个实施例中的多媒体播放控制系统的结构示意图;
图14为一个实施例中姿态识别模块的结构示意图;
图15为另一个实施例中姿态识别模块的结构示意图;
图16为一个实施例中指令生成模块的结构示意图;
图17为一个实施例中第一指令查找模块的结构示意图;
图18为另一个实施例中指令生成模块的结构示意图;
图19为一个实施例中第二指令查找模块的结构示意图。
【具体实施方式】
在一个实施例中,如图1所示,一种多媒体播放控制方法,包括如下步骤:
步骤S10,通过包含标记区域的交互设备产生姿态。
本实施例中,标记区域是交互设备的一个区域或设置在交互设备上的标记,如反光材料等。
具体的,在一个实施例中,交互设备可以是手持装置,可将手持装置的一部分或全部设定为指定的颜色或形状,则该指定颜色或形状的部分即形成标记区域。另外,可在手持装置上设置指定颜色或形状的标记(如反光材料),则该指定颜色或形状的标记即形成标记区域。
在另一个实施例中,交互设备还可以是人体部位(例如人脸、手掌、手臂等),具有皮肤颜色的人体部位即形成标记区域。另外,可在人体部分上附带指定颜色或形状的标记(如反光材料),则该指定颜色或形状的标记即形成标记区域。
步骤S20,采集包含标记区域的图像。
步骤S30,识别标记区域的姿态。
所谓姿态,是指标记区域在图像中所形成的姿势状态。进一步的,在二维图像中,姿态为二维图像中的标记区域与预设位置之间的角度,即姿态角;在三维图像中,姿态为三维图像中的标记区域与预设位置之间的多个姿态角所组成的矢量,即姿态向量。本发明中说的“标记区域产生的姿态”,“标记区域的姿态”、“姿态”都是指所述姿态,也就是不同实施例的姿态角与姿态向量。
步骤S40,生成姿态对应的播放指令。
本实施例中,可预先设定标记区域的姿态与播放指令之间的映射关系,并将该映射关系存储在数据库中。在识别出标记区域的姿态后,可根据识别出的姿态从数据库中查找与姿态对应的播放指令。
步骤S50,根据播放指令控制多媒体的播放。
例如,根据播放指令控制多媒体播放开始、播放暂停、播放前进、播放后退、播放上一个、播放下一个、调低音量、调高音量等。
上述多媒体播放控制方法,根据采集到的包含标记区域的图像识别出标记区域所产生的姿态,并生成姿态对应的播放指令,进一步的根据播放指令控制多媒体的播放。这种方式不需要用户操作多个操控部件,只需要挥动交互设备产生姿态即可,减少了操作步骤,操作起来更为简单和灵活,另外还可以将人体部位本身作为交互设备产生姿态,操作起来更为方便和人性化,因而这种方式加强了用户的体验,提高了用户的操作便利性。
在一个实施例中,步骤S30可提取图像中的标记区域,进一步的获取标记区域中的像素坐标,并根据像素坐标产生标记区域姿态。
具体的,在一个实施例中,所采集到的包含标记区域的图像为二维图像,则如图2所示,步骤S30的具体过程包括:
步骤S302,提取图像中与预设颜色模型匹配的像素,对获取的像素进行连通域检测,提取检测得到的连通域中的标记区域。
具体的,可通过摄像机采集包含标记区域的图像,得到的图像为二维可见光图像。优选的,还可在摄像机的镜头前加入红外滤光片,用于滤去除红外波段的其他波段光线,则采集的图像为二维红外图像。由于可见光图像中,场景中的物体会对标记区域的识别形成干扰,而红外图像因滤除掉了可见光信息,干扰较少,因此二维红外图像更有利于提取标记区域。
本实施例中,可预先建立颜色模型。例如标记区域的色彩为红色,则可预先建立红色模型,该模型中像素的RGB值分量可在200到255之间,G、B分量可接近于零;获取采集的图像中满足该红色模型的RGB值的像素即为红色像素。另外,当采集的图像中由人体部位形成标记区域时,则可获取采集的图像中与预设肤色模型匹配的像素。对获取的像素进行连通域检测,得到多个连通域,连通域是若干个连续的像素组成的集合。
本实施例中,由于标记区域的大小和形状应大致是固定不变的,在对获取的像素进行连通域检测时,可计算得到获取的像素中的所有连通域的周长和/或面积。具体的,连通域的周长可为连通域边界像素的个数,连通域的面积可为连通域中的全部像素的个数。进一步的,可将获取的连通域的周长和/或面积与预设标记区域的周长和/或面积进行对比,获取满足预设标记区域的周长和/或面积的连通域即为标记区域。优选的,还可将周长的平方与面积的比值作为判断准则,连通域的该比值满足预设标记区域的该比值,则该连通域为标记区域。
步骤S304,获取标记区域中的像素坐标,根据像素坐标产生标记区域姿态。
具体的,在一个实施例中,如图3所示,交互设备包括手持部分和附着于手持部分的标记,其中,标记可为长条形状的反光材料,优选的,可以为椭圆或矩形形状。在其他实施例中,交互设备还可为人体部位,如脸、手掌、手臂等,则采集到的图像中的标记区域即为人体部位的区域。
本实施例中,标记区域为一个连续区域,则根据像素坐标产生标记区域的姿态的过程为:计算得到像素坐标的协方差矩阵,获取协方差矩阵最大特征值对应的特征向量,根据特征向量产生标记区域的姿态,该标记区域的姿态为一个姿态角。
具体的,如图4所示,构建二维图像坐标系,对于该坐标系上的两个点A(u1,v1)和B(u2,v2),当u1≠u2时,其形成的姿态角则为直线AB斜率的反正切,即arctan((v2-v1)/(u2-u1)),当u1=u2时,点A、B形成的姿态角为90度或-90度。具体的,本实施例中,计算提取的标记区域中的像素坐标的协方差矩阵,获取协方差矩阵最大特征值对应的特征向量,该特征向量的方向即为标记区域长轴所在直线的方向。如图4所示,标记区域长轴所在直线方向为A、B两点所在直线的方向,设特征向量为[dir_u,dir_v]T,其中,dir_u描述标记区域长轴的方向在u轴上的投影,其绝对值正比于从A指向B的向量在u坐标轴方向上的投影(即u2-u1);dir_v描述标记区域长轴的方向在v轴上的投影,其绝对值正比于从A指向B的向量在v坐标轴方向上的投影(即v2-v1)。若dir_u或dir_v小于0,则修正为[-dir_u,-dir_v]T,则当dir_u不等于0时,标记区域的姿态角为:arctan(dir_v/dir_u)。当dir_u=0时,标记区域的姿态角为90度或-90度。
在另一个实施例中,标记区域包括第一连续区域和第二连续区域,则根据像素坐标产生标记区域的姿态的具体过程包括:计算第一连续区域的重心和第二连续区域的重心,根据第一连续区域的重心的像素坐标和第二连续区域的重心的像素坐标产生标记区域的姿态。具体的,在一个实施例中,交互设备包括手持部分和附着在手持部分的两个标记。如图5所示,标记为两个,分别附着在手持部分前端,标记的形状可以为椭圆形或矩形。优选的,标记可以为位于手持部位前端的两个圆点。如图6所示,可将标记设置在手持部分的两端。在其他实施例中,还可将标记设置在人体部位上,例如设置在人脸、手掌或手臂上。应当说明的是,所设置的两个标记可以大小、形状、颜色等特征上不一致。
本实施例中,提取的标记区域包括两个连续区域,分别为第一连续区域和第二连续区域。进一步的,根据像素坐标计算这两个连续区域的重心。具体的,计算连续区域中的全部像素坐标的平均值,所得到的像素坐标即为连续区域的重心。如图4所示,计算得到的两个连续区域的重心分别为A(u1,v1)和B(u2,v2),当u1≠u2时,则标记区域的姿态角为斜率的反正切,即arctan((v2-v1)/(u2-u1)),若u1=u2,标记区域的姿态角为90度或-90度。
在另一个实施例中,所采集的图像可以为三维图像。具体的,可利用传统的立体视觉系统(由两台空间位置已知的摄像机及相关数据处理设备组成)、结构光系统(右一台摄像机、一台光源以及相关数据处理设备组成)或TOF(timeof flight,飞行时间)深度相机采集三维图像(即三维深度图像)。
本实施例中,如图7所示,步骤S30的具体过程包括:
步骤S310,对图像进行分割,提取图像中的连通域,计算连通域的属性值,将连通域的属性值与预设的标记区域属性值进行对比,符合预设的标记区域属性值的连通域即为标记区域。
具体的,当三维深度图像中两个相邻的像素深度相差小于预先设定的阈值时,例如5厘米,则认为两个像素连通,对整个图像进行连通域检测,可得到包含标记连通域的一系列连通域。
本实施例中,连通域的属性值包括连通域的尺寸和形状。具体的,计算连通域的尺寸/形状,与交互设备上的标记的尺寸/形状进行对比,得到符合标记的尺寸/形状的连通域即为标记区域的连通域(标记区域)。以矩形标记为例,即交互设备上的标记在采集的图像中为矩形,预先设定好标记的长度和宽度,计算连通域对应的物理区域的长度和宽度,该长度和宽度与标记的长度和宽度越接近,则连通域与标记区域越相似。
进一步的,计算连通域对应的物理区域的长度和宽度的过程如下:计算连通域像素的三维坐标的协方差矩阵,采用如下公式计算连通域对应的物理区域的长度和宽度:
Figure BDA0000135695750000081
其中,k为预先设定的系数,例如设为4,当λ为协方差矩阵最大特征值时,则l为连通域的长度,当λ为协方差矩阵第二大的特征值时,则l为连通域的宽度。
进一步的,还可预先设定矩形标记的长宽比,例如长宽比为2,则连通域对应的物理区域的长宽比越接近于预设设定的矩形标记的长宽比,则连通域与标记区域越相似,具体的,采用如下公式计算连通域对应的物理区域的长宽比:
Figure BDA0000135695750000082
其中,r为连通域的长宽比,λ0为协方差矩阵的最大特征值,λ1为协方差矩阵的第二大特征值。
步骤S320,获取标记区域中的像素坐标,根据该像素坐标产生标记区域的姿态。
具体的,本实施例中,标记区域的姿态为姿态向量。如图8所示,构建三维图像坐标系,该坐标系为右手坐标系。在该坐标系中,设空间向量OP,P在平面XOY的投影为p,则用极坐标表示向量OP的姿态向量为[α,θ]T,α为角XOp,即X轴到Op角,取值范围为0到360度,θ为角pOP,即OP与XOY平面的夹角,取值范围为-90度到90度。设该坐标系中的空间射线上的两点为A(x1,y1,z1)和B(x2,y2,z2),当 ( x 2 - x 1 ) 2 + ( y 2 - y 1 ) 2 ≠ 0 时,则这两点的姿态向量[α,θ]T可用如下公式唯一确定:
cos ( α ) = x 2 - x 1 ( x 2 - x 1 ) 2 + ( y 2 - y 1 ) 2
sin ( α ) = y 2 - y 1 ( x 2 - x 1 ) 2 + ( y 2 - y 1 ) 2 - - - ( 1 )
θ = arctan ( z 2 - z 1 ( x 2 - x 1 ) 2 + ( y 2 - y 1 ) 2 ) - - - ( 2 )
( x 2 - x 1 ) 2 + ( y 2 - y 1 ) 2 = 0 时,可设置θ=90°或-90°,α=0°。
本实施例中,提取标记区域后,计算得到标记区域中的像素坐标的协方差矩阵,获取协方差矩阵最大特征值对应的特征向量,并将该特征向量转换为姿态向量。具体的,设得到的姿态向量为[dirx,diry,dirz]T,其中,dirx表示两点在x轴方向上的距离,diry表示两点在y轴方向上的距离,dirz表示两点在z轴方向上的距离。可认为该姿态向量描述的射线上有两个点,即(0,0,0)和
Figure BDA0000135695750000096
即射线从原点触发,指向(dirx,diry,dirz),则姿态角需满足上述公式(1)和(2),令上述公式(1)和(2)中的x1=0,y1=0,z1=0,x2=dirx,y2=diry,z2=dirz,即可得到姿态向量[α,θ]T
在一个实施例中,标记区域为一个连续区域,则根据像素坐标产生标记区域的姿态的过程为:计算得到像素坐标的协方差矩阵,获取协方差矩阵最大特征值对应的特征向量,根据特征向量产生标记区域的姿态。如上所述,该标记区域的姿态为一个姿态向量。
在另一个实施例中,标记区域包括第一连续区域和第二连续区域,则根据像素坐标产生标记区域的姿态的具体过程为:根据像素坐标计算第一连续区域的重心和第二连续区域的重心,根据第一连续区域的重心的像素坐标和第二连续区域的重心的像素坐标计算标记区域的姿态。如图8所示,本实施例中,标记区域中的像素坐标为三维坐标,具体的,可根据计算得到的两个连续区域的重心的像素坐标产生标记区域的姿态,该姿态为一个姿态向量。
在一个实施例中,在识别标记区域的姿态的步骤之前还可包括:判断采集的图像为二维图像还是三维图像的步骤。具体的,若采集的图像为二维图像,则执行上述步骤S302至步骤S304,若采集的图像为三维图像,则执行上述步骤S310至S320。
如图9所示,在一个实施例中,上述步骤S40的具体过程包括:
步骤S402,获取当前帧图像中的标记区域的姿态。
如上所述,步骤S402中获取的姿态可以是当前帧的二维图像中的标记区域的姿态(即姿态角),也可以是当前帧的三维深图像中的标记区域的姿态(即姿态向量)。该姿态也可称为绝对姿态。
步骤S404,根据预设的姿态与播放指令之间的映射关系生成与姿态对应的播放指令。
如图10所示,在一个实施例中,步骤S404包括:
步骤S414,根据预设的姿态与播放指令类型之间的映射关系获取姿态对应的播放指令类型。
播放指令类型包括开始、暂停、前进、后退、上一个、下一个、调高音量、调低音量等类型。
具体的,可预先设定当姿态角在(a,b)范围内时,则对应前进播放指令类型,当姿态角在(c,d)范围内时,则对应后退播放指令类型,等等。其中,a、b、c、d都为预先设定的角度,满足a<b,c<d,且集合[a,b]和集合[c,d]的交集为空。
步骤S424,根据预设的姿态与播放调整幅度之间的映射关系获取姿态对应的播放调整幅度。
具体的,可预先设定播放调整幅度与姿态角的映射关系。以二维图像为例,设姿态角在(m,n)范围内时,对应某一播放指令类型,则可设定该种类型播放指令的播放调整幅度与姿态角的映射关系为:y=k*(x-m)/(n-m),其中,y为播放调整幅度,x为姿态角,k为上限。例如,设姿态角在30度到60度范围内时,对应的播放指令类型为调高音量,则可设定播放调整幅度(即音量调高等级)与姿态角的映射关系为:y=20*(x-30)/(60-30),其中,y播放调整幅度,x为姿态角,20为最大音量等级,当姿态角为45度时,可计算得到播放调整幅度为10,即音量调高10个等级。优选的,当计算得到的播放调整幅度(即音量调高等级)为小数时,可进一步的将播放调整幅度(即音量调高等级)取整。优选的,若当前的音量等级与音量调高等级的和大于最大音量等级时,可将音量调高等级设置为最大音量调高等级与当前音量等级的差。
另外,在三维图像中,所识别出的姿态包含两个姿态角,可以使用其中的一个姿态角来获取播放调整幅度,也可以使用两个姿态角来获取播放调整幅度。使用其中一个姿态角的方法原理与二维图像类似,在此则不再赘述。使用两个姿态角时,可设置播放调整幅度为两个姿态角的二元函数。
步骤S434,根据姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
例如,播放指令类型为前进,播放调整幅度为10(分钟),则生成“将播放进度前进10分钟”的指令,等等。
在一个实施例中,可直接根据姿态对应的播放指令类型生成相应的播放指令。例如,当播放指令类型为开始、暂停、上一个、下一个时,不需要获取播放调整幅度,即可生成相应的播放指令“开始播放多媒体”、“暂停播放多媒体”、“播放上一个多媒体”、“播放下一个多媒体”。
如图11所示,在另一个实施例中,采集的包含标记区域的图像为图像序列,上述步骤S40的具体过程包括:
步骤S410,获取当前帧图像中的标记区域的姿态与前预设帧图像中的标记区域的姿态之间的相对姿态。
本实施例中,可实时采集由多个包含标记区域的图像组成的图像序列。如上所述,步骤S410中获取的姿态可以是当前帧图像和前预设帧图像中的标记区域的姿态角,也可以是当前帧图像和前预设帧图像中的标记区域的姿态向量。当前帧图像中的姿态与前预设帧图像中的姿态之间的相对姿态为两者的差值。
步骤S420,根据预设的相对姿态与播放指令之间的映射关系生成与相对姿态对应的播放指令。
如图12所示,在一个实施例中,步骤S420包括:
步骤S421,根据预设的相对姿态与播放指令类型之间的映射关系获取相对姿态对应的播放指令类型令。
具体的,可预先设定当相对姿态角在(a,b)范围内时,则对应前进播放指令类型,当相对姿态角在(c,d)范围内时,则对应后退播放指令类型,等等。其中,a、b、c、d都为预先设定的角度,满足a<b,c<d,且集合[a,b]和集合[c,d]的交集为空。
步骤S422,根据预设的相对姿态与播放调整幅度之间的映射关系获取相对姿态对应的播放调整幅度。
具体的,可预先设定播放调整幅度与相对姿态角的映射关系。以二维图像为例,设相对姿态角在(m,n)范围内时,对应某一播放指令类型,则可设定该种类型播放指令的播放调整幅度与相对姿态角的映射关系为:y=k*(x-m)/(n-m),其中,y为播放调整幅度,x为相对姿态角,k为上限。例如,设相对姿态角在30度到60度范围内时,对应的播放指令类型为调高音量,则可设定播放调整幅度(即音量调高等级)与相对姿态角的映射关系为:y=20*(x-30)/(60-30),其中,y播放调整幅度,x为相对姿态角,20为最大音量等级。当相对姿态角为45度时,可计算得到播放调整幅度为10,即音量调高10个等级。优选的,当计算得到的播放调整幅度(即音量调高等级)为小数时,可进一步的将播放调整幅度取整。优选的,若当前的音量等级与音量调高等级的和大于最大音量等级时,可将音量调高等级设置为最大音量调高等级与当前音量等级的差。
另外,在三维图像中,所识别出的姿态包含两个相对姿态角,可以使用其中的一个相对姿态角来获取播放调整幅度,也可以使用两个相对姿态角来获取播放调整幅度。使用其中一个相对姿态角的方法原理与二维图像类似,在此则不再赘述。使用两个相对姿态角时,可设置播放调整幅度为两个相对姿态角的二元函数。
步骤S423,根据相对姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
例如,播放指令类型为前进,播放调整幅度为10(分钟),则生成“将播放进度前进10分钟”的指令,等等。
在一个实施例中,可直接根据相对姿态对应的播放指令类型即可生成相应的播放指令。例如,当播放指令类型为开始、暂停、上一个、下一个时,不需要获取播放调整幅度,即可生成相应的播放指令“开始播放多媒体”、“暂停播放多媒体”、“播放上一个多媒体”、“播放下一个多媒体”。
上述多媒体播放控制方法,通过产生一个姿态即可生成相应的播放指令类型和播放调整幅度来控制多媒体的播放,几乎可做到一步到位,而不需要用户操作多个操控部件(如按键等),选择播放指令类型再逐步设置播放状态以控制多媒体播放,从而提高了用户的操作便利性。
在一个实施例中,如图13所示,一种多媒体播放控制系统,包括交互设备10、姿态识别器和多媒体播放设备50,姿态识别器包括图像采集模块20、姿态识别模块30、指令生成模块40,其中:
交互设备10用于通过标记区域产生姿态。
本实施例中,标记区域是交互设备10的一个区域或设置在交互设备10上的标记,如反光材料等。
具体的,在一个实施例中,交互设备10可以是手持装置,可将手持装置的一部分或全部设定为指定的颜色或形状,则该指定颜色或形状的部分即形成标记区域。另外,可在手持装置上设置指定颜色或形状的标记(如反光材料),则该指定颜色或形状的标记即形成标记区域。
在另一个实施例中,交互设备10还可以是人体部位(例如人脸、手掌、手臂等),具有皮肤颜色的人体部位即形成标记区域。另外,可在人体部分上附带指定颜色或形状的标记(如反光材料),则该指定颜色或形状的标记即形成标记区域。
图像采集模块20用于采集包含标记区域的图像。
姿态识别模块30用于识别标记区域的姿态。
所谓姿态,是指标记区域在图像中所形成的姿势状态。进一步的,在二维图像中,姿态为二维图像中的标记区域与预设位置之间的角度,即姿态角;在三维图像中,姿态为三维图像中的标记区域与预设位置之间的多个姿态角所组成的矢量,即姿态向量。本发明中说的“标记区域产生的姿态”,“标记区域的姿态”都是指所述姿态,也就是不同实施例的姿态角与姿态向量。
指令生成模块40用于生成姿态对应的播放指令。
本实施例中,预先设定标记区域的姿态与播放指令之间的映射关系,并将该映射关系存储在数据库中(图中未示出)。在识别出标记区域的姿态后,指令生成模块40可用于根据姿态识别模块30识别出的姿态从数据库中查找与姿态对应的播放指令。
多媒体播放设备50用于根据播放指令控制多媒体的播放。
例如,多媒体播放设备50可用于根据播放指令控制多媒体播放开始、播放暂停、播放前进、播放后退、播放上一个、播放下一个、调低音量、调高音量等
上述多媒体播放控制系统,根据采集到的包含标记区域的图像识别出标记区域所产生的姿态,并生成姿态对应的播放指令,进一步的根据播放指令控制多媒体的播放。这种方式不需要用户操作多个操控部件,只需要挥动交互设备产生姿态即可,减少了操作步骤,操作起来更为简单和灵活,而且还可以将人体部位本身作为交互设备产生姿态,操作起来更为方便和人性化,因而这种方式加强了用户的体验,提高了用户的操作便利性。
在一个实施例中,姿态识别模块30可用于提取图像中的标记区域,进一步的获取标记区域中的像素坐标,并根据像素坐标产生标记区域姿态。
在一个实施例中,图像采集模块20采集到的图像为二维图像,如图14所示,姿态识别模块30包括第一图像处理模块302和第一姿态产生模块304,其中:
第一图像处理模块302用于提取图像中与预设颜色模型匹配的像素,对获取的像素进行连通域检测,提取检测得到的连通域中的标记区域。
具体的,图像采集模块20可为摄像机,其采集得到的图像可为二维可见光图像。优选的,还可在摄像机的镜头前加入红外滤光片,用于滤去除红外波段的其他波段光线,则图像采集模块20采集的图像为二维红外图像。由于可见光图像中,场景中的物体会对标记区域的识别形成干扰,而红外图像因滤除掉了可见光信息,干扰较少,因此二维红外图像更有利于提取标记区域。
具体的,第一图像处理模块302用于预先建立颜色模型。例如标记区域的色彩为红色,则预先建立红色模型,该模型中像素的RGB值分量可在200到255之间,G、B分量可接近于零;第一图像处理模块302则用于获取帧图像中满足该红色模型的RGB值的像素即为红色像素。另外,当采集的图像中由人体部位形成标记区域时,第一图像处理模块302则用于获取图像中与预设肤色模型匹配的像素。第一图像处理模块302还用于对获取的像素进行连通域检测,得到多个连通域,连通域是若干个连续的像素组成的集合。
本实施例中,由于标记区域的大小和形状应大致是固定不变的,第一图像处理模块302在对获取的像素进行连通域检测时,可计算得到获取的像素中的所有连通域的周长和/或面积。具体的,连通域的周长可为连通域边界像素的个数,连通域的面积可为连通域中的全部像素的个数。进一步的,第一图像处理模块302可用于将获取的连通域的周长和/或面积与预设标记区域的周长和/或面积进行对比,获取满足预设标记区域的周长和/或面积的连通域即为标记区域。优选的,第一图像处理模块302还可用于将周长的平方与面积的比值作为判断准则,连通域的该比值满足预设标记区域的该比值,则该连通域为标记区域。
第一姿态产生模块304用于获取标记区域中的像素坐标,根据像素坐标产生标记区域的姿态。
本实施例中,标记区域产生的姿态为姿态角。在一个实施例中,标记区域为一个连续区域,则第一姿态产生模块304用于计算得到像素坐标的协方差矩阵,获取协方差矩阵最大特征值对应的特征向量,根据特征向量产生标记区域的姿态,该标记区域的姿态为一个姿态角。
在另一个实施例中,标记区域包括第一连续区域和第二连续区域,则第一姿态产生模块304还用于计算第一连续区域的重心和第二连续区域的重心,根据第一连续区域的重心的像素坐标和第二连续区域的重心的像素坐标产生标记区域的姿态。具体的,计算连续区域中的全部像素坐标的平均值,所得到的像素坐标即为连续区域的重心。
在另一个实施例中,图像采集模块20采集到的图像为三维图像。具体的,图像采集模块20可采用传统的立体视觉系统(由两台控制位置已知的摄像机及相关软件组成)、结构光系统(右一台摄像机、一台光源以及相关软件组成)或TOF(time of flight,飞行时间)深度相机实现采集三维图像(即三维深度图像)。
本实施例中,如图15所示,姿态识别模块30包括第二图像处理模块310和第二姿态产生模块320,其中:
第二图像处理模块310用于对图像进行分割,提取图像中的连通域,并计算连通域的属性值,将连通域的属性值与预设的标记区域属性值进行对比,符合预设的标记区域属性值的连通域即为标记区域。
具体的,第二图像处理模块310用于当三维图像中两个相邻的像素深度相差小于预先设定的阈值时,例如5厘米,则认为两个像素连通,对整个图像进行连通域检测,可得到包含标记连通域的一系列连通域。
本实施例中,连通域的属性值包括连通域的尺寸和形状。具体的,第二图像处理模块310用于计算连通域的尺寸/形状,与输入上的标记的尺寸/形状进行对比,得到符合标记的尺寸/形状的连通域即为标记区域的连通域(标记区域)。以矩形标记为例,即交互设备上的标记在采集的图像中为矩形,预先设定好标记的长度和宽度,第二图像处理模块310则用于计算连通域对应的物理区域的长度和宽度,该长度和宽度与标记的长度和宽度越接近,则连通域与标记区域越相似。
进一步的,第二图像处理模块310用于计算连通域对应的物理区域的长度和宽度的过程如下:计算连通域像素的三维坐标的协方差矩阵,采用如下公式计算连通域对应的物理区域的长度和宽度:
Figure BDA0000135695750000161
其中,k为预先设定的系数,例如设为4,当λ为协方差矩阵最大特征值时,则l为连通域的长度,当λ为协方差矩阵第二大的特征值时,则l为连通域的宽度。
进一步的,第二图像处理模块310还可用于预先设定矩形标记的长宽比,例如长宽比为2,则连通域对应的物理区域的长宽比越接近于预设设定的矩形标记的长宽比,则连通域与标记区域越相似,具体的,第二图像处理模块310用于采用如下公式计算连通域对应的物理区域的长宽比:
Figure BDA0000135695750000162
其中,r为连通域的长宽比,λ0为协方差矩阵的最大特征值,λ1为协方差矩阵的第二大特征值。
第二姿态产生模块320,用于获取标记区域中的像素坐标,根据像素坐标产生标记区域的姿态。
本实施例中,标记区域的姿态为姿态向量。在一个实施例中,标记区域为一个连续区域,则第二姿态产生模块320用于计算得到像素坐标的协方差矩阵,获取协方差矩阵最大特征值对应的特征向量,根据特征向量产生标记区域的姿态。如上所述,该标记区域的姿态为一个姿态向量。
在另一个实施例中,标记区域包括第一连续区域和第二连续区域,则第二姿态产生模块320用于计算第一连续区域的重心和第二连续区域的重心,根据第一连续区域的重心的像素坐标和第二连续区域的重心的像素坐标产生标记区域的姿态。本实施例中,标记区域中的像素坐标为三维坐标,具体的,可根据计算得到的两个连续区域的重心的像素坐标产生标记区域的姿态,该姿态为一个姿态向量。
在一个实施例中,姿态识别模块30还包括判断模块(图中未示出),用于判断采集的图像为二维图像还是三维图像。具体的,本实施例中,当判断模块判断到采集的图像为二维图像时,通知第一图像处理模块302提取二维图像中的标记区域,进而通过第一姿态产生模块304产生该标记区域的姿态。当判断模块判断到采集的图像为二维图像时,通知第二图像处理模块310提取三维图像中的标记区域,进而通过第二姿态产生模块320产生该标记区域的姿态。可以理解的,本实施例中,姿态识别模块30同时包括判断模块(图中未示出)、第一图像处理模块302、第一姿态产生模块304、第二图像处理模块310和第二姿态产生模块320。本实施例既可通过二维图像识别标记区域的姿态,又可通过二维图像识别标记区域的姿态。
如图16所示,在一个实施例中,指令生成模块40包括第一姿态获取模块402和第一指令查找模块404,其中:
第一姿态获取模块402,用于从姿态识别模块30中获取当前帧图像中的标记区域的姿态。
具体的,该姿态可以是当前帧的二维图像中的标记区域的姿态角,也可以是当前帧的三维深度图像中的标记区域的姿态向量。该姿态也可称为绝对姿态。
第一指令查找模块404,用于根据预设的姿态与播放指令之间的映射关系生成与姿态对应的播放指令。
如图17所示,本实施例中,第一指令查找模块404包括第一指令类型获取单元414、第一调整幅度获取单元424、第一指令生成单元434,其中:
第一指令类型获取单元414用于根据预设的姿态与播放指令类型之间的映射关系获取姿态对应的播放指令类型。
播放指令类型包括开始、暂停、前进、后退、上一个、下一个、调高音量、调低音量等类型。
具体的,可预先设定当姿态角在(a,b)范围内时,则对应前进播放指令类型,当姿态角在(c,d)范围内时,则对应后退播放指令类型,等等。其中,a、b、c、d都为预先设定的角度,满足a<b,c<d,且集合[a,b]和集合[c,d]的交集为空。
第一调整幅度获取单元424用于根据预设的姿态与播放调整幅度之间的映射关系获取姿态对应的播放调整幅度。
具体的,可预先设定播放调整幅度与姿态角的映射关系。以二维图像为例,设姿态角在(m,n)范围内时,对应某一播放指令类型,则可设定该种类型播放指令的播放调整幅度与姿态角的映射关系为:y=k*(x-m)/(n-m),其中,y为播放调整幅度,x为姿态角,k为上限。例如,设姿态角在30度到60度范围内时,对应的播放指令类型为调高音量,则可设定播放调整幅度(即音量调高等级)与姿态角的映射关系为:y=20*(x-30)/(60-30),其中,y播放调整幅度,x为姿态角,20为最大音量等级,当姿态角为45度时,第一调整幅度获取单元424可计算得到播放调整幅度为10,即音量调高10个等级。优选的,当计算得到的播放调整幅度(即音量调高等级)为小数时,第一调整幅度获取单元424可进一步的将播放调整幅度(即音量调高等级)取整。优选的,若当前的音量等级与音量调高等级的和大于最大音量等级时,第一调整幅度获取单元424可将音量调高等级设置为最大音量调高等级与当前音量等级的差。另外,在三维图像中,所识别出的姿态包含两个姿态角,可以使用其中的一个姿态角来获取播放调整幅度,也可以使用两个姿态角来获取播放调整幅度。使用其中一个姿态角的方法原理与二维图像类似,在此则不再赘述。使用两个姿态角时,可设置播放调整幅度为两个姿态角的二元函数。
第一指令生成单元434用于根据姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
例如,播放指令类型为前进,播放调整幅度为10(分钟),则第一指令生成单元434可生成“将播放进度前进10分钟”的指令,等等。
在一个实施例中,第一指令生成单元434可直接根据姿态对应的播放指令类型生成相应的播放指令。例如,当播放指令类型为开始、暂停、上一个、下一个时,不需要获取播放调整幅度,第一指令生成单元434即可生成相应的播放指令“开始播放多媒体”、“暂停播放多媒体”、“播放上一个多媒体”、“播放下一个多媒体”。
在另一个实施例中,图像采集模块20所采集的包含标记区域的图像是图像序列,如图18所示,指令生成模块40包括第二姿态获取模块410和第二指令查找模块420,其中:
第二姿态获取模块410,用于从姿态识别模块30中获取当前帧图像中的标记区域的姿态与前预设帧图像中的标记区域的姿态之间的相对姿态。
第二指令查找模块420用于根据预设的相对姿态与播放指令之间的映射关系生成与相对姿态对应的播放指令。
如图19所示,本实施例中,第二指令查找模块420包括第二指令类型获取单元421、第二调整幅度获取单元422、第二指令生成单元423,其中:
第二指令类型获取单元421用于根据预设的相对姿态与播放指令类型之间的映射关系获取相对姿态对应的播放指令类型。
第二调整幅度获取单元422用于根据预设的相对姿态与播放调整幅度之间的映射关系获取相对姿态对应的播放调整幅度。
第二指令生成单元423用于根据相对姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
上述多媒体播放控制系统,通过产生一个姿态即可生成相应的播放指令类型和播放调整幅度来控制多媒体的播放,几乎可做到一步到位,而不需要用户操作多个操控部件(如按键等),选择播放指令类型再逐步设置播放状态以控制多媒体播放,从而提高了用户的操作便利性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种多媒体播放控制方法,包括以下步骤:
通过包含标记区域的交互设备产生姿态;
采集包含所述标记区域的图像;
识别所述标记区域的姿态;
生成所述姿态对应的播放指令;
根据所述播放指令控制多媒体的播放。
2.根据权利要求1所述的多媒体播放控制方法,其特征在于,所述生成所述姿态对应的播放指令的步骤包括:
获取当前帧图像中的所述标记区域的姿态;
根据预设的姿态与播放指令之间的映射关系生成与所述姿态对应的播放指令。
3.根据权利要求2所述的多媒体播放控制方法,其特征在于,所述根据预设的姿态与播放指令之间的映射关系生成与所述姿态对应的播放指令的步骤包括:
根据预设的姿态与播放指令类型之间的映射关系获取所述姿态对应的播放指令类型;
根据预设的姿态与播放调整幅度之间的映射关系获取所述姿态对应的播放调整幅度;
根据所述姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
4.根据权利要求1所述的多媒体播放控制方法,其特征在于,所述采集的包含标记区域的图像为图像序列;
所述生成所述姿态对应的播放指令的步骤包括:
获取当前帧图像中的所述标记区域的姿态与前预设帧图像中的所述标记区域的姿态之间的相对姿态;
根据预设的相对姿态与播放指令之间的映射关系生成与所述相对姿态对应的播放指令。
5.根据权利要求4所述的多媒体播放控制方法,其特征在于,所述根据预设的相对姿态与播放指令之间的映射关系生成与所述相对姿态对应的播放指令的步骤包括:
根据预设的相对姿态与播放指令类型之间的映射关系获取所述相对姿态对应的播放指令类型;
根据预设的相对姿态与播放调整幅度之间的映射关系获取所述相对姿态对应的播放调整幅度;
根据所述相对姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
6.一种多媒体播放控制系统,其特征在于,包括交互设备、姿态识别器、多媒体播放设备,所述姿态识别器包括图像采集模块、姿态识别模块、指令生成模块,其中:
交互设备用于通过标记区域产生姿态;
图像采集模块用于采集所述包含标记区域的图像;
姿态识别模块用于识别标记区域的姿态;
指令生成模块用于生成所述姿态对应的播放指令;
多媒体播放设备用于根据所述播放指令控制多媒体的播放。
7.根据权利要求6所述的多媒体播放控制系统,其特征在于,所述指令生成模块包括:
第一姿态获取模块,用于获取当前帧图像中的所述标记区域的姿态;
第一指令查找模块,用于根据预设的姿态与播放指令之间的映射关系生成与所述姿态对应的播放指令。
8.根据权利要求7所述的多媒体播放控制系统,其特征在于,所述第一指令查找模块包括:
第一指令类型获取单元,用于根据预设的姿态与播放指令类型之间的映射关系获取所述姿态对应的播放指令类型;
第一调整幅度获取单元,用于根据预设的姿态与播放调整幅度之间的映射关系获取所述姿态对应的播放调整幅度;
第一指令生成单元用于根据所述姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
9.根据权利要求6所述的多媒体播放控制系统,其特征在于,所述采集的包含标记区域的图像为图像序列;
所述指令生成模块包括:
第二姿态获取模块,用于获取当前帧图像中的所述标记区域的姿态与前预设帧图像中的所述标记区域的姿态之间的相对姿态;
第二指令查找模块,用于根据预设的相对姿态与播放指令之间的映射关系生成与所述相对姿态对应的播放指令。
10.根据权利要求9所述的多媒体播放控制系统,其特征在于,所述第二指令查找模块包括:
第二指令类型获取单元,用于根据预设的相对姿态与播放指令类型之间的映射关系获取所述相对姿态对应的播放指令类型;
第二调整幅度获取单元,用于根据预设的相对姿态与播放调整幅度之间的映射关系获取所述相对姿态对应的播放调整幅度;
第二指令生成单元,用于根据所述相对姿态对应的播放指令类型和播放调整幅度生成相应的播放指令。
CN201210032934.4A 2011-12-02 2012-02-14 多媒体播放控制方法和系统 Active CN103135759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210032934.4A CN103135759B (zh) 2011-12-02 2012-02-14 多媒体播放控制方法和系统

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2011103962353 2011-12-02
CN201110396235.3 2011-12-02
CN201110396235 2011-12-02
CN201210032934.4A CN103135759B (zh) 2011-12-02 2012-02-14 多媒体播放控制方法和系统

Publications (2)

Publication Number Publication Date
CN103135759A true CN103135759A (zh) 2013-06-05
CN103135759B CN103135759B (zh) 2016-03-09

Family

ID=48488552

Family Applications (12)

Application Number Title Priority Date Filing Date
CN201110453879.1A Active CN103135756B (zh) 2011-12-02 2011-12-29 生成控制指令的方法和系统
CN201110451741.8A Active CN103135755B (zh) 2011-12-02 2011-12-29 交互系统及方法
CN201110451724.4A Active CN103135754B (zh) 2011-12-02 2011-12-29 采用交互设备实现交互的方法
CN201210011308.7A Active CN103135881B (zh) 2011-12-02 2012-01-13 显示控制方法及系统
CN201210011346.2A Active CN103135882B (zh) 2011-12-02 2012-01-13 控制窗口图片显示的方法和系统
CN201210023419XA Pending CN103139508A (zh) 2011-12-02 2012-02-02 控制电视画面显示的方法和系统
CN201210024389.4A Active CN103127717B (zh) 2011-12-02 2012-02-03 控制操作游戏的方法及系统
CN201210024483.XA Active CN103135883B (zh) 2011-12-02 2012-02-03 控制窗口的方法及系统
CN201210025300.6A Active CN103135453B (zh) 2011-12-02 2012-02-06 家用电器控制方法及系统
CN201210031595.8A Active CN103136986B (zh) 2011-12-02 2012-02-13 手语识别方法及系统
CN201210032934.4A Active CN103135759B (zh) 2011-12-02 2012-02-14 多媒体播放控制方法和系统
CN201210032932.5A Active CN103135758B (zh) 2011-12-02 2012-02-14 实现快捷功能的方法及系统

Family Applications Before (10)

Application Number Title Priority Date Filing Date
CN201110453879.1A Active CN103135756B (zh) 2011-12-02 2011-12-29 生成控制指令的方法和系统
CN201110451741.8A Active CN103135755B (zh) 2011-12-02 2011-12-29 交互系统及方法
CN201110451724.4A Active CN103135754B (zh) 2011-12-02 2011-12-29 采用交互设备实现交互的方法
CN201210011308.7A Active CN103135881B (zh) 2011-12-02 2012-01-13 显示控制方法及系统
CN201210011346.2A Active CN103135882B (zh) 2011-12-02 2012-01-13 控制窗口图片显示的方法和系统
CN201210023419XA Pending CN103139508A (zh) 2011-12-02 2012-02-02 控制电视画面显示的方法和系统
CN201210024389.4A Active CN103127717B (zh) 2011-12-02 2012-02-03 控制操作游戏的方法及系统
CN201210024483.XA Active CN103135883B (zh) 2011-12-02 2012-02-03 控制窗口的方法及系统
CN201210025300.6A Active CN103135453B (zh) 2011-12-02 2012-02-06 家用电器控制方法及系统
CN201210031595.8A Active CN103136986B (zh) 2011-12-02 2012-02-13 手语识别方法及系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201210032932.5A Active CN103135758B (zh) 2011-12-02 2012-02-14 实现快捷功能的方法及系统

Country Status (1)

Country Link
CN (12) CN103135756B (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104349197B (zh) * 2013-08-09 2019-07-26 联想(北京)有限公司 一种数据处理方法及装置
JP5411385B1 (ja) * 2013-08-12 2014-02-12 株式会社 ディー・エヌ・エー ゲームを提供するサーバ及び方法
CN104801042A (zh) * 2014-01-23 2015-07-29 鈊象电子股份有限公司 根据玩家挥手范围切换游戏画面的方法
CN103810922B (zh) * 2014-01-29 2016-03-23 上海天昊信息技术有限公司 手语翻译系统
CN103902045A (zh) * 2014-04-09 2014-07-02 深圳市中兴移动通信有限公司 通过非接触式姿势操作壁纸的方法及装置
CN105094785A (zh) * 2014-05-20 2015-11-25 腾讯科技(深圳)有限公司 一种配色文件生成方法及装置
CN104391573B (zh) * 2014-11-10 2017-05-03 北京华如科技股份有限公司 一种基于单姿态传感器识别投掷动作的方法及装置
CN104460988B (zh) * 2014-11-11 2017-12-22 陈琦 一种智能手机虚拟现实设备的输入控制方法
KR101608172B1 (ko) 2014-12-22 2016-03-31 주식회사 넥슨코리아 객체를 제어하는 방법 및 장치
CN106139590B (zh) * 2015-04-15 2019-12-03 乐线韩国股份有限公司 控制对象的方法和装置
US10543427B2 (en) * 2015-04-29 2020-01-28 Microsoft Technology Licensing, Llc Game controller function remapping via external accessory
CN105204354A (zh) * 2015-09-09 2015-12-30 北京百度网讯科技有限公司 智能家居设备的控制方法及装置
CN108027654B (zh) * 2015-09-28 2021-01-12 日本电气株式会社 输入设备、输入方法和程序
CN105892638A (zh) * 2015-12-01 2016-08-24 乐视致新电子科技(天津)有限公司 一种虚拟现实交互方法、装置和系统
CN106896732B (zh) * 2015-12-18 2020-02-04 美的集团股份有限公司 家用电器的展示方法和装置
CN105592367A (zh) * 2015-12-23 2016-05-18 青岛海信电器股份有限公司 一种图像显示参数调节方法和系统
JP6370820B2 (ja) * 2016-02-05 2018-08-08 株式会社バンダイナムコエンターテインメント 画像生成システム、ゲーム装置及びプログラム。
CN105760106B (zh) * 2016-03-08 2019-01-15 网易(杭州)网络有限公司 一种智能家居设备交互方法和装置
CN105930050B (zh) * 2016-04-13 2018-01-26 腾讯科技(深圳)有限公司 行为确定方法及装置
CN106682593A (zh) * 2016-12-12 2017-05-17 山东师范大学 一种基于手势识别的手语会议方法及系统
WO2018120657A1 (zh) * 2016-12-27 2018-07-05 华为技术有限公司 一种共享虚拟现实数据的方法和设备
CN108668042B (zh) * 2017-03-30 2021-01-15 富士施乐实业发展(中国)有限公司 一种复合机系统
CN109558000B (zh) * 2017-09-26 2021-01-22 京东方科技集团股份有限公司 一种人机交互方法及电子设备
CN107831996B (zh) * 2017-10-11 2021-02-19 Oppo广东移动通信有限公司 人脸识别启动方法及相关产品
CN107861682A (zh) * 2017-11-03 2018-03-30 网易(杭州)网络有限公司 虚拟对象的移动控制方法和装置
CN108228251B (zh) * 2017-11-23 2021-08-27 腾讯科技(上海)有限公司 游戏应用中控制目标对象的方法和装置
CN108036479A (zh) * 2017-12-01 2018-05-15 广东美的制冷设备有限公司 空调器的控制方法、系统、视觉控制器和存储介质
CN110007748B (zh) * 2018-01-05 2021-02-19 Oppo广东移动通信有限公司 终端的控制方法、处理装置、存储介质及终端
WO2019153971A1 (zh) * 2018-02-06 2019-08-15 广东虚拟现实科技有限公司 视觉交互装置及标记物
CN108765299B (zh) * 2018-04-26 2022-08-16 广州视源电子科技股份有限公司 立体图形标记系统及方法
CN108693781A (zh) * 2018-07-31 2018-10-23 湖南机电职业技术学院 智能家居控制系统
JP7262976B2 (ja) * 2018-11-02 2023-04-24 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
TWI681755B (zh) * 2018-12-24 2020-01-11 山衛科技股份有限公司 脊椎側彎量測系統與方法
CN109711349B (zh) * 2018-12-28 2022-06-28 百度在线网络技术(北京)有限公司 用于生成控制指令的方法和装置
CN109816650B (zh) * 2019-01-24 2022-11-25 强联智创(北京)科技有限公司 一种基于二维dsa图像的目标区域识别方法及其系统
CN111665727A (zh) * 2019-03-06 2020-09-15 北京京东尚科信息技术有限公司 用于控制家居设备的方法、装置和家居设备控制系统
CN111803930A (zh) * 2020-07-20 2020-10-23 网易(杭州)网络有限公司 多平台交互方法、装置以及电子设备
CN115623254A (zh) * 2021-07-15 2023-01-17 北京字跳网络技术有限公司 视频效果的添加方法、装置、设备及存储介质
CN113326849B (zh) * 2021-07-20 2022-01-11 广东魅视科技股份有限公司 一种可视化数据采集方法及系统
CN113499585A (zh) * 2021-08-09 2021-10-15 网易(杭州)网络有限公司 游戏中交互方法、装置、电子设备和存储介质
CN113822186A (zh) * 2021-09-10 2021-12-21 阿里巴巴达摩院(杭州)科技有限公司 手语翻译、客服、通信方法、设备和可读介质
CN113822187A (zh) * 2021-09-10 2021-12-21 阿里巴巴达摩院(杭州)科技有限公司 手语翻译、客服、通信方法、设备和可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101483005A (zh) * 2008-01-07 2009-07-15 致伸科技股份有限公司 多媒体文件播放遥控装置
CN101504728A (zh) * 2008-10-10 2009-08-12 深圳先进技术研究院 一种电子设备的遥控系统及其遥控方法
WO2009157633A1 (en) * 2008-06-24 2009-12-30 Electronics And Telecommunications Research Institute Registration method of reference gesture data, driving method of mobile terminal, and mobile terminal thereof
CN101729808A (zh) * 2008-10-14 2010-06-09 Tcl集团股份有限公司 一种电视遥控方法及用该方法遥控操作电视机的系统

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594469A (en) * 1995-02-21 1997-01-14 Mitsubishi Electric Information Technology Center America Inc. Hand gesture machine control system
JPH0918708A (ja) * 1995-06-30 1997-01-17 Omron Corp 画像処理方法およびその方法を用いた画像入力装置,制御装置,画像出力装置,ならびに画像処理システム
KR19990011180A (ko) * 1997-07-22 1999-02-18 구자홍 화상인식을 이용한 메뉴 선택 방법
US9292111B2 (en) * 1998-01-26 2016-03-22 Apple Inc. Gesturing with a multipoint sensing device
US10279254B2 (en) * 2005-10-26 2019-05-07 Sony Interactive Entertainment Inc. Controller having visually trackable object for interfacing with a gaming system
US20070124694A1 (en) * 2003-09-30 2007-05-31 Koninklijke Philips Electronics N.V. Gesture to define location, size, and/or content of content window on a display
JP4708422B2 (ja) * 2004-04-15 2011-06-22 ジェスチャー テック,インコーポレイテッド 両手動作の追跡
JP2006068315A (ja) * 2004-09-02 2006-03-16 Sega Corp ポーズ検出プログラム、ビデオゲーム装置、ポーズ検出方法、および、プログラムを記録したコンピュータ読み取り可能な記録媒体
CN100345085C (zh) * 2004-12-30 2007-10-24 中国科学院自动化研究所 基于玩家姿势和语音的电子游戏场景和角色控制方法
JP2009514106A (ja) * 2005-10-26 2009-04-02 株式会社ソニー・コンピュータエンタテインメント コンピュータプログラムとインタフェースするためのシステムおよび方法
KR100783552B1 (ko) * 2006-10-11 2007-12-07 삼성전자주식회사 휴대 단말기의 입력 제어 방법 및 장치
US8726194B2 (en) * 2007-07-27 2014-05-13 Qualcomm Incorporated Item selection using enhanced control
CN101388138B (zh) * 2007-09-12 2011-06-29 原相科技股份有限公司 互动图像系统、互动装置及其运作方法
CN101398896B (zh) * 2007-09-28 2012-10-17 三星电子株式会社 用于成像设备的提取有强识别力的颜色特征的设备和方法
JP4938617B2 (ja) * 2007-10-18 2012-05-23 幸輝郎 村井 オブジェクト操作装置、及び、デジタル画像フレームデータからマーカを特定する方法
JP5174492B2 (ja) * 2008-03-05 2013-04-03 公立大学法人首都大学東京 画像認識装置、画像認識方法、画像認識プログラム、ジェスチャ動作認識システム、ジェスチャ動作認識方法、及びジェスチャ動作認識プログラム
CN101551700B (zh) * 2008-03-31 2012-03-28 联想(北京)有限公司 电子游戏输入装置、电子游戏设备及电子游戏输入方法
KR101550478B1 (ko) * 2008-04-02 2015-09-04 오블롱 인더스트리즈, 인크 확장된 피사계심도에 걸쳐 추출된 3차원 정보를 이용하는 제스처 기반 제어 시스템 및 방법
CN101465116B (zh) * 2009-01-07 2013-12-11 北京中星微电子有限公司 一种显示设备控制方法及一种显示设备
CN101504586A (zh) * 2009-03-25 2009-08-12 中国科学院软件研究所 一种基于笔尾手势的指令方法
CN101527092A (zh) * 2009-04-08 2009-09-09 西安理工大学 特定会话场景下的计算机辅助手语交流方法
CN101539994B (zh) * 2009-04-16 2012-07-04 西安交通大学 一种手语语音互译系统及手语语音互译方法
CN101763515B (zh) * 2009-09-23 2012-03-21 中国科学院自动化研究所 一种基于计算机视觉的实时手势交互方法
CN101673094A (zh) * 2009-09-23 2010-03-17 曾昭兴 一种家电控制装置和控制方法
US20110151974A1 (en) * 2009-12-18 2011-06-23 Microsoft Corporation Gesture style recognition and reward
CN101799717A (zh) * 2010-03-05 2010-08-11 天津大学 基于手部行为捕捉的人机交互方法
CN101833653A (zh) * 2010-04-02 2010-09-15 上海交通大学 低分辨率视频中的人物识别方法
US20110289455A1 (en) * 2010-05-18 2011-11-24 Microsoft Corporation Gestures And Gesture Recognition For Manipulating A User-Interface
CN201750431U (zh) * 2010-07-02 2011-02-16 厦门万安智能股份有限公司 智能家居集控装置
CN102179048A (zh) * 2011-02-28 2011-09-14 武汉市高德电气有限公司 基于动作分解和行为分析实现实景游戏的方法
CN102226880A (zh) * 2011-06-03 2011-10-26 北京新岸线网络技术有限公司 一种基于虚拟现实的体感操作方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101483005A (zh) * 2008-01-07 2009-07-15 致伸科技股份有限公司 多媒体文件播放遥控装置
WO2009157633A1 (en) * 2008-06-24 2009-12-30 Electronics And Telecommunications Research Institute Registration method of reference gesture data, driving method of mobile terminal, and mobile terminal thereof
CN101504728A (zh) * 2008-10-10 2009-08-12 深圳先进技术研究院 一种电子设备的遥控系统及其遥控方法
CN101729808A (zh) * 2008-10-14 2010-06-09 Tcl集团股份有限公司 一种电视遥控方法及用该方法遥控操作电视机的系统

Also Published As

Publication number Publication date
CN103135883A (zh) 2013-06-05
CN103135754B (zh) 2016-05-11
CN103135881A (zh) 2013-06-05
CN103135758B (zh) 2016-09-21
CN103135756A (zh) 2013-06-05
CN103127717A (zh) 2013-06-05
CN103135453A (zh) 2013-06-05
CN103135881B (zh) 2016-12-14
CN103135754A (zh) 2013-06-05
CN103135883B (zh) 2016-07-06
CN103135755B (zh) 2016-04-06
CN103127717B (zh) 2016-02-10
CN103135758A (zh) 2013-06-05
CN103136986B (zh) 2015-10-28
CN103135755A (zh) 2013-06-05
CN103135882B (zh) 2016-08-03
CN103135759B (zh) 2016-03-09
CN103139508A (zh) 2013-06-05
CN103135882A (zh) 2013-06-05
CN103136986A (zh) 2013-06-05
CN103135756B (zh) 2016-05-11
CN103135453B (zh) 2015-05-13

Similar Documents

Publication Publication Date Title
CN103135759B (zh) 多媒体播放控制方法和系统
CN102184021B (zh) 一种基于手写输入和指尖鼠标的电视人机交互方法
JP5896578B2 (ja) データ入力装置
US9129155B2 (en) Systems and methods for initializing motion tracking of human hands using template matching within bounded regions determined using a depth map
EP1292877B1 (en) Apparatus and method for indicating a target by image processing without three-dimensional modeling
KR101083408B1 (ko) 인터렉티브 모드를 지원하는 증강현실 구현 장치 및 방법
US20140211991A1 (en) Systems and methods for initializing motion tracking of human hands
CN103995595A (zh) 一种基于手势的游戏体感控制方法
CN101901350A (zh) 一种基于特征向量的静态手势识别方法
CN103207709A (zh) 一种多点触摸系统及方法
CN103500010A (zh) 一种视频人手指尖定位方法
CN102929547A (zh) 智能终端无接触交互方法
CN103000054B (zh) 智能厨房烹饪教学机及其控制方法
KR20110125524A (ko) 멀티모달 상호작용을 이용한 로봇의 물체 학습 시스템 및 방법
CN103995586B (zh) 基于虚拟触摸屏的非穿戴指势人机交互方法
CN106203236A (zh) 一种基于视觉的手势识别方法和系统
CN117111736A (zh) 一种基于手势识别的增强显示交互方法和头戴式显示设备
CN115953375A (zh) 多方法融合的手部穴位定位方法、系统及电子设备
US20120162074A1 (en) User interface apparatus and method using two-dimensional image sensor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 518000 Shenzhen, Nanshan District Province, science and technology, South Road, the building of the big square, building 02, room 4,

Patentee after: SHENZHEN TAISHAN SPORTS TECHNOLOGY CORP., LTD.

Address before: 518000 Shenzhen, Nanshan District Province, science and technology, South Road, the building of the big square, building 02, room 4,

Patentee before: Shenzhen Tol Technology Co., Ltd.

CP01 Change in the name or title of a patent holder

Address after: 518000 room 02, 4th floor, Fangda building, Keji South 12th Road, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Taishan Sports Technology Co.,Ltd.

Address before: 518000 room 02, 4th floor, Fangda building, Keji South 12th Road, Nanshan District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN TAISHAN SPORTS TECHNOLOGY Corp.,Ltd.

CP01 Change in the name or title of a patent holder