CN101697199A - 头面部动作检测方法及应用该方法操控计算机的助残系统 - Google Patents

头面部动作检测方法及应用该方法操控计算机的助残系统 Download PDF

Info

Publication number
CN101697199A
CN101697199A CN200910180642A CN200910180642A CN101697199A CN 101697199 A CN101697199 A CN 101697199A CN 200910180642 A CN200910180642 A CN 200910180642A CN 200910180642 A CN200910180642 A CN 200910180642A CN 101697199 A CN101697199 A CN 101697199A
Authority
CN
China
Prior art keywords
head
women
action
module
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910180642A
Other languages
English (en)
Other versions
CN101697199B (zh
Inventor
孟繁荣
宋友
龚存晨
黄宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING YOUTHWIN TECH Co Ltd
Original Assignee
BEIJING YOUTHWIN TECH Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING YOUTHWIN TECH Co Ltd filed Critical BEIJING YOUTHWIN TECH Co Ltd
Priority to CN2009101806423A priority Critical patent/CN101697199B/zh
Publication of CN101697199A publication Critical patent/CN101697199A/zh
Application granted granted Critical
Publication of CN101697199B publication Critical patent/CN101697199B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种头面部检测方法及应用该方法操控计算机的助残系统,所述方法通过采集正例图片,反例图片,并对正例图片和反例图片应用Adaboost算法进行训练得到存有头面部特征的分类器,本发明在Adaboost算法的基础上,采取多线程的方法,先对人的头面部动作进行检测,然后根据头部所做出的不同的动作,在不同的功能选择下做出相应的操作,从而实现了用头面部动作控制计算机。本发明实现了控制鼠标键盘、辅助阅览、颈部操游戏、控制赛车游戏等一系列重要而实用的功能,能够应用于家庭自动控制系统中,使残疾人只用头部就能控制电视、空调等所有家庭设施。

Description

头面部动作检测方法及应用该方法操控计算机的助残系统
技术领域
本发明涉及一种动作的识别,属于图像识别与人机交互技术领域,具体地说,是指一种头面部动作检测方法及应用该方法操控计算机的助残系统。
背景技术
图像识别技术,是基于已有的adaboost算法实现的,但是现有的技术的检测速度不理想,以下是相关文献中的记录:
2007年10月北京大学学报(自然科学版)第八卷第5期上发表的论文“Adaboost算法在人脸检测中的应用”(作者叶延亮)中提到,Viola和Jones提出的Adaboost人脸检测方法检测速度为15帧/s。
2007年在计算机信息与技术第31期中发表的论文“基于Adaboost的人脸检测”(作者李振)中写到:“检测速率可达每秒十五帧”。
2007年6月发表的硕士学位论文“基于Adaboost算法的驾驶员疲劳检测系统”中所实现的帧速是10秒/帧。
2007年3月发表的硕士学位论文“基于Adaboost算法的人脸检测研究及实现”(作者林鹏)也提到Adaboost算法被Viola等人应用于人脸检测的速度是15帧/秒。
2007年10月中国图像图形学报第12卷第10期上发表的“基于Gentle Adaboost的行人检测”(作者朱文佳戚飞虎)中检测一幅图上的行人需要200ms,而论文中提到的文献中的方法需要250ms。
2007年2月中国图形图像学报上第12卷第2期中发表的论文“基于改进Adaboost算法的人耳检测与跟踪”(作者张怀  穆志纯  袁立)实现的检测速度是6-7帧/秒。
从上述文献记载可知,目前的基于adaboost算法的图像识别技术,图像检测速率只能达到最高15帧/秒,远远不能满足目前图像识别领域中需要高速识别的要求。
另外,目前尚未有人专门针对各种头面部动作做过精确的检测和判断。
发明内客
本发明的目的是解决目前数千万的残疾人,尤其是上肢残疾的人使用电脑的问题,并且能够进一步与家庭自动控制系统相结合使残疾人只需要头面部动作就能控制电脑,进而通过电脑遥控各种家具,如电视、空调等,为了实现这一目的,即通过识别头面部动作进行对电脑的各种操作,就需要通过摄像头实时捕捉用户的头面部动作,并加以识别,本发明采用了现有的adaboost算法,并结合多线程方法使头面部动作的检测速率提高到了30帧/秒,对所得到的头面部动作数据信息进行分析判断,从而达到了准确识别的效果。
本发明提供的头面部检测方法的具体实现步骤如下:
步骤1:采集各种头面部动作的图片,这些图片都是将来希望能够识别出来的各种头面部动作的图片,即正例图片。此外,再采集不含头面部动作的任何图片,即反例图片。
步骤2:用adaboost算法对正例图片和反例图片进行训练,归纳正例图片中的共同haar特征,并排除反例图片中所存有的haar特征,得到存有头面部动作特征的分类器,分类器中用文本记录了所训练的头面部动作中所含有的haar特征和每个haar特征在头面部动作的坐标位置。
步骤3:采用多线程方法获取图像并对图像进行预处理和头面部动作检测。
应用多线程方法创建两个线程,即线程A和线程B。其中线程B用于通过摄像头实时捕获图像,并把这个图像交给线程A处理,之后线程B捕获下一帧图像,具体过程如下:
(1)线程B通过摄像头实时捕获图像,并把这个图像交给线程A处理。
(2)当线程A获得一帧图像后,对该帧图像依次进行颜色空间转换、图像积分、边缘检测处理,得到预处理后的图像。
(3)以不同大小的窗口在图像中移动搜索目标(头面部动作),用窗口所选中的图片特征与分类器中的特征相比较,由此判断出图像中是否存在希望出现的头面部动作,如果是就记录下头面部动作在图像中的位置坐标与头面部动作的大小(长和宽)信息,如果不是就继续移动搜索下一目标。
(4)重复步骤(1)~(3),线程A继续处理送来的下一帧图像。
应用该多线程方法进行图像的捕获、预处理和头面部检测,可使此检测的速率提高到30帧/秒。
步骤4:根据上面步骤3得到的头面部动作的大小与坐标位置信息,连续考察n帧头面部动作的信息,求出他们的平均位置与大小,以及检测率,其中n为整数,n取值范围为100~300。
如果当前头面部动作的位置和大小与平均位置和大小相比较,二者的差值超过差值阈值,则计算机会出现错误信息提示,如“光线过差,无法识别”,此时不进行操作;如果小于或等于,则继续判断检测率。所述的差值阈值是通常取为20~30像素。
如果检测率小于检测率阈值,则无法使用目前的头面部信息来实现操作;如果检测率大于检测率阈值,则根据识别出的具体的头面部动作信息对计算机进行操控。
所述的检测率阈值取0.6~0.7。
步骤5:通过对所得到的具体的头面部动作信息数据进行分析,从而精确分辨出各个头面部动作:
1)比较最近的10帧图像眼睛的检测率与眼睛阈值的大小,检测率小于眼睛阈值被判断为闭眼动作,大于眼睛阈值被判断为睁眼。所述的眼睛阈值取值为0.2~0.3。
2)两种方法判断张嘴动作:a)检测率小于嘴阈值判断为张嘴,b)连续3帧图像在嘴的区域没有检测到嘴判断为张嘴。所述的嘴阈值的取值为0.5~0.8。
3)嘴部坐标与脸部坐标的差值大于左偏头阈值判断为左偏头,小于右偏头阈值判断为右偏头。所述的左偏头阈值取为4~6像素,右偏头阈值取为-6~-4像素。
4)连续识别m帧右侧面脸判断为左转头,连续识别m帧左侧面脸判断为右转头。M为正整数,5≤m≤7。
5)把步骤4所求的头部坐标平均值作为中心位置,当前头部坐标偏离中心位置的垂直位移小于俯头阈值判断为俯头,大于仰头阈值判断为仰头。所述的俯头阈值取为-5~-3像素,仰头阈值3~5像素。
6)把步骤4所求的头部坐标平均值作为中心位置,当前头部坐标偏离中心位置的水平位移大于左移阈值判断为左移头,小于右移阈值判断为右移头。所述的左移阈值取为4~8像素,右移阈值取为-8~-4像素。
7)当前脸部的大小与平均脸部的大小之差大于靠近阈值识别为靠近,小于远离阈值识别为远离。所述的靠近阈值取为10~20像素,远离阈值取为-20~-10像素。
以上这些头面部动作相互独立,它们之间可以相互组合,能够得到更多的头面部动作。
本发明还提供一种用于上述的检测方法的头面部动作操控计算机的助残系统,该系统包括:摄像头采集图像模块、图像预处理及检测模块、头面部动作数据分析模块、精确判断模块、动作到计算机命令映射模块。其中动作到计算机命令映射模块有包含控制鼠标模块、辅助阅览模块、坐姿监控模块、键盘输入模块、颈部操游戏模块、控制赛车游戏模块、控制家居模块、自定义控制模块。
所述的摄像头采集图像模块是通过摄像头实时捕获一帧图像,然后传给图像预处理及检测模块;所述的图像预处理及检测模块是用于预处理摄像头采集图像模块所传来的图像,并在图像上进行头面部动作检测,最终得到头面部动作的坐标位置与大小信息;所述头面部动作数据分析模块是对图像预处理及检测模块所得到的头面部动作信息进行统计分析得出头面部动作的平均位置和平均大小及检测率;所述的精确判断模块是用于精确判断并区分出15种相互独立的头面部动作;所述的动作到计算机命令模块是通过在不同的动作下调用不同的系统API,把头面部动作映射成各种计算机命令;所述的控制鼠标模块是把俯仰头、左右移动头动作映射为鼠标的上下左右移动操作,左右转头动作映射为鼠标的左右键点击,点头(组合动作)映射为鼠标的双击。所述的辅助阅览模块是把俯仰头动作映射为各种电子文档、网页等的上下翻页;所述的坐姿监控模块是把用户靠近计算机的动作映射为警告提示,提醒用户离电脑太近;所述的键盘输入模块是把俯仰头、左右转头、左上仰头、右上仰头、左下俯头、右下俯头和张嘴映射为不同的键盘按键,实现用户的快速输入;所述的颈部操游戏模块是把俯仰头、左右转头、左上仰头、右上仰头、左下俯头、右下俯头映射为不同的游戏控制命的游戏应用;所述的控制赛车游戏模块是把左右移动头部映射为赛车的左右转弯命令,俯仰头映射为加减速命令的游戏应用;所述的家居控制模块是通过与网络家具控制系统结合把头面部动作映射为各种家具的控制命令,实现电视机、空调、窗帘、灯的控制。所述的自定义控制模块是用于用户自己定义头面部动作与各种操作的映射。
本发明的主要优点在于:
1)打破思维定势应用多线程方法对图像进行捕获、预处理和头面部检测,使检测速率达到30帧/秒。
2)运用本发明提供的头面部检测方法能准确识别出15种独立(可以相互组合)的头面部动作。
3)本发明提供的检测方法可完全摆脱计算机对手的依赖,可由头面部动作完成对电脑的各种基本操作。在检测方法的帮助下,上肢残疾人也能无障碍地使用电脑,他们可以自由地控制鼠标,进行电子阅读、上网等日常工作,甚至还能够玩游戏。
附图说明
图1本发明头面部检测方法流程图;
图2多线程方法对图像进行捕获、预处理和头面部检测方法的流程图;
图3头面部动作数据统计分析流程图
图4准确识别出头面部动作并通过映射系统API把头面部动作转换为操作的流程图;
图5能识别出的15种头面部动作示意图;
图6本发明的应用头面部动作操控计算机系统示意图。
具体实施方式
下面结合附图对本发明提供的头面部检测方法及其应用该方法进行计算机操控的助残系统进行详细说明。
如图1所示的是本发明提供的头面部检测方法流程图,该方法可以通过如下具体步骤来实现:
步骤一、采集正例图片和反例图片。
采集3000~4000张各种头面部动作的图片,这些图片都是将来希望能够识别出来的各种头面部动作的图片,即正例图片。此外,再采集3000~4000张不含头面部动作的任何图片,即反例图片。
步骤二、采用adaboost算法对正例图片和反例图片进行训练。
采用adaboost算法对步骤一中采集的正例图片和反例图片进行训练,归纳正例图片中的共同haar特征,并排除反例图片中所存有的haar特征,得到存有头面部动作特征的分类器,分类器中用文本记录了所训练的头面部动作中所含有的haar特征和这种haar特征在头面部动作的坐标位置。
步骤三、应用多线程方法对图像进行捕获、预处理和头面部检测。
应用多线程方法创建两个线程,即线程A和线程B。其中线程B用于通过摄像头实时捕获图像,并把这个图像交给线程A处理,之后线程B捕获下一帧图像。如图2所示,捕获、预处理和头面部检测过程具体如下:
(1)线程B通过摄像头实时捕获图像,并把这个图像交给线程A处理。
(2)当线程A获得一帧图像后,对该帧图像依次进行颜色空间转换、图像积分、边缘检测处理,得到预处理后的图像。
(3)以不同大小的窗口在图像中移动搜索目标(头面部动作),用窗口所选中的图片特征与分类器中的特征相比较,由此判断出图像中是否存在希望出现的头面部动作,如果是就记录下头面部动作在图像中的位置坐标与头面部动作的大小(长和宽)信息,如果不是就继续移动搜索下一目标。
(4)重复步骤(1)~(3),线程A继续处理送来的下一帧图像。
步骤四、根据上面得到的头面部动作的大小与坐标位置,连续考察n(100~300)帧头面部动作的信息,求出他们的平均位置与大小,以及检测率。
如图3所示,初步识别出头面部动作的大小与坐标,根据步骤三中记录的头面部动作信息,如果当前头面部动作的位置和大小与平均位置和大小相比较,二者的差值超过差值阈值,则计算机会出现错误信息提示,如“光线过差,无法识别”,此时不进行操作;如果小于或等于差值阈值,则继续判断检测率。所述的差值阈值是通常取为20~30像素。
如果检测率小于检测率阈值,则无法使用目前的头面部信息来实现操作;如果检测率大于或等于检测率阈值,则根据识别出的具体的头面部动作信息对计算机进行操控。所述的检测率阈值取0.6~0.7。
步骤五、通过所得到的具体的头面部动作信息数据,根据如下的方法来精确分辨出各个头面部动作,如图4:
1)比较最近10帧图像眼睛的检测率与眼睛阈值(0.2~0.3)的大小,小于眼睛阈值被判断为闭眼动作,包括闭左眼、闭右眼、闭双眼;如果检测率大于眼睛阈值被判断为睁眼。
2)两种方法判断张嘴动作:a)检测率小于嘴阈值(0.5~0.8)判断为张嘴,b)连续3帧图像在嘴的区域没有检测到嘴判断为张嘴。
3)嘴部坐标与脸部坐标的差值大于左偏头阈值(4~6像素)判断为左偏头,小于右偏头阈值(-6~-4)判断为右偏头。
4)连续识别5(可调整)帧右侧面脸判断为左转头,连续识别5(可调整)帧左侧面脸判断为右转头。
5)把步骤四所求的头部坐标平均值作为中心位置,当前头部位置与平均位置的垂直差小于俯头阈值(-5~-3像素)判断为俯头,大于仰头阈值(3~5像素)判断为仰头。
6)把步骤四所求的头部坐标平均值作为中心位置,当前头部坐标偏离中心位置的水平位移(也即当前头部位置与平均位置的水平差)大于左移阈值(4~8像素)判断为左移头,小于右移阈值(-8~-4像素)判断为右移头。
7)当前脸部像素的大小与平均脸部像素的大小之差大于靠近阈值(10~20像素)识别为靠近,小于远离阈值(-20~-10像素)识别为远离。
这样,就成功地识别出了15种头面部动作,如图6,图中自左到右自上而下依次是抬头、低头、右偏头、左偏头、左移头、右移头、右转头、左转头、闭右眼、闭双眼、闭左眼、靠近、张嘴、闭嘴、远离。
以上这些头面部动作相互独立,它们之间可以相互组合,能够得到更多的头面部动作。
本发明还提供一种用于上述的检测方法的头面部动作操控计算机的助残系统,如图5,该系统包括:摄像头采集图像模块1、图像预处理及检测模块2、头面部动作数据分析模块3、精确判断模块4、动作到计算机命令映射模块5。其中动作到计算机命令映射模块有包含控制鼠标模块501、辅助阅览模块502、坐姿监控模块503、键盘输入模块504、颈部操游戏模块505、控制赛车游戏模块506、控制家居模块507、自定义控制模块508。
所述的摄像头采集图像模块1是通过摄像头实时捕获一帧图像,然后传给图像预处理及检测模块2;所述的图像预处理及检测模块2是用于预处理摄像头采集图像模块1所传来的图像,并在图像上进行头面部动作检测,最终得到头面部动作的坐标位置与大小信息;所述头面部动作数据分析模块3是对图像预处理及检测模块2所得到的头面部动作信息进行统计分析得出头面部动作的平均位置和大小及检测率;所述的精确判断模块4是用于精确判断并区分出15种相互独立的头面部动作;所述的动作到计算机命令映射模块5是通过在不同的动作下调用不同的系统API,把头面部动作映射成各种计算机命令。
所述的控制鼠标模块501是把俯仰头、左右移动头动作映射为鼠标的上下左右移动操作或滚轮滚动操作,左右转头动作映射为鼠标的左右键点击,点头(组合动作)映射为鼠标的双击。所述的辅助阅览模块502是把俯仰头动作映射为各种电子文档、网页等的上下翻页;所述的坐姿监控模块503是把用户靠近计算机的动作映射为警告提示,提醒用户离电脑太近;所述的键盘输入模块504是把俯仰头、左右转头、左上仰头、右上仰头、左下俯头、右下俯头和张嘴映射为不同的键盘按键,实现用户的快速输入;所述的颈部操游戏模块505是把俯仰头、左右转头、左上仰头、右上仰头、左下俯头、右下俯头映射为不同的游戏控制命的游戏应用;所述的控制赛车游戏模块506是把左右移动头部映射为赛车的左右转弯命令,俯仰头映射为加减速命令的游戏应用;所述的家居控制模块507是通过与网络家具控制系统结合把头面部动作映射为各种家具的控制命令,实现电视机、空调、窗帘、灯的控制。所述的自定义控制模块508是用于用户自己定义头面部动作与各种操作的映射。
在不同的头面部动作下调用不同的系统API(Application Programming Interface),把头面部动作转换为对应的计算机的命令,如图4,具体可以设定成如下的各种命令:
闭左眼执行单击鼠标左键、键盘Left键;闭右眼执行单击右键、键盘Right键;张嘴执行确认;左转头执行单击左键;右转头执行单击右键;左偏头单击鼠标左键;右偏头单击右键;左移头执行向左移动鼠标、键盘Left键;右移头执行向右移动鼠标、键盘Right键;仰头执行向上移动鼠标、滚轮上滚、键盘Up键;俯头执行向下移动鼠标或滚轮下滚;点头执行双击左键。此系统的函数库里封装了一些常用操作所对应的的系统API,用户还可以根据自己的习惯为每个头面部动作映射操作。

Claims (3)

1.头面部动作检测方法,其特征在于所述的方法通过如下步骤实现:
步骤1:采集各种头面部动作的图片,包括正例图片和反例图片;
步骤2:对正例图片和反例图片进行训练,归纳正例图片中的共同haar特征,并排除反例图片中所存有的haar特征,得到存有头面部动作特征的分类器;分类器中用文本记录了所训练的头面部动作中所含有的haar特征和每个haar特征在头面部动作的坐标位置;
步骤3:采用多线程方法获取图像并对图像进行预处理和头面部动作检测;应用多线程方法创建两个线程,即线程A和线程B,对图像进行预处理和头面部动作检测具体过程如下:
(1)线程B通过摄像头实时捕获图像,并把这个图像交给线程A处理;
(2)当线程A获得一帧图像后,对该帧图像依次进行颜色空间转换、图像积分、边缘检测处理,得到预处理后的图像;
(3)以不同大小的窗口在图像中移动搜索目标,用窗口所选中的图片特征与分类器中的特征相比较,由此判断出图像中是否存在希望出现的头面部动作,如果是就记录下头面部动作在图像中的位置坐标与头面部动作的大小信息,如果不是就继续移动搜索下一目标;
(4)重复步骤(1)~(3),线程A继续处理送来的下一帧图像;
步骤4:根据上面步骤3得到的头面部动作的大小与坐标位置信息,连续考察n帧头面部动作的信息,求出他们的平均位置与大小,以及检测率,其中n为整数,n取值为200~300;
如果当前头面部动作的位置和大小与平均位置和大小相比较,二者的差值超过差值阈值,则计算机会出现错误信息提示,此时不进行操作;如果小于或等于差值阈值,则继续判断检测率;所述的差值阈值取为20~30像素;
如果检测率小于检测率阈值,则无法使用目前的头面部信息来实现操作;如果检测率大于检测率阈值,则根据识别出的具体的头面部动作信息对计算机进行操控;所述的检测率阈值取0.6~0.7;
步骤5:通过对所得到的具体的头面部动作信息数据进行分析,从而精确分辨出各个头面部动作:
(1)比较最近的10帧图像眼睛的检测率与眼睛阈值的大小,检测率小于眼睛阈值被判断为闭眼动作,大于眼睛阈值被判断为睁眼;
(2)两种方法判断张嘴动作:a)检测率小于嘴阈值判断为张嘴,b)连续3帧图像在嘴的区域没有检测到嘴判断为张嘴;
(3)嘴部坐标与脸部坐标的差值大于左偏头阈值判断为左偏头,小于右偏头阈值判断为右偏头;
(4)连续识别m帧右侧面脸判断为左转头,连续识别m帧左侧面脸判断为右转头;
(5)把步骤4所求的头部坐标平均值作为中心位置,当前头部坐标偏离中心位置的垂直位移小于俯头阈值判断为俯头,大于仰头阈值判断为仰头;
(6)把步骤4所求的头部坐标平均值作为中心位置,当前头部坐标偏离中心位置的水平位移大于左移阈值判断为左移头,小于右移阈值判断为右移头;
(7)当前脸部的大小与平均脸部的大小之差大于靠近阈值识别为靠近,小于远离阈值识别为远离;
其中,眼睛阈值为0.2~0.3,嘴阈值为0.5~0.8,左偏头阈值为4~6像素,右偏头阈值为-6~-4像素,m为正整数,取为5~7,俯头阈值为-5~-3像素,仰头阈值为3~5像素,左移阈值为4~8像素,右移阈值为-8~-4像素,靠近阈值为10~20像素,远离阈值为-20~-10像素。
2.一种应用权利要求1所述的头面部检测方法进行计算机操控的助残系统,其特征在于:所述的助残系统包括:摄像头采集图像模块、图像预处理及检测模块、头面部动作数据分析模块、精确判断模块、动作到计算机命令映射模块,其中动作到计算机命令映射模块包含有控制鼠标模块、辅助阅览模块、坐姿监控模块、键盘输入模块、颈部操游戏模块、控制赛车游戏模块、控制家居模块、自定义控制模块;
所述的摄像头采集图像模块是通过摄像头实时捕获一帧图像,然后传给图像预处理及检测模块;所述的图像预处理及检测模块是用于预处理摄像头采集图像模块所传来的图像,并在图像上进行头面部动作检测,最终得到头面部动作的坐标位置与大小信息;所述头面部动作数据分析模块是对图像预处理及检测模块所得到的头面部动作信息进行统计分析得出头面部动作的平均位置和平均大小及检测率;所述的精确判断模块是用于精确判断并区分出15种相互独立的头面部动作;所述的动作到计算机命令模块是通过在不同的动作下调用不同的系统API,把头面部动作映射成各种计算机命令;所述的控制鼠标模块是把俯仰头、左右移动头动作映射为鼠标的上下左右移动操作,左右转头动作映射为鼠标的左右键点击,点头映射为鼠标的双击;所述的辅助阅览模块是把俯仰头动作映射为各种电子文档、网页等的上下翻页;所述的坐姿监控模块是把用户靠近计算机的动作映射为警告提示,提醒用户离电脑太近;所述的键盘输入模块是把俯仰头、左右转头、左上仰头、右上仰头、左下俯头、右下俯头和张嘴映射为不同的键盘按键,实现用户的快速输入;所述的颈部操游戏模块是把俯仰头、左右转头、左上仰头、右上仰头、左下俯头、右下俯头映射为不同的游戏控制命的游戏应用;所述的控制赛车游戏模块是把左右移动头部映射为赛车的左右转弯命令,俯仰头映射为加减速命令的游戏应用;所述的家居控制模块是通过与网络家具控制系统结合把头面部动作映射为各种家具的控制命令,实现电视机、空调、窗帘、灯的控制;所述的自定义控制模块是用于用户自己定义头面部动作与各种操作的映射。
3.根据权利要求2所述的助残系统,其特征在于:所述的15种相互独立的头面部动作分别为:抬头、低头、右偏头、左偏头、左移头、右移头、右转头、左转头、闭右眼、闭双眼、闭左眼、靠近、张嘴、闭嘴、远离。
CN2009101806423A 2009-08-11 2009-10-27 头面部动作检测方法及应用该方法操控计算机的助残系统 Expired - Fee Related CN101697199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101806423A CN101697199B (zh) 2009-08-11 2009-10-27 头面部动作检测方法及应用该方法操控计算机的助残系统

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910090865.0 2009-08-11
CN200910090865 2009-08-11
CN2009101806423A CN101697199B (zh) 2009-08-11 2009-10-27 头面部动作检测方法及应用该方法操控计算机的助残系统

Publications (2)

Publication Number Publication Date
CN101697199A true CN101697199A (zh) 2010-04-21
CN101697199B CN101697199B (zh) 2012-07-04

Family

ID=42142303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101806423A Expired - Fee Related CN101697199B (zh) 2009-08-11 2009-10-27 头面部动作检测方法及应用该方法操控计算机的助残系统

Country Status (1)

Country Link
CN (1) CN101697199B (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375533A (zh) * 2010-08-19 2012-03-14 阳程科技股份有限公司 游标操控方法
CN102622085A (zh) * 2012-04-11 2012-08-01 北京航空航天大学 多维感官人机交互系统及交互方法
CN102855484A (zh) * 2012-07-30 2013-01-02 杭州士兰微电子股份有限公司 基于局部积分图像处理的目标检测方法、装置及系统
CN102855501A (zh) * 2012-07-26 2013-01-02 北京锐安科技有限公司 一种多方向物体图像识别方法
CN102915193A (zh) * 2012-10-24 2013-02-06 广东欧珀移动通信有限公司 一种网页浏览方法、装置及智能终端
CN102945077A (zh) * 2012-10-24 2013-02-27 广东欧珀移动通信有限公司 一种图片查看方法、装置及智能终端
CN102999164A (zh) * 2012-11-30 2013-03-27 广东欧珀移动通信有限公司 一种电子书翻页控制方法及智能终端
CN103019386A (zh) * 2011-12-24 2013-04-03 黄得锋 一种人机互动的控制方法及其运用
CN103064517A (zh) * 2012-12-19 2013-04-24 苏州贝腾特电子科技有限公司 一种虚拟鼠标点击系统
CN103118297A (zh) * 2013-01-22 2013-05-22 广东星海数字家庭产业技术研究院有限公司 一种基于动作识别的防疲累数字电视系统
CN103186237A (zh) * 2011-12-31 2013-07-03 由田信息技术(上海)有限公司 藉由影像辨识之启动方法
CN103257712A (zh) * 2013-05-30 2013-08-21 苏州福丰科技有限公司 基于面部识别的阅读标记终端
CN103324283A (zh) * 2013-05-23 2013-09-25 广东欧珀移动通信有限公司 基于人脸识别控制视频播放的方法及其终端
CN103543843A (zh) * 2013-10-09 2014-01-29 中国科学院深圳先进技术研究院 基于加速度传感器的人机接口设备及人机交互方法
CN103631370A (zh) * 2012-08-28 2014-03-12 腾讯科技(深圳)有限公司 一种控制虚拟形象的方法及装置
CN104238732A (zh) * 2013-06-24 2014-12-24 由田新技股份有限公司 侦测脸部动作以产生讯号的装置、方法以及计算机可读取纪录媒体
CN105022280A (zh) * 2015-07-26 2015-11-04 徐君 适用于无手残疾人的家居装置
CN105022366A (zh) * 2014-04-30 2015-11-04 青岛北电高科技有限公司 基于振动编码的可穿戴式智能家居遥控方法和系统
CN105242942A (zh) * 2015-09-17 2016-01-13 小米科技有限责任公司 应用控制方法和装置
CN105630169A (zh) * 2015-12-25 2016-06-01 北京像素软件科技股份有限公司 一种体感输入方法及装置
CN105867621A (zh) * 2016-03-30 2016-08-17 上海斐讯数据通信技术有限公司 一种隔空操作智能设备的方法及装置
CN106022378A (zh) * 2016-05-23 2016-10-12 武汉大学 基于摄像头与压力传感器的颈椎病识别方法
CN106343977A (zh) * 2016-09-21 2017-01-25 中国人民解放军国防科学技术大学 基于多传感器融合的无人机操作员状态监视系统
CN106547339A (zh) * 2015-09-22 2017-03-29 百度在线网络技术(北京)有限公司 计算机设备的控制方法和装置
WO2017113742A1 (zh) * 2015-12-29 2017-07-06 乐视控股(北京)有限公司 基于人脸识别的播放控制方法及终端
CN107045387A (zh) * 2017-01-19 2017-08-15 博康智能信息技术有限公司 基于视觉系统的移动终端操控实现方法及装置
CN107274434A (zh) * 2017-07-14 2017-10-20 浙江大华技术股份有限公司 一种目标物体小幅度移动的检测方法和检测装置
CN107451564A (zh) * 2017-07-31 2017-12-08 上海爱优威软件开发有限公司 一种人脸动作控制方法及系统
CN107515670A (zh) * 2017-01-13 2017-12-26 维沃移动通信有限公司 一种实现自动翻页的方法及移动终端
CN107562204A (zh) * 2017-09-14 2018-01-09 深圳Tcl新技术有限公司 电视交互方法、电视及计算机可读存储介质
CN107741784A (zh) * 2017-10-09 2018-02-27 济南大学 一种适用于重度瘫痪病人的娱乐交互方法
CN108919946A (zh) * 2018-06-11 2018-11-30 诚迈科技(南京)股份有限公司 操作智能终端的方法及智能终端
CN109376016A (zh) * 2018-10-29 2019-02-22 安徽智传科技有限公司 一种多线程的人脸识别效率提高方法和系统
CN110170999A (zh) * 2019-05-29 2019-08-27 大国创新智能科技(东莞)有限公司 基于深度学习的智能翻页方法和机器人系统
CN110786869A (zh) * 2019-10-29 2020-02-14 浙江工业大学 一种程序员的疲劳程度的检测方法
CN111427697A (zh) * 2020-03-18 2020-07-17 深圳市瑞立视多媒体科技有限公司 基于多线程的动作捕捉方法、装置、设备及存储介质
CN112099634A (zh) * 2020-09-17 2020-12-18 珠海格力电器股份有限公司 基于头部动作的交互操作方法、装置、存储介质及终端
US11543886B2 (en) 2020-01-31 2023-01-03 Sony Group Corporation Providing television controller functions using head movements
CN116524572A (zh) * 2023-05-16 2023-08-01 北京工业大学 基于自适应Hope-Net的人脸精准实时定位方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7027618B2 (en) * 2001-09-28 2006-04-11 Koninklijke Philips Electronics N.V. Head motion estimation from four feature points
CN100531248C (zh) * 2005-08-17 2009-08-19 北京邮电大学 一种通过检测可拍照手机摄像头运动代替按键操作的方法
CN201181458Y (zh) * 2008-03-21 2009-01-14 方宇 头驱鼠标

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375533A (zh) * 2010-08-19 2012-03-14 阳程科技股份有限公司 游标操控方法
CN103207667A (zh) * 2011-12-24 2013-07-17 黄得锋 一种人机互动的控制方法及其运用
CN103019386A (zh) * 2011-12-24 2013-04-03 黄得锋 一种人机互动的控制方法及其运用
CN103186237A (zh) * 2011-12-31 2013-07-03 由田信息技术(上海)有限公司 藉由影像辨识之启动方法
CN102622085A (zh) * 2012-04-11 2012-08-01 北京航空航天大学 多维感官人机交互系统及交互方法
CN102855501A (zh) * 2012-07-26 2013-01-02 北京锐安科技有限公司 一种多方向物体图像识别方法
CN102855501B (zh) * 2012-07-26 2015-12-02 北京锐安科技有限公司 一种多方向物体图像识别方法
CN102855484A (zh) * 2012-07-30 2013-01-02 杭州士兰微电子股份有限公司 基于局部积分图像处理的目标检测方法、装置及系统
CN102855484B (zh) * 2012-07-30 2015-11-04 杭州士兰微电子股份有限公司 基于局部积分图像处理的目标检测方法、装置及系统
CN103631370A (zh) * 2012-08-28 2014-03-12 腾讯科技(深圳)有限公司 一种控制虚拟形象的方法及装置
CN103631370B (zh) * 2012-08-28 2019-01-25 腾讯科技(深圳)有限公司 一种控制虚拟形象的方法及装置
CN102915193A (zh) * 2012-10-24 2013-02-06 广东欧珀移动通信有限公司 一种网页浏览方法、装置及智能终端
CN102945077B (zh) * 2012-10-24 2015-12-16 广东欧珀移动通信有限公司 一种图片查看方法、装置及智能终端
CN102945077A (zh) * 2012-10-24 2013-02-27 广东欧珀移动通信有限公司 一种图片查看方法、装置及智能终端
CN102915193B (zh) * 2012-10-24 2015-04-01 广东欧珀移动通信有限公司 一种网页浏览方法、装置及智能终端
CN102999164B (zh) * 2012-11-30 2016-08-03 广东欧珀移动通信有限公司 一种电子书翻页控制方法及智能终端
CN102999164A (zh) * 2012-11-30 2013-03-27 广东欧珀移动通信有限公司 一种电子书翻页控制方法及智能终端
CN103064517B (zh) * 2012-12-19 2016-03-23 曹新民 一种虚拟鼠标点击系统
CN103064517A (zh) * 2012-12-19 2013-04-24 苏州贝腾特电子科技有限公司 一种虚拟鼠标点击系统
CN103118297A (zh) * 2013-01-22 2013-05-22 广东星海数字家庭产业技术研究院有限公司 一种基于动作识别的防疲累数字电视系统
CN103324283A (zh) * 2013-05-23 2013-09-25 广东欧珀移动通信有限公司 基于人脸识别控制视频播放的方法及其终端
CN103257712A (zh) * 2013-05-30 2013-08-21 苏州福丰科技有限公司 基于面部识别的阅读标记终端
CN104238732A (zh) * 2013-06-24 2014-12-24 由田新技股份有限公司 侦测脸部动作以产生讯号的装置、方法以及计算机可读取纪录媒体
CN103543843A (zh) * 2013-10-09 2014-01-29 中国科学院深圳先进技术研究院 基于加速度传感器的人机接口设备及人机交互方法
CN105022366B (zh) * 2014-04-30 2018-07-06 青岛北电高科技有限公司 基于振动编码的可穿戴式智能家居遥控方法和系统
CN105022366A (zh) * 2014-04-30 2015-11-04 青岛北电高科技有限公司 基于振动编码的可穿戴式智能家居遥控方法和系统
CN105022280A (zh) * 2015-07-26 2015-11-04 徐君 适用于无手残疾人的家居装置
CN105242942A (zh) * 2015-09-17 2016-01-13 小米科技有限责任公司 应用控制方法和装置
CN106547339A (zh) * 2015-09-22 2017-03-29 百度在线网络技术(北京)有限公司 计算机设备的控制方法和装置
CN106547339B (zh) * 2015-09-22 2020-03-20 百度在线网络技术(北京)有限公司 计算机设备的控制方法和装置
CN105630169A (zh) * 2015-12-25 2016-06-01 北京像素软件科技股份有限公司 一种体感输入方法及装置
WO2017113742A1 (zh) * 2015-12-29 2017-07-06 乐视控股(北京)有限公司 基于人脸识别的播放控制方法及终端
CN105867621A (zh) * 2016-03-30 2016-08-17 上海斐讯数据通信技术有限公司 一种隔空操作智能设备的方法及装置
CN105867621B (zh) * 2016-03-30 2020-05-22 上海斐讯数据通信技术有限公司 一种隔空操作智能设备的方法及装置
CN106022378A (zh) * 2016-05-23 2016-10-12 武汉大学 基于摄像头与压力传感器的颈椎病识别方法
CN106022378B (zh) * 2016-05-23 2019-05-10 武汉大学 坐姿判断方法及基于摄像头与压力传感器颈椎病识别系统
CN106343977A (zh) * 2016-09-21 2017-01-25 中国人民解放军国防科学技术大学 基于多传感器融合的无人机操作员状态监视系统
CN106343977B (zh) * 2016-09-21 2019-07-09 中国人民解放军国防科学技术大学 基于多传感器融合的无人机操作员状态监视系统
CN107515670A (zh) * 2017-01-13 2017-12-26 维沃移动通信有限公司 一种实现自动翻页的方法及移动终端
CN107515670B (zh) * 2017-01-13 2019-06-07 维沃移动通信有限公司 一种实现自动翻页的方法及移动终端
CN107045387A (zh) * 2017-01-19 2017-08-15 博康智能信息技术有限公司 基于视觉系统的移动终端操控实现方法及装置
CN107274434A (zh) * 2017-07-14 2017-10-20 浙江大华技术股份有限公司 一种目标物体小幅度移动的检测方法和检测装置
CN107451564A (zh) * 2017-07-31 2017-12-08 上海爱优威软件开发有限公司 一种人脸动作控制方法及系统
CN107562204B (zh) * 2017-09-14 2021-10-01 深圳Tcl新技术有限公司 电视交互方法、电视及计算机可读存储介质
CN107562204A (zh) * 2017-09-14 2018-01-09 深圳Tcl新技术有限公司 电视交互方法、电视及计算机可读存储介质
CN107741784A (zh) * 2017-10-09 2018-02-27 济南大学 一种适用于重度瘫痪病人的娱乐交互方法
CN108919946A (zh) * 2018-06-11 2018-11-30 诚迈科技(南京)股份有限公司 操作智能终端的方法及智能终端
CN109376016A (zh) * 2018-10-29 2019-02-22 安徽智传科技有限公司 一种多线程的人脸识别效率提高方法和系统
CN110170999A (zh) * 2019-05-29 2019-08-27 大国创新智能科技(东莞)有限公司 基于深度学习的智能翻页方法和机器人系统
CN110786869A (zh) * 2019-10-29 2020-02-14 浙江工业大学 一种程序员的疲劳程度的检测方法
CN110786869B (zh) * 2019-10-29 2021-12-21 浙江工业大学 一种程序员的疲劳程度的检测方法
US11543886B2 (en) 2020-01-31 2023-01-03 Sony Group Corporation Providing television controller functions using head movements
CN111427697A (zh) * 2020-03-18 2020-07-17 深圳市瑞立视多媒体科技有限公司 基于多线程的动作捕捉方法、装置、设备及存储介质
CN112099634A (zh) * 2020-09-17 2020-12-18 珠海格力电器股份有限公司 基于头部动作的交互操作方法、装置、存储介质及终端
CN116524572A (zh) * 2023-05-16 2023-08-01 北京工业大学 基于自适应Hope-Net的人脸精准实时定位方法
CN116524572B (zh) * 2023-05-16 2024-01-26 北京工业大学 基于自适应Hope-Net的人脸精准实时定位方法

Also Published As

Publication number Publication date
CN101697199B (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN101697199B (zh) 头面部动作检测方法及应用该方法操控计算机的助残系统
CN104571482B (zh) 一种基于体感识别的数字设备操控方法
CN106598226B (zh) 一种基于双目视觉和深度学习的无人机人机交互方法
CN108197589B (zh) 动态人体姿态的语义理解方法、装置、设备和存储介质
US8582037B2 (en) System and method for hand gesture recognition for remote control of an internet protocol TV
CN101661329B (zh) 智能终端的操作控制方法及装置
CN107493495A (zh) 交互位置确定方法、系统、存储介质和智能终端
CN101201695A (zh) 一种基于眼部区域运动特征提取与跟踪的鼠标系统
CN104699237B (zh) 辨识使用者操作的方法及相关互动装置与计算机可读介质
CN101337128B (zh) 一种基于人脸的游戏控制方法及系统
CN103353935A (zh) 一种用于智能家居系统的3d动态手势识别方法
CN103488294A (zh) 一种基于用户交互习惯的非接触手势控制映射调整方法
CN103488299A (zh) 一种融合人脸和手势的智能终端人机交互方法
CN105912126B (zh) 一种手势运动映射到界面的增益自适应调整方法
Song et al. Detection of movements of head and mouth to provide computer access for disabled
CN106200971A (zh) 基于手势识别的人机交互系统装置及操作方法
Zhao et al. Real-time sign language recognition based on video stream
CN105107200A (zh) 基于实时深度体感交互与增强现实技术的变脸系统及方法
CN103793056A (zh) 基于距离向量的空中手势漫游控制方法
CN103198330A (zh) 基于深度视频流的实时人脸姿态估计方法
CN112507918A (zh) 一种手势识别方法
CN102184016A (zh) 基于视频序列识别的无接触式鼠标控制方法
CN113220114A (zh) 一种融合人脸识别的可嵌入非接触式电梯按键交互方法
CN106682643A (zh) 一种手势的多语义识别方法
CN110713082B (zh) 一种电梯控制方法、系统、装置和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20151027

EXPY Termination of patent right or utility model