CN108399009A - 利用人机交互手势唤醒智能设备的方法及装置 - Google Patents
利用人机交互手势唤醒智能设备的方法及装置 Download PDFInfo
- Publication number
- CN108399009A CN108399009A CN201810153143.4A CN201810153143A CN108399009A CN 108399009 A CN108399009 A CN 108399009A CN 201810153143 A CN201810153143 A CN 201810153143A CN 108399009 A CN108399009 A CN 108399009A
- Authority
- CN
- China
- Prior art keywords
- face
- mute
- rect
- list
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 74
- 230000002618 waking effect Effects 0.000 claims abstract description 14
- 230000009471 action Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 claims 2
- 238000005516 engineering process Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000037007 arousal Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Computer Security & Cryptography (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种利用人机交互手势唤醒智能设备的方法,包括如下步骤:利用摄像头对用户进行拍摄,获取拍摄图像;利用人脸分类器对所述的拍摄图像进行人脸检测,获取人脸框列表;根据统计的多人静音手势与人脸比例参数,设置手势检测区域列表;在手势检测区域进行静音手势检测,如若检测到目标,则设置静音信号Is_Mute为true;如若没有检测到所述目标,则设置所述静音信号Is_Mute为false;将所述静音信号Is_Mute传入后台,判断静音信号Is_Mute为true时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断静音信号Is_Mute为false时,对下一帧数据进行处理。还提供了对应的装置,利用手势唤醒,减少了与语音的混淆。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种利用人机交互手势唤醒智能设备的方法及装置。
背景技术
随着各种语音唤醒技术的飞速发展,目前市场上大多数都采用语音唤醒语音功能技术。如今智能设备飞速发展,如何将智能设备与唤醒技术结合,从而提供更加方便快捷和人性化的服务是值得探讨的问题。设置特定的语音来启动唤醒的功能在实际应用中容易让人与正常聊天混淆。
发明内容
本发明为了解决现有唤醒功能容易与语音混淆的问题,本发明提供了一种利用人机交互手势唤醒智能设备的方法,包括如下步骤:
S110、利用设备的摄像头对用户进行拍摄,将当前时刻拍摄到的图像存为Image;
S120、使用现有常规技术如Haar人脸检测,在图像Image中检测出所有超过预设大小 Face_Size的人脸矩形列表Face_Rect_List;预设大小的定义可为尺寸大小,具体可用长宽方向上的像素数量来表征。
S130、根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表Face_Rect_List 设置手势检测的感兴趣区域Rect_Roi_List;
S140、在手势检测的感兴趣区域Rect_Roi_List中进行静音手势检测,如若检测到目标,则返回值Is_Mute为true并进入步骤S150;如若没有检测到则Is_Mute为false并进入步骤 S120;
S150、将所述静音信号Is_Mute传入后台,判断静音信号Is_Mute为true时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断静音信号Is_Mute为false时,执行步骤 S120,对下一帧数据进行处理。
进一步地,所述步骤S120包括:
将所述拍摄图像进行预处理转换成灰度图像,将所述灰度图像作为输入,使用Haar分类器进行检测,若检测到人脸,则返回人脸的坐标参数,并进入到步骤S130;若没有检测到人脸,则进入步骤S120,处理下一帧拍摄图像;其中,所述人脸框Face_Rect的定义为[face_x, face_y,face_width,face_height],face_x为人脸框的左上角的x坐标,face_y为人脸框的左上角的y坐标,face_width为人脸框的宽,face_height为人脸框的高。
进一步地,所述步骤S130中,所述人脸矩形列表Face_Rect_List由多个人脸框Face_Rect 组成,其中Face_Rect的定义为[face_x-0.1*face_width,face_y+face_height,1.2*face_width, 1.4*face_height],对每个人脸框Face_Rect生成手势检测区域Rect_Roi。
进一步地,所述步骤S140包括:
使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将所述候选框输入到静音检测模型中进行检测。若检测到目标做了静音的动作,则设置静音信号 Is_Mute为true,反之则设置静音信号Is_Mute为false。
进一步地,所述静音检测模型为基于opencv自带的Haar分类器进行训练得到的模型。
另一方面,本发明还提供了一种利用人机交互手势唤醒智能设备的装置,包括后台运行装置,还包括:
拍摄图像获取装置,用于获取利用摄像头对用户进行拍摄所得的图像;
人脸框列表获取装置,用于利用人脸分类器对所述拍摄的图像进行人脸检测,获取尺寸超出预设大小的人脸框列表;
手势检测区域列表获取装置,用于根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表设置手势检测区域列表;
静音手势检测装置,用于在手势检测区域列表中的手势检测区域进行静音手势检测,如若检测到目标,则设置静音信号Is_Mute为true,如若没有检测到所述目标,则设置所述静音信号Is_Mute为false,并将所述静音信号Is_Mute传输给所述后台运行装置;
所述后台运行装置用于接收所述静音信号Is_Mute,判断所述静音信号Is_Mute为true时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断所述静音信号Is_Mute为false 时,致使所述人脸框列表获取装置对下一帧数据进行处理。
进一步地,所述人脸框列表获取装置具体用于:
将所述拍摄图像进行预处理转换成灰度图像,将所述灰度图像作为输入,使用Haar分类器进行检测,若检测到人脸,则返回人脸的坐标参数,并将所述人脸框发送给所述手势检测区域列表获取装置;若没有检测到人脸,则对下一帧拍摄图像进行人脸检测;其中,所述人脸矩形列表Face_Rect_List由多个人脸框Face_Rect组成,其中Face_Rect的定义为[face_x, face_y,face_width,face_height],face_x为人脸框的左上角的x坐标,face_y为人脸框的左上角的y坐标,face_width为人脸框的宽,face_height为人脸框的高。
进一步地,所述手势检测区域Rect_Roi_List由多个Rect_Roi组成,Rect_Roi的定义为 [face_x-0.1*face_width,face_y+face_height,1.2*face_width,1.4*face_height],所述手势检测区域列表获取装置对每个人脸框Face_Rect生成手势检测区域Rect_Roi。
进一步地,所述静音手势检测装置具体用于:
使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将所述候选框输入到静音检测模型中进行检测。若检测到目标做了静音的动作,则设置静音信号 Is_Mute为true,反之则设置静音信号Is_Mute为false。
进一步地,所述静音检测模型为基于opencv自带的Haar分类器进行训练得到的模型。
通过上述实施例的技术方案,唤醒装置和方法仅用手势识别就能将设备唤醒,与语音区别开,减少了混淆的情况发生。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明一些实施例中的唤醒手势定义示意图;
图2为本发明一些实施例中的唤醒设备流程示意图;
图3为本发明一些实施例中的唤醒手势解析流程示意图;
图4为本发明一些实施例中的利用人机交互手势唤醒智能设备的方法流程示意图;
图5为本发明一些实施例中的利用人机交互手势唤醒智能设备的装置结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
本发明针对现有智能设备唤醒技术常常采用语音唤醒的所带来的易混淆问题,进行了改进,利用手势进行唤醒,例如利用食指靠拢嘴唇的手势来表达需要唤醒。
本发明提供了一种唤醒方法,包括如下步骤:
Step.1利用设备的摄像头对用户进行拍摄,将当前时刻拍摄到的图像存为Image;
智能设备在播放视屏、广播或其他操作的同时,摄像头采集实时影像并保存为Image。
Step.2使用现有常规技术如Haar人脸检测,在图像Image中检测出所有超过预设大小 Face_Size的人脸矩形列表Face_Rect_List;预设大小的定义可为尺寸大小,具体可用长宽方向上的像素数量来表征。
将Image进行预处理转换成灰度图像Image_Gray。Image_Gray作为输入,使用常规技术如Haar人脸检测进行检测,若检测到人脸,则返回人脸的坐标参数,并进入step.3;若没有检测到人脸,则进入step.2,处理下一帧数据;
其中Face_Rect_List由多个Face_Rect[face_x,face_y,face_width,face_height]组成。
Step.3根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表Face_Rect_List 设置手势检测的感兴趣区域Rect_Roi_List;
统计多人在做静音手势时相对于人脸检测框的比例参数,将统计得出的参数与人脸框进行处理得到手势检测感兴趣区域Rect_Roi其具体参数如下:
roi_x:face_x-0.1*face_width
roi_y:face_y+0.5*face_height
roi_width:1.2*face_width
roi_height:1.4*face_height
每个返回的人脸框Face_Rect均会生成一个Rect_Roi,由它们共同组成Rect_Roi_List;
其静音手势的准确定义如图1所示。
Step.4在手势检测的感兴趣区域Rect_Roi_List中进行静音手势检测,如若检测到目标,则返回值Is_Mute为true并进入step.5;如若没有检测到则Is_Mute为false并进入step.2;
使用Sliding Window(滑动窗口)的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将候选框输入到静音检测模型中进行检测。若检测到目标做了静音的动作,则返回值Is_Mute设置为true,反之则返回false;
静音检测模型主要基于opencv自带的Haar分类器进行训练得到的模型(Haar分类器针对Haar特征进行分类)。
Step.5将静音信号传入后台,若Is_Mute为true,则暂停当前播放视屏或广播,在后台启动语音识别功能;若为false,则不做任何响应并进入step.2。
本发明的人机交互手势唤醒的流程如图2所示,首先设备加载唤醒资源,然后用户发出静音手势指令,设备对静音手势指令进行解析,最终判定接收到指令,从休眠状态中被唤醒,并给出指定的响应。其中,静音手势指令解析的过程如图3所示,用户发出静音指令之后,设备进行人脸检测,检测到人脸之后,根据人脸位置设置手势检测区域,进行静音手势检测,最终判断手势为静音手势时,确定设备被唤醒,设备接收指令。
具体地,如图4所示,本发明的实施例提供了一种利用人机交互手势唤醒智能设备的方法,包括如下步骤:
S110、利用设备的摄像头对用户进行拍摄,将当前时刻拍摄到的图像存为Image。智能设备在播放视屏、广播或其他操作的同时,摄像头采集实时影像并保存为Image。
S120、利用人脸分类器对所述的拍摄图像进行人脸检测,获取尺寸超出预设大小的人脸框列表。使用现有常规技术如Haar人脸检测,在图像Image中检测出所有超过预设大小 Face_Size的人脸矩形列表Face_Rect_List。
S130、根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表Face_Rect_List 设置手势检测的感兴趣区域Rect_Roi_List。
S140、在手势检测的感兴趣区域Rect_Roi_List中进行静音手势检测,如若检测到目标,则返回值Is_Mute为true并进入步骤S150;如若没有检测到则Is_Mute为false并进入步骤 S120;
S150、将所述静音信号Is_Mute传入后台,判断静音信号Is_Mute为true时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断静音信号Is_Mute为false时,不做任何响应执行步骤S120,对下一帧数据进行处理。
进一步地,所述步骤S120包括:
将所述拍摄图像进行预处理转换成灰度图像,将所述灰度图像作为输入,使用Haar分类器进行检测,若检测到人脸,则返回人脸的坐标参数,并进入到步骤S130;若没有检测到人脸,则进入步骤S120,处理下一帧拍摄图像;其中,所述人脸框Face_Rect的定义为[face_x, face_y,face_width,face_height],face_x为人脸框的左上角的x坐标,face_y为人脸框的左上角的y坐标,face_width为人脸框的宽,face_height为人脸框的高。
优选地,所述步骤S130中,所述手势检测区域Rect_Roi_List由多个Rect_Roi组成, Rect_Roi的定义为[face_x-0.1*face_width,face_y+face_height,1.2*face_width,1.4*face_height],对每个人脸框Face_Rect生成手势检测区域Rect_Roi。
所述步骤S140包括:
使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将所述候选框输入到静音检测模型中进行检测。若检测到目标做了静音的动作,则设置静音信号 Is_Mute为true,反之则设置静音信号Is_Mute为false。
所述静音检测模型为基于opencv自带的Haar分类器进行训练得到的模型。
本发明实施例中的唤醒装置仅用手势识别就能将设备唤醒,与语音区别开,减少了混淆的情况发生。
另一方面,如图5所示,本发明实施例还提供了一种利用人机交互手势唤醒智能设备的装置100,包括后台运行装置110,还包括拍摄图像获取装置120、人脸框列表获取装置130、手势检测区域列表获取装置140和静音手势检测装置150:其中,
拍摄图像获取装置120用于获取利用摄像头对用户进行拍摄所得的图像。
人脸框列表获取装置130用于利用人脸分类器对所述的拍摄图像进行人脸检测,获取尺寸超出预设大小的人脸框列表。人脸框列表获取装置130将所述拍摄图像进行预处理转换成灰度图像,将所述灰度图像作为输入,使用Haar分类器进行检测,若检测到人脸,则返回人脸的坐标参数,并将所述人脸框发送给所述手势检测区域列表获取装置;若没有检测到人脸,则对下一帧拍摄图像进行人脸检测;其中,所述人脸框Face_Rect的定义为[face_x,face_y, face_width,face_height],face_x为人脸框的左上角的x坐标,face_y为人脸框的左上角的y 坐标,face_width为人脸框的宽,face_height为人脸框的高。
手势检测区域列表获取装置140用于根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表设置手势检测区域列表;所述手势检测区域Rect_Roi_List由多个Rect_Roi 组成,Rect_Roi的定义为[face_x-0.1*face_width,face_y+face_height,1.2*face_width, 1.4*face_height],所述手势检测区域列表获取装置140对每个人脸框Face_Rect生成手势检测区域Rect_Roi。
静音手势检测装置150用于在手势检测区域列表中的手势检测区域进行静音手势检测,如若检测到目标,则设置静音信号Is_Mute为true,如若没有检测到所述目标,则设置所述静音信号Is_Mute为false,并将所述静音信号Is_Mute传输给所述后台运行装置;所述静音手势检测装置150使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将所述候选框输入到静音检测模型中进行检测。若检测到目标做了静音的动作,则设置静音信号Is_Mute为true,反之则设置静音信号Is_Mute为false。所述静音检测模型为基于 opencv自带的Haar分类器进行训练得到的模型。
所述后台运行装置110用于接收所述静音信号Is_Mute,判断所述静音信号Is_Mute为true 时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断所述静音信号Is_Mute 为false时,致使所述人脸框列表获取装置对下一帧数据进行处理。
本发明中的装置100可为智能设备,如智能手机、智能电视等。本发明中的装置100通过检测手势,识别手势为唤醒手势时,将设备唤醒,减少了与语音混淆的情况发生。
在本发明中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种利用人机交互手势唤醒智能设备的方法,其特征在于,包括如下步骤:
S110、利用设备的摄像头对用户进行拍摄,将当前时刻拍摄到的图像存为Image;
S120、使用Haar进行人脸检测,在图像Image中检测出所有超过预设大小Face_Size的人脸矩形列表Face_Rect_List;预设大小的定义可为尺寸大小,具体可用长宽方向上的像素数量来表征;
S130、根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表Face_Rect_List设置手势检测的感兴趣区域Rect_Roi_List;
S140、在手势检测的感兴趣区域Rect_Roi_List中进行静音手势检测,如若检测到目标,则返回值Is_Mute为true并进入步骤S150;如若没有检测到则Is_Mute为false并进入步骤S120;
S150、将所述静音信号Is_Mute传入后台,判断静音信号Is_Mute为true时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断静音信号Is_Mute为false时,执行步骤S120,对下一帧数据进行处理。
2.根据权利要求1所述的利用人机交互手势唤醒智能设备的方法,其特征在于,所述步骤S120包括:
将所述拍摄图像进行预处理转换成灰度图像,将所述灰度图像作为输入,使用Haar分类器进行检测,若检测到人脸,则返回人脸的坐标参数,并进入到步骤S130;若没有检测到人脸,则进入步骤S120,处理下一帧拍摄图像;其中,所述人脸矩形列表Face_Rect_List由多个人脸框Face_Rect组成,其中Face_Rect的定义为[face_x,face_y,face_width,face_height],face_x为人脸框的左上角的x坐标,face_y为人脸框的左上角的y坐标,face_width为人脸框的宽,face_height为人脸框的高。
3.根据权利要求2所述的利用人机交互手势唤醒智能设备的方法,其特征在于,所述步骤S130中,所述手势检测区域Rect_Roi_List由多个Rect_Roi组成,Rect_Roi的定义为[face_x-0.1*face_width,face_y+face_height,1.2*face_width,1.4*face_height],对每个人脸框Face_Rect生成手势检测区域Rect_Roi。
4.根据权利要求3所述的利用人机交互手势唤醒智能设备的方法,其特征在于,所述步骤S140包括:
使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将所述候选框输入到静音检测模型中进行检测;若检测到目标做了静音的动作,则设置静音信号Is_Mute为true,反之则设置静音信号Is_Mute为false。
5.根据权利要求4所述的利用人机交互手势唤醒智能设备的方法,其特征在于,所述静音检测模型为基于opencv自带的Haar分类器进行训练得到的模型。
6.一种利用人机交互手势唤醒智能设备的装置,包括后台运行装置,其特征在于,还包括:
拍摄图像获取装置,用于获取利用摄像头对用户进行拍摄所得的图像;
人脸框列表获取装置,用于利用人脸分类器对所述拍摄的图像进行人脸检测,获取尺寸超出预设大小的人脸框列表;
手势检测区域列表获取装置,用于根据统计的多人静音手势与人脸比例参数,基于返回的人脸框列表设置手势检测区域列表;
静音手势检测装置,用于在手势检测区域列表中的手势检测区域进行静音手势检测,如若检测到目标,则设置静音信号Is_Mute为true,如若没有检测到所述目标,则设置所述静音信号Is_Mute为false,并将所述静音信号Is_Mute传输给所述后台运行装置;
所述后台运行装置用于接收所述静音信号Is_Mute,判断所述静音信号Is_Mute为true时,暂停当前播放视屏或广播,在所述后台启动语音识别功能;判断所述静音信号Is_Mute为false时,致使所述人脸框列表获取装置对下一帧数据进行处理。
7.根据权利要求6所述的利用人机交互手势唤醒智能设备的装置,其特征在于,所述人脸框列表获取装置具体用于:
将所述拍摄图像进行预处理转换成灰度图像,将所述灰度图像作为输入,使用Haar分类器进行检测,若检测到人脸,则返回人脸的坐标参数,并将所述人脸框发送给所述手势检测区域列表获取装置;若没有检测到人脸,则对下一帧拍摄图像进行人脸检测;其中,所述人脸框Face_Rect的定义为[face_x,face_y,face_width,face_height],face_x为人脸框的左上角的x坐标,face_y为人脸框的左上角的y坐标,face_width为人脸框的宽,face_height为人脸框的高。
8.根据权利要求7所述的利用人机交互手势唤醒智能设备的装置,其特征在于,所述步骤S130中,所述手势检测区域Rect_Roi_List由多个Rect_Roi组成,Rect_Roi的定义为[face_x-0.1*face_width,face_y+face_height,1.2*face_width,1.4*face_height],所述手势检测区域列表获取装置对每个人脸框Face_Rect生成手势检测区域Rect_Roi。
9.根据权利要求8所述的利用人机交互手势唤醒智能设备的装置,其特征在于,所述静音手势检测装置具体用于:
使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框,将所述候选框输入到静音检测模型中进行检测;若检测到目标做了静音的动作,则设置静音信号Is_Mute为true,反之则设置静音信号Is_Mute为false。
10.根据权利要求9所述的利用人机交互手势唤醒智能设备的装置,其特征在于,所述静音检测模型为基于opencv自带的Haar分类器进行训练得到的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810153143.4A CN108399009A (zh) | 2018-02-11 | 2018-02-11 | 利用人机交互手势唤醒智能设备的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810153143.4A CN108399009A (zh) | 2018-02-11 | 2018-02-11 | 利用人机交互手势唤醒智能设备的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108399009A true CN108399009A (zh) | 2018-08-14 |
Family
ID=63095665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810153143.4A Pending CN108399009A (zh) | 2018-02-11 | 2018-02-11 | 利用人机交互手势唤醒智能设备的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108399009A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112543359A (zh) * | 2020-11-12 | 2021-03-23 | 海信视像科技股份有限公司 | 一种显示设备及自动配置视频参数的方法 |
CN112764349A (zh) * | 2019-11-01 | 2021-05-07 | 佛山市云米电器科技有限公司 | 晾衣架控制方法、晾衣架、系统及存储介质 |
CN112788390A (zh) * | 2020-12-25 | 2021-05-11 | 深圳市优必选科技股份有限公司 | 一种基于人机交互的控制方法、装置、设备及存储介质 |
CN114125143A (zh) * | 2020-08-31 | 2022-03-01 | 华为技术有限公司 | 一种语音交互方法及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488299A (zh) * | 2013-10-15 | 2014-01-01 | 大连市恒芯科技有限公司 | 一种融合人脸和手势的智能终端人机交互方法 |
CN103558911A (zh) * | 2013-10-24 | 2014-02-05 | 广东欧珀移动通信有限公司 | 一种移动终端静音的实现方法及实现系统 |
CN103761508A (zh) * | 2014-01-02 | 2014-04-30 | 大连理工大学 | 一种融合人脸和手势的生物识别方法和系统 |
CN104484645A (zh) * | 2014-11-14 | 2015-04-01 | 华中科技大学 | 一种面向人机交互的“1”手势识别方法与系统 |
CN104809744A (zh) * | 2015-04-29 | 2015-07-29 | 小米科技有限责任公司 | 图片处理方法和装置 |
CN105700372A (zh) * | 2016-03-11 | 2016-06-22 | 珠海格力电器股份有限公司 | 智能设备及其控制方法 |
CN106227351A (zh) * | 2016-07-30 | 2016-12-14 | 深圳市光晕网络科技有限公司 | 一种车载设备的状态转换方法及装置 |
CN106990839A (zh) * | 2017-03-21 | 2017-07-28 | 张文庆 | 一种眼球识别多媒体播放器及其实现方法 |
CN107422859A (zh) * | 2017-07-26 | 2017-12-01 | 广东美的制冷设备有限公司 | 基于手势的调控方法、装置及计算机可读存储介质和空调 |
CN107491755A (zh) * | 2017-08-16 | 2017-12-19 | 京东方科技集团股份有限公司 | 用于手势识别的方法及装置 |
-
2018
- 2018-02-11 CN CN201810153143.4A patent/CN108399009A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488299A (zh) * | 2013-10-15 | 2014-01-01 | 大连市恒芯科技有限公司 | 一种融合人脸和手势的智能终端人机交互方法 |
CN103558911A (zh) * | 2013-10-24 | 2014-02-05 | 广东欧珀移动通信有限公司 | 一种移动终端静音的实现方法及实现系统 |
CN103761508A (zh) * | 2014-01-02 | 2014-04-30 | 大连理工大学 | 一种融合人脸和手势的生物识别方法和系统 |
CN104484645A (zh) * | 2014-11-14 | 2015-04-01 | 华中科技大学 | 一种面向人机交互的“1”手势识别方法与系统 |
CN104809744A (zh) * | 2015-04-29 | 2015-07-29 | 小米科技有限责任公司 | 图片处理方法和装置 |
CN105700372A (zh) * | 2016-03-11 | 2016-06-22 | 珠海格力电器股份有限公司 | 智能设备及其控制方法 |
CN106227351A (zh) * | 2016-07-30 | 2016-12-14 | 深圳市光晕网络科技有限公司 | 一种车载设备的状态转换方法及装置 |
CN106990839A (zh) * | 2017-03-21 | 2017-07-28 | 张文庆 | 一种眼球识别多媒体播放器及其实现方法 |
CN107422859A (zh) * | 2017-07-26 | 2017-12-01 | 广东美的制冷设备有限公司 | 基于手势的调控方法、装置及计算机可读存储介质和空调 |
CN107491755A (zh) * | 2017-08-16 | 2017-12-19 | 京东方科技集团股份有限公司 | 用于手势识别的方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112764349A (zh) * | 2019-11-01 | 2021-05-07 | 佛山市云米电器科技有限公司 | 晾衣架控制方法、晾衣架、系统及存储介质 |
CN114125143A (zh) * | 2020-08-31 | 2022-03-01 | 华为技术有限公司 | 一种语音交互方法及电子设备 |
CN112543359A (zh) * | 2020-11-12 | 2021-03-23 | 海信视像科技股份有限公司 | 一种显示设备及自动配置视频参数的方法 |
CN112543359B (zh) * | 2020-11-12 | 2023-01-20 | 海信视像科技股份有限公司 | 一种显示设备及自动配置视频参数的方法 |
CN112788390A (zh) * | 2020-12-25 | 2021-05-11 | 深圳市优必选科技股份有限公司 | 一种基于人机交互的控制方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399009A (zh) | 利用人机交互手势唤醒智能设备的方法及装置 | |
CN108090458B (zh) | 人体跌倒检测方法和装置 | |
CN109976506B (zh) | 一种电子设备的唤醒方法、存储介质及机器人 | |
WO2020164264A1 (zh) | 人脸图像识别方法、装置及计算机设备 | |
WO2018121428A1 (zh) | 一种活体检测方法、装置及存储介质 | |
CN105139039B (zh) | 视频序列中人脸微表情的识别方法 | |
US8194921B2 (en) | Method, appartaus and computer program product for providing gesture analysis | |
CN101141608B (zh) | 一种视频即时通讯系统及方法 | |
WO2019023921A1 (zh) | 一种手势识别方法、装置及设备 | |
CN106709932A (zh) | 一种人脸位置跟踪方法、装置和电子设备 | |
CN108259758B (zh) | 图像处理方法、装置、存储介质和电子设备 | |
CN109951595A (zh) | 智能调节屏幕亮度的方法、装置、存储介质及移动终端 | |
EP2998960B1 (en) | Method and device for video browsing | |
CN111626371B (zh) | 一种图像分类方法、装置、设备及可读存储介质 | |
CN109190449A (zh) | 年龄识别方法、装置、电子设备及存储介质 | |
CN109284081B (zh) | 一种音频的输出方法、装置及音频设备 | |
CN105528078B (zh) | 控制电子设备的方法及装置 | |
CN103218603A (zh) | 一种人脸自动标注方法及系统 | |
WO2016107037A1 (zh) | 图片分类方法及装置 | |
CN101950358A (zh) | 智能电视自动年龄估计与性别判别的方法 | |
CN109977811A (zh) | 基于嘴部关键位置特征检测实现免语音唤醒的系统及方法 | |
CN109286848B (zh) | 一种终端视频信息的交互方法、装置及存储介质 | |
CN109215010A (zh) | 一种图像质量判断的方法及机器人人脸识别系统 | |
CN108921178A (zh) | 获取图像模糊程度分类的方法、装置、电子设备 | |
CN108318042A (zh) | 导航模式切换方法、装置、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180814 |
|
RJ01 | Rejection of invention patent application after publication |