CN104253944A - 基于目光连接的声音命令下达装置和方法 - Google Patents

基于目光连接的声音命令下达装置和方法 Download PDF

Info

Publication number
CN104253944A
CN104253944A CN201410461030.2A CN201410461030A CN104253944A CN 104253944 A CN104253944 A CN 104253944A CN 201410461030 A CN201410461030 A CN 201410461030A CN 104253944 A CN104253944 A CN 104253944A
Authority
CN
China
Prior art keywords
video camera
sight
human eye
video data
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410461030.2A
Other languages
English (en)
Other versions
CN104253944B (zh
Inventor
陈飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bao Kejie
Original Assignee
陈飞
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 陈飞 filed Critical 陈飞
Priority to CN201410461030.2A priority Critical patent/CN104253944B/zh
Publication of CN104253944A publication Critical patent/CN104253944A/zh
Application granted granted Critical
Publication of CN104253944B publication Critical patent/CN104253944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)
  • Image Processing (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了基于目光连接的声音命令下达装置及方法。该方法包括:11,捕捉摄制以获第一视频数据;12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过t1,如有则获方位信息,再执行步骤2,否则继续执行步骤11;2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线以获得人眼的反光图像;3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和反光图像及位置判断人眼是否正在注视摄像机;4,判断人眼注视是否超过t2,如是则认定目光连接且向对应声音采集器发送命令;5,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它设备访问,并判断对话是否结束,如结束则执行步骤1,如未结束,则忽略对话期间第一视频数据中的人脸相关信息。

Description

基于目光连接的声音命令下达装置和方法
技术领域
本发明涉及一种基于目光连接的声音命令下达装置和方法。
背景技术
语音识别中有一个难点,就是声音采集装置无法判断用户什么时候在和其它对象聊天,什么时候是向语音系统下达命令,目前采用的手段多为通过设定按钮来开启录音,这种方式带来很多不便,而且既然要按下按钮,在操作步骤简单的场景,下达语音命令就有些多余,直接制作不同的按钮按下即可。
发明内容
本发明提供了基于目光连接的声音命令下达装置和方法,其克服了背景技术中声音命令下达装置和方法所存在的不足。
本发明解决其技术问题的所采用的技术方案之一是:
基于目光连接的声音命令下达装置,包括至少一声音采集器、一第一摄像机、一第一分析器、至少一装设有第二摄像机和光线发射器的自动云台、一第二分析器和一控制器;
该第一摄像机用于捕捉摄制可视空间内的图像以获第一视频数据,该第一分析器信号连接第一摄像机以用于分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该用户的人脸所处方位且至少将方位信息传输给控制器;
该控制器信号连接自动云台和光线发射器,该控制器依据方位信息调整自动云台使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,以获得人眼的反光图像;该第二分析器信号连接第二摄像机且分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
该控制器信号连接第二分析器以判断人眼注视是否超过设定时间t2,如是则认定目光连接且向对应实时三维坐标的声音采集器发送命令以控制声音采集器采集声音。
一实施例之中:该光线发射器包括多个发射光源,所发射的光线为固定距离的多个发射光源组合发射,以获得人眼的包含多个反光点的反光图像。
一实施例之中:该每一自动云台的第二摄像机和光线发射器的发射光源相对固定在一起,并保持相对固定的距离,确保采集到的反光点图像的稳定和可计算性。
一实施例之中:该第一摄像机为广角摄像机,该第一分析器为广角图像采集分析器;该第二摄像机为长可变焦摄像机,第二分析器为长焦图像采集分析器。
一实施例之中:该第一分析器将该方位信息和人脸图像传输给控制器;该第二摄像机依据控制器传输的人脸图像进行捕捉及自动变焦调整,使摄制图像调至合适大小。
一实施例之中:还包括一显示装置和一数据库,该数据库内保存有包括与人脸信息一一对应在内的用户信息;该第二分析器还获取人脸信息,控制器获取人脸信息且依据人脸信息获取用户其它信息,并在显示装置上显示该用户相关的其它信息。
一实施例之中:该光线发射器发射出的光线为摄像机能捕捉且不刺激人眼的光线。
一实施例之中:还包括语义分析装置,信号连接控制器和声音采集器。
本发明解决其技术问题的所采用的技术方案之二是:
基于目光连接的声音命令下达方法,包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
步骤12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,然后执行步骤2,否则继续执行步骤11;
步骤2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,所发射的光线为与第二摄像机固定距离的至少一个发射光源组合发射,以获得人眼反射的反光图像;
步骤3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
步骤4,判断人眼注视是否超过设定时间t2,如是则认定目光连接;
步骤5,向对应实时三维坐标的声音采集器发送命令,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它需要语义内容的设备访问,并判断对话是否结束,如结束则执行步骤1,如未结束,则忽略对话期间第一视频数据中转向摄像机组的人脸相关信息。
一实施例之中:该步骤3中,通过分析第二视频数据,还获取人脸图像;
该步骤5中,控制器依据人脸图像从数据库中获取对应的用户信息,还通过显示器显示对话过程中需要显示的提前设定的与该用户相关的其它信息。
本发明解决其技术问题的所采用的技术方案之三是:
基于目光连接的声音命令下达方法,包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
步骤12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,然后执行步骤2,否则继续执行步骤11;
步骤2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,所发射的光线为固定距离的至少一个发射光源组合发射,以获得人眼的反光图像;
步骤3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
步骤4,判断人眼注视是否超过设定时间t2,如是则认定目光连接且同时执行步骤5;
步骤5,向对应实时三维坐标的声音采集器发送命令,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它需要语义内容的设备访问,依据语音内容判断对话是否结束,或者通过特定软件通过人工选择结束对话,如结束则执行步骤6;
步骤6,判断是否还有其它人眼依据上述步骤建立目光连接,如是获取其它人眼中仍然在保持试图建立目光连接人眼序列中的一个的实时三维坐标然后执行步骤5,否则执行步骤1。
一实施例之中:该步骤4种,判断人眼注视是否超过设定时间t2,如是则认定目光连接且同时执行步骤5和步骤7;
该步骤7,包括:
步骤71,判断是否还有其它人眼依据上述步骤建立目光连接,如是执行步骤72,否则执行步骤1;
步骤72,判断其它人眼是否断开目光连接且断开时间超过设定时间t3,如是则直接执行步骤71,否则第二摄像机继续朝向该目光连接的人眼,然后执行步骤71。
本技术方案与背景技术相比,它具有如下优点:
依据目光对接确认声音是否向设备发出命令,如是采集声音执行命令,因此能克服背景技术中所存在的不足。先判断方位,再依据方位调整控制摄像机摄像,依据光线发射器发射信号,通过人眼图像和经人眼的反光点的图像及位置判断是否目光对接,判断准确,误操作率低,方便快速。目光连接为准确的一对一连接,解决了传统技术无法判断用户是跟其它人说话还是在向系统下达命令的问题。通过人脸的实时三维坐标控制该对应的声音采集器采集声音,声音清晰,避免杂音,成本低,能耗低。还通过显示器显示对话过程中需要显示的提前设定的与该用户的其它信息,能让其它用户了解谁建立了连接,也能让建立连接的用户获得一定的视觉反馈。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1绘示了基于目光连接的声音命令下达装置的示意图。
具体实施方式
请查阅图1,基于目光连接的声音命令下达装置,包括至少一声音采集器1、一第一摄像机7、一第一分析器8、至少一装设有第二摄像机2和光线发射器3的自动云台4、一第二分析器5和一控制器6。该第一摄像机7为广角摄像机7,根据需要,也可采用其它摄像机,如普通摄像机,该第一分析器8为广角图像采集分析器8,如采用其它摄像机,则相应的可改用普通图像采集分析器;该第二摄像机2为长可变焦摄像机2,根据需要,也可采用其它摄像机,如普通摄像机,第二分析器3为长焦图像采集分析器3,如采用其它摄像机,则相应的可改用普通图像采集分析器。该光线发射器3发射出的光线为摄像机能捕捉且对人眼不刺激的光线,例如红外光发射器或紫外光发射器。该声音采集器1选用定向声音采集器。
该控制器6信号连接所有声音采集器1、第一分析器8、所有自动云台4、第二分析器5、所有光线发射器3;该第二分析器5信号连接所有第二摄像机2,该第一分析器8信号连接第一摄像机7。
该第一摄像机7用于捕捉摄制可视空间内的图像以获第一视频数据;该第一分析器8分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该用户的人脸所处方位且至少将方位信息传输给控制器6,其例如采用如下方式判断持续停留时间:第一视频数据是由第一摄像机7摄制固定场所的图像连续组成的,判断图像某位置上是否有人脸转向摄像机组方向(例如通过脸形及五官相对位置判断是否为转向摄像机组的人脸),依据连续有同一人脸转向摄像机组方向的图像张数判断该持续停留时间,依据人脸图像所处位置判断人脸所处方位。
该控制器6信号连接第一分析器8以至少获取方位信息。该控制器6信号连接自动云台4,依据方位信息调整自动云台4,使自动云台4之上的第二摄像机2朝向该方位以能摄制人脸,使自动云台4之上的光线发射器3朝向人眼,该控制器6信号连接光线发射器3以控制光线发射器3能向人眼发射光线,所发射的光线为固定距离的至少一个发射光源组合发射,以获得人眼不同部位的多个反光点组成的反光图像。根据需要,可选择一个发射光源发射单个光线以在人眼的不同部位产生多个反光点,或者,包括多个发射光源发射多个光线以产生多个发光点,当然,不管是一个发射光源还是多个发射光源,该发射光源都相对第二摄像机固定。最好采用多个发射光源,其中,该每一自动云台的第二摄像机和光线发射器的多个发射光源相对固定在一起,确保采集到的反光点图像的稳定和可计算性。图中发射光源个数为n个,相邻的发射光源间隔布置且相对固定,11-nn表示发射光源编号,其中有n个自动云台,n表示各个平台的编号。本实施例之中,该自动云台4例如包括一底座、一能相对底座活动的平台、一传动连接在平台和底座的传动机构及多个驱动机构,驱动机构驱动传动机构,以能带动平台活动,该活动例如包括上下左右前后移动、竖直面转动、水平面转动之类,或者,该活动只包括水平面转动之类,等等。
该第二摄像机2摄制人脸以获第二视频数据。该第二分析器5信号连接第二摄像机2且分析第二视频数据,以获人脸的实时三维坐标,且依据人眼图像和经人眼的多个反光点的反光图像及位置判断人眼是否正在注视摄像机,其中由于光线发射器和摄像机固定,因此根据人眼图形和反光点在人眼图像的位置及反光点之间的图像及位置,既,能根据人眼图像和该反光点的图像及位置判断人眼是否正在注视摄像机。该控制器信号连接第二分析器以判断人眼注视是否超过设定时间t2,如是则认定目光连接且向对应该实时三维坐标的声音采集器1发送命令,启动可以覆盖该位置的定向声音采集器进行声音采集。该声音采集器1优选为多组,平均分布在整个摄像机组可视空间范围内,分布位置最好可将任何位置上的声音进行清晰采集,并且尽量减少周围杂音。
最好,还包括语义分析装置9,信号连接控制器6和声音采集器1,语义分析装置9采集声音且识别声音获语义内容,将语义内容提供给其它需要语义信息的设备访问。该其它需要语义信息的设备是指能访问语义分析装置9的供用户控制的设备。该语义分析装置,还依据语义内容判断该目标对话是否结束,如是则对话结束且发送相关信息给控制器,则将第一摄像机当前的采集目标信息控制云台转向,进入下一轮循环;如对话未结束,则保持云台控制第二摄像机的持续追踪,且忽略对话期间第一视频数据中转向摄像机组的人脸相关信息。根据需要,否则还判断没有语音的持续时间是否达到设定阀值,如是则对话结束且发送相关信息给控制器,否则继续判断。其中,单句语音命令结束可不视为对话结束。
优选方案中,该第一分析器2将方位信息和人脸图像一起传输给控制器6,该第二摄像机2依据控制器6传输的人脸图像进行捕捉及自动变焦以使摄制的视频中的人脸至合适大小,以可清晰捕捉到被捕捉人脸的眼球上的光线发射器造成的反光点。最好,控制器5除获取反射光线和三维信息外,还获取第二分析器5中第二视频数据中的人脸;本实施例的装置还包括显示装置10,显示装置10信号连接控制器6,显示装置10能显示第二摄像机2摄制的人脸,使人脸和采集的声音数据一一对应。根据需要,控制器6还可信号连接数据库,数据库中保存有一一对应的人脸和用户信息,则控制器6识别人脸并获取用户的其它信息(如人脸外的其它信息,如姓名、工作号、应用所需个性化参数等),显示装置10可显示提前设定的与该用户相关的其它信息,使用户信息和采集的声音数据一一对应,表示该命令终端已被该目标占用。
基于目光连接的声音命令下达方法,包括:
步骤11,第一摄像机捕捉摄制可视空间内的图像以获得第一视频数据;
步骤12,第一分析器分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,至少将方位信息传送给控制器,然后执行步骤2,否则继续执行步骤11;
步骤2,控制器6依据方位信息调整自动云台使第二摄像机摄制人脸以获第二视频数据,控制发射器发射光线,所发射的光线为固定距离的多个发射光源组合发射,以获得人眼的包含多个反光点的图像;而且,最好,第二摄像机还依据人脸图像进行捕捉及自动变焦调整,使图像至合适大小。
步骤3,第二分析器5获取并分析第二视频数据,以获人脸实时三维坐标、人脸图像,且依据人眼图像和经人眼的多个反光点的图像及位置判断人眼是否正在注视摄像机;
步骤4,控制器5信号连接第二分析器5以判断人眼注视是否超过设定时间t2,如超过t2则认定目光连接且向对应该实时三维坐标的声音采集器1发送命令;
步骤51,启动可以覆盖该位置的定向声音采集器采集声音;第二分析器还将人脸图像传送给控制器,控制器依据人脸图像从数据库中获取对应的用户信息,还通过显示器显示对话过程中需要显示的提前设定的与该用户信息相关的按照预设策略需要显示的其它信息;
步骤52,语义分析装置9信号连接控制器6和声音采集器1,语义分析装置9采集声音且识别声音获知语义内容,将语义内容提供给其它需要语义信息的设备访问。该语义分析装置,依据语义内容判断该目标对话是否结束,如是则对话结束且发送相关信息给控制器,否则判断没有语音的持续时间是否达到设定阀值,如是则对话结束且发送相关信息给控制器,否则继续判断。其中,单句语音命令结束可不视为对话结束。本实施例之中,根据语义分析装置对语音的分析结果,如该目标对话阶段未结束,则忽略对话期间第一视频数据中转向摄像机组的人脸相关信息,则保持云台控制第二摄像机的持续追踪,如该目标对话阶段结束,则将第一摄像机当前的采集目标信息控制云台转向,进入下一轮循环,执行步骤11。
另一较佳实施例之中,基于目光连接的声音命令下达方法,包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
步骤12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,然后执行步骤2,否则继续执行步骤11;
步骤2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,所发射的光线为固定距离的至少一个发射光源组合发射,以获得人眼的反光图像;
步骤3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
步骤4,判断人眼注视是否超过设定时间t2,如是则认定目光连接且同时执行步骤5和步骤7;
步骤5,向对应实时三维坐标的声音采集器发送命令,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它需要语义内容的设备访问,依据语音内容判断对话是否结束,或者通过特定软件通过人工选择结束对话,如结束则执行步骤6;
步骤6,判断是否还有其它人眼依据上述步骤建立目光连接,如是获取其它人眼中下一仍然在保持试图建立目光连接人眼序列中的一个的实时三维坐标然后执行步骤5,否则执行步骤1。
该步骤7,包括:
步骤71,判断是否还有其它人眼依据上述步骤建立目光连接,如是执行步骤72,否则执行步骤1;
步骤72,判断其它人眼是否断开目光连接且断开时间超过设定时间t3,如是则直接执行步骤71,否则第二摄像机继续朝向该目光连接的人眼,然后执行步骤71。
以上所述,仅为本发明较佳实施例而已,故不能依此限定本发明实施的范围,即依本发明专利范围及说明书内容所作的等效变化与修饰,皆应仍属本发明涵盖的范围内。

Claims (12)

1.基于目光连接的声音命令下达装置,其特征在于:包括至少一声音采集器、一第一摄像机、一第一分析器、至少一装设有第二摄像机和光线发射器的自动云台、一第二分析器和一控制器;
该第一摄像机用于捕捉摄制可视空间内的图像以获第一视频数据,该第一分析器信号连接第一摄像机以用于分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该用户的人脸所处方位且至少将方位信息传输给控制器;
该控制器信号连接自动云台和光线发射器,该控制器依据方位信息调整自动云台使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,以获得人眼的反光图像;该第二分析器信号连接第二摄像机且分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
该控制器信号连接第二分析器以判断人眼注视是否超过设定时间t2,如是则认定目光连接且向对应实时三维坐标的声音采集器发送命令以控制声音采集器采集声音。
2.根据权利要求1所述的基于目光连接的声音命令下达装置,其特征在于:该光线发射器包括多个发射光源,所发射的光线为固定距离的多个发射光源组合发射,以获得人眼的包含多个反光点的反光图像。
3.根据权利要求2所述的基于目光连接的声音命令下达装置,其特征在于:该每一自动云台的第二摄像机和光线发射器的发射光源相对固定在一起,并保持相对固定的距离,确保采集到的反光点图像的稳定和可计算性。
4.根据权利要求1所述的基于目光连接的声音命令下达装置,其特征在于:该第一摄像机为广角摄像机,该第一分析器为广角图像采集分析器;该第二摄像机为长可变焦摄像机,第二分析器为长焦图像采集分析器。
5.根据权利要求1所述的基于目光连接的声音命令下达装置,其特征在于:该第一分析器将该方位信息和人脸图像传输给控制器;该第二摄像机依据控制器传输的人脸图像进行捕捉及自动变焦调整,使摄制图像调至合适大小。
6.根据权利要求1所述的基于目光连接的声音命令下达装置,其特征在于:还包括一显示装置和一数据库,该数据库内保存有包括一一对应人脸信息在内的用户信息;该第二分析器还获取人脸信息,控制器获取人脸信息且依据人脸信息获取用户其它信息,并在显示装置上显示该用户相关的其它信息。
7.根据权利要求1所述的基于目光连接的声音命令下达装置,其特征在于:该光线发射器发射出的光线为摄像机能捕捉且不刺激人眼的光线。
8.根据权利要求1所述的基于目光连接的声音命令下达装置,其特征在于:还包括语义分析装置,信号连接控制器和声音采集器。
9.基于目光连接的声音命令下达方法,其特征在于:包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
步骤12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,然后执行步骤2,否则继续执行步骤11;
步骤2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,所发射的光线为固定距离的至少一个发射光源组合发射,以获得人眼的反光图像;
步骤3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
步骤4,判断人眼注视是否超过设定时间t2,如是则认定目光连接;
步骤5,向对应实时三维坐标的声音采集器发送命令,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它需要语义内容的设备访问,并判断对话是否结束,如结束则执行步骤1,如未结束,则忽略对话期间第一视频数据中转向摄像机组的人脸相关信息。
10.根据权利要求9所述的基于目光连接的声音命令下达方法,其特征在于:
该步骤3中,通过分析第二视频数据,还获取人脸图像;
该步骤5中,控制器依据人脸图像从数据库中获取对应的用户信息,还通过显示器显示对话过程中需要显示的提前设定的与该用户相关的其它信息。
11.基于目光连接的声音命令下达方法,其特征在于:包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
步骤12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,然后执行步骤2,否则继续执行步骤11;
步骤2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,所发射的光线为固定距离的至少一个发射光源组合发射,以获得人眼的反光图像;
步骤3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
步骤4,判断人眼注视是否超过设定时间t2,如是则认定目光连接且同时执行步骤5;
步骤5,向对应实时三维坐标的声音采集器发送命令,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它需要语义内容的设备访问,依据语音内容判断对话是否结束,如结束则执行步骤6;
步骤6,判断是否还有其它人眼依据上述步骤建立目光连接,如是获取其它人眼中仍然在保持试图建立目光连接人眼序列中的一个的实时三维坐标然后执行步骤5,否则执行步骤1。
12.根据权利要求11所述的基于目光连接的声音命令下达方法,其特征在于:
该步骤4种,判断人眼注视是否超过设定时间t2,如是则认定目光连接且同时执行步骤5和步骤7;
该步骤7,包括:
步骤71,判断是否还有其它人眼依据上述步骤建立目光连接,如是执行步骤72,否则执行步骤1;
步骤72,判断其它人眼是否断开目光连接且断开时间超过设定时间t3,如是则直接执行步骤71,否则第二摄像机继续朝向该目光连接的人眼,然后执行步骤71。
CN201410461030.2A 2014-09-11 2014-09-11 基于目光连接的声音命令下达装置和方法 Active CN104253944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410461030.2A CN104253944B (zh) 2014-09-11 2014-09-11 基于目光连接的声音命令下达装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410461030.2A CN104253944B (zh) 2014-09-11 2014-09-11 基于目光连接的声音命令下达装置和方法

Publications (2)

Publication Number Publication Date
CN104253944A true CN104253944A (zh) 2014-12-31
CN104253944B CN104253944B (zh) 2018-05-01

Family

ID=52188441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410461030.2A Active CN104253944B (zh) 2014-09-11 2014-09-11 基于目光连接的声音命令下达装置和方法

Country Status (1)

Country Link
CN (1) CN104253944B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930775A (zh) * 2016-04-14 2016-09-07 中南大学 基于灵敏度参数的人脸朝向识别方法
CN106251870A (zh) * 2015-06-08 2016-12-21 罗伯特·博世有限公司 识别语音控制用的语境的方法、求出语音控制用的语音控制信号的方法及实施该方法的设备
CN106257355A (zh) * 2015-06-18 2016-12-28 松下电器(美国)知识产权公司 设备控制方法和控制器
CN107548483A (zh) * 2015-03-27 2018-01-05 法雷奥舒适驾驶助手公司 控制方法、控制装置、系统以及包括这样的控制装置的机动车辆
CN109684935A (zh) * 2018-12-03 2019-04-26 深圳蚂里奥技术有限公司 一种高精度3d人脸采集、支付系统及方法
CN110351476A (zh) * 2018-04-03 2019-10-18 佳能株式会社 摄像设备和非暂时性记录介质
CN111310806A (zh) * 2020-01-22 2020-06-19 北京迈格威科技有限公司 分类网络及图像处理方法、装置、系统和存储介质
US11102389B2 (en) 2017-09-28 2021-08-24 Canon Kabushiki Kaisha Image pickup apparatus and control method therefor

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035452A1 (en) * 2000-10-24 2002-05-02 Alpha Engineering Co., Ltd. Eye image obtaining method, iris recognizing method, and system using the same
CN1423228A (zh) * 2002-10-17 2003-06-11 南开大学 识别人眼注视方向的装置和方法及其应用
US20060271258A1 (en) * 2004-08-24 2006-11-30 Ford Motor Company Adaptive voice control and vehicle collision warning and countermeasure system
CN1901663A (zh) * 2006-07-25 2007-01-24 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
CN101340562A (zh) * 2008-04-28 2009-01-07 安防科技(中国)有限公司 监控系统与监控方法
CN101520838A (zh) * 2008-02-27 2009-09-02 中国科学院自动化研究所 自动跟踪和自动变焦的虹膜图像获取方法
CN201307266Y (zh) * 2008-06-25 2009-09-09 韩旭 双目视线跟踪装置
CN101690165A (zh) * 2007-02-02 2010-03-31 百诺克公司 尤其用于拍照的基于无意识的眼睛信号的控制方法
CN101813976A (zh) * 2010-03-09 2010-08-25 华南理工大学 基于soc的视线跟踪人机交互方法及装置
CN101945612A (zh) * 2008-02-14 2011-01-12 诺基亚公司 用于确定注视方向的设备和方法
CN102496005A (zh) * 2011-12-03 2012-06-13 辽宁科锐科技有限公司 基于眼球特征的审讯辅助研判分析系统
US20120259638A1 (en) * 2011-04-08 2012-10-11 Sony Computer Entertainment Inc. Apparatus and method for determining relevance of input speech
CN102749991A (zh) * 2012-04-12 2012-10-24 广东百泰科技有限公司 一种适用于人机交互的非接触式自由空间视线跟踪方法
CN102749990A (zh) * 2011-04-08 2012-10-24 索尼电脑娱乐公司 通过追踪用户视线和姿态提供反馈的系统和方法
CN102830797A (zh) * 2012-07-26 2012-12-19 深圳先进技术研究院 一种基于视线判断的人机交互方法及系统
CN103885743A (zh) * 2012-12-24 2014-06-25 大陆汽车投资(上海)有限公司 结合注视跟踪技术的语音文本输入方法和系统

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035452A1 (en) * 2000-10-24 2002-05-02 Alpha Engineering Co., Ltd. Eye image obtaining method, iris recognizing method, and system using the same
CN1423228A (zh) * 2002-10-17 2003-06-11 南开大学 识别人眼注视方向的装置和方法及其应用
US20060271258A1 (en) * 2004-08-24 2006-11-30 Ford Motor Company Adaptive voice control and vehicle collision warning and countermeasure system
CN1901663A (zh) * 2006-07-25 2007-01-24 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
CN101690165A (zh) * 2007-02-02 2010-03-31 百诺克公司 尤其用于拍照的基于无意识的眼睛信号的控制方法
CN101945612A (zh) * 2008-02-14 2011-01-12 诺基亚公司 用于确定注视方向的设备和方法
CN101520838A (zh) * 2008-02-27 2009-09-02 中国科学院自动化研究所 自动跟踪和自动变焦的虹膜图像获取方法
CN101340562A (zh) * 2008-04-28 2009-01-07 安防科技(中国)有限公司 监控系统与监控方法
CN201307266Y (zh) * 2008-06-25 2009-09-09 韩旭 双目视线跟踪装置
CN101813976A (zh) * 2010-03-09 2010-08-25 华南理工大学 基于soc的视线跟踪人机交互方法及装置
US20120259638A1 (en) * 2011-04-08 2012-10-11 Sony Computer Entertainment Inc. Apparatus and method for determining relevance of input speech
CN102749990A (zh) * 2011-04-08 2012-10-24 索尼电脑娱乐公司 通过追踪用户视线和姿态提供反馈的系统和方法
CN102799262A (zh) * 2011-04-08 2012-11-28 索尼电脑娱乐公司 用于确定输入语音的相关性的装置和方法
CN102496005A (zh) * 2011-12-03 2012-06-13 辽宁科锐科技有限公司 基于眼球特征的审讯辅助研判分析系统
CN102749991A (zh) * 2012-04-12 2012-10-24 广东百泰科技有限公司 一种适用于人机交互的非接触式自由空间视线跟踪方法
CN102830797A (zh) * 2012-07-26 2012-12-19 深圳先进技术研究院 一种基于视线判断的人机交互方法及系统
CN103885743A (zh) * 2012-12-24 2014-06-25 大陆汽车投资(上海)有限公司 结合注视跟踪技术的语音文本输入方法和系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107548483A (zh) * 2015-03-27 2018-01-05 法雷奥舒适驾驶助手公司 控制方法、控制装置、系统以及包括这样的控制装置的机动车辆
CN106251870A (zh) * 2015-06-08 2016-12-21 罗伯特·博世有限公司 识别语音控制用的语境的方法、求出语音控制用的语音控制信号的方法及实施该方法的设备
CN106257355A (zh) * 2015-06-18 2016-12-28 松下电器(美国)知识产权公司 设备控制方法和控制器
CN105930775A (zh) * 2016-04-14 2016-09-07 中南大学 基于灵敏度参数的人脸朝向识别方法
CN105930775B (zh) * 2016-04-14 2019-07-19 中南大学 基于灵敏度参数的人脸朝向识别方法
US11102389B2 (en) 2017-09-28 2021-08-24 Canon Kabushiki Kaisha Image pickup apparatus and control method therefor
CN110351476A (zh) * 2018-04-03 2019-10-18 佳能株式会社 摄像设备和非暂时性记录介质
CN110351476B (zh) * 2018-04-03 2021-07-13 佳能株式会社 摄像设备和非暂时性记录介质
US11265477B2 (en) 2018-04-03 2022-03-01 Canon Kabushiki Kaisha Image capturing apparatus and non-transitory recording medium
CN109684935A (zh) * 2018-12-03 2019-04-26 深圳蚂里奥技术有限公司 一种高精度3d人脸采集、支付系统及方法
CN111310806A (zh) * 2020-01-22 2020-06-19 北京迈格威科技有限公司 分类网络及图像处理方法、装置、系统和存储介质
CN111310806B (zh) * 2020-01-22 2024-03-15 北京迈格威科技有限公司 分类网络及图像处理方法、装置、系统和存储介质

Also Published As

Publication number Publication date
CN104253944B (zh) 2018-05-01

Similar Documents

Publication Publication Date Title
CN104253944A (zh) 基于目光连接的声音命令下达装置和方法
US11388333B2 (en) Audio guided image capture method and device
CN101072332A (zh) 一种自动跟踪活动目标进行拍摄的方法
CN104144353B (zh) 基于智能电视的多区域环境光管理控制方法
CN105163061A (zh) 远端视频交互系统
CN110062205A (zh) 运动目标识别、跟踪装置及方法
WO2020078440A1 (zh) 采集高清晰度面部图像的装置和摄像头云台自动俯仰调节的方法
CN108650494B (zh) 基于语音控制的可即时获取高清照片的直播系统
US9615015B2 (en) Systems methods for camera control using historical or predicted event data
CN103338331A (zh) 一种采用眼球控制对焦的图像采集系统
CN203151686U (zh) 采用手势识别遥控器的智能电视
CN109451233B (zh) 一种采集高清晰度面部图像的装置
CN105279490A (zh) 一种人机交互式虹膜图像自动采集装置
CN105100635A (zh) 摄像头装置及摄像头控制方法
CN108234881A (zh) 一种语音控制的网络摄像机、视频监控系统以及控制方法
CN106598288A (zh) 激光笔鼠标定位系统及方法
WO2018121730A1 (zh) 视频监控和人脸识别方法、装置及系统
JP7187768B2 (ja) カメラ装置、カメラ装置制御システム、及びプログラム
CN103546672A (zh) 一种图像采集系统
CN108696725A (zh) 一种基于互联网的摄像头远程控制方法及系统
CN102361495A (zh) 投影控制方法及投影设备
EP3598744B1 (en) Pan-tilt control method, device and system
CN110413122A (zh) 一种具有工作场景识别的ar眼镜应用方法及系统
WO2021035704A1 (zh) 成像装置的对焦方法、组件、成像装置和可移动物体
CN201839377U (zh) 全场景红外分离自动跟踪装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20171101

Address after: Hangzhou City, Zhejiang province 310000 Binjiang District Albert Road, building 2 Room 202 rainbow heights

Applicant after: Chen Fei

Applicant after: Bao Kejie

Address before: Hangzhou City, Zhejiang province 310000 Binjiang District Albert Road, building 2 Room 202 rainbow heights

Applicant before: Chen Fei

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant