CN114095648A - 一种手势控制摄像头转动的方法和装置 - Google Patents
一种手势控制摄像头转动的方法和装置 Download PDFInfo
- Publication number
- CN114095648A CN114095648A CN202011375768.9A CN202011375768A CN114095648A CN 114095648 A CN114095648 A CN 114095648A CN 202011375768 A CN202011375768 A CN 202011375768A CN 114095648 A CN114095648 A CN 114095648A
- Authority
- CN
- China
- Prior art keywords
- gesture
- camera
- rotation
- instruction
- distance information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 230000001960 triggered effect Effects 0.000 claims description 10
- 230000003993 interaction Effects 0.000 abstract description 3
- 230000002452 interceptive effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及摄像头装置控制技术领域,特别是涉及一种手势控制摄像头转动的方法和装置,其方法包括,获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令,而加强了手势控制摄像头转动的的规律性,增强了人机交互的交互乐趣。
Description
技术领域
本发明涉及摄像头装置控制技术领域,特别是涉及一种手势控制摄像头转动的方法和装置。
背景技术
随着科技的发展,越来越多的智能终端逐渐走进用户的生活,例如,机顶盒、电视机、电脑等。但是当前的智能终端一般都需要用户通过键盘、鼠标或者遥控器等设备等控制指令发送装置发送控制指令至智能终端,实现对智能终端的控制。因此,往往操作较为繁琐,且当控制指令发送装置距离用户较远时,则无法实现对智能终端的控制。
现有技术中,已出现通过声源、光源等控制智能终端的方法,也出现了通过手势识别以达到控制的方法,其基本原理是通过手势识别模型对图像中的手势进行识别,确定与手势特征对应的操作指令,从而控制终端执行。
但就现有而言,手势识别较慢,单个手势保持时间较长,对动态手势识别能力较弱,而且大多数手势通过摄像头采集后识别,很少有用于控制摄像头转动上,特别是需要定点拍摄转换后转换角度比较麻烦。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种手势控制摄像头转动的方法和装置。
为了解决上述问题,本发明实施例公开了一种手势控制摄像头转动的方法,包括:
获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;
确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;
获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
进一步的,所述获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令,包括:
提取多帧手势图像中的目标手势的特征参数进行训练,得到存储多种可识别的手势特征的手势识别模型;
对所述训练模型中的每一手势特征匹配对应的控制指令,其中,当每一手势为第一手势时,触发摄像头转动的启动指令。
进一步的,所述确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动,包括:
获取摄像头的水平视场角大小和当前帧图像的水平方向的像素大小,确定单位视场角所对应的像素大小的信息;
根据所述单位视场角所对应的像素大小的信息,计算所述第一距离信息对应的视场角大小,得到第一转动角度;
驱动所述摄像头转动所述第一转动角度的角度值。
进一步的,所述驱动指令为转动指令,包括:
确定所述第二手势在所述下一帧图像中的位置参数,计算所述第二手势中心与所述下一帧图像中心的第二距离信息;
若该第二距离信息中的距离值大于第一距离信息中的距离值,则所述第二手势为转动指令,计算所述第二距离信息对应的视场角大小,得到第二转动角度,根据所述转动指令驱动所述摄像头按所述第二角度的角度值转动;
若该第二距离信息中的距离值小于第一距离信息中的距离值,则所述第二指令所对应的转动指令为无效指令。
进一步的,所述驱动指令为停止指令,包括:
确定所述第二手势的特征参数,根据所述手势识别模型确认为所述停止指令;
关闭所述摄像头转动的启动指令,重新调用预设的手势识别模型对所述第一手势的特征参数进行识别。
还提供一种手势控制摄像头转动的装置,包括:
第一手势识别模块,用于获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;
摄像头驱动模块,用于确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;
第二手势识别模块,用于获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
进一步的,所述第一手势识别模块,包括:
手势训练模块,用于提取多帧手势图像中的目标手势的特征参数进行训练,得到存储多种可识别的手势特征的手势识别模型;
指令匹配模块,用于对所述训练模型中的每一手势特征匹配对应的控制指令,其中,当每一手势为第一手势时,触发摄像头转动的启动指令。
进一步的,所述摄像头驱动模块,包括:
视场角确定模块,用于获取摄像头的水平视场角大小和当前帧图像的水平方向的像素大小,确定单位视场角所对应的像素大小的信息;
转动角度确定模块,用于根据所述单位视场角所对应的像素大小的信息,计算所述第一距离信息对应的视场角大小,得到第一转动角度;
驱动子模块,用于驱动所述摄像头转动所述第一转动角度的角度值。
还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现所述的手势控制摄像头转动的方法。
还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现所述的手势控制摄像头转动的方法。
本发明实施例包括以下优点:
本发明所提供的手势控制摄像头转动的方法,在首次识别到第一手势时,第一手势可以是任意可识别的手势,即可开启摄像头的转动指令,摄像头会自动转动至与手势相对应的位置,然后进行对手势的第二次识别来控制摄像头进一步转动控制,从而加强了手势控制摄像头转动的的规律性,增强了人机交互的交互乐趣。
附图说明
图1是本发明的一种手势控制摄像头转动的方法实施例的步骤流程图;
图2是本发明的一种手势控制摄像头转动的装置实施例的结构框图;
图3是本发明的一种手势控制摄像头转动的计算机设备的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例的基于声源定位控制摄像头转动的方法可以应用于任何配置了语音功能和图像识别功能的终端设备,例如,智能手机、平板电脑、智能家居等终端设备,本发明对此不作限制,从而能够使得用户在使用这些终端设备的过程中获得更及时准确的响应。
本申请实施例中对所应用的摄像头要求较低,普通的单目摄像头即可,但需要搭载一个可360度控制旋转的云台,以满足手势控制的需要。
如图1,示出了一种手势控制摄像头转动的方法,包括:
S100,获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;
S200,确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;
在步骤S100中,获取图像以及图像的参数可以为任一智能终端,该智能终端与摄像头和云台连接,为节约资源,该终端不会一直处于手势识别状态,即,只有当有手势图像输入时,才会触发对手势识别的识别指令。但在识别指令触发前,对摄像头所拍摄的每一帧图像都要进行目标识别,此处的目标识别有可能是人脸识别、手势识别、光源识别以及结合等,当任一所识别的目标特征输入时,才会对具体对应的训练模型对该目标进行精确识别;
所述获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令,包括:
提取多帧手势图像中的目标手势的特征参数进行训练,得到存储多种可识别的手势特征的手势识别模型;
对所述训练模型中的每一手势特征匹配对应的控制指令,其中,当每一手势为第一手势时,触发摄像头转动的启动指令。
本申请实施例旨在控制摄像头从启动、转动到停止的循环过程。当前帧实时首次获取到第一手势的特帧参数,通过手势识别模型对其识别为训练样本中的任一样本手势即可,触发摄像头转动的启动命令。
在步骤S200中,根据第一手势在当前帧图像中的位置参数,可第一时间确定摄像头转动方向信息,所述确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动,包括:
获取摄像头的水平视场角大小和当前帧图像的水平方向的像素大小,确定单位视场角所对应的像素大小的信息;
也即,通过上述步骤,确定摄像头的转动角度与图像像素点偏移距离之间的关系;
根据所述单位视场角所对应的像素大小的信息,计算所述第一距离信息对应的视场角大小,得到第一转动角度;
驱动所述摄像头转动所述第一转动角度的角度值。
按照第一转动角度转动摄像头,摄像头的中心与第一手势的中心相对,转动后的摄像头所采集的图像的中心也与所述第一手势的中心相对。
在本实施例中,对具有手势图像进行训练时,提取手势的特征参数中包括手部各个关节点的相对位置特征、手部组合成多个手势的形状特征以及用于识别手部大小的区域特征,通过第一手势的区域特征可确定所述第一手势的中心位置参数。
S300,获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
在步骤S300中,所述驱动指令为转动指令,包括:
确定所述第二手势在所述下一帧图像中的位置参数,计算所述第二手势中心与所述下一帧图像中心的第二距离信息;
若该第二距离信息中的距离值大于第一距离信息中的距离值,则所述第二手势为转动指令,计算所述第二距离信息对应的视场角大小,得到第二转动角度,根据所述转动指令驱动所述摄像头按所述第二角度的角度值转动;
若该第二距离信息中的距离值小于第一距离信息中的距离值,则所述第二指令所对应的转动指令为无效指令;
根据上述指令,即便第二指令为预存指令中的其中一种转动指令,在第二距离过小的情况下,该转动指令仍无法被触发,目的在于减少摄像头不必要的转动,提高摄像头视频采集的精准度。
所述驱动指令为停止指令,包括:
确定所述第二手势的特征参数,根据所述手势识别模型确认为所述停止指令;
关闭摄像头转动的启动指令,重新调用预设的手势识别模型对所述第一手势的特征参数进行识别。
当识别第二手势为停止指令时,将在下下一帧图像时,所识别的手势不在识别为转动指令,可设置一定的关闭时间阈值,即在一定时间段内,手势指令不在对摄像头起到控制作用。
本发明所提供的手势控制摄像头转动的方法,在首次识别到第一手势时,第一手势可以是任意可识别的手势,即可开启摄像头的转动指令,摄像头会自动转动至与手势相对应的位置,然后进行对手势的第二次识别来控制摄像头进一步转动控制,从而加强了手势控制摄像头转动的的规律性,增强了人机交互的交互乐趣。
如图2,本申请实施例还提供一种手势控制摄像头转动的装置,包括:
第一手势识别模块100,用于获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;
摄像头驱动模块200,用于确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;
第二手势识别模块300,用于获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
在一实施例中,所述第一手势识别模块100,包括:
手势训练模块,用于提取多帧手势图像中的目标手势的特征参数进行训练,得到存储多种可识别的手势特征的手势识别模型;
指令匹配模块,用于对所述训练模型中的每一手势特征匹配对应的控制指令,其中,当每一手势为第一手势时,触发摄像头转动的启动指令。
在一实施例中,所述摄像头驱动模块200,包括:
视场角确定模块,用于获取摄像头的水平视场角大小和当前帧图像的水平方向的像素大小,确定单位视场角所对应的像素大小的信息;
转动角度确定模块,用于根据所述单位视场角所对应的像素大小的信息,计算所述第一距离信息对应的视场角大小,得到第一转动角度;
驱动子模块,用于驱动所述摄像头转动所述第一转动角度的角度值。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图3,示出了本发明的一种手势控制摄像头转动的计算机设备,具体可以包括如下:
在本发明实施例中,本发明还提供一种计算机设备,上述计算机设备12以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,外围总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线18,增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)31和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD~ROM,DVD~ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具41,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN)和/或公共网络(例如因特网)通信。如图所示,网络适配器21通过总线18与计算机设备12的其他模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。
处理单元16通过运行存储在系统存储器28中的程序,执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种手势控制摄像头转动的方法。
即上述处理单元16执行上述程序时实现:获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的一种手势控制摄像头转动的方法。
也即,给程序被处理器执行时实现:获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPOM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD~ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,改计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种手势控制摄像头转动的方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种手势控制摄像头转动的方法,其特征在于,包括:
获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;
确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;
获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
2.根据权利要求1所述的方法,其特征在于,所述获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令,包括:
提取多帧手势图像中的目标手势的特征参数进行训练,得到存储多种可识别的手势特征的手势识别模型;
对所述训练模型中的每一手势特征匹配对应的控制指令,其中,当每一手势为第一手势时,触发摄像头转动的启动指令。
3.根据权利要求1所述的方法,其特征在于,所述确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动,包括:
获取摄像头的水平视场角大小和当前帧图像的水平方向的像素大小,确定单位视场角所对应的像素大小的信息;
根据所述单位视场角所对应的像素大小的信息,计算所述第一距离信息对应的视场角大小,得到第一转动角度;
驱动所述摄像头转动所述第一转动角度的角度值。
4.根据权利要求3所述的方法,其特征在于,所述驱动指令为转动指令,包括:
确定所述第二手势在所述下一帧图像中的位置参数,计算所述第二手势中心与所述下一帧图像中心的第二距离信息;
若该第二距离信息中的距离值大于第一距离信息中的距离值,则所述第二手势为转动指令,计算所述第二距离信息对应的视场角大小,得到第二转动角度,根据所述转动指令驱动所述摄像头按所述第二角度的角度值转动;
若该第二距离信息中的距离值小于第一距离信息中的距离值,则所述第二指令所对应的转动指令为无效指令。
5.根据权利要求1所述的方法,其特征在于,所述驱动指令为停止指令,包括:
确定所述第二手势的特征参数,根据所述手势识别模型确认为所述停止指令;
关闭所述摄像头转动的启动指令,重新调用预设的手势识别模型对所述第一手势的特征参数进行识别。
6.一种手势控制摄像头转动的装置,其特征在于,包括:
第一手势识别模块,用于获取当前帧图像中第一手势的特征参数,调用预设的手势识别模型对所述第一手势的特征参数进行识别,触发摄像头转动的启动指令;
摄像头驱动模块,用于确定所述第一手势在所述当前帧图像中的位置参数,计算得到所述第一手势中心与所述当前帧图像中心的第一距离信息,根据所述第一距离信息驱动所述摄像头转动;
第二手势识别模块,用于获取下一帧图像中第二手势的特征参数,根据所述手势识别模型对所述第二手势的识别结果,匹配相应的驱动所述摄像头的驱动指令。
7.根据权利要求6所述的装置,其特征在于,所述第一手势识别模块,包括:
手势训练模块,用于提取多帧手势图像中的目标手势的特征参数进行训练,得到存储多种可识别的手势特征的手势识别模型;
指令匹配模块,用于对所述训练模型中的每一手势特征匹配对应的控制指令,其中,当每一手势为第一手势时,触发摄像头转动的启动指令。
8.根据权利要求6所述的装置,其特征在于,所述摄像头驱动模块,包括:
视场角确定模块,用于获取摄像头的水平视场角大小和当前帧图像的水平方向的像素大小,确定单位视场角所对应的像素大小的信息;
转动角度确定模块,用于根据所述单位视场角所对应的像素大小的信息,计算所述第一距离信息对应的视场角大小,得到第一转动角度;
驱动子模块,用于驱动所述摄像头转动所述第一转动角度的角度值。
9.电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的手势控制摄像头转动的方法。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的手势控制摄像头转动的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011375768.9A CN114095648A (zh) | 2020-11-30 | 2020-11-30 | 一种手势控制摄像头转动的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011375768.9A CN114095648A (zh) | 2020-11-30 | 2020-11-30 | 一种手势控制摄像头转动的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114095648A true CN114095648A (zh) | 2022-02-25 |
Family
ID=80295883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011375768.9A Pending CN114095648A (zh) | 2020-11-30 | 2020-11-30 | 一种手势控制摄像头转动的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114095648A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030037692A (ko) * | 2001-11-05 | 2003-05-16 | 한국과학기술원 | 손 지시 인식을 이용한 원격제어 시스템 및 방법 |
CN103248824A (zh) * | 2013-04-27 | 2013-08-14 | 天脉聚源(北京)传媒科技有限公司 | 一种摄像头拍摄角度的确定方法、装置及摄像系统 |
CN104469145A (zh) * | 2014-11-05 | 2015-03-25 | 广东欧珀移动通信有限公司 | 一种控制移动终端摄像头旋转的方法、装置及移动终端 |
CN108089715A (zh) * | 2018-01-19 | 2018-05-29 | 赵然 | 一种基于深度摄像头的演示辅助系统 |
CN110401793A (zh) * | 2018-04-25 | 2019-11-01 | 北京京东尚科信息技术有限公司 | 用于控制智能终端的方法和装置 |
CN110688914A (zh) * | 2019-09-09 | 2020-01-14 | 苏州臻迪智能科技有限公司 | 一种手势识别的方法、智能设备、存储介质和电子设备 |
-
2020
- 2020-11-30 CN CN202011375768.9A patent/CN114095648A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030037692A (ko) * | 2001-11-05 | 2003-05-16 | 한국과학기술원 | 손 지시 인식을 이용한 원격제어 시스템 및 방법 |
CN103248824A (zh) * | 2013-04-27 | 2013-08-14 | 天脉聚源(北京)传媒科技有限公司 | 一种摄像头拍摄角度的确定方法、装置及摄像系统 |
CN104469145A (zh) * | 2014-11-05 | 2015-03-25 | 广东欧珀移动通信有限公司 | 一种控制移动终端摄像头旋转的方法、装置及移动终端 |
CN108089715A (zh) * | 2018-01-19 | 2018-05-29 | 赵然 | 一种基于深度摄像头的演示辅助系统 |
CN110401793A (zh) * | 2018-04-25 | 2019-11-01 | 北京京东尚科信息技术有限公司 | 用于控制智能终端的方法和装置 |
CN110688914A (zh) * | 2019-09-09 | 2020-01-14 | 苏州臻迪智能科技有限公司 | 一种手势识别的方法、智能设备、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11609631B2 (en) | Natural human-computer interaction for virtual personal assistant systems | |
CN109240576B (zh) | 游戏中的图像处理方法及装置、电子设备、存储介质 | |
CN108683937B (zh) | 智能电视的语音交互反馈方法、系统及计算机可读介质 | |
US11397559B2 (en) | Method and system based on speech and augmented reality environment interaction | |
CN104092932A (zh) | 一种声控拍摄方法及装置 | |
US11595591B2 (en) | Method and apparatus for triggering special image effects and hardware device | |
JP2021034003A (ja) | 人物識別方法、装置、電子デバイス、記憶媒体、及びプログラム | |
US20190251961A1 (en) | Transcription of audio communication to identify command to device | |
EP3714355B1 (en) | Expanding physical motion gesture lexicon for an automated assistant | |
CN109086097B (zh) | 一种小程序的启动方法、装置、服务器及存储介质 | |
CN109903054B (zh) | 一种操作确认方法、装置、电子设备及存储介质 | |
CN110991431A (zh) | 人脸识别方法、装置、设备及存储介质 | |
WO2023024455A1 (zh) | 语音交互方法及电子设备 | |
CN114095648A (zh) | 一种手势控制摄像头转动的方法和装置 | |
CN110263743B (zh) | 用于识别图像的方法和装置 | |
US11755118B2 (en) | Input commands via visual cues | |
US10901520B1 (en) | Content capture experiences driven by multi-modal user inputs | |
CN112817441A (zh) | 一种按键与人眼识别结合的方法和装置 | |
CN111488768B (zh) | 人脸图像的风格转换方法、装置、电子设备及存储介质 | |
CN113873165A (zh) | 拍照方法、装置和电子设备 | |
CN112347982A (zh) | 基于视频的无监督难例数据挖掘方法、装置、介质及设备 | |
CN107888830B (zh) | 相机启动方法及装置、计算机装置和计算机可读存储介质 | |
WO2021119908A1 (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN118092656A (zh) | 电子设备的操作方法、装置、电子设备和存储介质 | |
CN116009808A (zh) | 一种语音交互方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |