WO2022161250A1

WO2022161250A1 - 摄像控制方法、装置、计算机设备和存储介质

Info

Publication number: WO2022161250A1
Application number: PCT/CN2022/073007
Authority: WO
Inventors: 王文龙; 华旭宏; 杨国全; 曹亚曦; 王克彦
Original assignee: 浙江华创视讯科技有限公司
Priority date: 2021-01-28
Filing date: 2022-01-20
Publication date: 2022-08-04
Also published as: US20240114246A1

Abstract

一种摄像控制方法、装置、计算机设备和存储介质，通过确定第一比值，第一比值为目标摄像设备当前所处的光学变倍倍率与目标摄像设备的最大光学变倍倍率的比值；确定第二比值，第二比值为目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；判断是否第一比值小于等于第一比值阈值且第二比值小于等于第二比值阈值；若是，控制目标摄像设备进行光学变倍；若否，控制目标摄像设备进行数字变倍。

Description

摄像控制方法、装置、计算机设备和存储介质

相关申请

本申请要求2021年1月28日申请的，申请号为202110114788.9，发明名称为“一种聚焦步长确定方法、装置、存储介质及电子装置”的中国专利申请的优先权，以及2021年3月2日申请的，申请号为202110230319.3，发明名称为“摄像控制方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像通信技术领域，特别是涉及一种摄像控制方法、装置、计算机设备和存储介质。

背景技术

随着图像通信技术的发展，视频会议系统已经越来越普及，通过网络融合技术、编解码技术，实现语音、图像、数据等相关技术的远程实时传输。在当前的视频会议系统中，追求高质量的画质和音质。对于画质，更强调良好的人脸捕捉效果，即更侧重于人脸区域的聚焦。聚焦人脸区域，将人脸区域移到画面中心，采集合适的画面进行显示，特别是通过缩放技术调整至合适倍率进行特写显得越来越重要。对于当前拍摄的图像中仅存在单人时，可以对单人人脸进行特写，而对于拍摄到多人人脸时，可以进行全景特写。

目前，视频会议系统中的摄像设备大部分拥有变焦功能，可通过数字变倍和光学变倍进行缩放，实现合适的画质输出。然而，现实场景中的画面可能会存在一些复杂的情况，如多景深、多人脸等情况，如果采用手动调试，显然难度较大；并且，无法准确快速地决定变倍方式，造成图像清晰度和人脸捕捉无法兼顾，人脸消失后难以快速回退的问题也尤为突出。

发明内容

有鉴于此，本申请实施例为解决背景技术中存在的至少一个问题而提供一种摄像控制方法、装置、计算机设备和存储介质。

第一方面，本申请实施例提供了一种摄像控制方法，所述方法包括：

确定第一比值，所述第一比值为目标摄像设备当前所处的光学变倍倍率与所述目标摄像设备的最大光学变倍倍率的比值；

确定第二比值，所述第二比值为所述目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；

判断是否所述第一比值小于等于第一比值阈值且所述第二比值小于等于第二比值阈值；

若是，控制所述目标摄像设备进行光学变倍；若否，控制所述目标摄像设备进行数字变倍。

在一个可选实施例中，对应于所述目标摄像设备当前拍摄到单人人脸，所述第二比值为所述单人人脸的区域面积在整幅拍摄画面中的占比；

对应于所述目标摄像设备当前拍摄到多人人脸，所述第二比值为合并人脸区域面积在整幅拍摄画面中的占比，所述合并人脸区域面积为所述多人人脸中各人脸对应的区域面积的加和。

在一个可选实施例中，所述第一比值阈值的取值范围为0.45-0.55。

在一个可选实施例中，所述第二比值阈值的取值范围为0.15-0.25。

在一个可选实施例中，所述方法还包括：

基于所述目标摄像设备当前拍摄到的画面信息确定人物区域中心位置；

根据所述人物区域中心位置和整幅拍摄画面的中心位置，控制所述目标摄像设备移动和/或转动，以使所述人物区域中心位置与所述整幅拍摄画面的中心位置重合。

在一个可选实施例中，所述控制所述目标摄像设备移动和/或转动以使所述人物区域中心位置与所述整幅拍摄画面的中心位置重合的步骤，在所述确定第一比值的步骤之前执行。

在一个可选实施例中，所述基于所述目标摄像设备当前拍摄到的画面信息确定人物区域中心位置，具体包括：

对应于所述目标摄像设备当前拍摄到单人人脸，将所述单人人脸的区域中心位置确定为所述人物区域中心位置；

对应于所述目标摄像设备当前拍摄到多人人脸，将合并人体区域的中心位置确定为所述人物区域中心位置，所述合并人体区域为基于所述多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，所述闭合区域覆盖各所述人体图像。

在一个可选实施例中，所述根据所述人物区域中心位置和整幅拍摄画面的中心位置，控制所述目标摄像设备移动和/或转动，具体包括：

根据所述人物区域中心位置和整幅拍摄画面的中心位置之间的水平偏移量以及物距确定水平位置偏移角度；

根据所述人物区域中心位置和整幅拍摄画面的中心位置之间的竖直偏移量以及物距确定竖直位置偏移角度；

根据所述水平位置偏移角度和所述竖直位置偏移角度控制所述目标摄像设备转动；

其中，所述物距为当前拍摄到的人脸的实际位置和所述目标摄像设备的实际位置之间的距离。

在一个可选实施例中，所述物距根据所述目标摄像设备当前所处的光学变倍倍率以及所述第二比值确定。

在一个可选实施例中，在控制所述目标摄像设备进行光学变倍之后，或在控制所述目标摄像设备进行数字变倍之后，在所述目标摄像设备的显示画面中人物区域面积与所述显示画面的总面积的比值的范围为0.7-0.8；其中，

对应于所述目标摄像设备当前拍摄到单人人脸，所述人物区域面积为所述单人人脸对应的人体图像区域面积；

对应于所述目标摄像设备当前拍摄到多人人脸，所述人物区域面积为合并人体区域面积，所述合并人体区域为基于所述多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，所述闭合区域覆盖各所述人体图像。

在一个可选实施例中，所述人体图像区域面积基于对应的所述单人人脸的区域面积和预设倍数确定，所述预设倍数为预设的表征人体图像区域面积与人脸区域面积的比值。

在一个可选实施例中，在控制所述目标摄像设备进行光学变倍之后，所述方法还包括：

对所述目标摄像设备的显示画面进行人脸区域检测；

对应于在所述显示画面中没有检测到人脸区域，控制所述目标摄像设备进行光学变倍回退，并回退至所述目标摄像设备当前所处的光学变倍倍率的一半；

对进行光学变倍回退后所述目标摄像设备的显示画面进行人脸区域检测；

对应于在所述进行光学变倍回退后所述目标摄像设备的显示画面中没有检测到人脸区域，控制所述目标摄像设备进行光学变倍回退，并回退至广角端。

在一个可选实施例中，在控制所述目标摄像设备进行数字变倍之后，所述方法还包括：

对所述目标摄像设备的显示画面进行人脸区域检测；

对应于在所述显示画面中没有检测到人脸区域，判断所述整幅拍摄画面中是否具有人脸区域；

若是，调整显示画面以显示所述人脸区域；若否，控制所述目标摄像设备进行数字变倍回退和光学变倍回退。

在一个可选实施例中，控制所述目标摄像设备进行光学变倍包括：

获取目标摄像设备在分别采集预定数量的连续帧图像时的聚焦马达点位以及帧图像的清晰度；

基于分别获取的多个所述聚焦马达点位以及多个所述清晰度，确定每帧图像对应的坐标点，其中，每帧图像对应的坐标点的坐标值包括采集每帧图像时的聚焦马达点位以及每帧图像的清晰度；

基于所述连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定所述目标摄像设备的聚焦马达的目标调整步长，其中，所述第四目标帧图像为所述第三目标帧图像之前的帧图像，所述第三目标帧图像、所述第二目标帧图像以及所述第一目标帧图像为依次相邻的帧图像，且所述第一目标帧图像为所述连续帧图像的最后一帧图像。

在一个可选实施例中，基于所述连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定所述目标摄像设备的聚焦马达的目标调整步长包括：

基于第一坐标值、第二坐标值和第四坐标值确定第一坐标点的第一角度变化值和第一残差变化率，其中，所述第一坐标值为所述第一目标帧图像对应的所述第一坐标点的坐标值，所述第二坐标值为所述第二目标帧图像对应的第二坐标点的坐标值，所述第四坐标值为所述第四目标帧图像对应的第四坐标点的坐标值，所述第一角度变化值是第一平均每步长清晰度值与第二平均每步长清晰度值的变化量，所述第一平均每步长清晰度值为所述第一目标帧图像和所述第四目标帧图像之间的平均每步长清晰度值，所述第二平均每步长清晰度值为所述第一目标帧图像和所述第二目标帧图像之间的平均每步长清晰度值，所述第一残差变化率用于指示所述第一目标帧图像和所述第二目标帧图像的清晰度每步长变化率；

基于第二坐标值、第三坐标值和第四坐标值确定第二坐标点的第二角度变化值和第二残差变化率，其中，所述第三坐标值为所述第三目标帧图像对应的第三坐标点的坐标值，所述第二角度变化值是第三平均每步长清晰度值与第四平均每步长清晰度值的变化量，所述第三平均每步长清晰度值为所述第二目标帧图像和所述第四目标帧图像之间的平均每步长清晰度值，所述第四平均每步长清晰度值为所述第二目标帧图像和所述第三目标帧图像之间的平均每步长清晰度值，所述第二残差变化率用于指示所述第二目标帧图像和所述第三目标帧图像的清晰度每步长变化率；

基于所述第一角度变化值、所述第一残差变化率、所述第二角度变化值和所述第二残差变化率确定所述目标摄像设备的聚焦马达的目标调整步长。

在一个可选实施例中，基于所述第一角度变化值、所述第一残差变化率、所述第二角度变化值和所述第二残差变化率确定所述目标摄像设备的聚焦马达的目标调整步长包括：

确定所述第一角度变化值与所述第二角度变化值之间的第一差值；

确定所述第一残差变化率与所述第二残差变化率之间的第二差值；

基于所述第一差值和所述第二差值确定所述目标摄像设备的聚焦马达的目标调整步长。

在一个可选实施例中，基于所述第一差值和所述第二差值确定所述目标摄像设备的聚焦马达的目标调整步长包括：

基于所述第一差值和所述第二差值确定目标收敛值；

根据所述目标收敛值确定所述目标调整步长。

在一个可选实施例中，根据所述目标收敛值确定所述目标调整步长包括：

在确定所述目标收敛值满足第一条件的情况下，确定所述目标调整步长为预设步长值；

在所述目标收敛值不满足所述第一条件的情况下，确定所述目标调整步长为初始步长，其中，所述初始步长为所述目标摄像设备在采集预定数量的所述连续帧图像时所使用的步长。

在一个可选实施例中，在确定所述目标摄像设备的聚焦马达的目标调整步长之后，所述方法还包括：

按照所述目标调整步长对所述目标摄像设备进行聚焦处理。

第二方面，本申请实施例还提供了一种摄像控制装置，所述装置包括：

第一确定模块，用于确定第一比值，所述第一比值为目标摄像设备当前所处的光学变倍倍率与所述目标摄像设备的最大光学变倍倍率的比值；

第二确定模块，用于确定第二比值，所述第二比值为所述目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；

判断模块，用于判断是否所述第一比值小于等于第一比值阈值且所述第二比值小于等于第二比值阈值；

控制模块，用于在判断的结果为是时，控制所述目标摄像设备进行光学变倍；以及，在判断的结果为否时，控制所述目标摄像设备进行数字变倍。

第三方面，本申请实施例还提供了一种计算机设备，包括处理器和存储器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述各方法实施例中任意之一中的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述各方法实施例中任意之一中的步骤。

上述摄像控制方法、装置、计算机设备和计算机可读存储介质，通过确定第一比值，所述第一比值为目标摄像设备当前所处的光学变倍倍率与所述目标摄像设备的最大光学变倍倍率的比值；确定第二比值，所述第二比值为所述目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；判断是否所述第一比值小于等于第一比值阈值且所述第二比值小于等于第二比值阈值；若是，控制所述目标摄像设备进行光学变倍；若否，控制所述目标摄像设备进行数字变倍；如此，能够根据当前的变倍倍率以及人脸区域的占比实现光学变倍和数字变倍的自适应选择，既满足了准确快速利用缩放技术进行特写的需求，又可以得到较好的图像画质，从而有利于人脸区域的特写与捕捉。

上述聚焦步长确定方法、装置、计算机设备和计算机可读存储介质，由于根据连续帧图像中的坐标点的坐标值进行步长调整，能够使摄像设备进行快速聚焦，从而减少了聚焦过程的时间消耗，达到提高聚焦效率的效果。

本申请的一个或多个实施例的细节在以下附图和描述中提出，以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为一个实施例中摄像控制方法的流程示意图。

图2为一个实施例中云台摄像机的结构示意图。

图3为另一个实施例中摄像控制方法的流程示意图。

图4至图7为各实施例中缩放画面的示意图。

图8为一种示意性的物距与光学变倍倍率以及人脸区域占比之间的关系图。

图9为一个实施例中人体图像区域与人脸区域的示意图。

图10为一个实施例中数字变倍的画面区域示意图。

图11为一个实施例中光学变倍回退方法的流程示意图。

图12为一种具体实施方式中摄像控制方法的流程示意图。

图13为根据本申请实施例的一种聚焦步长确定方法的流程图。

图14为根据本申请实施例的爬山聚焦曲线示意图。

图15为根据本申请实施例的摄像控制装置的示意图。

图16为根据本申请实施例的一种聚焦步长确定装置的结构框图。

图17为根据本申请实施例的一种聚焦步长确定方法的移动终端的硬件结构框图。

图18为根据本申请的具体实施例的一种聚焦步长确定装置的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们的任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电气的连接，不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象，不代表针对对象的特定排序。

光学变倍和数字变倍是目前摄像设备主要采用的缩放技术。其中，光学变倍主要通过聚焦镜片组的移动来实现图像的缩放，图像画质不损失；而数字变倍主要通过对图像的裁剪实现图像的放大，且倍率越大，图像通过“插值”会导致画质损失越多。不仅如此，在实现对捕捉到的人脸区域的图像放大后，如果图像放大是通过数字变倍获得的，那么由于数字变倍技术中全景图像是可以实时获取的，当人脸突然消失时，镜头可以分析的全景画面可更广，对下一个场景画面的切面会更快速，该方法可实现单摄像设备二画面的检测；而对于通过光学变倍实现图像放大的情况，当人脸突然消失后，图像所能检测的区域会大大减小，对下个场景的切换速度会受影响。因此，光学变倍和数字变倍各自具有优选点，需要根据实际情况与需求进行合理选择。

本申请一实施例提供了一种摄像控制方法，图1为摄像控制方法的流程示意图，如图所示，上述方法包括：

步骤101，确定第一比值，第一比值为目标摄像设备当前所处的光学变倍倍率与目标摄像设备的最大光学变倍倍率的比值；

步骤102，确定第二比值，第二比值为目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；

步骤103，判断是否第一比值小于等于第一比值阈值且第二比值小于等于第二比值阈值；

步骤104，若步骤103的判断结果为是，控制目标摄像设备进行光学变倍；若步骤103的判断结果为否，控制目标摄像设备进行数字变倍。

可以理解地，本申请实施例能够根据当前的变倍倍率以及人脸区域的占比实现光学变倍和数字变倍的自适应选择，既满足了准确快速利用缩放技术进行特写的需求，又可以得到较好的图像画质，从而有利于人脸区域的特写与捕捉。

本申请实施例提供的摄像控制方法，例如应用于如图2所示的应用环境中。其中，图2中的目标摄像设备具体为云台摄像机，包括可转动的云台和安装在云台上的摄像机。当摄像机跟踪拍摄人脸时，通过分析计算人脸区域与摄像机中心位置，带动云台移动到合适的中心位置，同时通过分析人脸与整画面图像大小，分析摄像机合适的调整倍率。本申请实施例提供的方法可以很好的解决单云台摄像机对于人脸区域聚焦问题，实现人脸区域的快速框选及聚焦。其中，摄像机可以但不限于是枪形摄像机、球形摄像机和半球摄像机，摄像机可以位于云台的上方也可以位于云台的下方，在此对摄像机与云台的相对方位不做限制。应当理解，虽然以上仅说明了通过云台的转动带动摄像机，但本申请实施例的应用环境并不限于此；具体地，在其他一些实施例中，目标摄像设备可以被控制而实现移动和/或转动。

此外，本申请实施例提供的摄像控制方法可应用于单摄像机，即执行摄像控制方法的摄像控制装置可通过控制一台摄像机而执行上述方法中的步骤。

在步骤101中，确定第一比值，可以具体包括：确定摄像机当前所处的光学变倍倍率Xoz，计算Xoz与摄像机的最大光学变倍倍率Xz的比值，将该比值确定为第一比值，即Xoz/Xz。

这里，摄像机当前所处的光学变倍倍率具体可以指摄像机的镜头当前所处的光学变倍倍率；同样地，摄像机的最大光学变倍倍率具体可以指摄像机的镜头的最大光学变倍倍率。

摄像机的最大光学变倍倍率根据摄像机的功能而确定，通常为固定不变的。

在步骤102中，确定第二比值，可以具体包括：确定摄像机当前拍摄到的人脸区域面积Sface，计算拍摄到的Sface与整幅拍摄画面的面积Sw的比值，将该比值确定为第二比值Facepro；换言之，Facepro＝Sface/Sw。

这里，可以通过对摄像机的拍摄画面进行人脸区域检测，并根据已有算法计算检测到的人脸区域的面积。

整幅拍摄画面的面积通常为已知且可以根据设置情况而确定的。

在一具体实施例中，对应于摄像机当前拍摄到单人人脸，第二比值为单人人脸的区域面积在整幅拍摄画面中的占比。

在又一具体实施例中，对应于摄像机当前拍摄到多人人脸，第二比值为合并人脸区域面积在整幅拍摄画面中的占比，其中合并人脸区域面积为多人人脸中各人脸对应的区域面积的加和。

换言之，通过分析人脸区域面积与整幅画面的面积占比来求取人脸占比。其中，单人人脸例如通过分析单个人脸面积占比；多人人脸例如通过合并人脸区域，统计合并人脸区域计算整幅画面的人脸占比。

需要说明的是，对应于摄像机当前拍摄到单人人脸时第二比值的确定，与对应于摄像机当前拍摄到多人人脸时第二比值的确定，可以在同一实施例中采用，也可以在不同实施例中采用；即，当通过单人人脸的区域面积在整幅拍摄画面中的占比来确定对应于摄像机当前拍摄到单人人脸时的第二比值时，对应于摄像机当前拍摄到多人人脸时的第二比值的确定方法可以采用上述合并人脸区域面积在整幅拍摄画面中的占比的方法，也可以采用其他方法，二者不必要关联存在，反之亦然。

在步骤103中，判断是否第一比值小于等于第一比值阈值且第二比值小于等于第二比值阈值；这里，设第一比值阈值为N，第二比值阈值为M，步骤103即为判断是否Xoz/Xz≤N且Facepro≤M。

在一可选实施例中，N的取值范围为0.45-0.55；具体例如N为0.5，即1/2。M的取值范围为0.15-0.25；具体例如M为0.2，即1/5。

在步骤104中，若Xoz/Xz≤N且Facepro≤M，则控制摄像机进行光学变倍(用“Soz”表示)；若为除此以外的其他情况，则控制摄像机进行数字变倍(用“Sdz”表示)。

作为一种具体实施方式，综合考虑图像缩放后的画质和图像放大后人脸的消失检测机制，设置对图像缩放功能采取的缩放策略S如下：

其中，else表示除在其之上的条件以外的其他条件。

如此，当人脸在整幅画面中的占比较小且光学变倍倍率较小时，采用光学变倍进行缩放；当人脸占比超过一定人脸阈值(即第二比值阈值)时，采用数字变倍进行缩放；既满足放大人脸的功能，又可以得到较好的图像画质，同时有利于实现人脸消失后全景画面人脸的快速检测。

可以理解地，为实现快速的人像特写调节，本申请实施例通过分析人脸占比与倍率的缩放比例关系，做到快速缩放。

接下来，请参考图3，在一可选实施例中，上述方法还包括：

步骤001，基于目标摄像设备当前拍摄到的画面信息确定人物区域中心位置；

步骤002，根据人物区域中心位置和整幅拍摄画面的中心位置，控制目标摄像设备移动和/或转动，以使人物区域中心位置与整幅拍摄画面的中心位置重合。

作为一种可选的实施方式，控制目标摄像设备移动和/或转动以使人物区域中心位置与整幅拍摄画面的中心位置重合的步骤，在确定第一比值的步骤之前执行。换言之，参考图3，在执行完步骤001至步骤002之后，再执行步骤101至步骤104。如此，在检测到人脸区域后，先根据人脸区域将人物区域调整至画面的中心位置，再通过变倍功能将人脸缩放到合适大小，实现人脸聚焦。

当然，本申请并不限于此，步骤001至步骤002，和步骤101至步骤104，可以分别执行。如此，在检测到人脸区域后，通过变倍功能进行图像缩放，将人脸缩放到合适大小，同时保证人物区域在缩放后处于画面中心位置。

这里，由于目标摄像设备当前拍摄的画面可能存在单人人脸，也可能存在多人人脸。对于单人人脸的情况，将单人人脸的区域中心位置移动到整幅拍摄画面的中心位置一般可保证对人脸的聚焦需求；然而，对于多人人脸的情况，如果仅根据多人人脸中各人脸的区域中心位置来确定画面如何显示，则可能会由于各人脸的前后位置等复杂关系而导致画面中人像显示不完整。

基于此，在一具体实施例中，基于目标摄像设备当前拍摄到的画面信息确定人物区域中心位置，包括：对应于目标摄像设备当前拍摄到单人人脸，将单人人脸的区域中心位置确定为人物区域中心位置。

在又一具体实施例中，基于目标摄像设备当前拍摄到的画面信息确定人物区域中心位置，包括：对应于目标摄像设备当前拍摄到多人人脸，将合并人体区域的中心位置确定为人物区域中心位置，合并人体区域为基于多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，其中闭合区域覆盖各人体图像。

换言之，人物区域中心位置具体可以在单人人脸和多人人脸的情况下采用不同的方式确定；在单人人脸的情况下，可以根据人脸区域确定；在多人人脸的情况下，可以根据人体的图像边界来确定。

需要说明的是，对应于目标摄像设备当前拍摄到单人人脸时的人物区域中心位置的确定，与对应于目标摄像设备当前拍摄到多人人脸时的人物区域中心位置的确定，可以在同一实施例中采用，也可以在不同实施例中采用；即，当将单人人脸的区域中心位置确定为人物区域中心位置时，对应于目标摄像设备当前拍摄到多人人脸时的人物区域中心位置的确定方法可以采用上述根据合并人体区域的中心位置的确定方法，也可以采用其他确定方法，二者不必要关联存在，反之亦然。

人体的图像边界可以由设置于目标摄像设备之内或者之外的图像处理模块确定，图像处理模块可以根据当前拍摄到的画面信息直接确定人体的图像边界，也可以根据人脸区域结合算法来推算人体的图像边界，这里不做具体限制。

根据人物区域中心位置和整幅拍摄画面的中心位置，控制目标摄像设备移动和/或转动，具体包括：

根据人物区域中心位置和整幅拍摄画面的中心位置之间的水平偏移量以及物距确定水平位置偏移角度；

根据人物区域中心位置和整幅拍摄画面的中心位置之间的竖直偏移量以及物距确定竖直位置偏移角度；

根据水平位置偏移角度和竖直位置偏移角度控制目标摄像设备转动；

其中，物距为当前拍摄到的人脸的实际位置和目标摄像设备的实际位置之间的距离。

根据人物区域中心位置和整幅拍摄画面的中心位置之间的水平偏移量以及物距确定水平位置偏移角度，具体例如包括：根据人物区域中心位置和整幅拍摄画面的中心位置计算二者之间的水平偏移量Xoff，根据Xoff与物距Sd之间的比值计算水平位置偏移角度的正切函数值arctan(Xoff/Sd)，根据arctan(Xoff/Sd)计算水平位置偏移角度。

根据人物区域中心位置和整幅拍摄画面的中心位置之间的竖直偏移量以及物距确定竖直位置偏移角度，具体例如包括：根据人物区域中心位置和整幅拍摄画面的中心位置计算二者之间的竖直偏移量Yoff，根据Yoff与物距Sd之间的比值计算竖直位置偏移角度的正切函数值arctan(Yoff/Sd)，根据arctan(Yoff/Sd)计算竖直位置偏移角度。

这里，水平位置偏移角度和竖直位置偏移角度不仅包括相应角度的数值，还包括角度的方向(例如以正负来表示角度的方向)。

控制目标摄像设备转动，具体可以通过控制云台转动而带动目标摄像设备转动来实现。

在一可选实施例中，物距根据目标摄像设备当前所处的光学变倍倍率以及第二比值确定。

下面，将结合一具体示例进行进一步详细说明。

对应于目标摄像设备当前拍摄到单人人脸的情况：

如图4所示，在缩放过程中，如果人脸本身处于画面边缘位置，很可能因为倍率的变大而导致人脸消失。其中，A表示画面的中心位置，B表示人脸区域的中心位置。因而，需要将人脸调整到画面中心位置而进行变倍，才能保证良好的人脸聚焦效果。

这里，请参考图5，为保证变倍到位，使得人脸处于画面中心，假设画面宽、高分别为w、h，则A位于(w/2，h/2)处。根据B与A的水平竖直偏移量Xoff，竖直偏移量Yoff，将B移动到A的位置。

对应于目标摄像设备当前拍摄到多人人脸的情况：

当画面中存在多人人脸时，需要均衡画面整体人像画面特写效果，这里请参考图6，将多人人体的图像作为整体区域，其中，B和C分别表示多人人脸中各人脸区域的中心位置。如将B和C对应的各人体区域作为合并人体区域，合并人体区域中心位置为A’，实际画面中心位置仍然为A，则调整A’与A重合。

如果重合之前，合并人体区域的上下左右与拍摄画面的相应边界之间的距离差值分别为Yup、Ydown、Xleft、Xright；则调整至A’与A重合之后，合并人体区域的上下左右与拍摄画面的相应边界之间的距离差值分别变为Y’up、Y’down、X’left、X’right，此时，Y’up＝Y’down且X’left＝X’right。

为保证人物区域居中，需要较精准的移动云台，需要计算云台移动的角度。

请参考图7，根据人物区域中心位置(用R表示，即在单人人脸实施例中R＝B，在多人人脸实施例中R＝A’)和整幅拍摄画面的中心位置之间的水平偏移量Xoff以及物距Sd确定水平位置偏移角度∠R’CA，∠R’CA＝arctan(Xoff/Sd)；根据人物区域中心位置和整幅拍摄画面的中心位置之间的竖直偏移量Yoff以及物距Sd确定竖直位置偏移角度∠R”CA，∠R”CA＝arctan(Yoff/Sd)。

进一步根据水平位置偏移角度和竖直位置偏移角度，同时结合人物区域中心位置相对于整幅拍摄画面的中心位置的偏向进行云台移动。

这里，物距Sd通过人脸区域占比(即第二比值)，马达当前倍率Zoom以及对焦马达的位置计算获取。

在一可选实施例中，上述方法还包括：预先建立物距Sd与目标摄像设备所处不同的光学变倍倍率以及各不同的第二比值之间的对应关系，根据对应关系确定物距。

可以理解地，由于人脸区域在不同的倍率下占比不同；即使在相同的倍率下，位于不同距离处的人所对应的人脸区域的占比也不一样，具体地，倍率相同的情况下，远距离人脸区域占比小，近距离人脸区域占比大。因此，可以根据不同的物距、目标摄像设备所处不同的光学变倍倍率以及各不同的第二比值，构建三者之间的关系表或关系图，从而有利于快速确定当前对应的物距。如图8为一种示意性的物距与光学变倍倍率以及人脸区域占比之间的关系图，图中，Zoom电机位置与物距相对应。

在一可选实施例中，在控制目标摄像设备进行光学变倍之后，或在控制目标摄像设备进行数字变倍之后，在目标摄像设备的显示画面中人物区域面积与显示画面的总面积的比值的范围为0.7-0.8；其中，

对应于目标摄像设备当前拍摄到单人人脸，人物区域面积为单人人脸对应的人体图像区域面积；

对应于目标摄像设备当前拍摄到多人人脸，人物区域面积为合并人体区域面积，合并人体区域为基于多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，闭合区域覆盖各人体图像。

在一具体实施例中，目标摄像设备的显示画面中人物区域面积与显示画面的总面积的比值为0.75。

可以理解地，为保证人像得到良好的缩放比例，本实施通过设置合适的比例范围，使得目标摄像设备镜头可以进行自适应聚焦缩放。

在一可选实施例中，人体图像区域面积基于对应的单人人脸的区域面积和预设倍数确定，预设倍数为预设的表征人体图像区域面积与人脸区域面积的比值。

具体地，请参考图9，根据人体黄金分割比例，一般人在坐姿情况下身高为5个头长，站姿情况下身高为7.5个头长，而视频会议场景中无论站姿还是坐姿更注重人体的上半部分，因此，在一可选实施例中，设置人体宽度为人脸宽度w的2倍，即人体宽度为2*w；人的除头部以外的身体部分的高度为人脸高度h的3倍，即人体高度为4*h；从而确定人体图像区域面积。在本实施例中，预设倍数等于8，即人体图像区域面积根据对应的单人人脸的区域面积乘以8倍进行计算。

接下来，对应于步骤103的判断结果为是，在控制目标摄像设备进行光学变倍之后，上述方法还可以包括：

对目标摄像设备的显示画面进行人脸区域检测；

对应于在显示画面中没有检测到人脸区域，控制目标摄像设备进行光学变倍回退，并回退至目标摄像设备当前所处的光学变倍倍率的一半；

对进行光学变倍回退后目标摄像设备的显示画面进行人脸区域检测；

对应于在进行光学变倍回退后目标摄像设备的显示画面中没有检测到人脸区域，控制目标摄像设备进行光学变倍回退，并回退至广角端。

对应于步骤103的判断结果为否，在控制目标摄像设备进行数字变倍之后，上述方法还包括：

对目标摄像设备的显示画面进行人脸区域检测；

对应于在显示画面中没有检测到人脸区域，判断整幅拍摄画面中是否具有人脸区域；

若是，调整显示画面以显示人脸区域；若否，控制目标摄像设备进行数字变倍回退和光学变倍回退。

可以理解地，在进行变倍缩放以对人脸进行聚焦后，还需要保证如何在人脸消失的状态下，快速回退到合适的位置。

在实际应用中，可以分为数字变倍回退方法(一)和光学变倍回退方法(二)。

(一)对于采用了数字变倍的情况，如图10所示，a区域为中心裁剪数字变倍放大的画面所在的区域；b区域的外边界为数字变倍放大前的画面(原始画面)边界，b区域的内边界为a区域的外边界，进而b区域为数字变倍中被裁减掉而未进行显示的区域。当a区域中人脸消失时，在通常的一些情况中，需要进行倍率回退进行检测，而本实施例可暂时采用不回退的方式进行人脸快速检测，具体地，通过检测每帧保留的原始画面进行人脸位置检测，在多数情况下，人脸若移动至b区域，即移动至a区域与原始画面之间，可通过检测b区域快速锁定人脸区域位置，避免了大幅度倍率回退导致的画面来回缩放震动现象，也加速人脸区域再次特写锁定；当在b区域中也未检测到人脸时，立即进行数字变倍回退，同时光学变倍回退，按照光学变倍的回退方法进行重新人脸区域的锁定。

(二)对于采用了光学变倍的情况，如图11所示，当前光学变倍倍率为Z；当人脸区域消失后，本实施例通过如下步骤进行回退：光学变倍倍率由Z快速回退至Z/2位置，再进行人脸区域快速检测；当依旧未检查到人脸时，光学变倍倍率快速回退到最广角端，即回退至最小，再进行检测；如果检测到人脸区域，则根据本申请上述实施例提供的方法自适应缩放并缩放至合适倍率；在人脸区域消失时，再次执行光学变倍倍率回退至Z/2的步骤。此外，进行静置/画面特写。如此，不仅可以避免过渡回退导致的人脸缩放过渡，同时减少了镜头移动耗费的时间，避免了镜头移动耗时过长的问题。

如此，本申请实施例提供的摄像控制方法不仅可以根据人脸区域检测实现自适应缩放聚焦，而且在人脸消失时，还可以采用快速回退机制实现精准回退。

作为一种具体实施方式，请参考图12；如图所示，首先，采用人脸检测技术，进行人脸区域检测；当检测到人脸时，即存在人脸，则通过云台辅助机制，调整人物区域中心位置与整幅拍摄画面的中心位置重合，具体根据单人人脸还是多人人脸的不同情况计算人脸区域占比，根据人物区域中心与整幅拍摄画面的中心位置之间的偏移量，云台辅助移动，将人物区域中心与画面中心对应；根据当前的倍率结合缩放策略，采用合适的光学变倍和数字变倍进行自适应缩放；实时检测人脸区域画面，若人脸消失，根据回退机制，即根据光学变倍/数字变倍选择对应的回退方法进行回退，保证在人脸消失的同时快速跟踪人脸画面，做到精准回退；摄像机自适应缩放至合适位置，即倍率停留有效位置。

由此可见，本实施方式提供了一种基于单摄像机的自适应缩放技术，通过对区域人脸分析，摄像机进行自适应缩放，快速变倍至合适倍率；在变倍过程中，综合考虑云台，进行位置微调，将单人人脸或者多人人脸区域置于画面中心；为尽量保证图像画质同时保证自适应缩放，根据相机所处倍率及人脸区域占比决定采用数字变倍还是光学变倍；此外，本实施方式中提出了高效的回退机制，解决人脸消失后单摄像机的倍率回退问题。本实施方式提出的单摄像机高效的自适应缩放技术，实现人脸区域快速特写。

光学变倍主要通过聚焦镜片组的移动来实现图像的缩放，图像画质不损失。聚焦镜片组的移动涉及自动对焦技术，当前自动对焦技术已广泛应用于数码相机、安防监控、手机、视频会议等领域，其中，自动对焦技术在安防领域主要通过图像分析来实现对焦：获取当前帧，分析图像清晰度值，计算下一步对焦位置与对焦清晰度值，不断驱动对焦马达，直到找到最清晰度值。但通常对焦方式中存在聚焦过程始终在峰值点附近来回对焦，从而导致对焦速度慢，降低了聚焦效率。

在一可选实施例中，在控制所述目标摄像设备进行光学变倍的过程中，提供一种聚焦步长确定方法，图13是根据本申请实施例的一种聚焦步长确定方法的流程图，如图13所示，该流程包括如下步骤：

步骤301，获取目标摄像设备在分别采集预定数量的连续帧图像时的聚焦马达点位以及帧图像的清晰度；

在本实施例中，在目标摄像设备采集帧图像时，分别记录采集每帧图像时对应的聚焦马达点位以及清晰度，以便于进行后续的计算。

其中，聚焦马达点位包括目标摄像设备采集某一帧图像时的聚焦步长、亮度等信息；聚焦马达点位以及帧图像的清晰度的获取方式可以是将聚焦马达点位以及帧图像的清晰度存储在目标区域，随后再从目标区域进行调取；预定数量可以是至少4帧的图像。

需要说明的是，获取目标摄像设备在分别采集预定数量的连续帧图像时的聚焦马达点位以及帧图像的清晰度的步骤是在对目标摄像设备进行图像拍摄形成图像之前的操作，即完成聚焦后再进行图像的拍摄，以获取清晰度较高的图像；其中，图像包括图片和/或影像。

步骤302，基于分别获取的多个聚焦马达点位以及多个清晰度，确定每帧图像对应的坐标点，其中，每帧图像对应的坐标点的坐标值包括采集每帧图像时的聚焦马达点位以及每帧图像的清晰度；

在本实施例中，确定坐标点是为了在利用爬山聚焦算法进行聚焦时，能够方便对每帧图像的聚焦马达点位进行定位，从而方便确定爬山聚焦算法的曲线。

其中，将聚焦马达点位与清晰度一一对应，从而形成二维坐标系，并将聚焦马达定位点位通过曲线进行连接，以确定爬山聚焦算法的曲线。

步骤303，基于连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定目标摄像设备的聚焦马达的目标调整步长，其中，第四目标帧图像为第三目标帧图像之前的帧图像，第三目标帧图像、第二目标帧图像以及第一目标帧图像为依次相邻的帧图像，且第一目标帧图像为连续帧图像的最后一帧图像。

在本实施例中，根据至少四帧的目标帧图像的坐标点的坐标值确定目标摄像设备的聚焦马达的目标调整步长，减少了目标调整步长的反复调试过程，从而减少了聚焦过程所需要花费的时间，提高了聚焦效率。

其中，目标调整步长可以根据实际需要进行调整，例如设为1，也可以设置为其它值；第四目标帧图像可以是与第三目标帧相邻的帧图像，也可以是不与第三目标帧图像相邻的图像。

通过上述步骤，根据连续帧图像中的坐标点的坐标值进行步长调整，能够使摄像设备进行快速聚焦，从而减少了聚焦过程的时间消耗，解决了相关技术中聚焦效率低问题，提高了聚焦效率。

在一个可选的实施例中，基于连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定目标摄像设备的聚焦马达的目标调整步长包括：

步骤3031，基于第一坐标值、第二坐标值和第四坐标值确定第一坐标点的第一角度变化值和第一残差变化率，其中，第一坐标值为第一目标帧图像对应的第一坐标点的坐标值，第二坐标值为第二目标帧图像对应的第二坐标点的坐标值，第四坐标值为第四目标帧图像对应的第四坐标点的坐标值，第一角度变化值是第一平均每步长清晰度值与第二平均每步长清晰度值的变化量，第一平均每步长清晰度值为第一目标帧图像和第四目标帧图像之间的平均每步长清晰度值，第二平均每步长清晰度值为第一目标帧图像和第二目标帧图像之间的平均每步长清晰度值，第一残差变化率用于指示第一目标帧图像和第二目标帧图像的清晰度每步长变化率；

步骤3032，基于第二坐标值、第三坐标值和第四坐标值确定第二坐标点的第二角度变化值和第二残差变化率，其中，第三坐标值为第三目标帧图像对应的第三坐标点的坐标值，第二角度变化值是第三平均每步长清晰度值与第四平均每步长清晰度值的变化量，第三平均每步长清晰度值为第二目标帧图像和第四目标帧图像之间的平均每步长清晰度值，第四平均每步长清晰度值为第二目标帧图像和第三目标帧图像之间的平均每步长清晰度值，第二残差变化率用于指示第二目标帧图像和第三目标帧图像的清晰度每步长变化率；

步骤3033，基于第一角度变化值、第一残差变化率、第二角度变化值和第二残差变化率确定目标摄像设备的聚焦马达的目标调整步长。

在本实施例中，确定第一角度变化值和第二角度变化值是为了确定采集的相邻两帧的帧图像之间坐标点的角度变化，以确定清晰度是否超过或即将达到聚焦峰值，而当清晰度超过了聚焦峰值，第二角度变化值可能大于第一角度变化值，此时则可以判断聚焦峰值位于第一目标帧图像对应的聚焦马达点位的左侧，从而能够快速预判聚焦峰值的位置，以此类推；同理，确定第一残差变化率和第二残差变化率也是为了确定相邻两帧之间清晰度的变换，从而快速确定聚焦峰值的位置。

例如，如图14所示，第一目标帧图像为聚焦马达点位处于B点的帧图像，第二目标帧图像为聚焦马达点位处于C点的帧图像，第三目标帧图像为聚焦马达点位处于D点的帧图像，第四目标帧图像为聚焦马达点位处于A点的帧图像，第一角度变化值和第二角度变化值可以通过以下公式进行计算获得：

式(1)中，Fv_cur表示当前帧图像(即第一目标帧图像)的清晰度，Fv_init表示初始帧图像(即第四目标帧图像)的清晰度，Fv_bef表示前一帧图像(即第二目标帧图像)的清晰度， Pos_cur表示当前帧图像(即第一目标帧图像)的聚焦步长，Pos_init表示初始帧图像(即第四目标帧图像)的聚焦步长，Pos_bef表示前一帧图像(即第二目标帧图像)的聚焦步长，f_radio1为第一目标帧图像和第二目标帧图像分别相对于第四目标帧图像的清晰度相对变化率，即第一平均每步长清晰度值；f_radio2即为第二目标帧图像和第三目标帧图像分别相对于第四目标帧图像的清晰度相对变化率，即第二平均每步长清晰度值；在正常的爬山聚焦算法中，通常用来衡量清晰度是否到达聚焦峰值，当f_radio2＜0，表示曲线呈下降趋势，即当前帧图像的清晰度已过峰值点；为避免遇到假波峰，会设定一定阈值限定；当f_radio2＞0，表示曲线处于上升过程，但难以限定是否已接近稳定的峰值点，因而需要通过式(2)进行补充判断；在式(2)中，与前一帧形成的角度(θ ₂＞θ ₄)越小，且与初始角度形成的角度(θ ₁＜θ ₃)越小，则形成的角度差θ _diff越接近峰值越小；f_radio即为第一角度变化值和第二角度变化值的计算公式。

第一残差变化率和第二残差变化率可以通过以下公式计算获得：

式(3)中，fv_radio1即为第一残差变化率，fv_radio2即为第二残差变化率，Fv_cur表示当前帧的清晰度值，Fv_bef表示前一帧的清晰度值，Fv_bef′表示更前一帧的清晰度值，Step_cur表示当前帧相对于前一帧的行走步长，Step_bef表示前一帧图像的聚焦步长，fv_radio表示前后帧的清晰度值每步长变化率来计算残差变化率。

在一个可选的实施例中，基于第一角度变化值、第一残差变化率、第二角度变化值和第二残差变化率确定目标摄像设备的聚焦马达的目标调整步长包括：

步骤30331，确定第一角度变化值与所述第二角度变化值之间的第一差值；

步骤30332，确定第一残差变化率与所述第二残差变化率之间的第二差值；

步骤30333，基于第一差值和第二差值确定目标摄像设备的聚焦马达的目标调整步长。

在本实施例中，确定第一差值是为了确定相邻帧图像的角度变化值之间的变化情况，确定第二差值是为了确定相邻帧图像的清晰度变化情况。

其中，第二差值即为前述式(3)中的fv_radio值，且：

如式(4)所示，当fv_radio大于0，则表示清晰度值处于曲线的上升阶段，当fv_radio小于0，则表示搜索区域已到达平缓区域，快接近聚焦峰值。

第一差值f_radio_diff可通过以下公式进行计算获得：

式(5)中f_radio_B与f_radio_C分别代表B与C两帧图像的聚焦马达点位角度，B、C、D三点的清晰度值为分别代表f _b，f _c，f _d，B、C、D三点与初始点的位置差为p _b，p _c，p _d。

其中：当f值远大于p值，且在帧图像的清晰度未达到聚焦峰值时，f _b＞f _c＞f _d，p _b＞p _c＞p _d。若B点的清晰度超过聚焦峰值，则f _c＞f _b。

由式(4)可得，f _c ²·[f _b·(p _c-p _d)-f _d·p _b]将影响聚焦值f_radio_diff值，从而可进行提前判断收敛点验证，即：

当B还未达到峰值点时，f_radio_diff≥0；当B接近峰值点时，f_radio_diff＜0。

需要说明的是，步骤30331与步骤30332的执行顺序可以进行调换，即可以先执行步骤30332，再执行步骤30331。

在一个可选的实施例中，基于第一差值和第二差值确定目标摄像设备的聚焦马达的目标调整步长包括：

步骤303331，基于第一差值和第二差值确定目标收敛值；

步骤303332，根据目标收敛值确定目标调整步长。

在本实施例中，确定目标收敛值是为了确定帧图像的清晰度是否超过聚焦峰值或是否达到聚焦峰值附近，随后再确定目标调整步长，以使后续的聚焦过程能够快速的达到聚焦峰值。

其中，目标收敛值可以通过如下公式进行确定：

式中，条件A为：fv_radio0&&f_radio_diff＞default_radio1；

条件B为：f_radio_diff＜&&f_radio_C＞0；

条件C为：f_radio2＜default_radio2；

其中：default_radio1，default_radio2分别限定为5与-25。

在一个可选的实施例中，根据目标收敛值确定目标调整步长包括：

步骤3033321，在确定目标收敛值满足第一条件的情况下，确定目标调整步长为预设步长值；

步骤3033322，在目标收敛值不满足第一条件的情况下，确定目标调整步长为初始步长，其中，初始步长为目标摄像设备在采集预定数量的连续帧图像时所使用的步长。

在本实施例中，第一条件可以(但不限于)为以下公式：

其中，在未达到收敛条件时，即flag_near_peak＝0时，聚焦步长设置按照原先的设置进行行走，否则按照将聚焦步长设置为1。

在一个可选的实施例中，在确定目标摄像设备的聚焦马达的目标调整步长之后，该方法还包括：

步骤304，按照目标调整步长对目标摄像设备进行聚焦处理。

在本实施例中，聚焦处理可以(但不限于)是按照目标调整步长往复进行帧图像的采集和清晰度记录，并使清晰度达到聚焦峰值。

应该理解的是，虽然上述各流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

在此基础上，如图15所示，本申请实施例还提供了一种摄像控制装置400，该装置包括：第一确定模块410、第二确定模块420、判断模块430和控制模块440，其中：

第一确定模块410，用于确定第一比值，第一比值为摄像机当前所处的光学变倍倍率与摄像机的最大光学变倍倍率的比值；

第二确定模块420，用于确定第二比值，第二比值为摄像机当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；

判断模块430，用于判断是否第一比值小于等于第一比值阈值且第二比值小于等于第二比值阈值；

控制模块440，用于在判断的结果为是时，控制摄像机进行光学变倍；以及，在判断的结果为否时，控制摄像机进行数字变倍。

在一可选实施例中，对应于摄像机当前拍摄到单人人脸，第二比值为单人人脸的区域面积在整幅拍摄画面中的占比；对应于摄像机当前拍摄到多人人脸，第二比值为合并人脸区域面积在整幅拍摄画面中的占比，合并人脸区域面积为多人人脸中各人脸对应的区域面积的加和。

在一可选实施例中，第一比值阈值的取值范围为0.45-0.55。

在一可选实施例中，第二比值阈值的取值范围为0.15-0.25。

在一可选实施例中，该装置还包括：

第三确定模块，用于基于摄像机当前拍摄到的画面信息确定人物区域中心位置；

控制模块440，还用于根据人物区域中心位置和整幅拍摄画面的中心位置，控制摄像机移动和/或转动，以使人物区域中心位置与整幅拍摄画面的中心位置重合。

在一可选实施例中，控制模块440，用于在第一确定模块410确定第一比值之前，控制摄像机移动和/或转动以使人物区域中心位置与整幅拍摄画面的中心位置重合。

在一可选实施例中，第三确定模块，具体用于：

对应于摄像机当前拍摄到单人人脸，将单人人脸的区域中心位置确定为人物区域中心位置；

对应于摄像机当前拍摄到多人人脸，将合并人体区域的中心位置确定为人物区域中心位置，合并人体区域为基于多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，闭合区域覆盖各人体图像。

在一可选实施例中，控制模块440，具体用于：

根据水平位置偏移角度和竖直位置偏移角度控制摄像机转动；

其中，物距为当前拍摄到的人脸的实际位置和摄像机的实际位置之间的距离。

在一可选实施例中，物距根据摄像机当前所处的光学变倍倍率以及第二比值确定。

在一可选实施例中，在控制摄像机进行光学变倍之后，或在控制摄像机进行数字变倍之后，在摄像机的显示画面中人物区域面积与显示画面的总面积的比值的范围为0.7-0.8；其中，

对应于摄像机当前拍摄到单人人脸，人物区域面积为单人人脸对应的人体图像区域面积；

对应于摄像机当前拍摄到多人人脸，人物区域面积为合并人体区域面积，合并人体区域为基于多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，该闭合区域覆盖各人体图像。

在一可选实施例中，上述装置还包括：

回退模块，用于在控制摄像机进行光学变倍之后，对摄像机的显示画面进行人脸区域检测；

对应于在显示画面中没有检测到人脸区域，控制摄像机进行光学变倍回退，并回退至摄像机当前所处的光学变倍倍率的一半；

对进行光学变倍回退后摄像机的显示画面进行人脸区域检测；

对应于在进行光学变倍回退后摄像机的显示画面中没有检测到人脸区域，控制摄像机进行光学变倍回退，并回退至广角端。

在一可选实施例中，该装置还包括：

回退模块，用于在控制摄像机进行数字变倍之后，对摄像机的显示画面进行人脸区域检测；

若是，调整显示画面以显示人脸区域；若否，控制摄像机进行数字变倍回退和光学变倍回退。

在一可选实施例中，控制模块440包括：

参数采集模块441，用于获取目标摄像设备在分别采集预定数量的连续帧图像时的聚焦马达点位以及帧图像的清晰度；

坐标确定模块442，用于基于分别获取的多个所述聚焦马达点位以及多个所述清晰度，确定每帧图像对应的坐标点，其中，每帧图像对应的坐标点的坐标值包括采集每帧图像时的聚焦马达点位以及每帧图像的清晰度；

步长确定模块443，用于基于连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定所述目标摄像设备的聚焦马达的目标调整步长，其中，第四目标帧图像为第三目标帧图像之前的帧图像，第三目标帧图像、第二目标帧图像以及第一目标帧图像为依次相邻的帧图像，且第一目标帧图像为连续帧图像的最后一帧图像。

在一个可选的实施例中，步长确定模块443包括：

第一参数确定单元4431，用于基于第一坐标值、第二坐标值和第四坐标值确定第一坐标点的第一角度变化值和第一残差变化率，其中，所述第一坐标值为所述第一目标帧图像对应的所述第一坐标点的坐标值，所述第二坐标值为所述第二目标帧图像对应的第二坐标点的坐标值，所述第四坐标值为所述第四目标帧图像对应的第四坐标点的坐标值，所述第一角度变化值是第一平均每步长清晰度值与第二平均每步长清晰度值的变化量，所述第一平均每步长清晰度值为所述第一目标帧图像和所述第四目标帧图像之间的平均每步长清晰度值，所述第二平均每步长清晰度值为所述第一目标帧图像和所述第二目标帧图像之间的平均每步长清晰度值，所述第一残差变化率用于指示所述第一目标帧图像和所述第二目标帧图像的清晰度每步长变化率；

第二参数确定单元4432，用于基于第二坐标值、第三坐标值和第四坐标值确定第二坐标点的第二角度变化值和第二残差变化率，其中，所述第三坐标值为所述第三目标帧图像对应的第三坐标点的坐标值，所述第二角度变化值是第三平均每步长清晰度值与第四平均每步长清晰度值的变化量，所述第三平均每步长清晰度值为所述第二目标帧图像和所述第四目标帧图像之间的平均每步长清晰度值，所述第四平均每步长清晰度值为所述第二目标帧图像和所述第三目标帧图像之间的平均每步长清晰度值，所述第二残差变化率用于指示所述第二目标帧图像和所述第三目标帧图像的清晰度每步长变化率；

步长确定单元4433，用于基于所述第一角度变化值、所述第一残差变化率、所述第二角度变化值和所述第二残差变化率确定所述目标摄像设备的聚焦马达的目标调整步长。

在一个可选的实施例中，步长确定单元4433包括：

第一差值确定子单元44331，用于确定第一角度变化值与第二角度变化值之间的第一差值；

第二差值确定子单元44332，用于确定第一残差变化率与第二残差变化率之间的第二差值；

步长确定子单元44333，基于第一差值和第二差值确定目标摄像设备的聚焦马达的目标调整步长。

在一个可选的实施例中，步长确定子单元44333包括：

收敛确定子单元443331，用于基于第一差值和第二差值确定目标收敛值；

目标步长子单元443332，用于根据所述目标收敛值确定所述目标调整步长。

在一个可选的实施例中，目标步长子单元443332包括：

第一步长子单元4433321，用于在确定目标收敛值满足第一条件的情况下，确定目标调整步长为预设步长值；

第二步长子单元4433322，用于在目标收敛值不满足第一条件的情况下，确定目标调整步长为初始步长，其中，初始步长为目标摄像设备在采集预定数量的连续帧图像时所使用的步长。

在一个可选的实施例中，控制模块440还包括：

聚焦处理模块444，用于在确定目标摄像设备的聚焦马达的目标调整步长之后，按照目标调整步长对所述目标摄像设备进行聚焦处理。

关于摄像控制装置的具体限定可以参见上文中对于摄像控制方法的限定，在此不再赘述。上述摄像控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

需要说明的是，所述聚焦步长确定方法不仅可以在所述摄像控制方法中控制所述目标摄像设备进行光学变倍的过程中实施，也可以单独实施。参数采集模块441、坐标确定模块442和步长确定模块443也可以作为一个整体(如聚焦步长确定装置)以单独实施，如图16所示。

所述聚焦步长确定方法的实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例，图17是本申请实施例的一种聚焦步长确定方法的移动终端的硬件结构框图。如图17所示，移动终端可以包括一个或多个(图17中仅示出一个)处理器501(处理器501可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器502，其中，上述移动终端还可以包括用于通信功能的传输设备503以及输入输出设备504。本领域普通技术人员可以理解，图17所示的结构仅为示意，其并不对上述移动终端的结构造成限定。例如，移动终端还可包括比图17中所示更多或者更少的组件，或者具有与图17所示不同的配置。

存储器502可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的一种聚焦步长确定方法对应的计算机程序，处理器501通过运行存储在存储器502内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器502可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器502可进一步包括相对于处理器501远程设置的存储器，这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备503用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中，传输设备503包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备503可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

如图18所示，本申请还涉及具体装置结构包括：

聚焦触发模块，用于触发聚焦处理；

角度变化率确定单元，用于执行角度变化率计算；

相对变化率确定单元，用于执行相对变化率计算；

残差变化率确定单元，用于执行残差变化率计算；

步长调整单元(对应前述的目标步长子单元443332)，用于进行聚焦步长调整处理；

聚焦爬坡模块(对应前述的聚焦处理模块444)，用于根据调整后的聚焦步长进行聚焦处理。

本申请实施例还提供了一种计算机设备，包括处理器和存储器，该存储器存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中任意之一中的步骤。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中任意之一中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种摄像控制方法，其特征在于，所述方法包括：

确定第一比值，所述第一比值为目标摄像设备当前所处的光学变倍倍率与所述目标摄像设备的最大光学变倍倍率的比值；

确定第二比值，所述第二比值为所述目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；

判断是否所述第一比值小于等于第一比值阈值且所述第二比值小于等于第二比值阈值；

若是，控制所述目标摄像设备进行光学变倍；若否，控制所述目标摄像设备进行数字变倍。
根据权利要求1所述的摄像控制方法，其特征在于，

对应于所述目标摄像设备当前拍摄到单人人脸，所述第二比值为所述单人人脸的区域面积在整幅拍摄画面中的占比；

对应于所述目标摄像设备当前拍摄到多人人脸，所述第二比值为合并人脸区域面积在整幅拍摄画面中的占比，所述合并人脸区域面积为所述多人人脸中各人脸对应的区域面积的加和。
根据权利要求1所述的摄像控制方法，其特征在于，所述第一比值阈值的取值范围为0.45-0.55。
根据权利要求1所述的摄像控制方法，其特征在于，所述第二比值阈值的取值范围为0.15-0.25。
根据权利要求1所述的摄像控制方法，其特征在于，所述方法还包括：

基于所述目标摄像设备当前拍摄到的画面信息确定人物区域中心位置；

根据所述人物区域中心位置和整幅拍摄画面的中心位置，控制所述目标摄像设备移动和/或转动，以使所述人物区域中心位置与所述整幅拍摄画面的中心位置重合。
根据权利要求5所述的摄像控制方法，其特征在于，所述控制所述目标摄像设备移动和/或转动以使所述人物区域中心位置与所述整幅拍摄画面的中心位置重合的步骤，在所述确定第一比值的步骤之前执行。
根据权利要求5所述的摄像控制方法，其特征在于，所述基于所述目标摄像设备当前拍摄到的画面信息确定人物区域中心位置，具体包括：

对应于所述目标摄像设备当前拍摄到单人人脸，将所述单人人脸的区域中心位置确定为所述人物区域中心位置；

对应于所述目标摄像设备当前拍摄到多人人脸，将合并人体区域的中心位置确定为所述人物区域中心位置，所述合并人体区域为基于所述多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，所述闭合区域覆盖各所述人体图像。
根据权利要求5所述的摄像控制方法，其特征在于，所述根据所述人物区域中心位置和整幅拍摄画面的中心位置，控制所述目标摄像设备移动和/或转动，具体包括：

根据所述人物区域中心位置和整幅拍摄画面的中心位置之间的水平偏移量以及物距确定水平位置偏移角度；

根据所述人物区域中心位置和整幅拍摄画面的中心位置之间的竖直偏移量以及物距确定竖直位置偏移角度；

根据所述水平位置偏移角度和所述竖直位置偏移角度控制所述目标摄像设备转动；

其中，所述物距为当前拍摄到的人脸的实际位置和所述目标摄像设备的实际位置之间的距离。
根据权利要求8所述的摄像控制方法，其特征在于，

所述物距根据所述目标摄像设备当前所处的光学变倍倍率以及所述第二比值确定。
根据权利要求1所述的摄像控制方法，其特征在于，在控制所述目标摄像设备进行光学变倍之后，或在控制所述目标摄像设备进行数字变倍之后，在所述目标摄像设备的显示画面中人物区域面积与所述显示画面的总面积的比值的范围为0.7-0.8；其中，

对应于所述目标摄像设备当前拍摄到单人人脸，所述人物区域面积为所述单人人脸对应的人体图像区域面积；

对应于所述目标摄像设备当前拍摄到多人人脸，所述人物区域面积为合并人体区域面积，所述合并人体区域为基于所述多人人脸中各人脸对应的人体的图像边界而确定的一个闭合区域，所述闭合区域覆盖各所述人体图像。
根据权利要求10所述的摄像控制方法，其特征在于，所述人体图像区域面积基于对应的所述单人人脸的区域面积和预设倍数确定，所述预设倍数为预设的表征人体图像区域面积与人脸区域面积的比值。
根据权利要求1所述的摄像控制方法，其特征在于，在控制所述目标摄像设备进行光学变倍之后，所述方法还包括：

对所述目标摄像设备的显示画面进行人脸区域检测；

对应于在所述显示画面中没有检测到人脸区域，控制所述目标摄像设备进行光学变倍回退，并回退至所述目标摄像设备当前所处的光学变倍倍率的一半；

对进行光学变倍回退后所述目标摄像设备的显示画面进行人脸区域检测；

对应于在所述进行光学变倍回退后所述目标摄像设备的显示画面中没有检测到人脸区域，控制所述目标摄像设备进行光学变倍回退，并回退至广角端。
根据权利要求1所述的摄像控制方法，其特征在于，在控制所述目标摄像设备进行数字变倍之后，所述方法还包括：

对所述目标摄像设备的显示画面进行人脸区域检测；

对应于在所述显示画面中没有检测到人脸区域，判断所述整幅拍摄画面中是否具有人脸区域；

若是，调整显示画面以显示所述人脸区域；若否，控制所述目标摄像设备进行数字变倍回退和光学变倍回退。
根据权利要求1所述的摄像控制方法，其特征在于，所述控制所述目标摄像设备进行光学变倍包括：

获取所述目标摄像设备在分别采集预定数量的连续帧图像时的聚焦马达点位以及帧图像的清晰度；

基于分别获取的多个所述聚焦马达点位以及多个所述清晰度，确定每帧图像对应的坐标点，其中，每帧图像对应的坐标点的坐标值包括采集每帧图像时的聚焦马达点位以及每帧图像的清晰度；

基于所述连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定所述目标摄像设备的聚焦马达的目标调整步长，其中，所述第四目标帧图像为所述第三目标帧图像之前的帧图像，所述第三目标帧图像、所述第二目标帧图像以及所述第一目标帧图像为依次相邻的帧图像，且所述第一目标帧图像为所述连续帧图像的最后一帧图像。
根据权利要求14所述的摄像控制方法，其特征在于，基于所述连续帧图像中包括的第一目标帧图像、第二目标帧图像、第三目标帧图像以及第四目标帧图像对应的坐标点的坐标值确定所述目标摄像设备的聚焦马达的目标调整步长包括：

基于第一坐标值、第二坐标值和第四坐标值确定第一坐标点的第一角度变化值和第一残差变化率，其中，所述第一坐标值为所述第一目标帧图像对应的所述第一坐标点的坐标值，所述第二坐标值为所述第二目标帧图像对应的第二坐标点的坐标值，所述第四坐标值为所述第四目标帧图像对应的第四坐标点的坐标值，所述第一角度变化值是第一平均每步长清晰度值与第二平均每步长清晰度值的变化量，所述第一平均每步长清晰度值为所述第一目标帧图像和所述第四目标帧图像之间的平均每步长清晰度值，所述第二平均每步长清晰度值为所述第一目标帧图像和所述第二目标帧图像之间的平均每步长清晰度值，所述第一残差变化率用于指示所述第一目标帧图像和所述第二目标帧图像的清晰度每步长变化率；

基于第二坐标值、第三坐标值和第四坐标值确定第二坐标点的第二角度变化值和第二残差变化率，其中，所述第三坐标值为所述第三目标帧图像对应的第三坐标点的坐标值，所述第二角度变化值是第三平均每步长清晰度值与第四平均每步长清晰度值的变化量，所述第三平均每步长清晰度值为所述第二目标帧图像和所述第四目标帧图像之间的平均每步长清晰度值，所述第四平均每步长清晰度值为所述第二目标帧图像和所述第三目标帧图像之间的平均每步长清晰度值，所述第二残差变化率用于指示所述第二目标帧图像和所述第三目标帧图像的清晰度每步长变化率；

基于所述第一角度变化值、所述第一残差变化率、所述第二角度变化值和所述第二残差变化率确定所述目标摄像设备的聚焦马达的目标调整步长。
根据权利要求15所述的摄像控制方法，其特征在于，基于所述第一角度变化值、所述第一残差变化率、所述第二角度变化值和所述第二残差变化率确定所述目标摄像设备的聚焦马达的目标调整步长包括：

确定所述第一角度变化值与所述第二角度变化值之间的第一差值；

确定所述第一残差变化率与所述第二残差变化率之间的第二差值；

基于所述第一差值和所述第二差值确定所述目标摄像设备的聚焦马达的目标调整步长。
根据权利要求16所述的摄像控制方法，其特征在于，基于所述第一差值和所述第二差值确定所述目标摄像设备的聚焦马达的目标调整步长包括：

基于所述第一差值和所述第二差值确定目标收敛值；

根据所述目标收敛值确定所述目标调整步长。
根据权利要求17所述的摄像控制方法，其特征在于，根据所述目标收敛值确定所述目标调整步长包括：

在确定所述目标收敛值满足第一条件的情况下，确定所述目标调整步长为预设步长值；

在所述目标收敛值不满足所述第一条件的情况下，确定所述目标调整步长为初始步长，其中，所述初始步长为所述目标摄像设备在采集预定数量的所述连续帧图像时所使用的步长。
根据权利要求14所述的摄像控制方法，其特征在于，在确定所述目标摄像设备的聚焦马达的目标调整步长之后，所述方法还包括：

按照所述目标调整步长对所述目标摄像设备进行聚焦处理。
一种摄像控制装置，其特征在于，所述装置包括：

第一确定模块，用于确定第一比值，所述第一比值为目标摄像设备当前所处的光学变倍倍率与所述目标摄像设备的最大光学变倍倍率的比值；

第二确定模块，用于确定第二比值，所述第二比值为所述目标摄像设备当前拍摄到的人脸区域面积在整幅拍摄画面中的占比；

判断模块，用于判断是否所述第一比值小于等于第一比值阈值且所述第二比值小于等于第二比值阈值；

控制模块，用于在判断的结果为是时，控制所述目标摄像设备进行光学变倍；以及，在判断的结果为否时，控制所述目标摄像设备进行数字变倍。
一种计算机设备，包括处理器和存储器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至19中任意一项所述的摄像控制方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至19中任意一项所述的摄像控制方法的步骤。