CN113382155B - 自动聚焦方法、装置、设备和存储介质 - Google Patents

自动聚焦方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113382155B
CN113382155B CN202010160830.6A CN202010160830A CN113382155B CN 113382155 B CN113382155 B CN 113382155B CN 202010160830 A CN202010160830 A CN 202010160830A CN 113382155 B CN113382155 B CN 113382155B
Authority
CN
China
Prior art keywords
determining
weight
evaluation value
image
focusing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010160830.6A
Other languages
English (en)
Other versions
CN113382155A (zh
Inventor
吕乾坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Uniview Technologies Co Ltd
Original Assignee
Zhejiang Uniview Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Uniview Technologies Co Ltd filed Critical Zhejiang Uniview Technologies Co Ltd
Priority to CN202010160830.6A priority Critical patent/CN113382155B/zh
Publication of CN113382155A publication Critical patent/CN113382155A/zh
Application granted granted Critical
Publication of CN113382155B publication Critical patent/CN113382155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • H04N23/675Focus control based on electronic image sensor signals comprising setting of focusing regions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)

Abstract

本发明实施例公开了一种自动聚焦方法、装置、设备和存储介质。该自动聚焦方法应用于拍摄设备,拍摄设备包括音频采集器,音频采集器用于采集声音信息,还包括聚焦镜头,通过移动聚焦镜头的位置调整采集图像清晰度,包括:根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;将感兴趣区域在采集图像中的清晰度评价值权重设置为第一权重,采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;根据第一权重和第二权重确定采集图像的整体清晰度评价值,确定整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。实现提高在多目标复杂场景下的感兴趣区域的聚焦准确性。

Description

自动聚焦方法、装置、设备和存储介质
技术领域
本发明实施例涉及视频监控技术领域,尤其涉及一种自动聚焦方法、装置、设备和存储介质。
背景技术
随着对安防监控技术要求越来越高,对视听体验摄像机的需求也日益增加,并且对于摄像机监控画面既要求看清全景,也要求兼顾画面细节。为了满足监控需求,带有多拾音器的摄像头可以采集多个方向的声音信息,并且使用变焦镜头实现对监控场景的聚焦。
在对监控画面进行聚焦时,根据聚焦基本原理,当前摄像机自动聚焦的准确度依赖于聚焦清晰度评价曲线,基于此曲线使用传统的爬山搜索算法,可实现对监控目标的准确聚焦。
然而,在视频监控场景中,往往存在多个目标物体对应于不同的物距,则整个画面的清晰度评价曲线会出现多个峰值,不再满足单峰性。此时摄像机在进行自动聚焦时会因聚焦电机的初始位置差异,而出现不同的聚焦结果,从而影响用户体验。现有技术中,用户可通过手动调节来将聚焦电机移动至目标物体处,但是手动调节无法实现摄像机的自动聚焦,使用不方便,而且增加了用户的工作量。
发明内容
本发明实施例提供一种自动聚焦方法、装置、设备和存储介质,通过对清晰度评价值权重的设置,实现提高在多目标复杂场景下的感兴趣区域的聚焦准确性。
第一方面,本发明实施例提供了一种自动聚焦方法,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度,包括:
根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。
第二方面,本发明实施例还提供了一种自动聚焦装置,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度,包括:
感兴趣区域确定模块,用于根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
权重确定模块,用于将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
目标聚焦位置确定模块,用于根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。
第三方面,本发明实施例还提供了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的自动聚焦方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的自动聚焦方法。
本发明实施例根据拍摄设备采集图像区域内的声音信息,确定采集图像中的感兴趣区域以及其他区域,并为感兴趣区域以及其他区域设置不同的清晰度评价值权重;结合权重值确定采集图像的整体清晰度评价值,最后根据整体清晰度评价值确定目标聚焦位置。通过对清晰度评价值权重的设置,实现提高在多目标复杂监控场景下的感兴趣区域的聚焦准确性,实现拍摄设备根据实际场景的变化自动调整聚焦位置,提高用户对拍摄设备采集图像清晰度结果的满意度,提高用户体验感。
附图说明
图1(a)是本发明实施例一中的自动聚焦方法的流程图;
图1(b)是多目标场景下图像清晰度评价值变化曲线;
图2(a)是本发明实施例二中的自动聚焦方法的流程图;
图2(b)是在不同物距下的聚焦镜头的对焦曲线示意图;
图3是本发明实施例三中的自动聚焦装置的结构示意图;
图4是本发明实施例四中的设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1(a)是本发明实施例一中的自动聚焦方法的流程图,本实施例可适用于在多目标复杂监控场景下对感兴趣区域自动聚焦的情况,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度。该方法可以由自动聚焦装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在设备中,例如设备可以是后台服务器等具有通信和计算能力的设备。如图1(a)所示,该方法具体包括:
步骤101、根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域。
其中,音频采集器用于采集声音信息,尤其需要采集拍摄设备所能采集图像的覆盖区域内的声音。音频采集器可以设置在与拍摄设备同一位置处,也可以设置在与拍摄设备不同位置处。感兴趣区域是指在拍摄设备采集图像覆盖区域中用户感兴趣程度最高的区域,尤其对于拍摄设备采集图像覆盖区域中存在多个目标,则容易出现聚焦目标判断错误导致真正关注的主体未聚焦清晰的情况。在本发明实施例中,真正关注的目标主体是指发声源所对应的主体。例如对于监控范围内有至少两个人,则将发出声音的那个人设置为真正关注的目标。有利于拍摄设备根据当前实际场景判断感兴趣区域。可选的,对于本发明实施例中的包括音频采集器的拍摄设备可以采用多拾音器的摄像头,可以采集多个方向的声音信息和图像信息。
具体的,根据音频采集器获取的采集图像区域中的声音信息,确定采集图像上真正关注的目标所在区域,并将其设置为感兴趣区域。
在本发明实施例中,可选的,根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域,包括:
根据音频采集器获取到的声音信息进行声源定位,确定声源位置;将声源位置在拍摄设备采集图像中的区域,确定为感兴趣区域。
其中,声源定位是指根据声源定位技术从声音信息中确定发声源的位置,示例性的,可以采用TDOA(Time Difference of Arrival,到达时间差)算法和ILD(InterauralLevel Difference,耳间强度差)算法进行声源定位。声源位置是指拍摄设备采集图像覆盖区域内发声源相对于拍摄设备的位置信息,可以将拍摄设备与音频采集器的位置关系建立在同一坐标系下,根据声源位置与音频采集器之间的位置关系以及音频采集器与拍摄设备之间的位置关系确定声源位置与拍摄设备之间的位置关系。
具体的,采用声源定位技术从音频采集器获取到的声音信息中确定发出声音的位置,作为声源位置。示例性的,利用时间差进行定位,通过测量声音信号到达音频采集器的时间,可以确定声音信号源的距离。利用信号源到各个音频采集器的距离(以音频采集器为中心,距离为半径作圆),就能确定声音信号的位置。但是绝对时间一般比较难测量,通过比较信号到达各个音频采集器的绝对时间差,就能作出以音频采集器为焦点,距离差为长轴的双曲线,双曲线的交点就是声音信号的位置,即声源位置。或者利用声源和音频采集器的距离不同,使得声波在不同方位到达不同的音频采集器的时间不同,产生时间差,以此确定声源位置。
根据确定的声源位置确定该位置所在区域在拍摄设备采集图像中对应的目标区域,将此目标区域设置为感兴趣区域。示例性的,根据声源位置确定该声源落在采集图像的上半区域,则将上半区域确定为感兴趣区域。
在本发明实施例中,可选的,在根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域之前,还包括:
将拍摄设备采集图像划分为至少两个图像分析区域。
相应的,根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域,包括:
根据音频采集器获取到的声音信息,确定声源位置位于拍摄设备采集图像中的图像分析区域,作为目标图像分析区域;根据所述目标图像分析区域确定感兴趣区域。
其中,图像分析区域用于对采集图像的整体画面进行区分,便于更细致地确定感兴趣区域。
示例性的,将拍摄设备采集图像的画面划分为M×N的小区域,每个小区域对应一个图像分析区域。设置图像分析区域有利于根据声源位置更精确的确定感兴趣区域的设置范围,进而提高聚焦精度。
根据音频采集器获取到的声音信息,确定声源位置,并根据该声源位置确定该位置所在区域所覆盖的图像分析区域,将这些覆盖的图像分析区域确定为感兴趣区域。示例性的,将拍摄设备采集图像的画面划分为5×8的图像分析区域,根据声源位置确定声源所在的图像分析区域为第3行至第4行的第3列至第4列,则将第3行至第4行的第3列至第4列所在的区域设置为感兴趣区域。
步骤102、将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重。
其中,权重的大小表示对应区域的清晰度评价值对判断整幅图像画面的清晰度评价值的贡献程度,权重值越大,表示该区域的清晰度评价值对判断整幅图像画面的清晰度评价值的贡献程度越大。
第一权重可以包括多个权重值,同样第二权重也可以包括多个值,根据区域内部的位置取对应不同的权重值。示例性的,第一权重包括两个值分别为4和8,第二权重包括两个值分别为1和0。则将感兴趣所在的区域设置为第一权重,将感兴趣区域分为两个子区域,感兴趣区域中心位置的权重可以设置为8,感兴趣区域外沿位置的权重设置为4;同样,将感兴趣区域以外的其他区域分为两个子区域,距离感兴趣区域最近的位置的权重可以设置为1,距离感兴趣区域远的位置的权重设置为0。可选的,对于第一权重和第二权重的具体设置可以根据实际情况进行进一步的细分;对于感兴趣区域以及其他区域内部的权重赋值可以根据实际情况进行划分。
示例性的,在上述示例的基础上,将拍摄设备采集图像的画面划分为5×8的图像分析区域,则将第3行至第4行的第3列至第4列的图像分析区域的清晰度评价值权重设置为第一权重,其他区域的清晰度评价值权重设置为第二权重。
步骤103、根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。
其中,整体清晰度评价值用于表示采集图像的整体清晰情况。目标聚焦位置是指图像聚焦完成后拍摄设备中的聚焦镜头的最终位置,聚焦镜头在该位置下,所采集到的图像的清晰度评价值最大。
根据聚焦的基本原理,聚焦结果的准确性依赖于聚焦清晰度评价函数。清晰度评价函数需要具备下面的基本特性:单峰性、无偏性、单调性、灵敏性。在监控场景下,目标物体存在于不同的物距下时,整幅图像的清晰度评价值将会存在多个峰值,分别对应不同的物距,如图1(b)所示为多目标场景下图像清晰度评价值变化曲线,横坐标为聚焦镜头的位置,纵坐标为图像的清晰度评价值,两个峰值分别对应了不同的物体的聚焦位置。在该情况下,清晰度评价函数将不满足单峰性,导致在实际聚焦过程,会因初始聚焦镜头的位置差异出现不同的聚焦结果。当初始聚焦位置在近处物体的清晰度评价值峰值附近时,聚焦结果大概率是近处物体清晰远处物体模糊;而当初始聚焦位置在远处物体的清晰度评价值峰值附近时,聚焦结果则表现为远处物体清晰,近处物体相对模糊。当监控场景中目标物体存在于多个物距,且物距范围已经超出当前景深范围时,镜头属性决定无法同时看清楚近处和远处目标。这种场景下聚焦算法一次只能聚焦至一个目标,在默认兼顾全局监控画面的策略下,会出现聚焦结果表现不一致的问题,影响用户体验。
在本发明实施例中,根据设置的不同区域的清晰度评价值权重不同,确定整幅图像的整体清晰度评价值,由此确定的整幅图像的清晰度评价值将只存在一个峰值,根据该峰值所对应的聚焦镜头的位置即为目标聚焦位置。示例性的,遍历聚焦镜头的可移动位置,基于调整权重后的整体清晰度评价值使用爬山搜索算法,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。在调整权重后满足聚焦算法对清晰度评价曲线单峰性的要求,能保证感兴趣区域的清晰度,也能防止因多物距干扰导致的感兴趣区域聚焦不清晰情况。
在本发明实施例中,可选的,根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,包括:
确定聚焦镜头处于当前位置时,所述感兴趣区域的初始清晰度评价值和所述其他区域的初始清晰度评价值;根据所述第一权重和第二权重,对所述感兴趣区域的初始清晰度评价值和所述其他区域的初始清晰度评价值进行加权求和,得到所述采集图像的整体清晰度评价值。
采集图像的整体清晰度评价值由感兴趣区域的当前清晰度评价值和其他区域的当前清晰度评价值进行加权求和确定。示例性的,在上述示例的基础上,将拍摄设备采集图像的画面划分为5×8的图像分析区域,则将第3行至第4行的第3列至第4列的图像分析区域的清晰度评价值权重设置为第一权重,其他区域的清晰度评价值权重设置为第二权重。其中,第一权重值为8,第二权重值为0,采集图像中的各图像分析区域的初始清晰度评价值如表1所示,图中每个区域的数字表示当前该区域的清晰度评价值,则对应的整体清晰度评价值为333×8+333×8+104×8+114×8=7072。
示例性的,对于无声源定位信息的监控场景下,默认的感兴趣为图像画面的中央区域,并且为中央区域设置权重值,该权重值基于监控的主体位于画面中心进行制定,各个区域的清晰度评价值加权求和后即为当前画面的清晰度评价值。即在默认条件下,聚焦完成后的结果为画面中央区域的图像清晰。
表1
158 108 182 132 171 389 74 83
141 172 377 86 274 474 296 82
309 111 333 104 146 413 806 397
325 138 333 114 287 475 118 467
265 128 316 100 269 250 81 94
本发明实施例针对监控中目标物体存在于多个物距或多目标复杂场景,结合声源定位信息,确定感兴趣区域,当检测到感兴趣区域发生变化时,触发聚焦或者跟踪,并根据设置的权重计算整体清晰度评价值,以此提高感兴趣区域的图像质量。
本发明实施例根据拍摄设备采集图像区域内的声音信息,确定采集图像中的感兴趣区域以及其他区域,并为感兴趣区域以及其他区域设置不同的清晰度评价值权重;结合权重值确定采集图像的整体清晰度评价值,最后根据整体清晰度评价值确定目标聚焦位置。通过对清晰度评价值权重的设置,实现提高在多目标复杂监控场景下的感兴趣区域的聚焦准确性,实现拍摄设备根据实际场景的变化自动调整聚焦位置,提高用户对拍摄设备采集图像清晰度结果的满意度,提高用户体验感。
实施例二
图2(a)是本发明实施例二中的自动聚焦方法的流程图,本实施例二在实施例一的基础上进行进一步地优化。如图2(a)所示,所述方法包括:
步骤201、根据音频采集器获取到的声音信息进行声源定位,确定声源位置;将声源位置在拍摄设备采集图像中的区域,确定为感兴趣区域。
步骤202、将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重。
步骤203、根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值。
步骤204、根据所述声源位置与当前焦距确定聚焦镜头的位置移动范围。
其中,当前焦距是指变焦镜头的位置,在本实施例中,调整一个场景下的图像清晰度对应的焦距是固定不变的。聚焦镜头的位置移动范围是指包括了目标聚焦位置的聚焦镜头的遍历移动范围,聚焦镜头的位置移动范围越小,聚焦速度越快。
对于未限制聚焦镜头的位置移动范围的聚焦过程来说,确定目标聚焦位置的过程需要遍历聚焦镜头所能移动的所有范围,搜索区间太大,造成聚焦所需时长较长,影响用户体验感。
如图2(b)所示为在不同物距下的聚焦镜头的对焦曲线示意图,横坐标为变焦镜头的位置,即焦距;纵坐标为聚焦镜头的位置,即聚焦位置,不同的曲线分别对应在不同物距下的对焦曲线,在一定物距下,光学设计上为保证图像清晰,变焦镜头和聚焦镜头的位置存在一定的映射关系,即在同一物距下,存在一一对应的变焦镜头的位置和聚焦镜头的位置。例如在已知物距为0.1m时,当变焦镜头的焦距处于Zi位置时,聚焦镜头调整至Fi位置处即可保证采集图像的清晰度。
根据当前焦距和声源位置确定一个物距范围,根据确定的物距范围可以减小聚焦镜头所需移动的范围。示例性的,当变焦镜头处于Zi位置时,根据图2(b)所示,爬山法所需搜索的聚焦镜头的位置移动范围为(Fi,Fiii),此时聚焦耗时较大。在本发明实施例中,基于声源定位技术可以确定感兴趣区域距离拍摄设备的距离,根据该距离可以确定一个物距,在此物距的附近确定聚焦镜头的位置移动范围。示例性的,根据声源定位确定的物距为1m,则该物距下与Zi对应的聚焦镜头的位置为Fii,则在聚焦镜头在Fii位置附近确定聚焦镜头的位置移动范围,可以在保证聚焦精度的情况下缩小移动范围,提高聚焦速度。
在一个可选的实施例中,可选的,根据所述声源位置与当前焦距确定聚焦镜头的位置移动范围,包括:
确定所述声源位置与拍摄设备之间的距离,作为参考物距;根据所述参考物距确定聚焦镜头的参考位置;根据所述聚焦镜头的参考位置和与当前焦距匹配的位置移动波动值,确定聚焦镜头的位置移动范围。
参考物距为声源位置与拍摄设备之间的距离,示例性的,在上述示例的基础上,参考物距为1m,表示发出声音的物体距离拍摄设备1m。聚焦镜头的参考位置为根据参考物距、当前焦距以及对焦曲线确定的在参考物距下与当前焦距映射的聚焦电机的位置。示例性的,在上述示例的基础上,确定的聚焦镜头的参考位置为Fii。
最终确定的聚焦镜头的位置移动范围为以聚焦镜头的参考位置为中心,上下移动当前焦距匹配的位置移动波动值。示例性的,在上述示例的基础上,设定位置移动波动值为x,则对应的聚焦镜头的位置移动范围为(Fii-x,Fii+x)。位置移动波动值基于当前焦距进行确定,可以预先确定焦距与位置移动波动值之间的映射关系,该映射关系根据聚焦精度进行设置。
步骤205、根据所述聚焦镜头的位置移动范围确定采集图像的整体清晰度评价值变化范围。
确定聚焦镜头在上述确定的位置移动范围中的每个位置处,所对应的采集图像的整体清晰度评价值,根据获取到的每个位置的整体清晰度评价值确定整体清晰度评价值变化范围。
在一个可选的实施例中,可选的,根据所述聚焦镜头的位置移动范围确定采集图像的整体清晰度评价值变化范围,包括:
通过遍历所述聚焦镜头的位置移动范围,确定各位置的所述采集图像的整体清晰度评价值结果;根据所述整体清晰度评价值结果确定整体清晰度评价值变化范围。
示例性的,聚焦镜头的位置移动可以通过移动聚焦电机进行控制。确定聚焦电机从聚焦镜头的位置移动范围的下限值开始移动,每移动一步获取一次该位置下的采集图像的整体清晰度评价值,在聚焦电机移动至位置移动范围的上限值后结束。根据在此过程中获取到的所有整体清晰度评价值结果形成整体清晰度评价值变化范围。
步骤206、在所述整体清晰度评价值变化范围中整体清晰度评价值取最大值时,聚焦镜头的位置确定为目标聚焦位置。
确定整体清晰度评价值变化范围中的整体清晰度评价值最大值,并将该最大值对应的聚焦镜头的位置确定为目标聚焦位置。
本发明实施例通过声源定位确定参考物距,在参考物距下基于对焦曲线快速缩小聚焦镜头所需移动的范围,此范围远小于默认的移动范围,从而减少所需确定的整体清晰度评价值数量,提高在多目标复杂场景下感兴趣区域的聚焦速度,提高用户的体验感。
实施例三
图3是本发明实施例三中的自动聚焦装置的结构示意图,本实施例可适用于在多目标复杂监控场景下对感兴趣区域自动聚焦的情况,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度。如图3所示,该装置包括:
感兴趣区域确定模块310,用于根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
权重确定模块320,用于将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
目标聚焦位置确定模块330,用于根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。
本发明实施例根据拍摄设备采集图像区域内的声音信息,确定采集图像中的感兴趣区域以及其他区域,并为感兴趣区域以及其他区域设置不同的清晰度评价值权重;结合权重值确定采集图像的整体清晰度评价值,最后根据整体清晰度评价值确定目标聚焦位置。通过对清晰度评价值权重的设置,实现提高在多目标复杂监控场景下的感兴趣区域的聚焦准确性,实现拍摄设备根据实际场景的变化自动调整聚焦位置,提高用户对拍摄设备采集图像清晰度结果的满意度,提高用户体验感。
可选的,感兴趣区域确定模块310,具体用于:
根据音频采集器获取到的声音信息进行声源定位,确定声源位置;将声源位置在拍摄设备采集图像中的区域,确定为感兴趣区域。
可选的,目标聚焦位置确定模块330,包括整体清晰度评价值确定单元,具体用于:
确定聚焦镜头处于当前位置时,所述感兴趣区域的初始清晰度评价值和所述其他区域的初始清晰度评价值;根据所述第一权重和第二权重,对所述感兴趣区域的初始清晰度评价值和所述其他区域的初始清晰度评价值进行加权求和,得到所述采集图像的整体清晰度评价值。
可选的,所述装置还包括,图像分析区域划分模块,用于:
将拍摄设备采集图像划分为至少两个图像分析区域;
相应的,感兴趣区域确定模块310,包括:
根据音频采集器获取到的声音信息,确定声源位置位于拍摄设备采集图像中的图像分析区域,作为目标图像分析区域;根据所述目标图像分析区域确定感兴趣区域。
可选的,目标聚焦位置确定模块330,包括:
位置移动范围确定单元,用于根据所述声源位置与当前焦距确定聚焦镜头的位置移动范围;整体清晰度评价值变化范围确定单元,用于根据所述聚焦镜头的位置移动范围确定采集图像的整体清晰度评价值变化范围;目标聚焦位置确定单元,用于在所述整体清晰度评价值变化范围中整体清晰度评价值取最大值时,聚焦镜头的位置确定为目标聚焦位置。
可选的,位置移动范围确定单元,具体用于:
确定所述声源位置与拍摄设备之间的距离,作为参考物距;根据所述参考物距确定聚焦镜头的参考位置;根据所述聚焦镜头的参考位置和与当前焦距匹配的位置移动波动值,确定聚焦镜头的位置移动范围。
可选的,整体清晰度评价值变化范围确定单元,具体用于:
通过遍历所述聚焦镜头的位置移动范围,确定各位置的所述采集图像的整体清晰度评价值结果;根据所述整体清晰度评价值结果确定整体清晰度评价值变化范围。
本发明实施例所提供的自动聚焦装置可执行本发明任意实施例所提供的自动聚焦方法,具备执行自动聚焦方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储装置28,连接不同系统组件(包括系统存储装置28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储装置28可以包括易失性存储装置形式的计算机系统可读介质,例如随机存取存储装置(RAM)30和/或高速缓存存储装置32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储装置28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储装置28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储装置28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的自动聚焦方法,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度,包括:
根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的自动聚焦方法,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度,包括:
根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种自动聚焦方法,其特征在于,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度,该方法包括:
根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置;
其中,根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域,包括:
根据音频采集器获取到的声音信息进行声源定位,确定声源位置;
将声源位置在拍摄设备采集图像中的区域,确定为感兴趣区域;
确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置,包括:
根据所述声源位置与当前焦距确定聚焦镜头的位置移动范围;
根据所述聚焦镜头的位置移动范围确定采集图像的整体清晰度评价值变化范围;
在所述整体清晰度评价值变化范围中整体清晰度评价值取最大值时,聚焦镜头的位置确定为目标聚焦位置。
2.根据权利要求1所述的方法,其特征在于,根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,包括:
确定聚焦镜头处于当前位置时,所述感兴趣区域的初始清晰度评价值和所述其他区域的初始清晰度评价值;
根据所述第一权重和第二权重,对所述感兴趣区域的初始清晰度评价值和所述其他区域的初始清晰度评价值进行加权求和,得到所述采集图像的整体清晰度评价值。
3.根据权利要求1所述的方法,其特征在于,在根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域之前,还包括:
将拍摄设备采集图像划分为至少两个图像分析区域;
相应的,根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域,包括:
根据音频采集器获取到的声音信息,确定声源位置位于拍摄设备采集图像中的图像分析区域,作为目标图像分析区域;
根据所述目标图像分析区域确定感兴趣区域。
4.根据权利要求1所述的方法,其特征在于,根据所述声源位置与当前焦距确定聚焦镜头的位置移动范围,包括:
确定所述声源位置与拍摄设备之间的距离,作为参考物距;
根据所述参考物距确定聚焦镜头的参考位置;
根据所述聚焦镜头的参考位置和与当前焦距匹配的位置移动波动值,确定聚焦镜头的位置移动范围。
5.根据权利要求1所述的方法,其特征在于,根据所述聚焦镜头的位置移动范围确定采集图像的整体清晰度评价值变化范围,包括:
通过遍历所述聚焦镜头的位置移动范围,确定各位置的所述采集图像的整体清晰度评价值结果;
根据所述整体清晰度评价值结果确定整体清晰度评价值变化范围。
6.一种自动聚焦装置,其特征在于,应用于拍摄设备,所述拍摄设备包括音频采集器,所述音频采集器用于采集拍摄设备采集图像区域内的声音信息,还包括聚焦镜头,通过移动所述聚焦镜头的位置调整采集图像清晰度,包括:
感兴趣区域确定模块,用于根据音频采集器获取到的声音信息,确定拍摄设备采集图像中的感兴趣区域;
权重确定模块,用于将所述感兴趣区域在所述采集图像中的清晰度评价值权重设置为第一权重,所述采集图像中的其他区域的清晰度评价值权重设置为第二权重;其中,第一权重大于第二权重;
目标聚焦位置确定模块,用于根据所述第一权重和第二权重确定所述采集图像的整体清晰度评价值,确定所述整体清晰度评价值最大时的聚焦镜头的位置为目标聚焦位置;
其中,感兴趣区域确定模块,具体用于:
根据音频采集器获取到的声音信息进行声源定位,确定声源位置;将声源位置在拍摄设备采集图像中的区域,确定为感兴趣区域;
目标聚焦位置确定模块,包括:
位置移动范围确定单元,用于根据所述声源位置与当前焦距确定聚焦镜头的位置移动范围;整体清晰度评价值变化范围确定单元,用于根据所述聚焦镜头的位置移动范围确定采集图像的整体清晰度评价值变化范围;目标聚焦位置确定单元,用于在所述整体清晰度评价值变化范围中整体清晰度评价值取最大值时,聚焦镜头的位置确定为目标聚焦位置。
7.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的自动聚焦方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的自动聚焦方法。
CN202010160830.6A 2020-03-10 2020-03-10 自动聚焦方法、装置、设备和存储介质 Active CN113382155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010160830.6A CN113382155B (zh) 2020-03-10 2020-03-10 自动聚焦方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010160830.6A CN113382155B (zh) 2020-03-10 2020-03-10 自动聚焦方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN113382155A CN113382155A (zh) 2021-09-10
CN113382155B true CN113382155B (zh) 2023-02-28

Family

ID=77569425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010160830.6A Active CN113382155B (zh) 2020-03-10 2020-03-10 自动聚焦方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113382155B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113917437A (zh) * 2021-10-09 2022-01-11 福建汇川物联网技术科技股份有限公司 一种测量设备的对焦方法、装置、电子设备及存储介质
CN114245023B (zh) * 2022-02-24 2022-06-03 浙江华创视讯科技有限公司 一种聚焦处理方法及装置、摄像装置和存储介质
CN116705047B (zh) * 2023-07-31 2023-11-14 北京小米移动软件有限公司 音频采集方法、装置及存储介质
CN117676331A (zh) * 2024-02-01 2024-03-08 荣耀终端有限公司 自动对焦方法及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378635A (zh) * 2014-10-28 2015-02-25 西交利物浦大学 基于麦克风阵列辅助的视频感兴趣区域的编码方法
CN105472250A (zh) * 2015-12-23 2016-04-06 浙江宇视科技有限公司 自动聚焦方法及装置
CN105959577A (zh) * 2016-07-15 2016-09-21 苏州科达科技股份有限公司 一种摄像机的聚焦方法及装置
CN106973219A (zh) * 2017-02-21 2017-07-21 苏州科达科技股份有限公司 一种基于感兴趣区域的自动聚焦方法及装置
CN107835357A (zh) * 2016-09-15 2018-03-23 安讯士有限公司 自动聚焦方法、自动聚焦系统和包括自动聚焦模块的相机
WO2018059158A1 (zh) * 2016-09-29 2018-04-05 华为技术有限公司 一种自动聚焦方法及装置
CN108419015A (zh) * 2018-04-11 2018-08-17 浙江大华技术股份有限公司 一种聚焦方法及装置
CN110278383A (zh) * 2019-07-25 2019-09-24 浙江大华技术股份有限公司 聚焦方法、装置以及电子设备、存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378635A (zh) * 2014-10-28 2015-02-25 西交利物浦大学 基于麦克风阵列辅助的视频感兴趣区域的编码方法
CN105472250A (zh) * 2015-12-23 2016-04-06 浙江宇视科技有限公司 自动聚焦方法及装置
CN105959577A (zh) * 2016-07-15 2016-09-21 苏州科达科技股份有限公司 一种摄像机的聚焦方法及装置
CN107835357A (zh) * 2016-09-15 2018-03-23 安讯士有限公司 自动聚焦方法、自动聚焦系统和包括自动聚焦模块的相机
WO2018059158A1 (zh) * 2016-09-29 2018-04-05 华为技术有限公司 一种自动聚焦方法及装置
CN106973219A (zh) * 2017-02-21 2017-07-21 苏州科达科技股份有限公司 一种基于感兴趣区域的自动聚焦方法及装置
CN108419015A (zh) * 2018-04-11 2018-08-17 浙江大华技术股份有限公司 一种聚焦方法及装置
CN110278383A (zh) * 2019-07-25 2019-09-24 浙江大华技术股份有限公司 聚焦方法、装置以及电子设备、存储介质

Also Published As

Publication number Publication date
CN113382155A (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN113382155B (zh) 自动聚焦方法、装置、设备和存储介质
CN110278383B (zh) 聚焦方法、装置以及电子设备、存储介质
JP7236565B2 (ja) 位置姿勢決定方法、装置、電子機器、記憶媒体及びコンピュータプログラム
CN109683135A (zh) 一种声源定位方法及装置、目标抓拍系统
US20070018977A1 (en) Method and apparatus for generating a depth map
JPWO2018142496A1 (ja) 三次元計測装置
JP2015033103A (ja) 画像処理装置、画像処理方法、およびプログラム
CN111383204A (zh) 视频图像融合方法、融合装置、全景监控系统及存储介质
CN109902681B (zh) 用户群体关系确定方法、装置、设备及存储介质
US20160335775A1 (en) Visual navigation method, visual navigation device and robot
CN110602376B (zh) 抓拍方法及装置、摄像机
CN114529621B (zh) 户型图生成方法、装置、电子设备及介质
CA3069813A1 (en) Capturing, connecting and using building interior data from mobile devices
CN111818260B (zh) 一种自动聚焦方法和装置及电子设备
CN112215036B (zh) 跨镜追踪方法、装置、设备及存储介质
CN116980757A (zh) 快速聚焦方法、聚焦地图更新方法、设备以及存储介质
CN111105429A (zh) 一种一体化无人机检测方法
CN112601021B (zh) 一种网络摄像机监控视频的处理方法及系统
WO2023164814A1 (zh) 媒体设备及其控制方法和装置、目标跟踪方法和装置
CN115278209A (zh) 一种基于智能行走机器人的摄像头测试系统
CN112598732B (zh) 目标设备定位方法、地图构建方法及装置、介质、设备
CN109211185A (zh) 一种飞行设备、获取位置信息的方法及装置
Cao et al. Method based on bioinspired sample improves autofocusing performances
CN114758290A (zh) 火点检测方法、装置、电子设备和存储介质
JPH0252204A (ja) 3次元座標計測装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant