CN113132620B - 一种图像拍摄方法及相关装置 - Google Patents
一种图像拍摄方法及相关装置 Download PDFInfo
- Publication number
- CN113132620B CN113132620B CN201911426173.9A CN201911426173A CN113132620B CN 113132620 B CN113132620 B CN 113132620B CN 201911426173 A CN201911426173 A CN 201911426173A CN 113132620 B CN113132620 B CN 113132620B
- Authority
- CN
- China
- Prior art keywords
- focusing
- image
- main body
- target
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
Abstract
本申请实施例公开了一种图像拍摄方法及相关装置,能够在通过常规的对焦方法拍摄所获得的图像模糊时,切换成采用对场景适应性更强的基于神经网络模型的对焦方法进行对焦,以拍摄得到清晰的图像。该方案具体包括:确定当前场景中的目标对焦主体;通过第一对焦方法对当前场景中的目标对焦主体进行对焦,得到第一图像;在第一图像中该目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像;第一对焦方法和第二对焦方法对应的镜头位置不同,第二对焦方法为基于神经网络模型的对焦方法,基于第二对焦方法拍摄得到的第二图像中的目标对焦主体的清晰度不小于预设阈值。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像拍摄方法及相关装置。
背景技术
随着电子技术和图像处理技术的快速发展,智能手机、平板电脑等智能终端的拍照功能越来越强大,部分智能终端的拍照能力甚至能够媲美普通的数码相机。
在使用智能终端拍照的过程中,为了能够拍得到更好清晰度的照片,需要对当前场景的图像进行对焦,也就是根据当前的场景来调节镜头的位置以获取到最高清晰度的照片。
然而,对于一些图像拍摄方法而言,比如相位对焦方法或激光对焦方法,在一些特定的场景下其对焦能力较差,往往难以有效地实现准焦,从而无法拍摄得到清晰的照片。
发明内容
本申请实施例提供了一种图像拍摄方法及相关装置,在使用常规的对焦方法对目标对焦主体进行对焦并且得到相应的图像之后,在常规的对焦方法在当前场景下难以实现准焦而导致该图像中目标对焦主体的清晰度小于一定阈值的情况下,采用对场景的适应性更强的基于神经网络模型的对焦方法进行对焦,以获得拍摄清晰的图像。
本申请实施例第一方面提供一种图像拍摄方法,可以应用于具有触摸屏和摄像头的终端设备,或应用于终端设备中的电子装置,该方法可以包括:响应于用户打开相机应用的操作,启动相机,进入拍摄模式;在进入拍摄模式后,确定当前场景中的目标对焦主体,即确定当前场景中需要获得清晰图像的主体;通过第一对焦方法对当前场景中的目标对焦主体进行对焦,得到第一图像;在第一图像中该目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像;其中,第一对焦方法和第二对焦方法对应的镜头位置不同,即通过第一对焦方法对焦得到第一图像时的镜头位置与通过第二对焦方法对焦得到第二图像时的镜头位置不同。第一对焦方法可以包括相位对焦方法或者激光对焦方法,第二对焦方法为基于神经网络模型的对焦方法,基于第二对焦方法拍摄得到的第二图像中的目标对焦主体的清晰度不小于预设阈值。示例性地,预设阈值的值不是清晰度对应的最大取值。
本实施例中,在常规的对焦方法在当前场景下难以实现准焦而导致该图像中目标对焦主体的清晰度小于一定阈值的情况下,采用基于神经网络模型的对焦方法进行对焦,由于该神经网络模型是基于大量场景下的图像数据训练得到的,因此基于神经网络模型的对焦方法对场景的适应性更强,能够在大部分的场景下实现准焦,从而能够获得目标对焦主体拍摄清晰的图像。
可选地,在一种可能的实现方式中,该方法还包括:在第一图像中目标对焦主体的清晰度小于预设阈值时,输出第二图像为目标图像。示例性地,目标图像可以为拍摄界面上预览区域所显示的预览图像,也就是说,在第一图像中目标对焦主体的清晰度小于预设阈值的情况下,输出第二图像作为拍摄界面上的预览图像。或者,目标图像还可以是响应于用户的拍照指示,存储至存储介质(例如非易失性存储器(non-volatilememory))中的图像。
可选地,在一种可能的实现方式中,该方法还包括:在第一图像中目标对焦主体的清晰度不小于预设阈值时,输出第一图像为目标图像。示例性地,目标图像可以是拍摄界面上的预览图像,也可以是响应于用户的拍照指示,存储至存储介质中的图像。
可选地,在一种可能的实现方式中,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,包括:将标记有目标对焦主体的第一图像输入神经网络模型,得到神经网络模型的第一输出结果,第一输出结果为第一图像中目标对焦主体的清晰度;根据第一图像中目标对焦主体的清晰度调整镜头位置,得到第二图像。示例性地,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦时,可以将标记有目标对焦主体的第一图像输入至神经网络模型中,基于神经网络模型得到第一图像中目标对焦主体的清晰度,然后根据目标对焦主体的清晰度确定镜头的移动位置,将镜头移动至所确定的位置上,从而完成对焦,得到第二图像。
可选地,在一种可能的实现方式中,根据第一图像中目标对焦主体的清晰度以及全量程确定镜头的移动值,其中,全量程为镜头可移动的最大范围值,移动值为全量程与第一乘积之间的差值,第一乘积为清晰度与全量程的乘积;根据移动值将镜头移动至目标位置。例如,在得到第一图像中目标对焦主体的清晰度为80%时,可以确定镜头的移动值为镜头的全量程与(全量程*80%)的差值,也就是说,镜头的移动值为全量程与20%(1-80%)的乘积。
可选地,在一种可能的实现方式中,该神经网络模型可以是基于标记有对焦主体以及对焦主体的清晰度的图像训练数据训练得到的,也就是说,在训练神经网络模型之前,可以获取大量标记有对焦主体以及对焦主体的清晰度的图像作为神经网络模型的训练数据。示例性地,训练数据可以是预先通过手机或相机等摄像设备对大量的场景进行拍摄得到的;具体地,在同一个场景下,手机可以通过来回移动镜头,拍摄获得不同镜头位置下的图像,并且确定该图像的对焦主体;在获得不同镜头位置下的图像之后,可以基于图像所对应的镜头位置来标注该图像中对焦主体的清晰度。在训练神经网络模型的过程中,先选取一部分训练数据输入至神经网络模型中,通过神经网络模型中的前向传播算法,得到神经网络模型的清晰度预测结果。由于这部分训练数据预先标记有正确的清晰度,因此可以计算清晰度预测结果和标记的清晰度之间的差距,再基于这个差距通过反向传播算法来相应地更新神经网络模型的参数取值,从而使得神经网络模型的预测结果能够更为接近真实结果。由于神经网络模型是基于大量各种场景下的图像训练得到的,对各种场景的适应性强,因此,通过神经网络模型能够准确地获取当前图像的清晰度,从而使得手机能够根据图像的清晰度来控制镜头移动的位置,从而实现对焦,获得清晰的图像。
可选地,在一种可能的实现方式中,该方法还包括:在第一图像为多景深图像,且目标对焦主体位于多景深图像中的背景区域时,将目标对焦主体切换为多景深图像中的前景区域内的主体,从而得到切换后的目标对焦主体;在第一图像中目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像,包括:在第一图像中切换后的目标对焦主体的清晰度小于预设阈值时,在当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,得到第二图像。也就是说,在将目标对焦主体切换为多景深图像中的前景区域内的主体之后,通过第二对焦方法对当前场景中切换后的目标对焦主体进行对焦,以拍摄得到切换后的目标对焦主体清晰的第二图像。
可选地,在一种可能的实现方式中,在当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,包括:将标记有切换后的目标对焦主体的第一图像输入神经网络模型,得到神经网络模型的第二输出结果,第二输出结果为第一图像中切换后的目标对焦主体的清晰度;根据第一图像中切换后的目标对焦主体的清晰度调整镜头位置,得到第二图像。
可选地,在一种可能的实现方式中,该方法还包括:在通过第二对焦方法对切换后的目标对焦主体进行对焦时,可以根据切换后的目标对焦主体在拍摄界面上显示对焦框,对焦框用于标记切换后的目标对焦主体,以提示用户当前的目标对焦主体。
可选地,在一种可能的实现方式中,该方法还包括:在拍摄界面上显示提示信息1,该提示信息1用于提示用户切换对焦方法或开启通过第二对焦方法进行对焦的模式。也就是说,在通过第二对焦方法对目标对焦主体进行对焦的过程中,可以在拍摄界面上显示提示信息1,以提示用户当前正在切换对焦方法或者当前正在开启通过第二对焦方法进行对焦的模式。
可选地,在一种可能的实现方式中,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像之后,该方法还可以包括:在第二图像中的目标对焦主体的清晰度小于预设阈值时,在拍摄界面上显示提示信息2,该提示信息2用于提示用户调整拍摄距离。
可选地,在一种可能的实现方式中,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像之后,该方法还可以包括:在第二图像中的目标对焦主体的清晰度小于预设阈值时,在拍摄界面上显示提示信息3,该提示信息3用于提示用户切换摄像头或者切换拍摄模式。
本申请实施例第二方面提供了一种图像拍摄装置,包括:处理单元,用于确定当前场景中的目标对焦主体;处理单元,还用于通过第一对焦方法对当前场景中的目标对焦主体进行对焦,得到第一图像;处理单元,还用于在第一图像中目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像,第二图像中的目标对焦主体的清晰度不小于预设阈值;其中,第一对焦方法和第二对焦方法对应的镜头位置不同,第二对焦方法为基于神经网络模型的对焦方法。
可选地,在一种可能的实现方式中,图像拍摄装置还包括输出单元,用于在第一图像中目标对焦主体的清晰度小于预设阈值时,输出第二图像为目标图像。
可选地,在一种可能的实现方式中,图像拍摄装置还包括输出单元,用于在第一图像中目标对焦主体的清晰度不小于预设阈值时,输出第一图像为目标图像。
可选地,在一种可能的实现方式中,处理单元,还用于将标记有所述目标对焦主体的第一图像输入所述神经网络模型,得到所述神经网络模型的第一输出结果,所述第一输出结果为所述第一图像中所述目标对焦主体的清晰度;根据所述第一图像中所述目标对焦主体的清晰度调整镜头位置,得到第二图像。
可选地,在一种可能的实现方式中,处理单元,还用于根据所述第一图像中所述目标对焦主体的清晰度以及全量程确定所述镜头的移动值,其中,所述全量程为所述镜头可移动的最大范围值,所述移动值为所述全量程与第一乘积之间的差值,所述第一乘积为所述清晰度与所述全量程的乘积;根据所述移动值将所述镜头移动至目标位置。
可选地,在一种可能的实现方式中,处理单元,还用于在第一图像为多景深图像,且目标对焦主体位于多景深图像中的背景区域时,将目标对焦主体切换为多景深图像中的前景区域内的主体,得到切换后的目标对焦主体;处理单元,还用于在第一图像中切换后的目标对焦主体的清晰度小于预设阈值时,在当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,得到第二图像。
可选地,在一种可能的实现方式中,图像拍摄装置还包括显示单元,用于根据切换后的目标对焦主体在拍摄界面上显示对焦框,对焦框用于标记切换后的目标对焦主体。
可选地,在一种可能的实现方式中,图像拍摄装置还包括显示单元,用于在拍摄界面上显示提示信息,提示信息用于提示用户切换对焦方法或开启通过第二对焦方法进行对焦的模式。
可选地,在一种可能的实现方式中,神经网络模型是通过标记有对焦主体以及所述对焦主体的清晰度的图像训练数据训练得到的。
可选地,在一种可能的实现方式中,第一对焦方法包括相位对焦方法或激光对焦方法。
本申请实施例第三方面提供了一种电子设备,包括:触摸屏,其中,触摸屏包括触敏表面和显示器;摄像头;处理器;存储器;多个应用程序;以及计算机程序。其中,计算机程序被存储在存储器中,计算机程序包括指令。当指令被电子设备执行时,使得电子设备执行上述第一方面任一项可能的实现中的图像拍摄方法。
本申请实施例第四方面提供了一种电子装置,包括处理器和存储器。该存储器与处理器耦合,存储器用于存储计算机指令,当处理器执行该计算机指令时,使得终端设备执行上述第一方面任一项可能的实现方式中的图像拍摄方法。
本申请实施例第五方面提供了一种电子装置,包括存储器和多个处理器。该存储器与多个处理器耦合,存储器用于存储计算机指令,当多个处理器执行该计算机指令时,使得终端设备执行上述第一方面任一项可能的实现方式中的图像拍摄方法。示例性地,多个处理器可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processing unit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU),其中,AP、调制解调处理器、GPU、ISP、控制器、视频编解码器、DSP和基带处理器等可以用于通过第一对焦方法来进行对焦,NPU可以用于通过第二对焦方法来进行对焦。
本申请实施例第六方面提供了一种无线通信装置,该无线通信装置包括:处理器以及接口电路;其中,该处理器通过该接口电路与存储器耦合,该处理器用于执行该存储器中的程序代码,以实现如第一方面中任一可能的实现方式中的图像拍摄方法。
本申请实施例第七方面提供了一种计算机存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面任一项可能的实现方式中的图像拍摄方法。
本申请实施例第八方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得电子设备执行上述第一方面任一项可能的实现方式中的图像拍摄方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例提供了一种图像拍摄方法及相关装置,在使用常规的对焦方法对目标对焦主体进行对焦并且得到相应的图像之后,在常规的对焦方法在当前场景下难以实现准焦而导致该图像中目标对焦主体的清晰度小于一定阈值的情况下,采用对场景的适应性更强的基于神经网络模型的对焦方法进行对焦,以获得拍摄清晰的图像。
附图说明
图1a为本申请实施例提供的一种电子设备的硬件结构示意图;
图1b为本申请实施例提供的一种电子设备的软件结构示意图;
图1c为本申请实施例提供的一组显示界面示意图;
图2为本申请实施例提供的另一组显示界面示意图;
图3为本申请实施例提供的另一组显示界面示意图;
图4为本申请实施例提供的另一组显示界面示意图;
图5a为本申请实施例提供的一种感受野的示意图;
图5b为本申请实施例提供的一种神经网络模型的结构示意图;
图5c为本申请实施例提供的另一组显示界面示意图;
图6为本申请实施例提供的另一组显示界面示意图;
图7为本申请实施例提供的另一组显示界面示意图;
图8为本申请实施例提供的一种镜头移动示意图;
图9A为本申请实施例提供的一组显示界面示意图;
图9B为本申请实施例提供的另一组显示界面示意图;
图10为本申请实施例提供的另一组显示界面示意图;
图11为本申请实施例提供的另一种显示界面示意图;
图12为本申请实施例提供的另一种显示界面示意图;
图13为本申请实施例提供的一种图像拍摄方法的流程示意图;
图14为本申请实施例提供的一种电子设备的结构示意图;
图15为本申请实施例提供的一种电子装置的结构示意图;
图16为本申请实施例提供的一种无线通信装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
目前,传统的对焦方法大多采用多器件辅助的方法,通过终端上的多器件获取辅助信息,再基于获取到的辅助信息来进行对焦,如相位对焦方法、激光对焦方法、反差式对焦方法或双目对焦方法等辅助对焦方法。但是,这些对焦方法所得到的辅助信息往往存在局限性而给出错误的数据,最终导致无法对焦清晰。
例如,相位对焦方法是通过硬件的方式,新增加了分离镜头和线性传感器对进行图像处理,通过分离镜头分离出两个图像之后,通过线性传感器检测两个图像的距离,从而推动镜头到准焦位置,保证图像的清晰。然而,在一些特定的场景下,例如光线较暗的场景、包含较多平坦区域的场景(比如湖面、天空等场景)、弱纹理场景(比如雪山等场景)或者是包括有小目标物体的场景,相位对焦方法往往较难预测对焦位置,从而难以实现较好的对焦结果。
又例如,激光对焦方法是通过硬件(如激光发射装置和测距仪)的方式预测目标物体和镜头的距离,将距离转换为对应的镜头位置,从而推动镜头到达预测准焦位置。比如,在拍摄时,激光发射装置发射红外激光,红外激光照射到目标物体的表面上,并且经过目标物体的反射之后,红外激光被测距仪接收到。这样一来,便可以通过计算红外激光的发射时间与接收时间之间的时间差,来计算目标物体到镜头的距离,从而基于该距离实现对焦。然而,由于激光对焦方法通过红外激光感知对焦距离,很容易受到环境光干扰,例如太阳直射场景或者是强灯光直射场景,测距仪可能会接收到其他的反射光线,从而导致难以准确地计算目标物体与镜头之间的距离,导致对焦效果差。
再例如,反差式对焦方法是检测拍摄得到的图像对应的对比度,在检测到最大对比度之前不断地调整镜头位置,最终找到能使得图像对比度最大的镜头位置,即为准焦位置。然而,反差式对焦方法在平坦区域场景、小目标物体场景、以及夜景等场景下难以找到最大对比度位置,并且容易受到手抖、环境变化(如闪烁灯)等外部因素影响,从而导致图像失焦。有鉴于此,本申请实施例提供了一种图像拍摄方法,可以应用于电子设备,在使用常规的对焦方法对目标对焦主体进行对焦并且得到相应的图像之后,在常规的对焦方法在当前场景下难以实现准焦而导致该图像中目标对焦主体的清晰度小于一定阈值的情况下,采用对场景的适应性更强的基于神经网络模型的对焦方法进行对焦,由经过大量场景下的图像训练得到的神经网络模型提供图像中目标对焦主体的清晰度作为辅助信息,来确定镜头位置,以获得拍摄清晰的图像。
本申请实施例提供的图像拍摄方法可以应用于电子设备上,该电子设备可以包括终端设备或电子装置,该电子装置包括有处理器和存储器,可部署于终端设备上。其中,终端设备可以包括手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digitalassistant,PDA)等设备。本申请实施例对终端设备以及电子装置的具体类型不作任何限制。
示例性的,图1a示出了电子设备100的结构示意图。电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
在本申请实施例中,在拍摄场景下,摄像头193采集彩色图像,ISP对摄像头193反馈的数据进行处理,处理器110中的NPU可以对ISP处理后的图像进行图像分割,确定图像上不同物体或不同物体类型分别所在的区域。处理器110可以保留特定的一个或多个物体所在区域的色彩,并将特定的一个或多个物体所在的区域以外的其他区域进行灰度化处理,从而可以将特定的物体所在的整个区域的色彩保留下来。
其中,灰度化处理是指像素点的像素值转换为灰度值,将彩色图像变为灰度图像(也称黑白图像)。其中,像素值用于表示像素点的颜色,例如像素值可以为R(红)G(绿)B(蓝)值,灰度化可以将像素点的RGB值处理为R值=G值=B值。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图1b是本申请实施例的电子设备100的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。应用程序层可以包括一系列应用程序包。
如图1b所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图1b所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
为了便于叙述,以下将以电子设备为手机为例,对本申请实施例提供的图像拍摄方法进行详细的描述。
图1c中的(a)示出了手机的一种图形用户界面(graphical user interface,GUI),该GUI为手机的桌面101。当手机检测到用户点击桌面101上的相机应用(application,APP)的图标102的操作后,可以启动相机应用,显示如图1c中的(b)所示的另一GUI,该GUI可以称为拍摄界面103。该拍摄界面103上可以包括取景框104。在预览状态下,该取景框104内可以实时显示预览图像。
示例性的,参见图1c中的(b),手机在启动相机后,取景框104内可以显示有图像1。拍摄界面上还可以包括用于指示拍照模式的控件105,用于指示录像模式的控件106,以及拍摄控件107。在拍照模式下,当手机检测到用户点击该拍摄控件307的操作后,手机执行拍照操作;在录像模式下,当手机检测到用户点击该拍摄控件107的操作后,手机执行拍摄视频的操作。
在手机启动相机后,手机可以通过摄像头采集当前场景的图像,并且将采集到的图像显示在取景框内。在采集到当前场景的图像之后,手机可以确定当前场景中的目标对焦主体,其中,目标对焦主体可以是当前场景中需要获得清晰图像的主体。
手机确定目标对焦主体的方式可以有多种。
在一些实施例中,手机可以在自动对焦模式下确定目标对焦主体。一般地,在手机启动相机之后,手机可以自动进入自动对焦模式。在自动对焦模式下,手机可以自动选取当前场景的图像中的部分区域作为对焦区域,从而确定当前场景的图像中的目标对焦主体为位于该对焦区域内的主体。一般地,手机所选取的对焦区域可以是预先设置好的,例如是图像中心的一个方形区域或者一个圆形区域等等;手机所选取的对焦区域的边长或者周长也可以是预先设置好的,例如在手机选取方形区域作为对焦区域的情况下,该方形区域的边长可以是取景框其中一个边长的五分之一。示例性地,如图2所示,手机以当前场景的图像的中心为参照点,选取了图像中心的一个方形区域作为对焦区域,确定目标对焦主体为该对焦区域内的主体。在一些可选的实施方式中,手机在自动对焦模式下所选取的对焦区域可以是隐藏的,也就是说,手机所选取的对焦区域在拍摄界面上是不显示的。
在一些实施例中,手机可以在手动对焦模式下确定目标对焦主体。其中,在手机启动相机之后,当手机检测到用户点击取景框中的图像的任意一个位置之后,手机可以进入手动对焦模式。在手动对焦模式下,手机可以选取用户点击的位置作为对焦点,并且选取以对焦点为中心的一个方形区域或者圆形区域作为对焦区域,从而确定当前场景的图像中的目标对焦主体为位于该对焦区域内的主体。示例性地,如图3中(a)所示,用户在取景框中对当前场景的图像中的花朵进行了点击,如图3中(b)所示,手机检测到了用户的点击之后,选取以用户点击的位置为中心的一个方形区域作为对焦区域,并且确定位于该方形区域内的花朵为目标对焦主体。
在一些实施例中,手机可以在人工智能(artificial intelligence,AI)对焦模式下确定目标对焦主体。在AI对焦模式下,手机可以对当前场景的图像中的对象进行检测,并且在检测到特定的对象时,确定该对象为目标对焦主体。例如,对静态场景下的人物、动物或者建筑物等进行检测,确定检测到的对象为目标对焦主体;又例如,对动态场景下移动中的人物或者动物进行检测,确定检测到的人物或者动物为目标对焦主体;再例如,通过识别图像中的前景和后景,检测位于图像前景中的对象,确定图像前景中的对象为目标对焦主体。示例性地,如图4中(a)所示,手机可以对当前场景的图像中的人物进行检测,并且在检测到人物时,选择人物或者人物的脸作为目标对焦主体;示例性地,如图4中(b)所示,手机可以对当前场景的图像中的动物进行检测,并且在检测到动物时,选择该动物作为目标对焦主体;示例性地,如图4中(c)所示,手机还可以对当前场景的图像中的建筑物进行检测,并且在检测到建筑物时,选择该建筑物作为目标对焦主体。
其中,手机可以有多种进入AI对焦模式的方式。在一实施例中,在手机检测到用户点击拍摄界面上的AI控件时,手机进入或者退出AI对焦模式,示例性地,如图4中(d)所示,在手机没进入AI对焦模式的情况下,手机检测到用户点击拍摄界面上的AI控件401时,手机进入AI对焦模式,并且改变AI控件401的显示颜色(例如将AI控件401变为彩色);在手机进入AI对焦模式之后,手机检测到用户点击拍摄界面上的AI控件401时,手机退出AI对焦模式,并且恢复AI控件401原来的显示颜色(例如将AI控件401恢复为白色)。在另一实施例中,在手机检测到用户点击拍摄界面上的拍摄选项控件时,手机可以进入模式选择界面,并且在手机检测到用户点击模式选择界面中的AI模式控件时,手机进入AI对焦模式;示例性地,如图4中(e)所示,手机检测到用户点击拍摄选项控件402时,手机可以进入模式选择界面,如图4中(f)所示,手机检测到用户点击模式选择界面中的AI模式控件403时,手机可以选择进入AI对焦模式。在另一实施例中,在手机检测到用户在拍摄界面上的预设手势操作时,可以进入或退出AI对焦模式;例如,在手机检测到用户在拍摄界面上画出圆圈或者拖动一定的轨迹时,手机可以进入或退出AI对焦模式。
在确定了当前场景中的目标对焦主体之后,手机可以通过第一对焦方法对当前场景中的目标对焦主体进行对焦,得到第一图像。
在一些实施例中,手机可以是通过相位对焦方法对当前场景的图像进行对焦,即第一对焦方法可以是相位对焦方法。
在一些实施例中,手机可以是通过激光对焦方法对当前场景的图像进行对焦,即第一对焦方法可以是激光对焦方法。
在手机通过第一对焦方法对当前场景中的目标对焦主体进行对焦,并且得到第一图像之后,手机可以确定第一图像中目标对焦主体的清晰度。
在一些实施例中,手机可以通过预置的神经网络模型来确定第一图像中目标对焦主体的清晰度。具体地,手机可以将标记了目标对焦主体的第一图像输入至神经网络模型中,由神经网络模型输出第一图像中目标对焦主体的清晰度,例如,神经网络模型的输出值可以为30%、50%、100%等等,其中上述的30%、50%、100%即为第一图像中目标对焦主体对应的清晰度。
具体地,在手机确定了目标对焦主体之后,可以通过标记框将目标对焦主体在第一图像中所在的区域进行标记,以使得神经网络模型能够获取到第一图像中需要输出清晰度的区域。在一种可能的实施方式中,标记框可以是预设形状的框,例如方形框或者圆形框等,该标记框的大小与目标对焦主体相匹配,能够将目标对焦主体包围于标记框内。在一种可能的实施方式中,标记框还可以是与目标对焦主体的形状相匹配的轮廓框,即标记框为基于目标对焦主体外围的轮廓所形成的框,能够刚好将目标对焦主体包围于标记框内。
在一些实施例中,神经网络模型可以是通过采用大量的训练数据对机器学习模型进行训练后得到的。其中,训练数据指的是标注有对焦主体以及对焦主体的清晰度的图像数据,通过获取大量的原始图像,标记原始图像中的对焦主体,并且对这些原始图像中对焦主体的清晰度进行标注,即可获得用于训练模型的训练数据。
示例性地,训练数据可以是预先通过手机或相机等摄像设备对大量的场景进行拍摄得到的;具体地,在同一个场景下,手机可以通过来回移动镜头,拍摄获得不同镜头位置下的图像;在获得不同镜头位置下的图像之后,可以基于图像所对应的镜头位置来标注该图像的清晰度。例如,假设手机中镜头能够移动的全量程(full range)为500,镜头能够在100-600的位置之间来回移动,其中,位置100和位置600为镜头能够移动的两个端点位置),在某一场景下,在手机中的镜头移动到450的位置时实现准焦,即镜头的实际准焦位置为450,那么,在镜头位置为300时所拍摄的图像的清晰度为100%-(450-300)/500=70%,在镜头位置为550时所拍摄的图像的清晰度为100%-(550-450)/500=80%,在镜头位置为450时所拍摄的图像的清晰度为100%-(450-450)/500=100%。也就是说,在同一个场景下,图像的清晰度为100%与镜头位置差值与镜头全量程的比值之间的差值,其中,镜头位置差值是指拍摄该图像时的镜头位置与镜头准焦位置之间的差值的绝对值。这样,在同一个场景下,通过移动镜头至不同的位置,并且获取不同位置下的图像,便可以得到同一个场景下不同清晰度的一组图像;对于每一个不同的场景,都可以执行上述的步骤,从而获得多组不同场景下的图像。
由于在用于训练神经网络模型的图像训练数据中,图像中的对焦主体的清晰度是与图像拍摄时的镜头位置具有对应关系的,因此,将标记有目标对焦主体的第一图像输入至训练后的神经网络模型后,所得到的目标对焦主体的清晰度也与镜头位置具有对应关系,也就是说,基于目标对焦主体的清晰度可以确定图像准焦时的镜头位置。并且,由于神经网络模型是基于大量场景下的图像训练数据所得到的,因此,基于神经网络模型确定图像中目标对焦主体的清晰度对场景的适应性更强,即神经网络模型所提供的清晰度辅助信息并不具有由硬件所带来的局限性,能够实现大部分场景下的准焦,对焦效果好。
示例性地,上述的机器学习模型具体可以是卷积神经网络(convolutionalneural network,CNN)模型、超分辨率卷积神经网络(superresolution convolutionalneural network,SRCNN)模型或者残差网络(residual network,ResNet)模型等模型。
在一个具体的实施例中,可以采用基于单幅图像的超分辨率(very deep superresolution,VDSR)方法对CNN模型进行训练,得到训练后的神经网络模型。其中,VDSR方法指的是给定一个低分辨率图像来生成一个高清图像,其具体实现过程是:通过一个网络层次较深的网络(即深网络),采用较大的感受野(receptive field),充分考虑上下文消息,使用残差学习和极高学习率来提高训练效果。
其中,感受野是CNN模型中每一层输出的特征图上的像素点在输入图像上映射的区域大小。简单来说,感受野即为特征图上的一个点对应输入图像上的区域,举例而言,两层3*3的卷积核卷积操作之后的感受野是5*5;三层3*3卷积核操作之后的感受野是7*7。如图5a所示,图像为2层3x3卷积操作,其感受野为5x5。感受野越大,表明每个特征点对应输入图上的区域越大。
具体地,采用VDSR方法对CNN模型进行训练的过程可以包括:
1、在采用深网络的学习方法时,可以采用较大的感受野(例如大于41×41的感受野)来保证能够学习到更多的特征,并且通过领域内的数据、目标的标注、目标的空间位置等数据考虑上下文消息,从而提高CNN模型的检测准确率。
2、为了加速训练过程中的收敛,可以使用残差学习来观测实际观察值和估计值之间的差,例如采用大于0.1的高学习率;以及采用梯度裁剪的方式来避免训练时间过长。
其中,采用梯度裁剪的方法具体可以为:根据多个参数的梯度所组成的向量进行L2norm(即L2范数,其中L2指的是欧式距离)裁剪。先设定一个clip norm(裁剪范数),然后在某一次反向传播之后,通过各个参数的变化率构成一个向量,通过计算向量各元素的平和方后开方来计算这个向量的L2 norm。然后比较L2 norm和clip norm的值,若L2norm<=clip_norm,则不做处理,否则计算缩放因子scale_factor=clip_norm/LNorm,然后令原来的梯度乘上这个缩放因子。这样,可以使得向量的变化率的L2 norm小于预设的clipnorm。值得注意的是,若不采用梯度裁剪方式,会导致梯度过大优化算法超过最优点。
3、将不同尺寸大小的图像混合在一起训练,保证不同尺寸大小的图像都能够具有较高的检测准确率。
具体地,可以参阅图5b,图5b具体为用于实现VDSR方法的网络结构图。首先,模糊图像通过向量卷积运算子(Conv1)和激活函数(Relu.1),Conv12和Relu.2…Conv.D-1和Relu.D-1进行深层次的卷积和激活函数,最终得到高精图像。每一层卷积Conv为3x3的矩阵算子,激活函数可以有效的避免梯度爆炸,使用到的激活函数可以为:Relu(x)=max(0,x)。
一般地,在手机获得第一图像之后,手机可以默认为直接确定第一图像中目标对焦主体的清晰度;在下面的一些情况下,手机则可以是在切换第一图像中的目标对焦主体之后,确定第一图像中切换后的目标对焦主体的清晰度。
在一些实施例中,手机在获得第一图像之后,可以对第一图像进行检测,在手机检测到第一图像为多景深图像时,且目标对焦主体位于多景深图像中的背景区域时,将目标对焦主体切换为多景深图像中的前景区域内的主体,得到切换后的目标对焦主体。通常来说,在手机完成对焦之后,在距离焦点处被拍摄物体前后一定范围内的物体均能够呈现清晰的图像,而焦点处被拍摄物体所对应的前后距离范围则称为景深。多景深图像指的就是在一个图像中存在有多个景深的图像。示例性地,手机可以对第一图像中不同区域的清晰度或者对比度进行检测,如果手机检测到第一图像中存在多个清晰度或者对比度差异较大的区域时,手机可以确定第一图像为多景深图像。
相较于现有的对焦方法,本实施例中通过对图像进行检测,在图像的目标对焦主体位于背景区域时,切换目标对焦主体为前景区域中的主体,并且基于切换后的目标对焦主体通过神经网络模型进行对焦,能够对目标对焦主体进行纠正,对焦得到前景区域中的主体清晰的图像,对焦效果好。
示例性地,如图5c所示,图5c中(a)表示手机在确定了当前场景的图像中心对应的主体为目标对焦主体之后,通过第一对焦方法进行对焦,获得第一图像,并且在拍摄界面上显示第一图像;图5c中(b)表示手机检测到第一图像为多景深图像,并且确定了第一图像中的前景区域;图5c(c)表示手机在确定第一图像中的前景区域之后,对前景区域中的主体进行识别,识别得到位于前景区域中的花朵,从而将目标对焦主体切换为位于前景区域内的花朵。
在一种可能的实现方式中,手机可以是每次在获得第一图像之后,都自动对第一图像进行检测,也可以是在手机处于多景深拍摄模式时,对第一图像进行检测。例如,在手机的拍摄界面上可以显示有多景深模式控件,在手机检测到用户点击多景深模式控件时,手机进入多景深拍摄模式。示例性地,如图6中(a)所示,该多景深模式控件可以为控件601;如图6中(b)所示,该多景深模式控件可以为控件602;在另一实施例中,在手机的模式选择界面上可以显示有多景深模式控件,在手机检测到用户点击拍摄界面上的拍摄选项控件时,手机可以进入模式选择界面,并且在手机检测到用户点击模式选择界面中的多景深模式控件时,手机进入多景深拍摄模式;示例性地,如图6中(c)所示,该多景深模式控件可以为控件603。
在一种可能的实现方式中,手机也可以对当前场景的图像进行检测,在检测到当前场景的图像为多景深图像时,自动进入多景深拍摄模式,并且在拍摄界面上显示多景深拍摄模式控件,以提示用户手机已进入多景深拍摄模式中。示例性地,如图6中(d)所示,手机在进入多景深拍摄模式之后,在拍摄界面上所显示的多景深模式控件可以为控件604,也可以为如图6中(e)所示的控件605或者如图6中(f)所示的控件606。
在一些实施例中,手机在获得第一图像之后,可以对第一图像进行检测,在手机检测到第一图像中包含有目标对象时,将目标对焦主体切换为第一图像中的目标对象,得到切换后的目标对焦主体。示例性地,目标对象可以是人物;目标对象也可以是动物,例如猫、狗或者兔子等;目标对象还可以是景物,例如花朵、小草或树木等;目标对象还可以是一些特定的物体,例如汽车、水杯或鼠标等;目标对象还可以是建筑物,例如高楼、铁塔或庙宇等。示例性地,如图7所示,图7中(a)表示手机通过第一对焦方法进行对焦,获得第一图像,并且在拍摄界面上显示第一图像;图7中(b)表示手机检测到第一图像包含有目标对象--寺庙,并且确定了第一图像中寺庙所在的目标区域;图7中(c)表示手机在确定第一图像中寺庙所在的目标区域之后,对目标区域进行提取,以标记第一图像中的目标对象。
在手机确定了第一图像中目标对焦主体的清晰度之后,手机可以确定当前场景中的目标对焦主体的清晰度是否小于预设阈值。
在一些实施例中,在手机得到切换后的目标对焦主体的情况下,手机可以在当前场景下确定切换后的目标对焦主体的清晰度是否小于预设阈值。
在手机确定了第一图像中目标对焦主体的清晰度小于预设阈值,或者手机确定了第一图像中切换后的目标对焦主体的清晰度小于预设阈值时,手机可以通过第二对焦方法对当前场景中的目标对焦主体或者切换后的目标对焦主体进行对焦,获得对焦效果更佳的第二图像。
需要说明的是,在本实施例中,目标对焦主体的清晰度可以是基于预先训练好的神经网络模型所得到的一个程度值、分值或百分比,用于表示目标对焦主体的清晰程度;其中,分值或者程度值越高,可以表示图像中目标对焦主体越清晰。例如,一种表达清晰度的取值范围可以是0%至100%,或者0到100,或者0到10等。具体地,清晰度的取值与获得图像的镜头位置也具有关联关系,通常镜头在目标对焦主体对应的准焦位置处所拍摄到的图像中,目标对焦主体对应的清晰度可以理解为最高;实际拍摄场景中,对于同一目标对焦主体而言,拍摄图像时,镜头位置距离目标对焦主体对应的准焦位置越接近,目标对焦主体的清晰度的取值越大;图像中目标对焦主体的各细部影纹及边界的清晰程度越高,即人眼所看到的图像中的目标对焦主体越清晰。
可选的,清晰度可以用亮度来衡量或表示,对于同一个拍摄主体而言,图像的清晰度越大,图像的亮度越大;可选的,清晰度还可以用色度来衡量或表示,对于同一个拍摄主体而言,图像的清晰度越大,图像的色度也越大。图像的亮度/色度可以具体到拍摄主体在图像中的整个区域的整体亮度/色度水平,或者具体到这个区域中各个像素的亮度/色度的整体均值。可选的,清晰度还可以用对比度来衡量或表示,对于同一个拍摄主体而言,图像的清晰度越大,图像的对比度也越大。在对焦过程中,目标对焦主体的对比度最大时,清晰度对应的取值为100%,在目标对焦主体的对比度最小时,清晰度对应的取值为0。其中,对比度指的是图像的明暗区域中最亮的白点和最暗的黑点之间不同亮度层级之间的对比,简单来说,就是目标对焦主体所在的区域中亮度最高的像素点与亮度最低的像素点之间的亮度比值。一般来说,对比度越大,图像越清晰醒目,色彩也越鲜明艳丽;而对比度越小,图像越模糊,色彩也越灰蒙。图像的对比度可以具体到拍摄主体在图像中的整个区域的整体对比度水平,或者具体到这个区域中各个像素的对比度的整体均值。对于本领域技术人员而言,清晰度的衡量标准还有很多种公知的实施方式,本发明不予以穷举和赘述。
值得注意的是,在本实施例的一些可能的实施方式中,也可以是通过模糊程度值来判断图像中的目标对焦主体是否失焦,对于同一个拍摄主体,模糊程度值越大,越不清楚。模糊程度值越小,越清楚。类似的,模糊程度值可以是基于预先训练好的神经网络模型所得到的一个程度值、分值或百分比。在图像中的目标对焦主体的模糊程度值大于预设阈值的时候,判定目标对焦主体失焦,手机通过第二对焦方法对当前场景中的目标对焦主体或者切换后的目标对焦主体进行对焦。其中,模糊程度值的取值范围也可以是0至100%,模糊程度值的取值与获得第一图像时的镜头位置具有对应关系,获得第一图像时的镜头位置距离准焦位置越近,模糊程度值的取值越小;获得第一图像时的镜头位置距离准焦位置越远,模糊程度值的取值越大。类似的,模糊程度值也可以由对比度来表征,在对焦过程中,目标对焦主体的对比度最大时,模糊程度对应的取值为0,在目标对焦主体的对比度最小时,模糊程度对应的取值为100%。在本实施例的一些可能的实施方式中,也可以根据模糊程度值来确定图像的清晰度,例如,图像的模糊程度与清晰度之和为常数,具体地,例如,第一图像的模糊程度为20%,常数为1,则第一图像的清晰度为80%。
可选的,预设阈值可以是终端预先设定好的一个阈值,其具体的数值可以由以下示例性的方法确定得到:例如根据神经网络模型的精度或者偏差值来确定预设阈值的具体数值,或者根据经过大量的拍摄运算得到的经验值来确定预设阈值的具体数值;可选的,预设阈值也可以是终端从云端获取到的一个阈值,例如,终端系统升级时系统设置的阈值;可选的,预设阈值还可以是用户通过终端自行设置的一个阈值,例如,通过系统交互界面设置的一个阈值。
通常来说,预设阈值为一个用于衡量图像中目标对焦主体是否失焦的值,在第一图像中目标对焦主体的清晰度小于预设阈值时,可以认为第一图像失焦;因此,在实际应用中,可以结合神经网络模型检测清晰度的精度以及失焦经验值,来确定预设阈值的具体取值。其中,失焦经验值指的是根据经验所确定的一个失焦值,在对焦主体的清晰度小于该失焦经验值时,认为图像失焦;也就是说,在实际应用中,在神经网络模型的精度越大时,预设阈值的取值可以越接近失焦经验值,在神经网络模型的精度较小时,则可以根据神经网络模型的偏差确定预设阈值与失焦经验值之间的差值,从而确定预设阈值的取值。示例性地,在手机采用神经网络模型来确定第一图像中目标对焦主体的清晰度的情况下,预设阈值具体可以是80%或者85%等;通常来说,预设阈值一般为100%之外的值,即预设阈值的值不是清晰度对应的最大取值。
可以理解的是,在手机确定第一图像中目标对焦主体的清晰度小于预设阈值时,可以认为手机通过第一对焦方法进行对焦后所得到的第一图像中目标对焦主体较为模糊,即第一图像中目标对焦主体的清晰度不满足要求,此时,手机可以通过第二对焦方法对当前场景的图像再次进行对焦,以获得目标对焦主体清晰度较高的第二图像。
为了便于理解,以下将对上文的基于神经网络模型的对焦方法进行详细的介绍。
在一些实施例中,基于神经网络模型的对焦方法具体可以是通过神经网络模型获取图像中目标对焦主体的清晰度,然后根据图像的清晰度以及当前镜头所在的位置来确定镜头待移动的位置,并且通过对焦马达驱动镜头移动到所确定的位置上,从而实现对焦。由于神经网络模型是基于大量各种场景下的图像训练得到的,对各种场景的适应性强,因此,通过神经网络模型能够准确地获取当前图像中目标对焦主体的清晰度,从而使得手机能够根据图像的清晰度来控制镜头移动的位置,从而实现对焦,获得清晰的图像。
示例性地,如图8中(a)所示,假设镜头的全量程为500,镜头能够在位置100至位置600之间移动,在获得第一图像之后,通过上述的神经网络模型确定第一图像中目标对焦主体的清晰度为60%,且确定拍摄第一图像时镜头所在的位置为350,那么可以根据第一图像中目标对焦主体的清晰度60%以及镜头的全量程500,确定镜头待移动的位置与拍摄第一图像时镜头所在的位置之间的距离为500*(1-60%)=200,结合拍摄第一图像时镜头所在的位置350,可以计算得到,镜头待移动的位置为150或者是550。在确定了镜头待移动的位置之后,即可通过推动对焦马达来将镜头移动至所确定的位置上。
在一种实施例中,在确定得到镜头待移动的位置有两个时,可以先随机将镜头移动到其中一个位置上,并且获取镜头在该位置下采集到的图像,然后获取采集到的图像的清晰度,如果镜头在移动后所采集到的图像的清晰度小于第一图像中目标对焦主体的清晰度,则确定镜头所移动的位置为准焦位置,对焦完成;如果镜头在移动所采集到的图像的清晰度小于第一图像中目标对焦主体的清晰度,则将镜头移动至另一个待移动位置上,并且确定镜头最后移动的位置为准焦位置,对焦完成。示例性地,如图8中(a)所示,在确定镜头待移动的位置为150或者是550时,可以先将镜头移动至位置150处,然后在镜头移动至位置150之后,获取该位置下对应的图像,如果在镜头位置为150时对应的图像的清晰度要小于镜头位置在350时的清晰度,则确定镜头在位置150为准焦位置;如果在镜头位置为150时对应的图像的清晰度要大于镜头位置在350时的清晰度,则将镜头继续移动至位置550处,并且确定镜头在位置550为准焦位置。
在另一实施例中,在确定得到镜头待移动的位置有两个时,可以确定第一图像是否为多景深图像,如果第一图像为多景深图像,则可以将镜头移动至待移动的位置中靠近第一端点位置的一个位置,其中,第一端点位置为镜头在微距场景下能够实现图像准焦的端点位置;如果第一图像不是多景深图像,则可以将镜头移动至待移动的位置中靠近第二端点位置的一个位置,其中,第二端点位置为镜头在无穷远场景下能够实现图像准焦的端点位置。示例性地,假设镜头在位置600时拍摄微距下的物体时能够实现图像准焦,则位置600为上述的第一端点位置,那么,镜头在位置100时拍摄无穷远的物体时能够实现图像准焦,则位置100为上述的第二端点位置;这样,在第一图像为多景深图像时,位置550相对于位置150要更靠近位置600,因此可以将镜头移动至位置550;在第一图像不是多景深图像时,位置150相对于位置550要更靠近位置100,因此可以将镜头移动至位置150。可以理解的是,在第一图像为多景深图像时,第一图像中包括有前景物体和后景物体,那么,将镜头往第一端点位置的方向移动时,会更容易使得前景物体成像清晰,实现准焦;在第一图像不是多景深图像时,第一图像中通常会包括较远处的物体,因此,将镜头往第二端点位置的方向移动时,会更容易使得远处的物体成像清晰,实现准焦。
在另一实施例中,在一些情况下,结合镜头能够移动的两个端点位置,可以确定得到镜头待移动的位置只有一个。示例性地,如图8中(b)所示,假设镜头的全量程为500,镜头能够在位置100至位置600之间移动,在获得第一图像之后,通过上述的神经网络模型确定第一图像中目标对焦主体的清晰度为60%,且确定拍摄第一图像时镜头所在的位置为250,那么可以根据第一图像中目标对焦主体的清晰度60%以及镜头的全量程500,确定镜头待移动的位置与拍摄第一图像时镜头所在的位置之间的距离为500*(1-40%)=200,结合拍摄第一图像时镜头所在的位置250,可以计算得到,镜头待移动的位置为50或者是450,很显然,位置50已经超出了镜头能够移动的范围,镜头是无法移动到位置50的,因此,可以确定镜头待移动的位置只有450,此时可以通过推动对焦马达来将镜头移动至位置450上。示例性地,如图8中(c)所示,在获得第一图像之后,通过上述的神经网络模型确定第一图像中目标对焦主体的清晰度为60%,且确定拍摄第一图像时镜头所在的位置为450,那么可以根据第一图像中目标对焦主体的清晰度60%以及镜头的全量程500,确定镜头待移动的位置与拍摄第一图像时镜头所在的位置之间的距离为500*(1-40%)=200,结合拍摄第一图像时镜头所在的位置450,可以计算得到,镜头待移动的位置为250或者是650,很显然,位置650已经超出了镜头能够移动的范围,镜头是无法移动到位置650的,因此,可以确定镜头待移动的位置只有250。
在一种可能的实现方式中,在第一图像中目标对焦主体的清晰度小于预设阈值时,输出第二图像为目标图像。示例性地,目标图像可以为拍摄界面上预览区域所显示的预览图像,也就是说,在第一图像中目标对焦主体的清晰度小于预设阈值的情况下,输出第二图像作为拍摄界面上的预览图像。或者,目标图像还可以是响应于用户的拍照指示,存储至存储介质(例如非易失性存储器)中的图像。
在一种可能的实现方式中,在第一图像中目标对焦主体的清晰度不小于预设阈值时,输出第一图像为目标图像。示例性地,目标图像可以是拍摄界面上的预览图像,也可以是响应于用户的拍照指示,存储至存储介质中的图像。
在一些实施例中,在手机将目标对焦主体切换为位于多景深图像中前景区域的主体之后,在手机通过第二对焦方法对切换后的目标对焦主体进行对焦的过程中,为了便于用户获知切换后的目标对焦主体,手机可以在拍摄界面上显示对焦框,该对焦框用于标记当前场景中切换后的目标对焦主体。示例性地,如图9A中(a)所示,在手机通过第二对焦方法进行对焦的过程中,手机可以在拍摄界面上显示用于标记当前场景中切换后的目标对焦主体的对焦框901;示例性地,如图9A中(b)所示,用于标记切换后的目标对焦主体的对焦框还可以是对焦框902;示例性地,如图9A中(c)所示,用于标记切换后的目标对焦主体的对焦框还可以是对焦框903;示例性地,如图9A中(d)所示,用于标记切换后的目标对焦主体的对焦框还可以是对焦框904。
在一些实施例中,在手机将目标对焦主体切换为当前场景中的目标对象之后,在手机通过第二对焦方法对切换后的目标对焦主体进行对焦的过程中,手机可以在拍摄界面上显示对焦框,该对焦框用于标记切换后的目标对焦主体(即当前场景中的目标对象)。示例性地,如图9B中(a)所示,在手机通过第二对焦方法对切换后的目标对焦主体进行对焦的过程中,手机可以在拍摄界面上显示用于标记切换后的目标对焦主体的对焦框905。示例性地,如图9B中(b)所示,用于标记切换后的目标对焦主体的对焦框还可以是对焦框906;示例性地,如图9B中(c)所示,用于标记切换后的目标对焦主体的对焦框还可以是对焦框907;示例性地,如图9B中(d)所示,用于标记切换后的目标对焦主体的对焦框还可以是对焦框908。
在一些实施例中,在手机通过第二对焦方法进行对焦时,手机可以在拍摄界面上显示提示信息1,用于提示用户当前手机正在切换对焦方法。示例性地,如图10中(a)所示,手机在拍摄界面上显示的提示信息1可以为信息1001,信息1001具体为“当前图像模糊,正在切换对焦方式”;示例性地,如图10中(b)所示,在手机采用的第二对焦方法为基于神经网络模型的对焦方法的情况下,手机在拍摄界面上显示的提示信息1可以为信息1002,信息1002具体为“当前图像模糊,已自动切换AI对焦方式”;如图10中(c)所示,手机在拍摄界面上显示的提示信息1可以为信息1003,信息1003具体为“当前图像模糊,已开启AI对焦”;如图10中(d)所示,手机在拍摄界面上显示的提示信息1可以为信息1004,信息1004具体为“切换对焦方式中,请持稳手机”;如图10中(e)所示,手机在拍摄界面上显示的提示信息1可以为信息1005,信息1005具体为“二次对焦中,请持稳手机”;如图10中(f)所示,手机在拍摄界面上显示的提示信息1可以为信息1006,信息1006具体为“正在改善图像品质,请持稳手机”。示例性地,在手机通过第二对焦方法完成对焦之后,在手机的拍摄界面上所显示的提示信息1可以自动消失;示例性地,在手机的拍摄界面上显示提示信息1预置时间之后(例如1秒或者2秒等),拍摄界面上的提示信息1可以自动消失。
在一些实施例中,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像之后,在第二图像中的目标对焦主体的清晰度小于预设阈值时,在拍摄界面上显示提示信息2,该提示信息2用于提示用户调整拍摄距离。由于手机中的摄像头均有最小对焦距离限制,在手机距离目标物体太近的时候,手机往往难以实现准焦,那么在第二图像中的目标对焦主体的清晰度小于预设阈值时,可以认为手机经过了二次对焦仍然无法实现准焦,因此,可以确定当前手机距离目标物体过近,因而导致手机始终无法实现准焦。因此,在手机确定第二图像中的目标对焦主体的清晰度小于预设阈值时,手机可以在拍摄界面上显示提示信息2,用于提示用户调整拍摄距离。示例性地,如图11中(a)所示,提示信息2可以是拍摄界面上的信息1101,信息1101具体为“当前拍摄距离过近,请移远手机”;示例性地,如图11中(b)所示,提示信息2可以是拍摄界面上的信息1102,信息1102具体为“当前拍摄距离过近,请调整拍摄距离”;如图11中(c)所示,提示信息2可以是拍摄界面上的信息1103,信息1103具体为“当前拍摄距离已小于最小对焦距离”。
在一些实施例中,在手机配置有多个摄像头的情况下,在手机确定第二图像中的目标对焦主体的清晰度小于预设阈值时,手机还可以在拍摄界面上显示提示信息3,该提示信息3用于提示用户切换摄像头。示例性地,如图12中(a)所示,在手机的拍摄界面上可以显示用于提示用户切换摄像头的提示信息3,提示信息3可以为信息1201,信息1201具体为“当前拍摄距离过近,请切换微距摄像头”;示例性地,如图12中(b)所示,在手机的拍摄界面上显示有摄像头切换控件1202,在手机检测到用户点击摄像头切换控件1202中表示微距摄像头的按键时,手机可以将摄像头切换为微距摄像头来进行对焦;示例性地,如图12中(c)所示,响应于用户点击摄像头切换控件1202中表示微距摄像头的按键,手机将摄像头切换为微距摄像头并且进行了对焦,并且在摄像头切换控件1203上显示当前工作的摄像头为微距摄像头。
在一些实施例中,在手机中的多个摄像头配置有对应的拍摄模式的情况下,例如手机中的广角镜头配置有广角拍摄模式,手机中的微距镜头配置有微距拍摄模式时,该提示信息3还可以用于提示用户切换拍摄模式,这样一来,在用户根据提示信息3切换微距拍摄模式之后,手机可以进入到微距拍摄模式并且切换微距镜头进行拍摄。示例性地,如图12中(d)所示,在手机的拍摄界面上可以显示用于提示用户切换拍摄模式的提示信息3,提示信息3可以为信息1204,信息1204具体为“当前拍摄距离过近,请切换微距拍摄模式”;示例性地,如图12中(e)所示,在手机的拍摄界面上显示有微距拍摄模式切换控件1205,在手机检测到用户点击微距拍摄模式切换控件1205时,手机可以进入微距拍摄模式并且将摄像头切换为微距摄像头来进行对焦;示例性地,如图12中(f)所示,响应于用户点击微距拍摄模式切换控件1205,手机将摄像头切换为微距摄像头并且进行了对焦,并且在拍摄界面上显示微距拍摄模式控件1206,在手机检测到用户点击微距拍摄模式控件1206上的关闭按键之后,手机可以退出微距拍摄模式。
结合上述实施例及相关附图,本申请实施例提供了一种图像拍摄方法,该方法可以由电子设备(例如手机、平板电脑等终端设备或可部署于终端设备上的电子装置)来实现。如图13所示,该方法可以包括以下步骤:
1301、确定当前场景中的目标对焦主体。
响应于用户打开相机应用的操作,启动相机,进入拍摄模式;在进入拍摄模式后,确定当前场景中的目标对焦主体,即确定当前场景中需要获得清晰图像的主体。
1302、通过第一对焦方法对当前场景中的目标对焦主体进行对焦,得到第一图像。
示例性地,第一对焦方法可以是相位对焦方法或者激光对焦方法。示例性地,电子设备可以在如图2所示的自动对焦模式下通过第一对焦方法进行对焦;示例性地,电子设备也可以是在如图3所示的手动对焦模式下通过第一对焦方法进行对焦;示例性地,电子设备还可以是在如图4所示的AI对焦模式下通过第一对焦方法进行对焦。
1303、在第一图像中目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像,第二图像中的目标对焦主体的清晰度不小于预设阈值;其中,第一对焦方法和第二对焦方法对应的镜头位置不同,第二对焦方法为基于神经网络模型的对焦方法。
示例性地,电子设备获得第一图像之后,电子设备可以通过上述的神经网络模型来确定第一图像中目标对焦主体的清晰度。示例性地,第一对焦方法可以包括相位对焦方法或者激光对焦方法,第二对焦方法为基于神经网络模型的对焦方法,基于第二对焦方法拍摄得到的第二图像中的目标对焦主体的清晰度不小于预设阈值。
在一些实施例中,在第一图像中目标对焦主体的清晰度小于预设阈值时,输出第二图像为目标图像。
在一些实施例中,在第一图像中目标对焦主体的清晰度不小于预设阈值时,输出第一图像为目标图像。
示例性地,目标图像可以为拍摄界面上预览区域所显示的预览图像;或者,目标图像还可以是响应于用户的拍照指示,存储至存储介质中的图像。
在一些实施例中,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,包括:
将标记有目标对焦主体的第一图像输入神经网络模型,得到神经网络模型的第一输出结果,第一输出结果为第一图像中目标对焦主体的清晰度;根据第一图像中目标对焦主体的清晰度调整镜头位置,得到第二图像。示例性地,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦时,可以将标记有目标对焦主体的第一图像输入至神经网络模型中,基于神经网络模型得到第一图像中目标对焦主体的清晰度,然后根据目标对焦主体的清晰度确定镜头的移动位置,将镜头移动至所确定的位置上,从而完成对焦,得到第二图像。
在一些实施例中,根据第一图像中目标对焦主体的清晰度调整镜头位置,包括:根据第一图像中目标对焦主体的清晰度以及全量程确定镜头的移动值,其中,全量程为镜头可移动的最大范围值,移动值为全量程与第一乘积之间的差值,第一乘积为清晰度与全量程的乘积;根据移动值将镜头移动至目标位置。
在一些实施例中,在第一图像为多景深图像,且目标对焦主体位于多景深图像中的背景区域时,将目标对焦主体切换为多景深图像中的前景区域内的主体,得到切换后的目标对焦主体;在第一图像中目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像,包括:在第一图像中切换后的目标对焦主体的清晰度小于预设阈值时,在当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,得到第二图像。
在一些实施例中,在当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,包括:将标记有切换后的目标对焦主体的第一图像输入神经网络模型,得到神经网络模型的第二输出结果,第二输出结果为第一图像中切换后的目标对焦主体的清晰度;根据第一图像中切换后的目标对焦主体的清晰度调整镜头位置,得到第二图像。
在一些实施例中,神经网络模型是通过标记有对焦主体以及对焦主体的清晰度的图像训练数据训练得到的。
在一些实施例中,在将目标对焦主体切换为多景深图像中的前景区域内的主体,得到切换后的目标对焦主体之后,还可以根据切换后的目标对焦主体在拍摄界面上显示对焦框,对焦框用于标记切换后的目标对焦主体。
在一些实施例中,在通过第二对焦方法进行对焦的过程中,可以在拍摄界面上显示提示信息1,提示信息用1于提示用户切换对焦方法或开启通过第二对焦方法进行对焦的模式。示例性地,该提示信息1可以为如图10中所示的信息1001至信息1006。
在一些实施例中,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像之后,在第二图像中的目标对焦主体的清晰度小于预设阈值时,在拍摄界面上显示提示信息2,该提示信息2用于提示用户调整拍摄距离。示例性地,该提示信息2可以为如图11中所示的信息1101至信息1106。
在一些实施例中,在通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像之后,在第二图像中的目标对焦主体的清晰度小于预设阈值时,在拍摄界面上显示提示信息3,该提示信息3用于提示用户切换摄像头或者切换拍摄模式。示例性地,该提示信息3可以为如图12中所示的信息1201至信息1206。
可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件和/或软件模块。结合本文中所公开的实施例描述的各示例的算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以结合实施例对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本实施例可以根据上述方法示例对电子设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块可以采用硬件的形式实现。需要说明的是,本实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图14示出了上述实施例中涉及的电子设备1400的一种可能的组成示意图,如图14所示,该电子设备1400可以包括:处理单元1401和显示单元1402。
其中,处理单元1401可以用于支持电子设备1400执行上述步骤1301、步骤1302以及步骤1303,和/或用于本文所描述的技术的其他过程。
显示单元1402可以用于支持电子设备1400执行上述显示对焦框、提示信息1、提示信息2和提示信息3等步骤,和/或用于本文所描述的技术的其他过程。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本实施例提供的电子设备,用于执行上述图像拍摄方法,因此可以达到与上述实现方法相同的效果。
在采用集成的单元的情况下,电子设备可以包括处理模块、存储模块和通信模块。其中,处理模块可以用于对电子设备的动作进行控制管理,例如,可以用于支持电子设备执行上述处理单元1401执行的步骤。存储模块可以用于支持电子设备存储程序代码和数据等。通信模块,可以用于支持电子设备与其他设备的通信。
其中,处理模块可以是处理器或控制器。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(digital signal processing,DSP)和微处理器的组合等等。存储模块可以是存储器。通信模块具体可以为射频电路、蓝牙芯片、Wi-Fi芯片等与其他电子设备交互的设备。
应理解,本申请各实施例的设备还可以基于包括有存储器和处理器的电子装置实现,存储器存储有用于执行本申请各实施例的方法的指令,处理器执行上述指令,使得终端设备执行本申请各实施例的方法。
可以参阅图15,图15为本申请实施例提供的一种电子装置的结构示意图。本申请实施例提供的一种电子装置1500,包括:处理器1501和存储器1502,存储器1502上存储有计算机指令,处理器1501执行存储器上的计算机指令时用于实现以下步骤:
确定当前场景中的目标对焦主体;
通过第一对焦方法对当前场景中的目标对焦主体进行对焦,得到第一图像;
在第一图像中目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对当前场景中的目标对焦主体进行对焦,得到第二图像,第二图像中的目标对焦主体的清晰度不小于预设阈值;其中,第一对焦方法和第二对焦方法对应的镜头位置不同,第二对焦方法为基于神经网络模型的对焦方法。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:在第一图像中目标对焦主体的清晰度小于预设阈值时,输出第二图像为目标图像。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:在第一图像中目标对焦主体的清晰度不小于预设阈值时,输出第一图像为目标图像。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:将标记有目标对焦主体的第一图像输入神经网络模型,得到神经网络模型的第一输出结果,第一输出结果为第一图像中目标对焦主体的清晰度;根据第一图像中目标对焦主体的清晰度调整镜头位置,得到第二图像。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:根据第一图像中目标对焦主体的清晰度以及全量程确定镜头的移动值,其中,全量程为镜头可移动的最大范围值,移动值为全量程与第一乘积之间的差值,第一乘积为清晰度与全量程的乘积;根据移动值将镜头移动至目标位置。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:在第一图像为多景深图像,且目标对焦主体位于多景深图像中的背景区域时,将目标对焦主体切换为多景深图像中的前景区域内的主体,得到切换后的目标对焦主体;在第一图像中切换后的目标对焦主体的清晰度小于预设阈值时,在当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,得到第二图像。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:将标记有切换后的目标对焦主体的第一图像输入神经网络模型,得到神经网络模型的第二输出结果,第二输出结果为第一图像中切换后的目标对焦主体的清晰度;根据第一图像中切换后的目标对焦主体的清晰度调整镜头位置,得到第二图像。
在一些实施例中,神经网络模型是通过标记有对焦主体以及对焦主体的清晰度的图像训练数据训练得到的。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:根据切换后的目标对焦主体在拍摄界面上显示对焦框,对焦框用于标记切换后的目标对焦主体。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:
向终端设备的显示模块发送第一信号,以使得终端设备在拍摄界面上显示对焦框,该对焦框用于标记切换后的目标对焦主体。
在一些实施例中,处理器1501在执行存储器上的计算机指令时还用于实现以下步骤:
在拍摄界面上显示提示信息,向终端设备的显示模块发送第二信号,以使得终端设备在拍摄界面上显示提示信息,该提示信息2用于提示用户切换对焦方法或开启通过第二对焦方法进行对焦的模式。
应理解,本申请实施例中提及的处理器1501可以包括一个或多个处理单元,例如:处理器1501可以包括应用处理器,调制解调处理器,图形处理器,图像信号处理器,控制器,视频编解码器,数字信号处理器,基带处理器,和/或神经网络处理器等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
在一些实施例中,处理器1501可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器1501可以包含多组I2C总线。处理器1501可以通过不同的I2C总线接口分别耦合触摸传感器,充电器,闪光灯,摄像头等。例如:处理器1501可以通过I2C接口耦合触摸传感器,使处理器1501与触摸传感器通过I2C总线接口通信,实现终端设备的触摸功能。
MIPI接口可以被用于连接处理器1501与终端设备的显示屏,摄像头等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(display serial interface,DSI)等。在一些实施例中,处理器1501和摄像头通过CSI接口通信,实现终端设备的拍摄功能。处理器1501和显示屏通过DSI接口通信,实现终端设备的显示功能。
可以理解的是,本实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端设备的结构限定。在本申请另一些实施例中,终端设备也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
在一些实施例中,存储器1502可以是易失性存储器或非易失性存储器(non-volatilememory),或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmableROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)、快闪存储器(flashmemory)、硬盘(harddiskdrive,HDD)或固态硬盘(solid-statedrive,SSD)。易失性存储器可以是随机存取存储器(randomaccessmemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(staticRAM,SRAM)、动态随机存取存储器(dynamicRAM,DRAM)、同步动态随机存取存储器(synchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(doubledatarateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(directrambusRAM,DRRAM)。
应注意,本实施例中所描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
可以参阅图16,图16为本申请实施例提供的一种无线通信装置的结构示意图。本申请实施例还提供一种无线通信装置1600,该无线通信装置1600包括:处理器1601以及接口电路1602;其中,该处理器1601通过该接口电路1602与存储器1603耦合,该处理器1601用于执行该存储器1603中的程序代码,以使得无线通信装置执行上述相关方法步骤实现上述实施例中的图像拍摄方法。
本实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在电子设备上运行时,使得电子设备执行上述相关方法步骤实现上述实施例中的图像拍摄方法。
本实施例还提供了一种计算机程序产品,当该计算机程序产品在电子设备上运行时,使得电子设备执行上述相关步骤,以实现上述实施例中的图像拍摄方法。
另外,本申请的实施例还提供一种装置,这个装置具体可以是芯片,组件或模块,该装置可包括相连的处理器和存储器;其中,存储器用于存储计算机执行指令,当装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述各方法实施例中的图像拍摄方法。
其中,本实施例提供的电子设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (22)
1.一种图像拍摄方法,其特征在于,包括:
确定当前场景中的目标对焦主体;
通过第一对焦方法对所述当前场景中的目标对焦主体进行对焦,得到第一图像;
在所述第一图像中所述目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对所述当前场景中的目标对焦主体进行对焦,得到第二图像,所述第二图像中的所述目标对焦主体的清晰度不小于预设阈值;其中,所述第一对焦方法和所述第二对焦方法对应的镜头位置不同,所述第二对焦方法为基于神经网络模型的对焦方法;
所述通过第二对焦方法对所述当前场景中的目标对焦主体进行对焦,包括:
将标记有所述目标对焦主体的第一图像输入所述神经网络模型,得到所述神经网络模型的第一输出结果,所述第一输出结果为所述第一图像中所述目标对焦主体的清晰度;
根据所述第一图像中所述目标对焦主体的清晰度调整镜头位置,得到第二图像。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第一图像中所述目标对焦主体的清晰度小于预设阈值时,输出所述第二图像为目标图像。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在所述第一图像中所述目标对焦主体的清晰度不小于预设阈值时,输出所述第一图像为目标图像。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一图像中所述目标对焦主体的清晰度调整镜头位置,包括:
根据所述第一图像中所述目标对焦主体的清晰度以及全量程确定所述镜头的移动值,其中,所述全量程为所述镜头可移动的最大范围值,所述移动值为所述全量程与第一乘积之间的差值,所述第一乘积为所述清晰度与所述全量程的乘积;
根据所述移动值将所述镜头移动至目标位置。
5.根据权利要求1、2和4中任意一项所述的方法,其特征在于,所述方法还包括:
在所述第一图像为多景深图像,且所述目标对焦主体位于所述多景深图像中的背景区域时,将所述目标对焦主体切换为所述多景深图像中的前景区域内的主体,得到切换后的目标对焦主体;
所述在所述第一图像中所述目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对所述当前场景中的目标对焦主体进行对焦,得到第二图像,包括:
在所述第一图像中所述切换后的目标对焦主体的清晰度小于预设阈值时,在所述当前场景中通过第二对焦方法对所述切换后的目标对焦主体进行对焦,得到第二图像。
6.根据权利要求5所述的方法,其特征在于,在所述当前场景中通过第二对焦方法对所述切换后的目标对焦主体进行对焦,包括:
将标记有所述切换后的目标对焦主体的第一图像输入所述神经网络模型,得到所述神经网络模型的第二输出结果,所述第二输出结果为所述第一图像中所述切换后的目标对焦主体的清晰度;
根据所述第一图像中所述切换后的目标对焦主体的清晰度调整镜头位置,得到第二图像。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据所述切换后的目标对焦主体在拍摄界面上显示对焦框,所述对焦框用于标记所述切换后的目标对焦主体。
8.根据权利要求1、2、4、6和7中任意一项所述的方法,其特征在于,所述方法还包括:在拍摄界面上显示提示信息,所述提示信息用于提示用户切换对焦方法或开启通过所述第二对焦方法进行对焦的模式。
9.根据权利要求1、2、4、6和7中任意一项所述的方法,其特征在于,所述神经网络模型是通过标记有对焦主体以及所述对焦主体的清晰度的图像训练数据训练得到的。
10.根据权利要求1、2、4、6和7中任意一项所述的方法,其特征在于,所述第一对焦方法包括相位对焦方法或激光对焦方法。
11.一种电子设备,其特征在于,包括:触摸屏,其中,所述触摸屏包括触敏表面和显示器;摄像头;一个或多个处理器;存储器;多个应用程序;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
确定当前场景中的目标对焦主体;
通过第一对焦方法对所述当前场景中的目标对焦主体进行对焦,得到第一图像;
在所述第一图像中所述目标对焦主体的清晰度小于预设阈值时,通过第二对焦方法对所述当前场景中的目标对焦主体进行对焦,得到第二图像,所述第二图像中的所述目标对焦主体的清晰度不小于预设阈值;其中,所述第一对焦方法和所述第二对焦方法对应的镜头位置不同,所述第二对焦方法为基于神经网络模型的对焦方法;
所述通过第二对焦方法对所述当前场景中的目标对焦主体进行对焦,包括:
将标记有所述目标对焦主体的第一图像输入所述神经网络模型,得到所述神经网络模型的第一输出结果,所述第一输出结果为所述第一图像中所述目标对焦主体的清晰度;
根据所述第一图像中所述目标对焦主体的清晰度调整镜头位置,得到第二图像。
12.根据权利要求11所述的电子设备,其特征在于,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
在所述第一图像中所述目标对焦主体的清晰度小于预设阈值时,输出所述第二图像为目标图像。
13.根据权利要求11或12所述的电子设备,其特征在于,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
在所述第一图像中所述目标对焦主体的清晰度不小于预设阈值时,输出所述第一图像为目标图像。
14.根据权利要求11所述的电子设备,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
根据所述第一图像中所述目标对焦主体的清晰度以及全量程确定所述镜头的移动值,其中,所述全量程为所述镜头可移动的最大范围值,所述移动值为所述全量程与第一乘积之间的差值,所述第一乘积为所述清晰度与所述全量程的乘积;
根据所述移动值将所述镜头移动至目标位置。
15.根据权利要求11、12和14中任意一项所述的电子设备,其特征在于,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
在所述第一图像为多景深图像,且所述目标对焦主体位于所述多景深图像中的背景区域时,将所述目标对焦主体切换为所述多景深图像中的前景区域内的主体,得到切换后的目标对焦主体;
在所述第一图像中所述切换后的目标对焦主体的清晰度小于预设阈值时,在所述当前场景中通过第二对焦方法对切换后的目标对焦主体进行对焦,得到第二图像。
16.根据权利要求15所述的电子设备,其特征在于,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
将标记有所述切换后的目标对焦主体的第一图像输入所述神经网络模型,得到所述神经网络模型的第二输出结果,所述第二输出结果为所述第一图像中所述切换后的目标对焦主体的清晰度;
根据所述第一图像中所述切换后的目标对焦主体的清晰度调整镜头位置,得到第二图像。
17.根据权利要求15所述的电子设备,其特征在于,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
根据所述切换后的目标对焦主体在拍摄界面上显示对焦框,所述对焦框用于标记所述切换后的目标对焦主体。
18.根据权利要求11、12、14、16和17中任意一项所述的电子设备,其特征在于,当所述指令被所述电子设备执行时,使得所述电子设备执行以下步骤:
在拍摄界面上显示提示信息,所述提示信息用于提示用户切换对焦方法或开启通过所述第二对焦方法进行对焦的模式。
19.根据权利要求11、12、14、16和17中任意一项所述的电子设备,其特征在于,所述神经网络模型是通过标记有对焦主体以及所述对焦主体的清晰度的图像训练数据训练得到的。
20.根据权利要求11、12、14、16和17中任意一项所述的电子设备,其特征在于,所述第一对焦方法包括相位对焦方法或激光对焦方法。
21.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机指令,其特征在于,所述处理器执行所述计算机指令时实现所述权利要求1-10中任一项所述图像拍摄方法的步骤。
22.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-10中任一项所述的图像拍摄方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911426173.9A CN113132620B (zh) | 2019-12-31 | 2019-12-31 | 一种图像拍摄方法及相关装置 |
PCT/CN2020/138859 WO2021136050A1 (zh) | 2019-12-31 | 2020-12-24 | 一种图像拍摄方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911426173.9A CN113132620B (zh) | 2019-12-31 | 2019-12-31 | 一种图像拍摄方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113132620A CN113132620A (zh) | 2021-07-16 |
CN113132620B true CN113132620B (zh) | 2022-10-11 |
Family
ID=76686476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911426173.9A Active CN113132620B (zh) | 2019-12-31 | 2019-12-31 | 一种图像拍摄方法及相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113132620B (zh) |
WO (1) | WO2021136050A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114286064A (zh) * | 2020-09-17 | 2022-04-05 | 深圳光峰科技股份有限公司 | 一种实时对焦方法、装置、系统和计算机可读存储介质 |
CN114697528A (zh) * | 2020-12-30 | 2022-07-01 | Oppo广东移动通信有限公司 | 图像处理器、电子设备及对焦控制方法 |
CN114092364B (zh) * | 2021-08-12 | 2023-10-03 | 荣耀终端有限公司 | 图像处理方法及其相关设备 |
CN113674258B (zh) * | 2021-08-26 | 2022-09-23 | 展讯通信(上海)有限公司 | 图像处理方法及相关设备 |
CN113810615A (zh) * | 2021-09-26 | 2021-12-17 | 展讯通信(上海)有限公司 | 对焦处理方法、装置、电子设备和存储介质 |
CN114164790B (zh) * | 2021-12-27 | 2022-05-10 | 哈尔滨职业技术学院 | 一种智能化路面清压实冰雪设备及其使用方法 |
CN114666497B (zh) * | 2022-02-28 | 2024-03-15 | 青岛海信移动通信技术有限公司 | 成像方法、终端设备及存储介质 |
CN114422708B (zh) * | 2022-03-15 | 2022-06-24 | 深圳市海清视讯科技有限公司 | 图像获取方法、装置、设备及存储介质 |
CN116935391A (zh) * | 2022-04-08 | 2023-10-24 | 广州视源电子科技股份有限公司 | 一种基于摄像头的文本识别方法、装置、设备及存储介质 |
CN114760415B (zh) * | 2022-04-18 | 2024-02-02 | 上海千映智能科技有限公司 | 一种镜头调焦方法、系统、设备及介质 |
CN116051368B (zh) * | 2022-06-29 | 2023-10-20 | 荣耀终端有限公司 | 图像处理方法及其相关设备 |
CN116074624B (zh) * | 2022-07-22 | 2023-11-10 | 荣耀终端有限公司 | 一种对焦方法和装置 |
CN115209057B (zh) * | 2022-08-19 | 2023-05-23 | 荣耀终端有限公司 | 一种拍摄对焦方法及相关电子设备 |
CN115278089B (zh) * | 2022-09-26 | 2022-12-02 | 合肥岭雁科技有限公司 | 人脸模糊图像对焦矫正方法、装置、设备和存储介质 |
CN115512166B (zh) * | 2022-10-18 | 2023-05-16 | 湖北华鑫光电有限公司 | 镜头的智能化制备方法及其系统 |
CN116132791A (zh) * | 2023-03-10 | 2023-05-16 | 创视微电子(成都)有限公司 | 一种获取多运动物体多景深清晰图像的方法及装置 |
CN116991298B (zh) * | 2023-09-27 | 2023-11-28 | 子亥科技(成都)有限公司 | 一种基于对抗神经网络的虚拟镜头控制方法 |
CN117132646B (zh) * | 2023-10-26 | 2024-01-05 | 湖南自兴智慧医疗科技有限公司 | 基于深度学习的分裂相自动对焦系统 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7280149B2 (en) * | 2001-12-21 | 2007-10-09 | Flextronics Sales & Marketing (A-P) Ltd. | Method and apparatus for detecting optimum lens focus position |
US8600186B2 (en) * | 2010-04-26 | 2013-12-03 | City University Of Hong Kong | Well focused catadioptric image acquisition |
US20120019703A1 (en) * | 2010-07-22 | 2012-01-26 | Thorn Karl Ola | Camera system and method of displaying photos |
US8659697B2 (en) * | 2010-11-11 | 2014-02-25 | DigitalOptics Corporation Europe Limited | Rapid auto-focus using classifier chains, MEMS and/or multiple object focusing |
US8648959B2 (en) * | 2010-11-11 | 2014-02-11 | DigitalOptics Corporation Europe Limited | Rapid auto-focus using classifier chains, MEMS and/or multiple object focusing |
JP2013135459A (ja) * | 2011-12-27 | 2013-07-08 | Canon Marketing Japan Inc | 撮影装置とその制御方法及びプログラム |
JP6159097B2 (ja) * | 2013-02-07 | 2017-07-05 | キヤノン株式会社 | 画像処理装置、撮像装置、制御方法、及びプログラム |
CN104079837B (zh) * | 2014-07-17 | 2018-03-30 | 广东欧珀移动通信有限公司 | 一种基于图像传感器的对焦方法及装置 |
CN104601879A (zh) * | 2014-11-29 | 2015-05-06 | 深圳市金立通信设备有限公司 | 一种对焦方法 |
US9715721B2 (en) * | 2015-12-18 | 2017-07-25 | Sony Corporation | Focus detection |
CN105629631B (zh) * | 2016-02-29 | 2020-01-10 | Oppo广东移动通信有限公司 | 控制方法、控制装置及电子装置 |
CN106713750B (zh) * | 2016-12-19 | 2019-07-19 | Oppo广东移动通信有限公司 | 对焦控制方法、装置、电子装置及终端设备 |
CN107483825B (zh) * | 2017-09-08 | 2019-12-24 | 上海创功通讯技术有限公司 | 一种自动调整焦距的方法和装置 |
CN109698901B (zh) * | 2017-10-23 | 2020-07-10 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 自动对焦方法、装置、存储介质和计算机设备 |
CN109561257B (zh) * | 2019-01-18 | 2020-09-18 | 深圳看到科技有限公司 | 画面对焦方法、装置、终端及对应的存储介质 |
-
2019
- 2019-12-31 CN CN201911426173.9A patent/CN113132620B/zh active Active
-
2020
- 2020-12-24 WO PCT/CN2020/138859 patent/WO2021136050A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2021136050A1 (zh) | 2021-07-08 |
CN113132620A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113132620B (zh) | 一种图像拍摄方法及相关装置 | |
CN112532857B (zh) | 一种延时摄影的拍摄方法及设备 | |
CN109951633B (zh) | 一种拍摄月亮的方法和电子设备 | |
KR102535607B1 (ko) | 사진 촬영 중 이미지를 표시하는 방법 및 전자 장치 | |
CN113905179B (zh) | 一种终端切换摄像头的方法及终端 | |
CN114915726A (zh) | 一种拍摄方法及电子设备 | |
CN111327814A (zh) | 一种图像处理的方法及电子设备 | |
EP4020967B1 (en) | Photographic method in long focal length scenario, and mobile terminal | |
CN112532892B (zh) | 图像处理方法及电子装置 | |
CN113810603B (zh) | 点光源图像检测方法和电子设备 | |
CN112887583A (zh) | 一种拍摄方法及电子设备 | |
CN113542580B (zh) | 去除眼镜光斑的方法、装置及电子设备 | |
CN114095666B (zh) | 拍照方法、电子设备和计算机可读存储介质 | |
CN110248037B (zh) | 一种身份证件扫描方法及装置 | |
CN110138999B (zh) | 一种用于移动终端的证件扫描方法及装置 | |
WO2023273323A1 (zh) | 一种对焦方法和电子设备 | |
CN115967851A (zh) | 快速拍照方法、电子设备及计算机可读存储介质 | |
CN115484383A (zh) | 拍摄方法及相关装置 | |
CN113542574A (zh) | 变焦下的拍摄预览方法、终端、存储介质及电子设备 | |
CN116055872B (zh) | 图像获取方法、电子设备和计算机可读存储介质 | |
CN116709018B (zh) | 一种变焦条分割方法及电子设备 | |
CN116708751B (zh) | 一种拍照时长的确定方法、装置和电子设备 | |
CN115686182B (zh) | 增强现实视频的处理方法与电子设备 | |
CN115705663B (zh) | 图像处理方法与电子设备 | |
CN117880645A (zh) | 一种图像处理的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |