CN115103107B - 对焦控制方法、智能终端和存储介质 - Google Patents
对焦控制方法、智能终端和存储介质 Download PDFInfo
- Publication number
- CN115103107B CN115103107B CN202210617611.5A CN202210617611A CN115103107B CN 115103107 B CN115103107 B CN 115103107B CN 202210617611 A CN202210617611 A CN 202210617611A CN 115103107 B CN115103107 B CN 115103107B
- Authority
- CN
- China
- Prior art keywords
- main body
- focusing
- target
- subject
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 163
- 230000004044 response Effects 0.000 claims abstract description 20
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 23
- 230000033001 locomotion Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 description 138
- 230000006870 function Effects 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 15
- 230000006854 communication Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 210000000887 face Anatomy 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 230000037237 body shape Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000036544 posture Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 231100000241 scar Toxicity 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241000253999 Phasmatodea Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 210000004709 eyebrow Anatomy 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000001747 pupil Anatomy 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Abstract
本申请提出了一种对焦控制方法、智能终端和存储介质,对焦控制方法包括:响应于获取预览画面,读取存储的预设主体的主体特征;根据所述主体特征与所述预览画面进行特征匹配,以识别所述预览画面中的所述预设主体;以识别到的所述预设主体为目标主体,使用所述预设对焦模式对所述目标主体对焦。本申请提供的对焦控制方法、智能终端和存储介质,通过使用主体特征进行万物识别和对焦,能实现更快捷、更智能和更清晰的对焦,进而提升了用户拍摄体验。
Description
技术领域
本申请涉及对焦技术领域,具体涉及一种对焦控制方法、智能终端和存储介质。
背景技术
在相机等拍摄产品的使用中,智能对焦技术是目前行业发展的一个方向,包括人脸对焦,人眼对焦,人体追焦,动物追焦等,而追焦技术主要是人脸追焦。目前常用的对焦方式有PDAF对焦(相位对焦)、反差对焦,激光对焦。
在构思及实现本申请过程中,发明人发现至少存在如下问题:反差对焦时深肤色人脸逆光场景对焦不上,导致人脸模糊;在点光源场景或者前后景反差较大时,无法锁定对焦点,对焦画面不清晰;当动物或者植物较小如拍摄苍蝇,对焦不准,导致拍摄对象模糊。
前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
发明内容
针对上述技术问题,本申请提供一种对焦控制方法、智能终端和存储介质,以缓解对焦不准导致拍摄对象模糊的问题。
在一方面,本申请提供一种对焦控制方法,可应用于智能终端,包括:
响应于获取预览画面,读取存储的预设主体的主体特征;
根据所述主体特征与所述预览画面进行特征匹配,以识别所述预览画面中的所述预设主体;
以识别到的所述预设主体为目标主体。
可选地,所述识别到的所述预设主体为目标主体,使用预设对焦模式对所述目标主体对焦包括:
对所述预览画面进行主体识别,以获取所述预览画面中的所述目标主体;
根据所述目标主体,选择与所述目标主体对应的预设对焦模式;
使用所述预设对焦模式对所述目标主体对焦。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别的步骤之前包括:
使用机器学习对主体识别的类型进行识别检测模型的训练;
使用所述识别检测模型对所述预览画面进行主体识别。
可选地,所述对焦控制方法在执行所述根据所述目标主体,选择与所述目标主体对应的预设对焦模式的步骤包括:
识别到所述目标主体包括人物主体时,选择人物对焦模式;和/或,
在未识别到所述目标主体包括人物主体时,选择非人对焦模式。
可选地,所述对焦控制方法在执行所述识别到所述目标主体包括人物主体时,选择人物对焦模式的步骤包括以下至少一项:
识别到所述目标主体包括人眼时,选择人眼追焦模式;
识别到所述目标主体包括人脸时,选择人脸追焦模式;
识别到所述目标主体包括人体时,选择人体追焦模式。
可选地,所述对焦控制方法在执行所述识别到所述目标主体包括人脸时,选择人脸追焦模式的步骤包括:
计算所述预览画面的总面积和所述人脸的第一面积;
所述第一面积与所述总面积的比大于第一阈值时,切换对焦模式为所述人眼追焦模式。
可选地,所述对焦控制方法在执行所述在未识别到所述目标主体包括人物主体时,选择非人对焦模式的步骤包括以下至少一项:
识别到所述目标主体包括动物时,选择动物追焦模式;
识别到所述目标主体包括文字时,选择微距追焦模式;
识别到所述目标主体包括月亮和/或飞机时,选择超距追焦模式。
可选地,所述对焦控制方法在执行所述识别到所述目标主体包括动物时,选择动物追焦模式的步骤包括:
响应于获取所述动物图像,在判断所述动物图像包括动物脸时,切换对焦模式为动物眼追焦模式。
可选地,所述对焦控制方法还包括所述识别到所述目标主体包括月亮时,选择超月追焦模式的步骤包括:
计算所述预览画面的总面积和所述预览画面中月亮的第二面积;
所述第二面积与所述总面积的比大于第二阈值时,切换对焦模式为所述超月模式。
可选地,所述目标主体包括前景主体和后景主体,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤包括:
获取所述预览画面中所述前景主体的第三面积和所述后景主体的第四面积;
在所述第三面积大于所述第四面积时,以所述前景主体为所述目标主体;
在所述第三面积小于所述第四面积时,以所述后景主体为所述目标主体。
可选地,所述对焦控制方法还包括通过分割或语义分类划分前景和后景以分别识别前景主体和后景主体,和/或,通过所述预览画面中主体所在区域的像素个数进行面积计算。
可选地,所述目标主体包括前景区域和后景区域的至少一个主体,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤包括:
计算所述预览画面中前景区域面积和后景区域面积;
在所述前景区域面积大于所述后景区域面积时,以所述前景区域的主体为所述目标主体;和/或,
在所述前景区域面积小于所述后景区域面积时,以所述后景区域的主体为所述目标主体。
可选地,所述预设对焦模式包括第一对焦方式和第二对焦方式,所述对焦控制方法在执行所述使用所述预设对焦模式对所述目标主体对焦的步骤包括:
响应于获取所述第一对焦方式和所述第二对焦方式,分别获取所述第一对焦方式和所述第二对焦方式的可信度;
在所述第一对焦方式的可信度大于所述第二对焦方式的可信度时,以所述第一对焦方式进行对焦。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤中包括:
获取所述预览画面的上一帧画面的跟踪区域,根据所述上一帧画面的跟踪区域确定权重图;其中,所述权重图中的每个像素点均存在对应的可信度,所述跟踪区为所述上一帧画面中目标主体所在的区域;
通过所述权重图在所述预览画面上滑动,得到各候选区;
获取所述各候选区的图像特征,将各图像特征分别进行卷积计算,以获取各候选区的卷积值;
根据所述卷积值中的最大值对应的候选区确定所述预览画面的目标主体。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤之后包括:
根据识别到同一目标主体的至少两张预览画面,获取所述至少两张预览画面的拍摄时间和拍摄角度;
根据所述拍摄时间和拍摄角度,计算所述目标主体的移动特征;
根据所述移动特征和当前时刻,预测所述目标主体所在的预测位置;
获取所述预测位置的预览画面,识别所述预测位置的预览画面中的所述目标主体。
可选地,所述预设主体为预设人物,所述对焦控制方法在执行所述读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
采集所述预设人物的脸部图像,对所述脸部图像进行人脸特征提取,以备对所述人脸特征匹配;
采集所述预设人物的眼部图像,对所述眼部图像进行人眼特征提取,以备对所述人眼特征匹配;
采集所述预设人物的人体图像,对所述人体图像进行人体特征提取,以备对所述人体特征匹配;
采集所述预设人物的第一附属图像,对所述第一附属图像进行人物附属物特征提取,以备对所述人物附属特征匹配。
可选地,所述预设主体为预设动物,所述对焦控制方法在执行所述读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
采集所述预设动物的动物脸图像,对所述动物脸图像进行动物脸特征识别,以备对所述动物脸特征匹配;
采集所述预设动物的动物体图像,对所述动物体图像进行动物特征识别,以备对所述动物特征匹配;
采集所述预设动物的第二附属图像,对所述第二附属图像进行动物附属物特征提取,以备对所述动物附属物特征匹配。
可选地,所述对焦控制方法在执行所述读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
所述预设主体为预设文字,采集所述预设文字的关键词,提取所述关键词的字体特征,以备对所述字体特征匹配;
所述预设主体为预设物体,采集所述预设物体的物体图像,对所述物体图像进行物体特征提取,以备对所述物体特征匹配。
本申请还提供一种对焦控制方法,可应用于智能终端,包括:
对预览画面进行主体识别,以获取目标主体;
根据所述目标主体,选择对应的预设对焦模式;
使用所述预设对焦模式对所述目标主体对焦。
可选地,所述对预览画面进行主体识别,以获取目标主体包括:响应于对屏幕的操作信号,获取所述操作信号所对应操作的屏幕区域,以预览画面中对应所述屏幕区域的主体为目标主体。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别的步骤之前包括:
使用机器学习对主体识别的类型进行识别检测模型的训练;
使用所述识别检测模型对所述预览画面进行主体识别。
可选地,所述对焦控制方法在执行所述根据所述目标主体,选择与所述目标主体对应的预设对焦模式的步骤包括:
识别到所述目标主体包括人物主体时,选择人物对焦模式;和/或,
在未识别到所述目标主体包括人物主体时,选择非人对焦模式。
可选地,所述对焦控制方法在执行所述识别到所述目标主体包括人物主体时,选择人物对焦模式的步骤包括以下至少一项:
识别到所述目标主体包括人眼时,选择人眼追焦模式;
识别到所述目标主体包括人脸时,选择人脸追焦模式;
识别到所述目标主体包括人体时,选择人体追焦模式。
可选地,所述对焦控制方法在执行所述识别到所述目标主体包括人脸时,选择人脸追焦模式的步骤包括:
计算所述预览画面的总面积和所述人脸的第一面积;
所述第一面积与所述总面积的比大于第一阈值时,切换对焦模式为所述人眼追焦模式。
可选地,所述对焦控制方法在执行所述在未识别到所述目标主体包括人物主体时,选择非人对焦模式的步骤包括以下至少一项:
识别到所述目标主体包括动物时,选择动物追焦模式;
识别到所述目标主体包括文字时,选择微距追焦模式;
识别到所述目标主体包括月亮和/或飞机时,选择超距追焦模式。
可选地,所述对焦控制方法在执行所述识别到所述目标主体包括动物时,选择动物追焦模式的步骤包括:
响应于获取所述动物图像,在判断所述动物图像包括动物脸时,切换对焦模式为动物眼追焦模式。
可选地,所述对焦控制方法还包括所述识别到所述目标主体包括月亮时,选择超月追焦模式的步骤包括:
计算所述预览画面的总面积和所述预览画面中月亮的第二面积;
所述第二面积与所述总面积的比大于第二阈值时,切换对焦模式为所述超月模式。
可选地,所述目标主体包括前景主体和后景主体,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤包括:
获取所述预览画面中所述前景主体的第三面积和所述后景主体的第四面积;
在所述第三面积大于所述第四面积时,以所述前景主体为所述目标主体;
在所述第三面积小于所述第四面积时,以所述后景主体为所述目标主体。
可选地,所述对焦控制方法还包括通过分割或语义分类划分前景和后景以分别识别前景主体和后景主体,和/或,通过所述预览画面中主体所在区域的像素个数进行面积计算。
可选地,所述目标主体包括前景区域和后景区域的至少一个主体,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤包括:
计算所述预览画面中前景区域面积和后景区域面积;
在所述前景区域面积大于所述后景区域面积时,以所述前景区域的主体为所述目标主体;和/或,
在所述前景区域面积小于所述后景区域面积时,以所述后景区域的主体为所述目标主体。
可选地,所述预设对焦模式包括第一对焦方式和第二对焦方式,所述对焦控制方法在执行所述使用所述预设对焦模式对所述目标主体对焦的步骤包括:
响应于获取所述第一对焦方式和所述第二对焦方式,分别获取所述第一对焦方式和所述第二对焦方式的可信度;
在所述第一对焦方式的可信度大于所述第二对焦方式的可信度时,以所述第一对焦方式进行对焦。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤中包括:
获取所述预览画面的上一帧画面的跟踪区域,根据所述上一帧画面的跟踪区域确定权重图;其中,所述权重图中的每个像素点均存在对应的可信度,所述跟踪区为所述上一帧画面中目标主体所在的区域;
通过所述权重图在所述预览画面上滑动,得到各候选区;
获取所述各候选区的图像特征,将各图像特征分别进行卷积计算,以获取各候选区的卷积值;
根据所述卷积值中的最大值对应的候选区确定所述预览画面的目标主体。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤之后包括:
根据识别到同一目标主体的至少两张预览画面,获取所述至少两张预览画面的拍摄时间和拍摄角度;
根据所述拍摄时间和拍摄角度,计算所述目标主体的移动特征;
根据所述移动特征和当前时刻,预测所述目标主体所在的预测位置;
获取所述预测位置的预览画面,识别所述预测位置的预览画面中的所述目标主体。
可选地,所述对焦控制方法在执行所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤包括:
响应于获取所述预览画面,读取存储的预设主体的主体特征;
根据所述主体特征进行特征匹配,以识别所述预览画面中的所述预设主体;
以识别到的所述预设主体为所述目标主体。
可选地,所述预设主体为预设人物,所述对焦控制方法在执行所述读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
采集所述预设人物的脸部图像,对所述脸部图像进行人脸特征提取;
采集所述预设人物的眼部图像,对所述眼部图像进行人眼特征提取;
采集所述预设人物的人体图像,对所述人体图像进行人体特征提取;
采集所述预设人物的第一附属图像,对所述第一附属图像进行人物附属物特征提取。
可选地,所述预设主体为预设动物,所述对焦控制方法在执行所述读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
采集所述预设动物的动物脸图像,对所述动物脸图像进行动物脸特征识别;
采集所述预设动物的动物体图像,对所述动物体图像进行动物特征识别;
采集所述预设动物的第二附属图像,对所述第二附属图像进行动物附属物特征提取。
可选地,所述对焦控制方法在执行所述读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
所述预设主体为预设文字,采集所述预设文字的关键词,提取所述关键词的字体特征;
所述预设主体为预设物体,采集所述预设物体的物体图像,对所述物体图像进行物体特征提取。
本申请还提供一种智能终端,包括处理器和存储器;
所述存储器上存储有计算机程序;
所述处理器执行从所述存储器上读取的所述计算机程序,实现如上任一所述的对焦控制方法。
本申请提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一所述的对焦控制方法。
如上所述,本申请提供的对焦控制方法、智能终端和存储介质,通过使用主体特征进行万物识别和追焦,能实现更快、更稳和更清晰的对焦,进而提升了用户拍摄体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为实现本申请各个实施例的一种智能终端的硬件结构示意图;
图2为本申请实施例提供的一种通信网络系统架构图;
图3是根据第一实施例示出的对焦控制方法的流程示意图;
图4是根据第一实施例示出的对焦控制方法中步骤S20的流程示意图;
图5是根据第一实施例示出的对焦控制方法中步骤S31的流程示意图;
图6是根据第一实施例示出的对焦控制方法中步骤S32的流程示意图;
图7是根据第二实施例示出的对焦控制方法中步骤S20的流程示意图;
图8是根据第三实施例示出的智能终端的结构图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在……时"或"当……时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。本申请使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的,或意味着任一个或任何组合。例如,“包括以下至少一个:A、B、C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A和B和C”,再如,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A和B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在......时”或“当......时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
需要说明的是,在本文中,采用了诸如S10、S20等步骤代号,其目的是为了更清楚简要地表述相应内容,不构成顺序上的实质性限制,本领域技术人员在具体实施时,可能会先执行S20后执行S10等,但这些均应在本申请的保护范围之内。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。
智能终端可以以各种形式来实施。例如,本申请中描述的智能终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等智能终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本申请的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本申请各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System ofMobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)、TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)和5G等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。可选地,光传感器包括环境光传感器及接近传感器,可选地,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。可选地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。可选地,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。可选地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
可选地,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,可选地,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,可选地,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本申请实施例,下面对本申请的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本申请实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
可选地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。可选地,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。可选地,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本申请不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统(如5G)等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本申请各个实施例。
第一实施例
本申请实施例提供一种对焦控制方法,可应用于智能终端,图3是根据第一实施例示出的对焦控制方法的流程示意图。
请参阅图3,在一实施例中,对焦控制方法包括以下步骤:
S10:获取预览画面。
可选地,预览画面选自镜头中即将拍摄的画面。
S20:对预览画面进行主体识别,以获取预览画面中的目标主体。
目标主体为用户想要拍摄的主要物体,包括但不限于人眼、人脸、动物和植物等常用拍摄目标。
S30:根据目标主体,选择与目标主体对应的预设对焦模式。
可以理解地,不同的对焦模式具有不同的对焦控制方式。
S40:使用预设对焦模式对目标主体对焦。
对焦控制方法根据不同的目标主体选择相对应的对焦模式能够实现更快捷、更智能和更清晰的对焦,从而获得清晰的目标主体的拍摄画面。
图4是根据第一实施例示出的对焦控制方法中步骤S20的流程示意图。
请参阅图4,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S50:响应于获取预览画面,读取存储的预设主体的主体特征。
可选地,通过输入特征信息或提取图像识别特征读取已存储的预设主体的主体特征。
S60:根据主体特征与预览画面进行特征匹配,以识别预览画面中的预设主体。
不同的主体具有不同的特征。可选地,通过预先构建识别模型,对不同主体的特征进行训练和学习,在拍摄时可以准确地识别出需要拍摄的预设主体。
S70:以识别到的预设主体为目标主体。
在本实施例中,对焦控制方法通过将智能万物识别技术即采用人眼识别、人脸识别、人体识别、动物眼睛识别和物体主体识别等多种识别技术和智能对焦与追焦技术结合,从而进行万物识别和对焦,能实现更快、更稳和更清晰的对焦,进而提升了用户拍摄体验。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别的步骤之前包括:
S200:使用机器学习对主体识别的类型进行识别检测模型的训练。
可选地,检测模型训练选自pytorch、mxnet/tensorflow和mnn/ncnn训练模型。
S201:使用识别检测模型对预览画面进行主体识别。
在本实施例中,对焦控制方法通过使用AI技术,进行检测模型训练,包括训练人眼识别、人脸识别、人体识别等模型,能够识别出人眼、人脸、人体和动物眼睛和物体主体等。
在一实施例中,对焦控制方法在执行S30:根据目标主体,选择与目标主体对应的预设对焦模式的步骤包括:
S31:识别到目标主体包括人物主体时,选择人物对焦模式。
可选地,目标主体中可能包括人物主体和非人物主体,优先选择人物主体对应的人物对焦模式。
和/或,S32:在未识别到目标主体包括人物主体时,选择非人对焦模式。
在本实施例中,对焦控制方法根据目标主体的显著主体特征判断是否包括人物主体,从而选择不同的对焦模式实现更快、更稳和更清晰的对焦。
图5是根据第一实施例示出的对焦控制方法中步骤S31的流程示意图。
请参阅图5,在一实施例中,对焦控制方法在执行S31:识别到目标主体包括人物主体时,选择人物对焦模式的步骤包括以下至少一项:
S310:识别到目标主体包括人眼时,选择人眼追焦模式;
S311:识别到目标主体包括人脸时,选择人脸追焦模式;
S312:识别到目标主体包括人体时,选择人体追焦模式。
在本实施例中,对焦控制方法通过将人物主体中人眼、人脸和人体的特征细化,能够更加准确智能的追焦用户想要拍摄的目标主体。
在一实施例中,对焦控制方法在执行S311:识别到目标主体包括人脸时,选择人脸追焦模式的步骤包括:
计算预览画面的总面积和人脸的第一面积;
第一面积与总面积的比大于第一阈值时,切换对焦模式为人眼追焦模式。
本申请对第一阈值不做限定,用户可以根据拍摄需求选择不同的数值。可选地,在人脸面积大于总面积的1/50时,选择人眼追焦模式。
图6是根据第一实施例示出的对焦控制方法中步骤S32的流程示意图。
请参阅图6,在一实施例中,对焦控制方法在执行S32:在未识别到目标主体包括人物主体时,选择非人对焦模式的步骤包括以下至少一项:
S320:识别到目标主体包括动物时,选择动物追焦模式;
S321:识别到目标主体包括文字时,选择微距追焦模式;
S322:识别到目标主体包括月亮和/或飞机时,选择超距追焦模式。
可选地,目标主体包括飞鸟等超远距离的物体时,也可选择超距追焦模式。
在本实施例中,对焦控制方法通过将非人物主体中动物、文字和月亮和/或飞机的特征细化,能够更加准确智能的追焦用户想要拍摄的目标主体。
在一实施例中,对焦控制方法在执行S320:识别到目标主体包括动物时,选择动物追焦模式的步骤包括:
响应于获取动物图像,在判断动物图像包括动物脸时,切换对焦模式为动物眼追焦模式。
在本实施例中,对焦控制方法可以通过设置动物脸面积与总面积比的阈值判断何时进行动物眼追焦模式。在动物脸面积不符合要求,即动物图像不存在动物脸或动物脸面积占比较小时根据动物显著特性进行物体对焦。
在一实施例中,对焦控制方法在执行S322:识别到目标主体包括月亮时,选择超月追焦模式的步骤包括:
计算预览画面的总面积和预览画面中月亮的第二面积;
第二面积与总面积的比大于第二阈值时,切换对焦模式为超月模式。
可选地,本申请对第二阈值不做限定,用户可以根据拍摄需求选择不同的数值。在本实施例中,在预览画面中月亮的面积符合对焦需求时,选择超月模式,直接把对焦焦距设置为无穷远。
在一实施例中,目标主体包括前景主体和后景主体,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S21:获取预览画面中前景主体的第三面积和后景主体的第四面积;
S22:在第三面积大于第四面积时,以前景主体为目标主体;
S23:在第三面积小于第四面积时,以后景主体为目标主体。
可选地,在点光源场景或者前后景反差较大时,无法锁定对焦点,对焦画面不清晰,对焦控制方法根据景深信息对前景和后景的画幅占比进行计算,如果前景占比较大则以前景主体为作为对焦主体,如果后景占比较大则以后景主体为作为对焦主体。
在一实施例中,对焦控制方法还包括通过分割或语义分类划分前景和后景以分别识别前景主体和后景主体,和/或,通过预览画面中主体所在区域的像素个数进行面积计算。
可选地,对焦控制方法可以根据镜头厂商提供的景深表中查询得出前景和后景的划分方式,或根据预览画面中对焦的像素个数的面积通过算法计算出前景和后景的面积。
在一实施例中,目标主体包括前景区域和后景区域的至少一个主体,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S24:计算预览画面中前景区域面积和后景区域面积;
S25:在前景区域面积大于后景区域面积时,以前景区域的主体为目标主体;
S26:在前景区域面积小于后景区域面积时,以后景区域的主体为目标主体。
在本实施例中,前景和后景包括至少一个主体,将至少一个主体的面积相加得到前景区域面积和后景区域面积。对焦控制方法通过计算前景区域面积和后景区域面积,如果前景区域占比较大则以前景区域为作为对焦主体,如果后景区域占比较大则以后景区域为作为对焦主体。可选地,统计两类所占的像素个数的方式计算前后景的面积。可选地,也可以通过分割或语义分类划分前后景的分割。比如一般把人作为前景,除人以外的背景分割出来,实现前后景分离。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤中包括:
S202:获取预览画面的上一帧画面的跟踪区域,根据上一帧画面的跟踪区域确定权重图。
可选地,上一帧画面可以是常用的任意一种图像格式。上一帧画面指的是与当前预览画面相邻时刻获取的画面。可选地,跟踪区域是指图像中的目标主体所在的区域。可选地,跟踪区域指运动中的目标主体需要对焦跟踪的范围。可选地,权重图为画面中各像素点的可信度的分布图。
其中,权重图中的每个像素点均存在对应的可信度。对焦的权重其实就是正常对焦中的可信度的统计。可选地,权重值从画面中心向四边呈逐渐减小趋势。通过权重图表征画面中的中心像素点到边缘像素点的可信度统计值逐渐减小。可选地,权重图可采用常用的函数或方程生成。可选地,可以采用二维高斯函数生成权重图。
可选地,当检测出预览画面中不存在触发的对焦区域时,可获取预览画面的上一帧画面。根据上一帧图像中的跟踪区域的大小生成对应的权重图。
可选地,可信度包括高可信度、中可信度和低可信度,不同的可信度程度代表权重图中的不同区域的权重占比。
S203:通过权重图在预览画面上滑动,得到各候选区。
可选地,根据权重图滑动经过预览画面,可以得到至少一个候选区,每个候选区的大小跟权重图的大小相同。可选地,使用权重图在预览画面上每滑动一次,可得到一个候选区。当使用权重图滑动经过整个预览画面时,可得到多个候选区。
S204:获取各候选区的图像特征,将各图像特征分别进行卷积计算,以获取各候选区的卷积值。
可选地,使用训练好的滤波器对各候选区的图像特征进行卷积计算。可选地,滤波器可以预先根据上一帧画面的主体区域进行更新。经过对图像特征的卷积计算,可以从至少一个候选区中确定目标主体所在的候选区。
S205:根据卷积值中的最大值对应的候选区确定预览画面的目标主体。
可选地,将目标主体所在的候选区输入主体分割网络进行目标主体的判断。可选地,确定最大的卷积值的候选区,并进行适当扩大,得到最大卷积值候选区中的目标主体区域。将目标主体区域输入主体分割网络,即可得到预览画面中的目标主体。
在本实施例中,对焦控制方法通过将预览画面进行分割并计算每个分割的候选区在总画面的权重,从而判断预览画面中目标主体的位置,选取目标主体的中心位置进行对焦拍摄。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤之后包括:
S206:根据识别到同一目标主体的至少两张预览画面,获取至少两张预览画面的拍摄时间和拍摄角度;
S207:根据拍摄时间和拍摄角度,计算目标主体的移动特征;
S208:根据移动特征和当前时刻,预测目标主体所在的预测位置;
S209:获取预测位置的预览画面,识别预测位置的预览画面中的目标主体。
在本实施例中,对焦控制方法结合目标主体的运动特征等信息进行联合判断预览画面中目标主体的位置,选择最优对焦方式。可选地,通过两张不同预览画面中的同一目标人物在不同时刻的出现位置,可以估算目标人物的运动方向和运动速度,然后推测目标人物在当前时刻出现的区域、角度及景深等,以进行快捷对焦。
可选地,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S501:响应于获取预览画面,在屏幕上展示预览画面。
S502:响应于对屏幕的操作信号,获取操作信号所对应操作的屏幕区域。
可选地,手动操作可以是触摸屏操作、鼠标操作或按键选取操作。
S503:以预览画面中对应屏幕区域的主体为目标主体。
可选地,在获取预览画面以后,可以直接展示预览画面让用户进行操作,用户选择后再分析操作的屏幕区域具有哪些可选主体;也可以预先筛选出可选的几个主体,再让用户操作选择。可选地,在预先筛选的方式中,可以将可选主体以可见或不可见的方式标识出来,从而方便对操作目标的识别。例如用方框、圆圈、五角星、三角形、文字、数字等特殊图形进行框示或标记。
标识出来的形式可以是在预览图像中直接标识、可以是在预览图像之外单独列示、也可以是与预览图像同时列示;既可以是以用可选主体的截图进行标识,也可以是对可选主体进行编码或编号后由用户进行对应选择。
在本实施例中,对焦控制方法通过将操作信号发送给用户,提示用户主动进行目标主体的选取,能实现更快捷、更智能和更清晰的对焦,进而提升了用户拍摄体验。
在一实施例中,预设主体为预设人物,对焦控制方法在执行S50:响应于获取预览画面,读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
S51:采集预设人物的脸部图像,对脸部图像进行人脸特征提取,以备对人脸特征匹配。
可选地,通过预设模型进行人脸识别,可以协助对目标人脸或目标人物进行快捷对焦。
S52:采集预设人物的眼部图像,对眼部图像进行人眼特征提取,以备对人眼特征匹配。
可选地,通过预设模型对人眼识别,可以协助对目标人脸或目标人物进行快捷对焦。人眼特征可以是眼形、眉形、虹膜、瞳孔等特征。
S53:采集预设人物的人体图像,对人体图像进行人体特征提取,以备对人体特征匹配。
可选地,通过预设模型对人体识别,可以协助对目标人体进行快捷对焦。人体特征可以是衣型、鞋子、颜色、发型、疤痕、身高、体型、特殊手势或姿势等特征。
S54:采集预设人物的第一附属图像,对第一附属图像进行人物附属物特征提取,以备对人物附属特征匹配。
可选地,通过预设模型对人物附属物的识别,可以协助对目标人物进行快捷对焦。人物附属物特征可以是配饰、帽子、背包、手杖、轮椅等随身物特征。
在本实施例中,对焦控制方法根据人物的人脸、人体、人眼和附属图像特征,能够准确获取预览画面中的目标主体,从而能够选择最优的对焦模式。可选地,本次拍摄任务是为拍摄婚纱照,在拍摄之前,可以录入新郎及新娘的脸部图像、眼部图像、当天的人体图像、当天的附属物图像,以提取相关特征,从而协助拍摄时快捷对焦。
在一实施例中,预设主体为预设动物,对焦控制方法在执行S50:响应于获取预览画面,读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
S55:采集预设动物的动物脸图像,对动物脸图像进行动物脸特征识别,以备对动物脸特征匹配。
可选地,通过预设模型进行动物脸识别,可以协助对目标动物脸或目标动物的快捷对焦。
S56:采集预设动物的动物体图像,对动物体图像进行动物特征识别,以备对动物特征匹配。
可选地,通过预设模型进行动物体识别,可以协助对目标动物的快捷对焦。动物特征可以是毛发、颜色、身高、疤痕、尾巴、体型、特殊动作或姿势等特征。
S57:采集预设动物的第二附属图像,对第二附属图像进行动物附属物特征提取,以备对动物附属物特征匹配。
可选地,通过预设模型进行动物附属物识别,可以协助对目标动物的快捷对焦。动物附属物特征可以是配饰、动物服装、雪橇、猫包、兔笼、动物玩具等随身物特征。
在本实施例中,对焦控制方法根据动物的动物脸、动物体和附属图像特征,能够准确获取预览画面中的目标主体,从而能够选择最优的对焦模式。可选地,在周末带宠物狗去公园拍照,在拍摄前,可以录入宠物狗的脸部图像、宠物狗的各种姿势图像、宠物狗所用配饰的图像等,以提取相关特征,从而协助拍摄时快捷对焦。
在一实施例中,对焦控制方法在执行S50:响应于获取预览画面,读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
S58:预设主体为预设文字,采集预设文字的关键词,提取关键词的字体特征,以备对字体特征匹配。
可选地,通过预设模型进行预设文字的关键词识别,可以协助对目标文字的快捷对焦。关键词的字体特征可以是不同关键词字体的图像匹配或不同字体的关键词识别等特征。
S59:预设主体为预设物体,采集预设物体的物体图像,对物体图像进行物体特征提取,以备对物体特征匹配。
可选地,通过预设模型进行预设物体的物体图像识别,可以协助对目标物体的快捷对焦。物体特征可以是物体的外形、颜色、透明度、大小等特征。
在本实施例中,对焦控制方法根据文字和物体特征,能够准确获取预览画面中的目标主体,从而能够选择最优的对焦模式。可选地,本次拍摄任务是拍摄摩崖石刻文字或者龙门石窟雕像,可以预先录入关于摩崖石刻文字图片或者龙门石窟的图像,以对摩崖石刻的文字特征或龙门石窟的特征进行识别,协助拍摄任务执行时的快捷对焦。
在一实施例中,预设对焦模式包括第一对焦方式和第二对焦方式,对焦控制方法在执行S40:使用预设对焦模式对目标主体对焦的步骤包括:
S41:响应于获取第一对焦方式和第二对焦方式,分别获取第一对焦方式和第二对焦方式的可信度;
S42:在第一对焦方式的可信度大于第二对焦方式的可信度时,以第一对焦方式进行对焦。
可选地,本申请对对焦模式的不做限定,对焦模式可选择相位对焦,激光对焦、反差对焦和中心对焦中的一种,用户根据对焦模式的可信度,选择最优的对焦模式。如上所述,对焦控制方法结合前后景信息如前景在画幅中占比等以及目标主体特征等进行联合判断,选择最优对焦方式进行对焦。
第二实施例
本申请实施例还提供一种对焦控制方法,可应用于智能终端,包括以下步骤:
S10:获取预览画。
可选地,预览画面选自镜头中即将拍摄的画面。
S20:对预览画面进行主体识别,以获取预览画面中的目标主体。
目标主体为用户想要拍摄的主要物体,可以是人眼、人脸、动物和植物等常用拍摄目标。
S30:根据目标主体,选择与目标主体对应的预设对焦模式。
可以理解地,不同的对焦模式具有不同的对焦控制方式。
S40:使用预设对焦模式对目标主体对焦;
可选地,对焦控制方法根据不同的目标主体选择相对应的对焦模式能够实现更快捷、更智能和更清晰的对焦,从而获得清晰的目标主体的拍摄画面。
图7是根据第二实施例示出的对焦控制方法中步骤S20的流程示意图。
请参阅图7,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S501:响应于获取预览画面,在屏幕上展示预览画面。
S502:响应于对屏幕的操作信号,获取操作信号所对应操作的屏幕区域。
可选地,手动操作可以是触摸屏操作、鼠标操作或按键选取操作。
S503:以预览画面中对应屏幕区域的主体为目标主体。
可选地,在获取预览画面以后,可以直接展示预览画面让用户进行操作,用户选择后再分析操作的屏幕区域具有哪些可选主体;也可以预先筛选出可选的几个主体,再让用户操作选择。可选地,在预先筛选的方式中,可以将可选主体以可见或不可见的方式标识出来,从而方便对操作目标的识别。例如用方框、圆圈、五角星、三角形、文字、数字等特殊图形进行框示或标记。
标识出来的形式可以是在预览图像中直接标识、可以是在预览图像之外单独列示、也可以是与预览图像同时列示;既可以是以用可选主体的截图进行标识,也可以是对可选主体进行编码或编号后由用户进行对应选择。
在本实施例中,对焦控制方法通过将操作信号发送给用户,提示用户主动进行目标主体的选取,能实现更快捷、更智能和更清晰的对焦,进而提升了用户拍摄体验。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别的步骤之前包括:
S200:使用机器学习对主体识别的类型进行识别检测模型的训练。
可选地,检测模型训练可以选自pytorch、mxnet/tensorflow和mnn/ncnn训练模型。
S201:使用识别检测模型对预览画面进行主体识别。
在本实施例中,对焦控制方法通过使用AI技术,进行检测模型训练,包括训练人眼识别、人脸识别、人体识别等模型,能够识别出人眼、人脸、人体和动物眼睛和物体主体等。
在一实施例中,对焦控制方法在执行S30:根据目标主体,选择与目标主体对应的预设对焦模式的步骤包括:
S31:识别到目标主体包括人物主体时,选择人物对焦模式。
可选地,目标主体中可能包括人物主体和非人物主体,优先选择人物主体对应的人物对焦模式。
和/或,S32:在未识别到目标主体包括人物主体时,选择非人对焦模式。
在本实施例中,对焦控制方法根据目标主体的显著主体特征判断是否包括人物主体,从而选择不同的对焦模式实现更快、更稳和更清晰的对焦。
在一实施例中,对焦控制方法在执行S31:识别到目标主体包括人物主体时,选择人物对焦模式的步骤包括以下至少一项:
S310:识别到目标主体包括人眼时,选择人眼追焦模式;
S311:识别到目标主体包括人脸时,选择人脸追焦模式;
S312:识别到目标主体包括人体时,选择人体追焦模式。
在本实施例中,对焦控制方法通过将人物主体中人眼、人脸和人体的特征细化,能够更加准确智能的追焦用户想要拍摄的目标主体。
在一实施例中,对焦控制方法在执行S311:识别到目标主体包括人脸时,选择人脸追焦模式的步骤包括:
计算预览画面的总面积和人脸的第一面积;
第一面积与总面积的比大于第一阈值时,切换对焦模式为人眼追焦模式。
本申请对第一阈值不做限定,用户可以根据拍摄需求选择不同的数值。可选地,在人脸面积大于总面积的1/50时,选择人眼追焦模式。
在一实施例中,对焦控制方法在执行S32:在未识别到目标主体包括人物主体时,选择非人对焦模式的步骤包括以下至少一项:
S320:识别到目标主体包括动物时,选择动物追焦模式;
S321:识别到目标主体包括文字时,选择微距追焦模式;
S322:识别到目标主体包括月亮和/或飞机时,选择超距追焦模式。
可选地,目标主体包括飞鸟等超远距离的物体时,也可选择超距追焦模式。
在本实施例中,对焦控制方法通过将非人物主体中动物、文字和月亮和/或飞机的特征细化,能够更加准确智能的追焦用户想要拍摄的目标主体。
在一实施例中,对焦控制方法在执行S320:识别到目标主体包括动物时,选择动物追焦模式的步骤包括:
响应于获取动物图像,在判断动物图像包括动物脸时,切换对焦模式为动物眼追焦模式。
在本实施例中,对焦控制方法可以通过设置动物脸面积与总面积比的阈值判断何时进行动物眼追焦模式。在动物脸面积不符合要求,即动物图像不存在动物脸或动物脸面积占比较小时根据动物显著特性进行物体对焦。
在一实施例中,对焦控制方法在执行S322:识别到目标主体包括月亮时,选择超月追焦模式的步骤包括:
计算预览画面的总面积和预览画面中月亮的第二面积;
第二面积与总面积的比大于第二阈值时,切换对焦模式为超月模式。
可选地,本申请对第二阈值不做限定,用户可以根据拍摄需求选择不同的数值。在本实施例中,在预览画面中月亮的面积符合对焦需求时,选择超月模式,直接把对焦设置为无穷远。
在一实施例中,目标主体包括前景主体和后景主体,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S21:获取预览画面中前景主体的第三面积和后景主体的第四面积;
S22:在第三面积大于第四面积时,以前景主体为目标主体;
S23:在第三面积小于第四面积时,以后景主体为目标主体。
可选地,在点光源场景或者前后景反差较大时,无法锁定对焦点,对焦画面不清晰,对焦控制方法根据景深信息对前景和后景的画幅占比进行计算,如果前景占比较大则以前景主体为作为对焦主体,如果后景占比较大则以后景主体为作为对焦主体。
在一实施例中,对焦控制方法还包括通过分割或语义分类划分前景和后景以分别识别前景主体和后景主体,和/或,通过预览画面中主体所在区域的像素个数进行面积计算。
可选地,对焦控制方法可以根据镜头厂商提供的景深表中查询得出前景和后景的划分方式,或根据预览画面中对焦的像素个数的面积通过算法计算出前景和后景的面积。
在一实施例中,目标主体包括前景区域和后景区域的至少一个主体,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S24:计算预览画面中前景区域面积和后景区域面积;
S25:在前景区域面积大于后景区域面积时,以前景区域的主体为目标主体;
S26:在前景区域面积小于后景区域面积时,以后景区域的主体为目标主体。
在本实施例中,前景和后景包括至少一个主体,将至少一个主体的面积相加得到前景区域面积和后景区域面积。对焦控制方法通过计算前景区域面积和后景区域面积,如果前景区域占比较大则以前景区域为作为对焦主体,如果后景区域占比较大则以后景区域为作为对焦主体。可选地,统计两类所占的像素个数的方式计算前后景的面积。可选地,也可以通过分割或语义分类划分前后景的分割。比如一般把人作为前景,除人以外的背景分割出来,实现前后景分离。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤中包括:
S202:获取预览画面的上一帧画面的跟踪区域,根据上一帧画面的跟踪区域确定权重图。
可选地,上一帧画面可以是常用的任意一种图像格式。上一帧画面指的是与当前预览画面相邻时刻获取的画面。可选地,跟踪区域是指图像中的目标主体所在的区域。可选地,跟踪区域指运动中的目标主体需要对焦跟踪的范围。可选地,权重图为画面中各像素点的可信度的分布图。
其中,权重图中的每个像素点均存在对应的可信度。对焦的权重其实就是正常对焦中的可信度的统计。可选地,权重值从画面中心向四边呈逐渐减小趋势。通过权重图表征画面中的中心像素点到边缘像素点的可信度统计值逐渐减小。可选地,权重图可采用常用的函数或方程生成。可选地,可以采用二维高斯函数生成权重图。
可选地,当检测出预览画面中不存在触发的对焦区域时,可获取预览画面的上一帧画面。根据上一帧图像中的跟踪区域的大小生成对应的权重图。
可选地,可信度包括高可信度、中可信度和低可信度,不同的可信度程度代表权重图中的不同区域的权重占比。
S203:通过权重图在预览画面上滑动,得到各候选区。
可选地,根据权重图滑动经过预览画面,可以得到至少一个候选区,每个候选区的大小跟权重图的大小相同。可选地,使用权重图在预览画面上每滑动一次,可得到一个候选区。当使用权重图滑动经过整个预览画面时,可得到多个候选区。
S204:获取各候选区的图像特征,将各图像特征分别进行卷积计算,以获取各候选区的卷积值。
可选地,使用训练好的滤波器对各候选区的图像特征进行卷积计算。可选地,滤波器可以预先根据上一帧画面的主体区域进行更新。经过对图像特征的卷积计算,可以从至少一个候选区中确定目标主体所在的候选区。
S205:根据卷积值中的最大值对应的候选区确定预览画面的目标主体。
可选地,将目标主体所在的候选区输入主体分割网络进行目标主体的判断。可选地,确定最大的卷积值的候选区,并进行适当扩大,得到最大卷积值候选区中的目标主体区域。将目标主体区域输入主体分割网络,即可得到预览画面中的目标主体。
在本实施例中,对焦控制方法通过将预览画面进行分割并计算每个分割的候选区在总画面的权重,从而判断预览画面中目标主体的位置,选取目标主体的中心位置进行对焦拍摄。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤之后包括:
S206:根据识别到同一目标主体的至少两张预览画面,获取至少两张预览画面的拍摄时间和拍摄角度;
S207:根据拍摄时间和拍摄角度,计算目标主体的移动特征;
S208:根据移动特征和当前时刻,预测目标主体所在的预测位置;
S209:获取预测位置的预览画面,识别预测位置的预览画面中的目标主体。
在本实施例中,对焦控制方法结合目标主体的运动特征等信息进行联合判断预览画面中目标主体的位置,选择最优对焦方式。可选地,通过两张不同预览画面中的同一目标人物在不同时刻的出现位置,可以估算目标人物的运动方向和运动速度,然后推测目标人物在当前时刻出现的区域、角度及景深等,以进行快捷对焦。
在一实施例中,对焦控制方法在执行S20:对预览画面进行主体识别,以获取预览画面中的目标主体的步骤包括:
S50:响应于获取预览画面,读取存储的预设主体的主体特征。
可选地,通过输入特征信息或提取图像识别特征读取已存储的预设主体的主体特征。
S60:根据主体特征进行特征匹配,以识别预览画面中的预设主体;
不同的主体具有不同的特征。可选地,通过预先构建识别模型,对不同主体的特征进行训练和学习,在拍摄时可以准确地识别出需要拍摄的预设主体。
S70:以识别到的预设主体为目标主体。
在本实施例中,对焦控制方法通过将智能万物识别技术即采用人眼识别、人脸识别、人体识别、动物眼睛识别和物体主体识别等多种识别技术和智能对焦与追焦技术结合,从而进行万物识别和对焦,能实现更快、更稳和更清晰的对焦,进而提升了用户拍摄体验。
在一实施例中,预设主体为预设人物,对焦控制方法在执行S50:响应于获取预览画面,读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
S51:采集预设人物的脸部图像,对脸部图像进行人脸特征提取。
可选地,通过预设模型进行人脸识别,可以协助对目标人脸或目标人物进行快捷对焦。
S52:采集预设人物的眼部图像,对眼部图像进行人眼特征提取。
可选地,通过预设模型对人眼识别,可以协助对目标人脸或目标人物进行快捷对焦。人眼特征可以是眼形、眉形、虹膜、瞳孔等特征。
S53:采集预设人物的人体图像,对人体图像进行人体特征提取。
可选地,通过预设模型对人体识别,可以协助对目标人体进行快捷对焦。人体特征可以是衣型、鞋子、颜色、发型、疤痕、身高、体型、特殊手势或姿势等特征。
S54:采集预设人物的第一附属图像,对第一附属图像进行人物附属物特征提取。
可选地,通过预设模型对人物附属物的识别,可以协助对目标人物进行快捷对焦。人物附属物特征可以是配饰、帽子、背包、手杖、轮椅等随身物特征。
在本实施例中,对焦控制方法根据人物的人脸、人体、人眼和附属图像特征,能够准确获取预览画面中的目标主体,从而能够选择最优的对焦模式。可选地,本次拍摄任务是为拍摄婚纱照,在拍摄之前,可以录入新郎及新娘的脸部图像、眼部图像、当天的人体图像、当天的附属物图像,以提取相关特征,从而协助拍摄时快捷对焦。
在一实施例中,预设主体为预设动物,对焦控制方法在执行S50:响应于获取预览画面,读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
S55:采集预设动物的动物脸图像,对动物脸图像进行动物脸特征识别。
可选地,通过预设模型进行动物脸识别,可以协助对目标动物脸或目标动物的快捷对焦。
S56:采集预设动物的动物体图像,对动物体图像进行动物特征识别。
可选地,通过预设模型进行动物体识别,可以协助对目标动物的快捷对焦。动物特征可以是毛发、颜色、身高、疤痕、尾巴、体型、特殊动作或姿势等特征。
S57:采集预设动物的第二附属图像,对第二附属图像进行动物附属物特征提取。
可选地,通过预设模型进行动物附属物识别,可以协助对目标动物的快捷对焦。动物附属物特征可以是配饰、动物服装、雪橇、猫包、兔笼、动物玩具等随身物特征。
在本实施例中,对焦控制方法根据动物的动物脸、动物体和附属图像特征,能够准确获取预览画面中的目标主体,从而能够选择最优的对焦模式。可选地,在周末带宠物狗去公园拍照,在拍摄前,可以录入宠物狗的脸部图像、宠物狗的各种姿势图像、宠物狗所用配饰的图像等,以提取相关特征,从而协助拍摄时快捷对焦。
在一实施例中,对焦控制方法在执行S50:响应于获取预览画面,读取存储的预设主体的主体特征的步骤之前包括以下至少一项:
S58:预设主体为预设文字,采集预设文字的关键词,提取关键词的字体特征。
可选地,通过预设模型进行预设文字的关键词识别,可以协助对目标文字的快捷对焦。关键词的字体特征可以是不同关键词字体的图像匹配或不同字体的关键词识别等特征。
S59:预设主体为预设物体,采集预设物体的物体图像,对物体图像进行物体特征提取。
可选地,通过预设模型进行预设物体的物体图像识别,可以协助对目标物体的快捷对焦。物体特征可以是物体的外形、颜色、透明度、大小等特征。
在本实施例中,对焦控制方法根据文字和物体特征,能够准确获取预览画面中的目标主体,从而能够选择最优的对焦模式。可选地,本次拍摄任务是拍摄摩崖石刻文字或者龙门石窟雕像,可以预先录入关于摩崖石刻文字图片或者龙门石窟的图像,以对摩崖石刻的文字特征或龙门石窟的特征进行识别,协助拍摄任务执行时的快捷对焦。
在一实施例中,预设对焦模式包括第一对焦方式和第二对焦方式,对焦控制方法在执行S40:使用预设对焦模式对目标主体对焦的步骤包括:
S41:响应于获取第一对焦方式和第二对焦方式,分别获取第一对焦方式和第二对焦方式的可信度;
S42:在第一对焦方式的可信度大于第二对焦方式的可信度时,以第一对焦方式进行对焦。
本申请对对焦模式的不做限定,对焦模式可选择相位对焦,激光对焦、反差对焦和中心对焦中的一种,用户根据对焦模式的可信度,选择最优的对焦模式。
如上所述,对焦控制方法在结合用户主动选择的基础上,结合前后景信息如前景在画幅中占比等以及目标主体特征等进行联合判断,选择最优对焦方式进行对焦。
第三实施例
本申请实施例还提供一种智能终端。图8是根据第三实施例示出的智能终端的结构图。
请参阅图8,在一实施例中,智能终端包括处理器10和分别与处理器10连接的镜头20和存储器30。镜头20用于获取预览画面。存储器30上存储有计算机程序。处理器10用于在接收到镜头20发送的预览画面时,执行从存储器30上读取的计算机程序,以实现如第一实施例和第二实施例所述的对焦控制方法。
可选地,处理器10在实现第一实施例和第二实施例所述的对焦控制方法的步骤包括:
处理器10打开镜头20和存储器30,接收镜头20发送的预览画面,读取并启动存储器30中的对焦识别技术模型对预览画面进行识别检测。处理器10识别出预览画面的目标主体后,结合目标物体的前后景信息以及目标物体拍摄中心位置等进行联合判断目标主体的区域。处理器10将目标主体区域作为对焦区域启动对焦流程进行对焦参数配置,选择最优对焦方式如激光对焦,相位对焦或反差对焦。
在本实施例中,智能终端通过使用主体特征进行万物的识别和对焦,能实现更快、更稳和更清晰的对焦,进而提升了用户拍摄体验。
第四实施例
本申请实施例还提供一种存储介质。在一实施例中,存储介质上存储有计算机程序,计算机程序被处理器执行时实现如第一实施例和第二实施例所述的对焦控制方法。
可选地,在智能对焦的实现过程中,包括以下步骤:
对焦识别技术模型训练;
对焦识别技术模型配置到相机系统中;
打开相机系统;
对焦识别技术模块启动识别检测;
识别出对焦主体;
智能对焦控制系统;
智能对焦参数配置;
对焦流程执行;
对焦结束。
在实现对焦控制方法的过程中:
可选地,对焦时首先明确对象的主体是人脸、人眼、人体或者动物主体还是物体主体。
可选地,根据对焦的清晰点,根据对焦距离得出前后景深信息。从镜头厂商提供的景深表中查询得出前景深和后景深的数值,通过算法计算出前景深和后景深的面积。
可选地,根据对焦主体数量和前后景深面积选择对焦主体。其中,如果具有至少一个主体,可以选择前景或者后景面积大的区域的主体作为对焦对象;如果前景面积比较大,可以选择前景作为对焦区域,如果后景面积比较大,可以选择后景作为对焦区域。
可选地,可以根据对焦主体变化重新选择对焦区域。
可选地,根据对焦方式如PDAF对焦,激光对焦和CAF反差对焦.选择合适的对焦方式。如根据PDAF或者激光对焦,计算出对焦方式的的可信度,得出当前是高可信度、中可信度还是度可信度。
可选地,人体识别对焦控制流程:
1.启动相机应用,打开AI对焦识别技术模块,启动智能对焦系统识别。
2.人脸检测失败,检测出人体。
3.智能对焦控制系统结合前后景深信息如前景在画幅中占比等以及物体拍摄中心位置等进行联合判断,选择最优对焦方式。
4.智能对焦参数配置模块把人体区域作为对焦区域启动对焦流程,可以选择激光对焦,相位对焦或反差对焦等方式。
5.对焦结束。
可选地,动物主体对焦控制流程:
1.启动相机应用,打开AI对焦识别技术模块,启动智能对焦系统识别。
2.检测到动物如苍蝇。
3.智能对焦控制系统结合前后景深信息如前景在画幅中占比等以及物体拍摄中心位置等进行联合判断,选择最优对焦方式。
4.把动物主体如苍蝇检测区域作为对焦区域启动对焦流程,可以选择激光对焦,相位对焦或反差对焦等方式。
5.对焦结束。
可选地,物体主体对焦控制流程(超月模式):
1.启动相机应用,打开AI对焦识别技术模块,启动智能对焦系统识别。
2.检测到物体如月亮。
3.智能对焦控制系统结合前后景深信息如前景在画幅中占比等以及物体拍摄中心位置等进行联合判断。使用月亮状态算法检测,满足月亮状态算法检测要求,则认为是月亮。判断是否是超月模式,如果是,则直接把对焦焦距设置为无穷远;如果否,则把月亮作为主体进行对焦。可添加自动构图、自动焦距调整、月亮检测机制等。
4.把物体主体如月亮检测区域作为对焦区域启动对焦流程,可以选择激光对焦,相位对焦或反差对焦等方式。
5.对焦结束。
可选地,多前景主体和多后景主体的对焦流程:
1.启动相机应用,打开AI对焦识别技术模块,启动智能对焦系统识别。
2.前景和后景均检测到至少一个主体对象。
3.计算每个前景主体在整个画幅中的比例,如果超过设置阀值,则选择前景占比最大的主体或中心物体作为对焦主体,否则选择后景作为对焦主体。如果前景或后景有好几个物体,可以用好几个物体加起来的面积来判断。
4.把对焦主体区域作为对焦区域启动对焦流程,可以选择激光对焦,相位对焦或反差对焦等方式。
5.对焦结束。
如上所述,本申请的对焦控制方法、智能终端和存储介质,通过使用主体特征进行万物的识别和对焦,结合前后景信息如前景在画幅中占比等以目标主体拍摄中心位置等进行联合判断,选择最优对焦方式,能实现更快、更稳和更清晰的对焦,进而提升了用户拍摄体验。
在本申请提供的智能终端和计算机可读存储介质的实施例中,可以包含任一上述方法实施例的全部技术特征,说明书拓展和解释内容与上述方法的各实施例基本相同,在此不再做赘述。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括计算机程序代码,当计算机程序代码在计算机上运行时,使得计算机执行如上各种可能的实施方式中的方法。
本申请实施例还提供一种芯片,包括存储器和处理器,存储器用于存储计算机程序,处理器用于从存储器中调用并运行计算机程序,使得安装有芯片的设备执行如上各种可能的实施方式中的方法。
可以理解,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例设备中的单元可以根据实际需要进行合并、划分和删减。
在本申请中,对于相同或相似的术语概念、技术方案和/或应用场景描述,一般只在第一次出现时进行详细描述,后面再重复出现时,为了简洁,一般未再重复阐述,在理解本申请技术方案等内容时,对于在后未详细描述的相同或相似的术语概念、技术方案和/或应用场景描述等,可以参考其之前的相关详细描述。
在本申请中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本申请技术方案的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本申请记载的范围。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本申请每个实施例的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络,或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、存储盘、磁带)、光介质(例如,DVD),或者半导体介质(例如固态存储盘Solid State Disk(SSD))等。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (7)
1.一种对焦控制方法,其特征在于,包括:
响应于获取预览画面,读取存储的预设主体的主体特征;
根据所述主体特征与所述预览画面进行特征匹配,以识别所述预览画面中的所述预设主体;
识别到的所述预设主体为目标主体,使用预设对焦模式对所述目标主体对焦;
所述识别到的所述预设主体为目标主体,使用预设对焦模式对所述目标主体对焦包括:
对所述预览画面进行主体识别,以获取所述预览画面中的所述目标主体;
根据所述目标主体,选择与所述目标主体对应的预设对焦模式;
使用所述预设对焦模式对所述目标主体对焦;
所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤之后包括:
根据识别到同一目标主体的至少两张预览画面,获取所述至少两张预览画面的拍摄时间和拍摄角度;
根据所述拍摄时间和拍摄角度,计算所述目标主体的移动特征;
根据所述移动特征和当前时刻,预测所述目标主体所在的预测位置;
获取所述预测位置的预览画面,识别所述预测位置的预览画面中的所述目标主体。
2.如权利要求1所述的方法,其特征在于,包括以下至少一项:
所述对所述预览画面进行主体识别的步骤之前包括:使用机器学习对主体识别的类型进行识别检测模型的训练,使用所述识别检测模型对所述预览画面进行主体识别;
所述根据所述目标主体,选择与所述目标主体对应的预设对焦模式的步骤包括:识别到所述目标主体包括人物主体时,选择人物对焦模式,和/或,在未识别到所述目标主体包括人物主体时,选择非人对焦模式。
3.如权利要求2所述的方法,其特征在于,包括以下至少一项:
识别到所述目标主体包括人脸时,计算所述预览画面的总面积和所述人脸的第一面积,所述第一面积与所述总面积的比大于第一阈值时,切换对焦模式为人眼追焦模式;
识别到所述目标主体包括月亮时,计算所述预览画面的总面积和所述预览画面中月亮的第二面积,所述第二面积与所述总面积的比大于第二阈值时,切换对焦模式为超月模式。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述目标主体包括前景区域和后景区域的至少一个主体,所述对所述预览画面进行主体识别,以获取所述预览画面中的目标主体的步骤包括:
计算所述预览画面中前景区域面积和后景区域面积;
在所述前景区域面积大于所述后景区域面积时,以所述前景区域的主体为所述目标主体;和/或,
在所述前景区域面积小于所述后景区域面积时,以所述后景区域的主体为所述目标主体。
5.如权利要求1至3中任一项所述的方法,其特征在于,所述预设对焦模式包括第一对焦方式和第二对焦方式,所述使用所述预设对焦模式对所述目标主体对焦的步骤包括:
响应于获取所述第一对焦方式和所述第二对焦方式,分别获取所述第一对焦方式和所述第二对焦方式的可信度;
在所述第一对焦方式的可信度大于所述第二对焦方式的可信度时,以所述第一对焦方式进行对焦。
6.一种智能终端,其特征在于,包括处理器和和存储器;
所述处理器用于执行从所述存储器上读取的计算机程序,以实现如权利要求1至5中任一项所述的对焦控制方法。
7.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的对焦控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210617611.5A CN115103107B (zh) | 2022-06-01 | 2022-06-01 | 对焦控制方法、智能终端和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210617611.5A CN115103107B (zh) | 2022-06-01 | 2022-06-01 | 对焦控制方法、智能终端和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115103107A CN115103107A (zh) | 2022-09-23 |
CN115103107B true CN115103107B (zh) | 2023-11-07 |
Family
ID=83289159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210617611.5A Active CN115103107B (zh) | 2022-06-01 | 2022-06-01 | 对焦控制方法、智能终端和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115103107B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107820020A (zh) * | 2017-12-06 | 2018-03-20 | 广东欧珀移动通信有限公司 | 拍摄参数的调整方法、装置、存储介质及移动终端 |
CN108989672A (zh) * | 2018-07-26 | 2018-12-11 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN110365897A (zh) * | 2019-07-08 | 2019-10-22 | Oppo广东移动通信有限公司 | 图像修正方法和装置、电子设备、计算机可读存储介质 |
CN110392211A (zh) * | 2019-07-22 | 2019-10-29 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN110493527A (zh) * | 2019-09-24 | 2019-11-22 | Oppo广东移动通信有限公司 | 主体对焦方法、装置、电子设备和存储介质 |
CN111586282A (zh) * | 2019-02-18 | 2020-08-25 | 北京小米移动软件有限公司 | 拍摄方法、装置、终端及可读存储介质 |
CN113766125A (zh) * | 2019-09-29 | 2021-12-07 | Oppo广东移动通信有限公司 | 对焦方法和装置、电子设备、计算机可读存储介质 |
-
2022
- 2022-06-01 CN CN202210617611.5A patent/CN115103107B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107820020A (zh) * | 2017-12-06 | 2018-03-20 | 广东欧珀移动通信有限公司 | 拍摄参数的调整方法、装置、存储介质及移动终端 |
CN108989672A (zh) * | 2018-07-26 | 2018-12-11 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN111586282A (zh) * | 2019-02-18 | 2020-08-25 | 北京小米移动软件有限公司 | 拍摄方法、装置、终端及可读存储介质 |
CN110365897A (zh) * | 2019-07-08 | 2019-10-22 | Oppo广东移动通信有限公司 | 图像修正方法和装置、电子设备、计算机可读存储介质 |
CN110392211A (zh) * | 2019-07-22 | 2019-10-29 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN110493527A (zh) * | 2019-09-24 | 2019-11-22 | Oppo广东移动通信有限公司 | 主体对焦方法、装置、电子设备和存储介质 |
CN113766125A (zh) * | 2019-09-29 | 2021-12-07 | Oppo广东移动通信有限公司 | 对焦方法和装置、电子设备、计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115103107A (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108024065B (zh) | 一种终端拍摄的方法、终端及计算机可读存储介质 | |
CN106937039B (zh) | 一种基于双摄像头的成像方法、移动终端及存储介质 | |
CN107959795B (zh) | 一种信息采集方法、设备和计算机可读存储介质 | |
CN107231470B (zh) | 图像处理方法、移动终端及计算机可读存储介质 | |
CN108322644A (zh) | 一种图像处理方法、移动终端以及计算机可读存储介质 | |
CN107613208B (zh) | 一种对焦区域的调节方法及终端、计算机存储介质 | |
CN110266957B (zh) | 影像拍摄方法及移动终端 | |
CN107707821B (zh) | 畸变参数的建模方法及装置、校正方法、终端、存储介质 | |
CN111885307B (zh) | 一种景深拍摄方法、设备及计算机可读存储介质 | |
CN108022227B (zh) | 一种黑白背景照片获取方法、装置及计算机可读存储介质 | |
CN114037692A (zh) | 图像处理方法、移动终端及存储介质 | |
CN107888829A (zh) | 移动终端的对焦方法、移动终端及存储介质 | |
CN108197560B (zh) | 人脸图像识别方法、移动终端及计算机可读存储介质 | |
CN107295262B (zh) | 图像处理方法、移动终端及计算机存储介质 | |
CN107368253B (zh) | 图片缩放显示方法、移动终端及存储介质 | |
CN108600639B (zh) | 一种人像图像拍摄的方法、终端及计算机可读存储介质 | |
CN115103107B (zh) | 对焦控制方法、智能终端和存储介质 | |
CN114143471B (zh) | 图像处理方法、系统、移动终端及计算机可读存储介质 | |
CN113572916B (zh) | 拍摄方法、终端设备及存储介质 | |
CN112532838B (zh) | 一种图像处理方法、移动终端以及计算机存储介质 | |
CN113301252B (zh) | 图像拍摄方法、移动终端及计算机可读存储介质 | |
CN114298883A (zh) | 图像处理方法、智能终端及存储介质 | |
CN115334240B (zh) | 图像拍摄方法、智能终端及存储介质 | |
CN117157989A (zh) | 拍照方法、移动终端及可读存储介质 | |
CN112184722B (zh) | 图像处理方法、终端及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |