CN109963072A - 对焦方法、装置、存储介质及电子设备 - Google Patents
对焦方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN109963072A CN109963072A CN201711437550.XA CN201711437550A CN109963072A CN 109963072 A CN109963072 A CN 109963072A CN 201711437550 A CN201711437550 A CN 201711437550A CN 109963072 A CN109963072 A CN 109963072A
- Authority
- CN
- China
- Prior art keywords
- focusing area
- prediction model
- focusing
- stand
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000003062 neural network model Methods 0.000 claims description 30
- 230000015654 memory Effects 0.000 claims description 24
- 230000007246 mechanism Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000005055 memory storage Effects 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 description 39
- 238000013527 convolutional neural network Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000007477 logistic regression Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 5
- 241001269238 Data Species 0.000 description 4
- 230000001149 cognitive effect Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 239000000571 coke Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013488 ordinary least square regression Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/62—Control of parameters via user interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Studio Devices (AREA)
Abstract
本申请实施例公开了一种对焦方法、装置、存储介质及电子设备,其中,本申请实施例首先获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;然后从预测模型集合中选取待用预测模型;再根据构建的样本集对选取的待用预测模型进行训练;再根据训练后的待用预测模型预测预览图像的对焦区域;最后根据预测的对焦区域对预览图像进行对焦,从而实现电子设备的自动对焦,无需用户操作,提高了对焦效率。
Description
技术领域
本申请涉及终端技术领域,具体涉及一种对焦方法、装置、存储介质及电子设备。
背景技术
随着智能手机等电子设备的普及,配备摄像头的电子设备能够为用户提供照相机的拍照功能以及摄像机的录像功能。为了能够使得拍摄的图像更为清晰,往往需要用户在拍照时手动标定预览图像的对焦区域,以指示电子设备根据对焦区域对预览图像进行对焦,这样每次在拍照时均需要用户手动标定,操作繁琐且对焦效率低。
发明内容
本申请实施例提供了一种对焦方法、装置、存储介质及电子设备,能够实现电子设备的自动对焦,无需用户操作,提高了对焦效率。
第一方面,本申请实施例了提供了的一种对焦方法,包括:
获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;
从预测模型集合中选取待用预测模型;
根据所述样本集对所述待用预测模型进行训练;
根据训练后的所述待用预测模型预测预览图像的对焦区域,并根据所述对焦区域对预览图像进行对焦。
第二方面,本申请实施例了提供了的一种对焦装置,包括:
获取模块,用于获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;
选取模块,用于从预测模型集合中选取待用预测模型;
训练模块,用于根据所述样本集对所述待用预测模型进行训练;
对焦模块,用于根据训练后的所述待用预测模型预测预览图像的对焦区域,并根据所述对焦区域对预览图像进行对焦。
第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的对焦方法。
第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的对焦方法。
本申请实施例首先获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;然后从预测模型集合中选取待用预测模型;再根据构建的样本集对选取的待用预测模型进行训练;再根据训练后的待用预测模型预测预览图像的对焦区域;最后根据预测的对焦区域对预览图像进行对焦,从而实现电子设备的自动对焦,无需用户操作,提高了对焦效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的对焦方法的应用场景示意图;
图2是本申请实施例提供的对焦方法的一个流程示意图;
图3是本申请实施例提供的对焦方法的另一个流程示意图;
图4是本申请实施例中拍摄某处风景时的预览图像的示意图;
图5是本申请实施例对之上预览图像进行预测得到对焦区域的示意图;
图6是本申请实施例提供的对焦装置的一结构示意图;
图7是本申请实施例提供的电子设备的一个结构示意图;
图8是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例提供一种对焦方法,该对焦方法的执行主体可以是本申请实施例提供的对焦装置,或者集成了该对焦装置的电子设备,其中该对焦装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。
请参阅图1,图1为本申请实施例提供的对焦方法的应用场景示意图,以对焦装置集成在电子设备中为例,电子设备可以获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;从预测模型集合中选取待用预测模型;根据构建的样本集对选取的待用预测模型进行训练;根据训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦。
具体地,请参照图1,以某次对焦操作为例,首先获取到携带有对焦区域信息的样本图像(这些样本图像可以是拍摄的风景图像、人物图像等,对焦区域信息用于描述样本图像在拍摄时所选取的对焦区域,如风景图像中的山体所在的区域,人物图像中的人物所在的区域等),并根据获取到的这些样本图像构建用于对焦区域预测的样本集;从预测模型集合(包括多个不同的预测模型,如决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等)中选取待用预测模型;根据构建的样本集对选取的待用预测模型进行训练,也即是利用样本集中的样本图像让电子设备学习如何选取图像中的对焦区域;采用训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦,实现电子设备的自动对焦,对焦效率高,无需用户操作。
请参照图2,图2为本申请实施例提供的对焦方法的流程示意图。本申请实施例提供的对焦方法的具体流程可以如下:
201、获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集。
其中,获取的样本图像为拍摄的图像,比如拍摄的风景图像、拍摄的人物图像等,对焦区域信息用于描述样本图像在拍摄时选取的对焦区域,或者用于描述样本图像在拍摄时可能选取的对焦区域。换言之,对焦区域可以形象的理解为拍摄时针对的拍摄对象所在的区域,其中拍摄对象可以是人物、风景、动物、物体(如房子或汽车)等。比如,用户应用电子设备对某处风景进行拍摄时,电子设备将在屏幕上形成一个图形预览区域,并调用摄像头对待拍摄对象进行拍摄,以在图形预览区域形成该待拍摄对象的预览图像;之后,用户可以点击屏幕上预览图像中待拍摄对象所在区域,以指示电子设备将用户点击区域作为对焦区域,从而根据对焦区域对预览图像进行对焦;这样,电子设备在对待拍摄对象进行拍摄时,拍摄得到的图像将携带对焦区域信息。
在获取到多个携带对焦区域信息的样本图像之后,需要对这些样本进预处理。比如,首先将这些样本图像转换为灰度图像,再对转换后的样本图像进行大小归一化处理,例如将样本图像处理为256x256像素。
根据预处理后的这些样本图像构建用于对焦区域预测的样本集,这样得到的样本集中将包括多个携带对焦区域信息的样本图像,如风景图像,其携带的对焦区域信息对应该风景图像中的一个区域;又如人物图像,其携带的对焦区域信息对应该人物图像中的人物。
可选地,在一实施例中,获取携带对焦区域信息的样本图像可以包括:
获取多个拍摄的图像;
确定获取到的多个图像的对焦区域信息;
将获取到的各图像与之对应的对焦区域信息关联后作为样本图像。
其中,首先获取到多个拍摄的图像,这些图像可以是本机拍摄的,也可以其它电子设备拍摄的。
相应的,在获取这些图像时,可以从本地存储空间中提取,也可以从其它电子设备处获取,也可以从预设服务器处获取。其中,预设服务器预先接收各电子设备备份的图像,在具体实施时,用户可以通过电子设备对备份至预设服务器的图像进行权限设置,比如可以设置图像的权限为“公开”或“私有”,这样电子设备在从预设服务器处获取图像时,将仅能获取到其它电子设备备份的,且设置权限为“公开”的图像,此外,还可获取到自己备份的所有图像。
在获取到多个拍摄的图像之后,需要进一步对这些图像的对焦区域信息进行确定,包括两种情况,一种是获取到的图像即携带了对焦区域信息(比如电子设备在储存拍摄的图像时即将该图像的对焦区域信息编码进了图像中),一种是获取到的图像未携带对焦区域信息。
对于携带有对焦区域信息的图像,可以直接从图像中提取出对焦区域信息。
对于未携带有对焦区域信息的图像,可以接收用户的标定指令,在具体实施时,可以人工点击电子设备显示的图像,触发标定指令,指示电子设备将点击处所在的区域作为对焦区域;或者,可以人工在电子设备显示的图像上划出拍摄对象的轮廓(例如,图像的拍摄对象为人体,则可人工在图像上划出人体轮廓),指示电子设备根据接收到划屏操作的轨迹确定图像的对焦区域,也即是划屏操作所围合成的封闭区域(即划出的人体轮廓);或者,可以人工操作电子设备的对焦框,使得对焦框框定图像的拍摄对象,指示电子设备将对焦框框定的区域作为对焦区域;或者,可以由电子设备对整副图像的清晰度进行识别,并将清晰度最高的区域确定为对焦区域,从而得到该图像的对焦区域信息。
需要说明的是,其它确定对焦区域信息的方式此处不再一一列出,本领域技术人员可以根据实际需要选取合适的方式来确定图像的对焦区域信息。
本申请实施例中,在确定获取的各图像的对焦区域信息之后,将获取到的各图像与之对应的对焦区域信息关联后作为样本图像。
202、从预测模型集合中选取待用预测模型。
其中,预测模型集合包括多个预测模型,如包括多种不同类型的预测模型。
预测模型为机器学习算法,机器学习算法可以通过不断特征学习来对人类行为进行预测,比如,可以预测拍摄时人类可能选取的预览图像的对焦区域。该机器学习算法可以包括:决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等等。
本申请实施例中,机器学习算法的算法类型可以根据各种情况划分,比如,可以基于学习方式可以将机器学习算法划分成:监督式学习算法、非监控式学习算法、半监督式学习算法、强化学习算法等等。
在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(LogisticRegression)和反向传递神经网络(Back Propagation Neural Network)。
在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。
半监督式学习算法,在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM)等。
强化学习算法,在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning)。
此外,在一实施例中,还可以基于根据算法的功能和形式的类似性将机器学习算法划分成:
回归算法,常见的回归算法包括:最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(LocallyEstimated Scatterplot Smoothing)。
基于实例的算法,包括k-Nearest Neighbor(KNN),学习矢量量化(LearningVector Quantization,LVQ),以及自组织映射算法(Self-Organizing Map,SOM)。
正则化方法,常见的算法包括:Ridge Regression,Least Absolute Shrinkageand Selection Operator(LASSO),以及弹性网络(Elastic Net)。
决策树算法,常见的算法包括:分类及回归树(Classification And RegressionTree,CART),ID3(Iterative Dichotomiser 3),C4.5,Chi-squared AutomaticInteraction Detection(CHAID),Decision Stump,随机森林(Random Forest),多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine,GBM)。
贝叶斯方法算法,包括:朴素贝叶斯算法,平均单依赖估计(Averaged One-Dependence Estimators,AODE),以及Bayesian Belief Network(BBN)。
……。
例如,特征类型对应的预测模型类型包括:监督式学习算法、非监控式学习算法、半监督式学习算法;此时,可以从预测模型集合中选取逻辑回归(Logistic Regression)模型、k-Means算法、图论推理算法等等属于属于该预测模型类型的算法。
又例如,特征类型对应的预测模型类型包括:回归算法模型、决策树算法模型;此时,可以从模型集合中选取逻辑回归(Logistic Regression)模型、分类及回归树模型等等属于该预测模型类型的算法。
本申请实施例中,具体选取何种预测模型,可由本领域技术人员根据实际需要进行选取,例如,本申请实施例可以选取卷积神经网络作为待用预测模型。
步骤201和202之间的时序不受序号限制,可以是步骤202在步骤201之前执行,也可以是同时执行。
在一实施例中,为提高对焦区域预测的准确度,“从预测模型集合中选取待用预测模型”,可以包括:
分别选择所述多个神经网络模型的一层或多层;
将所选择的层组合为新的神经网络模型,作为所述待用预测模型。
其中,对于选择的多个神经网络模型,可以从每个神经网络模型中选择一层或者多层,然后将所选择的层组合在一起,得到一个新的神经网络模型,将这个新的神经网络模型作为对焦区域预测的待用预测模型。
比如,从预测模型集合中选择5个不同的的卷积神经网络,从第一个卷积神经网络中提取出数据输入层,从第二个卷积神经网络中提取出卷积计算层,从第三个卷积神经网络中提取出激励层,从第四个卷积神经网络中提取出池化层,从第五个卷积神经网络中提取出全向连接层,然后将提取出的数据输入层、卷积计算层、激励层、池化层以及全向连接层组合为一个新的卷积神经网络,将这个新的卷积神经网络作为对焦区域预测的待用预测模型。
203、根据构建的样本集对选取的待用预测模型进行训练。
其中,对待用预测模型进行的训练操作并不会改变待用预测模型的构型,仅会改变待用预测模型的参数。需要说明的是,对于无法通过训练得到的参数,可以采用相应的经验参数。
204、根据训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦。
形象的说,可以将运行待用预测模型的电子设备想象成一个小孩子,你带小孩去公园。公园里有很多人在遛狗。
简单起见,以二元分类问题为例。你告诉小孩这个动物是狗,那个也是狗。但突然一只猫跑过来,你告诉他,这个不是狗。久而久之,小孩就会产生认知模式。这个学习过程,就叫“训练”。所形成的认知模式,就是“模型”。
训练之后。这时,再跑过来一个动物时,你问小孩,这个是狗吧?他会回答,是,或者否。这个就叫“预测”。
本申请实施例中,在完成对待用预测模型的训练之后,即可利用训练后的待用预测模型来预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦。
比如,在对某处风景进行拍摄时,电子设备将在屏幕上形成一个图形预览区域,并调用摄像头对待拍摄对象进行拍摄,以在图形预览区域形成该待拍摄对象的预览图像;在形成待拍摄对象的预览图像之后,调用训练后的待用预测模型,对预览图像的对焦区域进行预测;在完成预测并得到预览图像的对焦区域之后,即可根据预测的对焦区域对预览图像进行对焦,从而提高拍摄出的图像中对焦区域的清晰度。
在一实施例中,“根据训练后的待用预测模型预测预览图像的对焦区域”,可以包括:
将预览图像输入到待用预测模型,得到待用预测模型输出的,所述预览图像的梯度图;
根据所述梯度图在每个通道上的最大绝对值,生成所述预览图像的候选对焦区域;
对所述候选对焦区域进行二值化处理,得到二值化的候选对焦区域;
根据所述二值化的候选对焦区域的连通区域,得到所述预览图像的对焦区域。
其中,通过对待用预测模型进行训练,使得训练后的待用预测模型能够学习到图像中哪些物体的显著性更高,也即是学习如何识别图像中的显著性区域,例如普遍认为人物、动物要比天空、草地以及建筑物的显著性更高。通常的,人们更愿意将图像中的显著性区域作为对焦区域进行对焦,因此,可根据训练后的待用预测模型识别出预览图像的显著性区域,再根据识别出的显著性区域确定预览图像的对焦区域,更为符合人们选取对焦区域的习惯。
具体的,首先对拍摄到的预览图像进行前述样本图像相同的预处理,如将预览图像按照256x256像素进行大小归一化处理,然后将预处理后的预览图像输入到训练后的待用预测模型,得到待用预测模型输出的预览图像的梯度图。
在得到预览图像的梯度图之后,进一步根据该梯度图在每个通道上的最大绝对值,生成预览图像的显著性区域,将该显著性区域作为预览图像的候选对焦区域。
在得到候选对焦区域之后,对候选对焦区域进行二值化处理,得到二值化的候选对焦区域。其中,此处对于采用何种方式对候选对焦区域进行二值化处理不做具体限制,比如,可以采用最大类间方差法。
在得到二值化的候选对焦区域之后,即可提取出二值化的候选对焦区域的连通区域,然后根据提取出的连通区域,得到预览图像的对焦区域。
在一实施例中,“根据二值化的候选对焦区域的连通区域,得到预览图像的对焦区域”,可以包括:
确定二值化的候选对焦区域的连通区域,将该连通区域作为预览图像的对焦区域。
其中,直接将整个连通区域作为预览图像的对焦区域,能够更快的确定预览图像的对焦区域。
在一实施例中,“根据二值化的候选对焦区域的连通区域,得到预览图像的对焦区域”,可以包括:
确定二值化的候选对焦区域的连通区域,获取该连通区域中各像素点的坐标平均值;
以坐标平均值对应的像素点为中心,生成预设形状的对焦区域。
比如,获取到的连通区域为80*60的方形像素区域,则需要计算80*60共4800个像素点的坐标平均值。
其中,对于预设形状的设置,此处不做具体限制,比如,可以是正方形,也可以是长方形等。
在一实施例中,为更好的完成对焦区域的预测,“根据训练后的待用预测模型预测预览图像的对焦区域”,之前可以包括:
获取待用预测模型的预测准确度;
判断待用预测模型的预测准确度是否达到预设准确度;
在待用预测模型的预测准确度达到预设准确度时,根据训练后的待用预测模型预测预览图像的对焦区域。
需要说明的是,之前在根据构建的样本集对选取的待用预测模型进行训练时,除了将得到经训练的待用预测模型之外,还将获得与待用预测模型相关的属性数据。而获得的这些属性数据并不是所有的均与待用预测模型的运行有关,其可以是待用预测模型的本身属性,比如待用预测模型的输入数据的属性以及参数的个数等。这类属性数据的指标可以称为硬指标。
相反的,有些属性数据与待用预测模型的运行有关,比如待用预测模型针对输入数据和电子设备的预测速度和预测准确度。
本申请实施例中,在获取待用预测模型的预测准确度时,可以直接从训练得到的属性数据中提取出待用预测模型的预测准确度。
之后,将待用预测模型的预测准确度,与预先设置的,用于衡量待用预测模型是否达标的预设准确度进行比较,以判断待用预测模型的预测准确度是否达到预设准确度,进而确定待用预测模型是否达标。
在待用预测模型的预测准确度达到预设准确度,也即是待用预测模型达标时,即可根据训练后的待用预测模型预测预览图像的对焦区域。
在一实施例中,“判断待用预测模型的预测准确度是否达到预设准确度”之后,可以包括:
在待用预测模型的预测准确度未达到预设准确度时,重新选取待用预测模型,并对重新选取的待用预测模型进行训练,直至重新选取的待用预测模型的预测准确度达到预设准确度。
其中,重新选取待用预测模型的操作,以及对重新选取的待用预测模型进行训练的操作可以参照之前描述进行,此处不再赘述。
在一实施例中,为更好的完成对焦区域的预测,“根据训练后的待用预测模型预测预览图像的对焦区域”,之前可以包括:
获取待用预测模型的预测时长;
判断待用预测模型的预测时长是否大于预设时长;
在待用预测模型的预测时长小于或等于预设时长时,根据训练后的待用预测模型预测预览图像的对焦区域。
本申请实施例中,在获取待用预测模型的预测时长时,可以直接从训练得到的属性数据中提取出待用预测模型的预测时长。
之后,将待用预测模型的预测时长,与预先设置的,用于衡量待用预测模型是否达标的预设时长进行比较,以判断待用预测模型的预测时长是否小于预设时长,进而确定待用预测模型是否达标。
在待用预测模型的预测时长小于预设时长,也即是待用预测模型达标时,即可根据训练后的待用预测模型预测预览图像的对焦区域。
在一实施例中,“判断待用预测模型的预测时长是否小于预设时长”之后,可以包括:
在待用预测模型的预测时长大于预设时长时,重新选取待用预测模型,并对重新选取的待用预测模型进行训练,直至重新选取的待用预测模型的预测准确度达到预设准确度。
其中,重新选取待用预测模型的操作,以及对重新选取的待用预测模型进行训练的操作可以参照之前描述进行,此处不再赘述。
由上可知,本申请实施例首先获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;然后从预测模型集合中选取待用预测模型;再根据构建的样本集对选取的待用预测模型进行训练;再根据训练后的待用预测模型预测预览图像的对焦区域;最后根据预测的对焦区域对预览图像进行对焦,从而实现电子设备的自动对焦,无需用户操作,提高了对焦效率。
下面将在上述实施例描述的方法基础上,对本申请的清理方法做进一步介绍。参考图3,该对焦方法可以包括:
301、获取多个拍摄的图像。
其中,首先获取到多个拍摄的图像,这些图像可以是本机拍摄的,也可以其它电子设备拍摄的。比如拍摄的风景图像、拍摄的人物图像等
相应的,在获取这些图像时,可以从本地存储空间中提取,也可以从其它电子设备处获取,也可以从预设服务器处获取。其中,预设服务器预先接收各电子设备备份的图像,在具体实施时,用户可以通过电子设备对备份至预设服务器的图像进行权限设置,比如可以设置图像的权限为“公开”或“私有”,这样电子设备在从预设服务器处获取图像时,将仅能获取到其它电子设备备份的,且设置权限为“公开”的图像,此外,还可获取到自己备份的所有图像。
302、确定获取到的多个图像的对焦区域信息。
其中,对焦区域信息用于描述样本图像在拍摄时选取的对焦区域,或者用于描述样本图像在拍摄时可能选取的对焦区域。换言之,对焦区域可以形象的理解为拍摄时针对的拍摄对象所在的区域,其中拍摄对象可以是人物、风景、动物、物体(如房子或汽车)等。
在获取到多个拍摄的图像之后,需要进一步对这些图像的对焦区域信息进行确定,包括两种情况,一种是获取到的图像即携带了对焦区域信息(比如电子设备在储存拍摄的图像时即将该图像的对焦区域信息编码进了图像中),一种是获取到的图像未携带对焦区域信息。
对于携带有对焦区域信息的图像,可以直接从图像中提取出对焦区域信息。
对于未携带有对焦区域信息的图像,可以接收用户的标定指令,在具体实施时,可以人工点击电子设备显示的图像,触发标定指令,指示电子设备将点击处所在的区域作为对焦区域;或者,可以人工在电子设备显示的图像上划出拍摄对象的轮廓(例如,图像的拍摄对象为人体,则可人工在图像上划出人体轮廓),指示电子设备根据接收到划屏操作的轨迹确定图像的对焦区域,也即是划屏操作所围合成的封闭区域(即划出的人体轮廓);或者,可以人工操作电子设备的对焦框,使得对焦框框定图像的拍摄对象,指示电子设备将对焦框框定的区域作为对焦区域;或者,可以由电子设备对整副图像的清晰度进行识别,并将清晰度最高的区域确定为对焦区域,从而得到该图像的对焦区域信息。
需要说明的是,其它确定对焦区域信息的方式此处不再一一列出,本领域技术人员可以根据实际需要选取合适的方式来确定图像的对焦区域信息。
303、将获取到的各图像与之对应的对焦区域信息关联后作为样本图像,并构建对焦区域预测的样本集。
本申请实施例中,在确定获取的各图像的对焦区域信息之后,将获取到的各图像与之对应的对焦区域信息关联后作为样本图像。之后,需要对这些样本进预处理。比如,首先将这些样本图像转换为灰度图像,再对转换后的样本图像进行大小归一化处理,例如将样本图像处理为256x256像素。
根据预处理后的这些样本图像构建用于对焦区域预测的样本集,这样得到的样本集中将包括多个携带对焦区域信息的样本图像,如风景图像,其携带的对焦区域信息对应该风景图像中的一个区域;又如人物图像,其携带的对焦区域信息对应该人物图像中的人物。
304、从预测模型集合中选取多个不同的神经网络模型。
其中,预测模型集合包括多个预测模型,如包括多种不同类型的预测模型。
预测模型为机器学习算法,机器学习算法可以通过不断特征学习来对人类行为进行预测,比如,可以预测拍摄时人类可能选取的预览图像的对焦区域。该机器学习算法可以包括:决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等等。
本申请实施例中可以从预测模型集合中选取多个不同的神经网络模型。
305、分别选择多个神经网络模型的一层或多层。
其中,对于选择的多个神经网络模型,可以从每个神经网络模型中选择一层或者多层。
306、将所选择的层组合为新的神经网络模型,作为对焦区域预测的待用预测模型。
比如,可以从预测模型集合中选择5个不同的的卷积神经网络,从第一个卷积神经网络中提取出数据输入层,从第二个卷积神经网络中提取出卷积计算层,从第三个卷积神经网络中提取出激励层,从第四个卷积神经网络中提取出池化层,从第五个卷积神经网络中提取出全向连接层,然后将提取出的数据输入层、卷积计算层、激励层、池化层以及全向连接层组合为一个新的卷积神经网络,将这个新的卷积神经网络作为对焦区域预测的待用预测模型。
307、根据构建的样本集对待用预测模型进行训练。
其中,对待用预测模型进行的训练操作并不会改变待用预测模型的构型,仅会改变待用预测模型的参数。需要说明的是,对于无法通过训练得到的参数,可以采用相应的经验参数。
形象的说,可以将运行待用预测模型的电子设备想象成一个小孩子,你带小孩去公园。公园里有很多人在遛狗。
简单起见,以二元分类问题为例。你告诉小孩这个动物是狗,那个也是狗。但突然一只猫跑过来,你告诉他,这个不是狗。久而久之,小孩就会产生认知模式。这个学习过程,就叫“训练”。所形成的认知模式,就是“模型”。
训练之后。这时,再跑过来一个动物时,你问小孩,这个是狗吧?他会回答,是,或者否。这个就叫“预测”。
308、获取待用预测模型的预测准确度。
需要说明的是,之前在根据构建的样本集对选取的待用预测模型进行训练时,除了将得到经训练的待用预测模型之外,还将获得与待用预测模型相关的属性数据。而获得的这些属性数据并不是所有的均与待用预测模型的运行有关,其可以是待用预测模型的本身属性,比如待用预测模型的输入数据的属性以及参数的个数等。这类属性数据的指标可以称为硬指标。
相反的,有些属性数据与待用预测模型的运行有关,比如待用预测模型针对输入数据和电子设备的预测速度和预测准确度。
本申请实施例中,在获取待用预测模型的预测准确度时,可以直接从训练得到的属性数据中提取出待用预测模型的预测准确度。
309、在待用预测模型的预测准确度达到预设准确度时,将预览图像输入到待用预测模型,得到待用预测模型输出的,预览图像的梯度图。
其中,通过对待用预测模型进行训练,使得训练后的待用预测模型能够学习到图像中哪些物体的显著性更高,也即是学习如何识别图像中的显著性区域,例如普遍认为人物、动物要比天空、草地以及建筑物的显著性更高。通常的,人们更愿意将图像中的显著性区域作为对焦区域进行对焦,因此,可根据训练后的待用预测模型识别出预览图像的显著性区域,再根据识别出的显著性区域确定预览图像的对焦区域,更为符合人们选取对焦区域的习惯。
其中,将待用预测模型的预测准确度,与预先设置的,用于衡量待用预测模型是否达标的预设准确度进行比较,以判断待用预测模型的预测准确度是否达到预设准确度,进而确定待用预测模型是否达标。
在待用预测模型的预测准确度达到预设准确度,也即是待用预测模型达标时,首先对拍摄到的预览图像进行前述样本图像相同的预处理,如将预览图像按照256x256像素进行大小归一化处理,然后将预处理后的预览图像输入到训练后的待用预测模型,得到待用预测模型输出的预览图像的梯度图。
310、根据梯度图在每个通道上的最大绝对值,生成预览图像的候选对焦区域。
其中,在得到预览图像的梯度图之后,进一步根据该梯度图在每个通道上的最大绝对值,生成预览图像的显著性区域,将该显著性区域作为预览图像的候选对焦区域。
311、对候选对焦区域进行二值化处理,得到二值化的候选对焦区域。
其中,在得到候选对焦区域之后,对候选对焦区域进行二值化处理,得到二值化的候选对焦区域。其中,此处对于采用何种方式对候选对焦区域进行二值化处理不做具体限制,比如,可以采用最大类间方差法。
312、确定二值化的候选对焦区域的连通区域,并获取该连通区域中各像素点的坐标平均值。
比如,获取到的连通区域为80*60的方形像素区域,则需要计算80*60共4800个像素点的坐标平均值。
313、以坐标平均值对应的像素点为中心,生成预设形状的对焦区域,并根据生成的对焦区域对预览图像进行对焦。
其中,对于预设形状的设置,此处不做具体限制,比如,可以是正方形,也可以是长方形等。例如,请参照图4,为对某处景物进行拍摄时,得到的预览图像的示意图,请参照图5,为生成的长方形对焦区域,该对焦区域框定了景物中较为显著的一建筑物。
由上可知,本申请实施例首先获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;然后从预测模型集合中选取待用预测模型;再根据构建的样本集对选取的待用预测模型进行训练;再根据训练后的待用预测模型预测预览图像的对焦区域;最后根据预测的对焦区域对预览图像进行对焦,从而实现电子设备的自动对焦,无需用户操作,提高了对焦效率。
在一实施例中还提供了一种对焦装置。请参阅图6,图6为本申请实施例提供的对焦装置的结构示意图。其中该对焦装置应用于电子设备,该对焦装置包括获取模块401、选取模块402、训练模块403和对焦模块404,如下:
获取模块401,用于获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;
选取模块402,用于从预测模型集合中选取待用预测模型;
训练模块403,用于根据构建的样本集对选取的待用预测模型进行训练;
对焦模块404,用于根据训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦。
在一实施例中,对焦模块404,可以用于:
将预览图像输入到训练后的待用预测模型,得到待用预测模型输出的,预览图像的梯度图;
根据梯度图在每个通道上的最大绝对值,生成预览图像的候选对焦区域;
对候选对焦区域进行二值化处理,得到二值化的候选对焦区域;
根据二值化的候选对焦区域的连通区域,得到预览图像的对焦区域。
在一实施例中,对焦模块404,可以用于:
确定二值化的候选对焦区域的连通区域,并获取该连通区域中各像素点的坐标平均值;
以坐标平均值对应的像素点为中心,生成预设形状的对焦区域。
在一实施例中,预测模型为神经网络模型,选取模块402,可以用于:
从预测模型集合中选取多个不同的神经网络模型;
分别选择多个神经网络模型的一层或多层;
将所选择的层组合为新的神经网络模型,作为待用预测模型。
在一实施例中,获取模块401,可以用于:
获取多个拍摄的图像;
确定获取的多个图像的对焦区域信息;
将各图像与之对应的对焦区域信息关联后作为样本图像。
其中,对焦装置中各模块执行的步骤可以参考上述方法实施例描述的方法步骤。该对焦装置可以集成在电子设备中,如手机、平板电脑等。
具体实施时,以上各个模块可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单位的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例对焦装置可以由获取模块401获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;由选取模块402从预测模型集合中选取待用预测模型;由训练模块403根据构建的样本集对选取的待用预测模型进行训练;由对焦模块404根据训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦,从而实现对电子设备的自动对焦,无需用户操作,提高了对焦效率。
本申请实施例还提供一种电子设备。请参阅图7,电子设备500包括处理器501以及存储器502。其中,处理器501与存储器502电性连接。
所述处理器500是电子设备500的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器502内的计算机程序,以及调用存储在存储器502内的数据,执行电子设备500的各种功能并处理数据,从而对电子设备500进行整体监控。
所述存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
在本申请实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中,并由处理器501运行存储在存储器502中的计算机程序,从而实现各种功能,如下:
获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;
从预测模型集合中选取待用预测模型;
根据构建的样本集对选取的待用预测模型进行训练;
根据训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦。
在某些实施方式中,在根据训练后的待用预测模型预测预览图像的对焦区域时,处理器501可以具体执行以下步骤:
将预览图像输入到训练后的待用预测模型,得到待用预测模型输出的,预览图像的梯度图;
根据梯度图在每个通道上的最大绝对值,生成预览图像的候选对焦区域;
对候选对焦区域进行二值化处理,得到二值化的候选对焦区域;
根据二值化的候选对焦区域的连通区域,得到预览图像的对焦区域。
在某些实施方式中,在根据二值化的候选对焦区域的连通区域,得到预览图像的对焦区域时,处理器501可以具体执行以下步骤:
确定二值化的候选对焦区域的连通区域,并获取该连通区域中各像素点的坐标平均值;
以坐标平均值对应的像素点为中心,生成预设形状的对焦区域。
在某些实施方式中,预测模型为神经网络模型,在从预测模型集合中选取待用预测模型时,处理器501可以具体执行以下步骤:
从预测模型集合中选取多个不同的神经网络模型;
分别选择多个神经网络模型的一层或多层;
将所选择的层组合为新的神经网络模型,作为待用预测模型。
在某些实施方式中,在获取携带有对焦区域信息的样本图像时,处理器501还可以具体执行以下步骤:
获取多个拍摄的图像;
确定获取的多个图像的对焦区域信息;
将各图像与之对应的对焦区域信息关联后作为样本图像。
由上述可知,本申请实施例首先获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;然后从预测模型集合中选取待用预测模型;再根据构建的样本集对选取的待用预测模型进行训练;再根据训练后的待用预测模型预测预览图像的对焦区域;最后根据预测的对焦区域对预览图像进行对焦,从而实现电子设备的自动对焦,无需用户操作,提高了对焦效率。
请一并参阅图8,在某些实施方式中,电子设备500还可以包括:显示器503、射频电路504、音频电路505以及电源506。其中,其中,显示器503、射频电路504、音频电路505以及电源506分别与处理器501电性连接。
所述显示器503可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器503可以包括显示面板,在某些实施方式中,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
所述射频电路504可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
所述音频电路505可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
所述电源506可以用于给电子设备500的各个部件供电。在一些实施例中,电源506可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图8中未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例还提供一种存储介质,所述存储介质存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述任一实施例中的对焦方法,比如:获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;从预测模型集合中选取待用预测模型;根据构建的样本集对选取的待用预测模型进行训练;根据训练后的待用预测模型预测预览图像的对焦区域,并根据预测的对焦区域对预览图像进行对焦。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM,)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的对焦方法而言,本领域普通测试人员可以理解实现本申请实施例的对焦方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如对焦方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的对焦装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种对焦方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种对焦方法,其特征在于,包括:
获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;
从预测模型集合中选取待用预测模型;
根据所述样本集对所述待用预测模型进行训练;
根据训练后的所述待用预测模型预测预览图像的对焦区域,并根据所述对焦区域对预览图像进行对焦。
2.如权利要求1所述的对焦方法,其特征在于,所述根据训练后的所述待用预测模型预测预览图像的对焦区域的步骤包括:
将所述预览图像输入到所述待用预测模型,得到所述待用预测模型输出的,所述预览图像的梯度图;
根据所述梯度图在每个通道上的最大绝对值,生成所述预览图像的候选对焦区域;
对所述候选对焦区域进行二值化处理,得到二值化的候选对焦区域;
根据所述二值化的候选对焦区域的连通区域,得到所述预览图像的对焦区域。
3.如权利要求2所述的对焦方法,其特征在于,所述根据所述二值化的候选对焦区域的连通区域,得到所述预览图像的对焦区域包括:
确定所述二值化的候选对焦区域的连通区域,并获取所述连通区域中各像素点的坐标平均值;
以所述坐标平均值对应的像素点为中心,生成预设形状的对焦区域。
4.如权利要求1-3任一项所述的对焦方法,其特征在于,预测模型为神经网络模型,所述从预测模型集合中选取待用预测模型的步骤包括:
从预测模型集合中选取多个不同的神经网络模型;
分别选择所述多个神经网络模型的一层或多层;
将所选择的层组合为新的神经网络模型,作为所述待用预测模型。
5.如权利要求1-3任一项所述的对焦方法,其特征在于,所述获取携带有对焦区域信息的样本图像的步骤包括:
获取多个拍摄的图像;
确定所述多个图像的对焦区域信息;
将各所述图像与之对应的对焦区域信息关联后作为样本图像。
6.一种对焦装置,其特征在于,包括:
获取模块,用于获取携带有对焦区域信息的样本图像,并构建对焦区域预测的样本集;
选取模块,用于从预测模型集合中选取待用预测模型;
训练模块,用于根据所述样本集对所述待用预测模型进行训练;
对焦模块,用于根据训练后的所述待用预测模型预测预览图像的对焦区域,并根据所述对焦区域对预览图像进行对焦。
7.如权利要求6所述的对焦装置,其特征在于,所述对焦模块可以用于:
将所述预览图像输入所述待用预测模型,得到所述待用预测模型输出的,所述预览图像的梯度图;
根据所述梯度图在每个通道上的最大绝对值,生成所述预览图像的候选对焦区域;
对所述候选对焦区域进行二值化处理,得到二值化的候选对焦区域;
根据所述二值化的候选对焦区域的连通区域,得到所述预览图像的对焦区域。
8.如权利要求7所述的对焦装置,其特征在于,所述对焦模块可以用于:
获取所述连通区域中各像素点的坐标平均值;
以所述坐标平均值对应的像素点为中心,生成预设形状的对焦区域。
9.如权利要求6-8任一项所述的对焦装置,其特征在于,预测模型为神经网络模型,所述选取模块可以用于:
从预测模型集合中选取多个不同的神经网络模型;
分别选择所述多个神经网络模型的一层或多层;
将所选择的层组合为新的神经网络模型,作为所述待用预测模型。
10.如权利要求6-8任一项所述的对焦装置,其特征在于,所述获取模块可以用于:
获取多个拍摄的图像;
确定所述多个图像的对焦区域信息;
将各所述图像与之对应的对焦区域信息关联后作为样本图像。
11.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至5任一项所述的对焦方法。
12.一种电子设备,包括处理器和存储器,所述存储器储存有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至5任一项所述的对焦方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711437550.XA CN109963072B (zh) | 2017-12-26 | 2017-12-26 | 对焦方法、装置、存储介质及电子设备 |
PCT/CN2018/116759 WO2019128564A1 (zh) | 2017-12-26 | 2018-11-21 | 对焦方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711437550.XA CN109963072B (zh) | 2017-12-26 | 2017-12-26 | 对焦方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109963072A true CN109963072A (zh) | 2019-07-02 |
CN109963072B CN109963072B (zh) | 2021-03-02 |
Family
ID=67022651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711437550.XA Expired - Fee Related CN109963072B (zh) | 2017-12-26 | 2017-12-26 | 对焦方法、装置、存储介质及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109963072B (zh) |
WO (1) | WO2019128564A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110536068A (zh) * | 2019-09-29 | 2019-12-03 | Oppo广东移动通信有限公司 | 对焦方法和装置、电子设备、计算机可读存储介质 |
CN113067980A (zh) * | 2021-03-23 | 2021-07-02 | 北京澎思科技有限公司 | 图像采集方法、装置、电子设备及存储介质 |
CN114424518A (zh) * | 2019-09-27 | 2022-04-29 | 索尼集团公司 | 信息处理装置、电子设备、终端装置、信息处理系统、信息处理方法和程序 |
CN114466130A (zh) * | 2020-11-09 | 2022-05-10 | 哲库科技(上海)有限公司 | 图像处理器、装置、方法及电子设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610803B (zh) * | 2021-08-06 | 2024-09-06 | 苏州迪美格智能科技有限公司 | 数字切片扫描仪的自动分层对焦方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140313373A1 (en) * | 2013-04-19 | 2014-10-23 | Canon Kabushiki Kaisha | Imaging apparatus and its control method and program |
CN104954677A (zh) * | 2015-06-12 | 2015-09-30 | 联想(北京)有限公司 | 摄像头对焦确定方法及电子设备 |
CN105093479A (zh) * | 2014-04-30 | 2015-11-25 | 西门子医疗保健诊断公司 | 用于显微镜的自动对焦方法和装置 |
CN105354565A (zh) * | 2015-12-23 | 2016-02-24 | 北京市商汤科技开发有限公司 | 基于全卷积网络人脸五官定位与判别的方法及系统 |
CN105678242A (zh) * | 2015-12-30 | 2016-06-15 | 小米科技有限责任公司 | 手持证件模式下的对焦方法和装置 |
CN105763802A (zh) * | 2016-02-29 | 2016-07-13 | 广东欧珀移动通信有限公司 | 控制方法、控制装置及电子装置 |
CN105791674A (zh) * | 2016-02-05 | 2016-07-20 | 联想(北京)有限公司 | 电子设备和对焦方法 |
WO2016185952A1 (ja) * | 2015-05-18 | 2016-11-24 | ソニー株式会社 | 制御装置及び医療用撮像システム |
CN106528428A (zh) * | 2016-11-24 | 2017-03-22 | 中山大学 | 一种软件易变性预测模型的构建方法 |
CN106599941A (zh) * | 2016-12-12 | 2017-04-26 | 西安电子科技大学 | 基于卷积神经网络与支持向量机的手写数字识别方法 |
CN107169463A (zh) * | 2017-05-22 | 2017-09-15 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9202281B2 (en) * | 2012-03-17 | 2015-12-01 | Sony Corporation | Integrated interactive segmentation with spatial constraint for digital image analysis |
-
2017
- 2017-12-26 CN CN201711437550.XA patent/CN109963072B/zh not_active Expired - Fee Related
-
2018
- 2018-11-21 WO PCT/CN2018/116759 patent/WO2019128564A1/zh active Application Filing
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140313373A1 (en) * | 2013-04-19 | 2014-10-23 | Canon Kabushiki Kaisha | Imaging apparatus and its control method and program |
CN105093479A (zh) * | 2014-04-30 | 2015-11-25 | 西门子医疗保健诊断公司 | 用于显微镜的自动对焦方法和装置 |
WO2016185952A1 (ja) * | 2015-05-18 | 2016-11-24 | ソニー株式会社 | 制御装置及び医療用撮像システム |
CN104954677A (zh) * | 2015-06-12 | 2015-09-30 | 联想(北京)有限公司 | 摄像头对焦确定方法及电子设备 |
CN105354565A (zh) * | 2015-12-23 | 2016-02-24 | 北京市商汤科技开发有限公司 | 基于全卷积网络人脸五官定位与判别的方法及系统 |
CN105678242A (zh) * | 2015-12-30 | 2016-06-15 | 小米科技有限责任公司 | 手持证件模式下的对焦方法和装置 |
CN105791674A (zh) * | 2016-02-05 | 2016-07-20 | 联想(北京)有限公司 | 电子设备和对焦方法 |
CN105763802A (zh) * | 2016-02-29 | 2016-07-13 | 广东欧珀移动通信有限公司 | 控制方法、控制装置及电子装置 |
CN106528428A (zh) * | 2016-11-24 | 2017-03-22 | 中山大学 | 一种软件易变性预测模型的构建方法 |
CN106599941A (zh) * | 2016-12-12 | 2017-04-26 | 西安电子科技大学 | 基于卷积神经网络与支持向量机的手写数字识别方法 |
CN107169463A (zh) * | 2017-05-22 | 2017-09-15 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
郏东耀 等: "基于小波神经网络的自动调焦方法研究", 《电子测量与仪器学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114424518A (zh) * | 2019-09-27 | 2022-04-29 | 索尼集团公司 | 信息处理装置、电子设备、终端装置、信息处理系统、信息处理方法和程序 |
US12058441B2 (en) | 2019-09-27 | 2024-08-06 | Sony Group Corporation | Information processing apparatus with automatic adjustment of focal point |
CN110536068A (zh) * | 2019-09-29 | 2019-12-03 | Oppo广东移动通信有限公司 | 对焦方法和装置、电子设备、计算机可读存储介质 |
CN114466130A (zh) * | 2020-11-09 | 2022-05-10 | 哲库科技(上海)有限公司 | 图像处理器、装置、方法及电子设备 |
CN113067980A (zh) * | 2021-03-23 | 2021-07-02 | 北京澎思科技有限公司 | 图像采集方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019128564A1 (zh) | 2019-07-04 |
CN109963072B (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109963072A (zh) | 对焦方法、装置、存储介质及电子设备 | |
CN109543714B (zh) | 数据特征的获取方法、装置、电子设备及存储介质 | |
CN110555481B (zh) | 一种人像风格识别方法、装置和计算机可读存储介质 | |
CN109635770A (zh) | 活体检测方法、装置、存储介质及电子设备 | |
CN108764304A (zh) | 场景识别方法、装置、存储介质及电子设备 | |
WO2019100724A1 (zh) | 训练多标签分类模型的方法和装置 | |
US11741711B2 (en) | Video classification method and server | |
Tahir et al. | An open-ended continual learning for food recognition using class incremental extreme learning machines | |
CN111241985B (zh) | 一种视频内容识别方法、装置、存储介质、以及电子设备 | |
CN109948633A (zh) | 用户性别预测方法、装置、存储介质及电子设备 | |
CN108924420A (zh) | 图像拍摄方法、装置、介质、电子设备及模型训练方法 | |
CN113284142B (zh) | 图像检测方法、装置、计算机可读存储介质及计算机设备 | |
CN112287994A (zh) | 伪标签处理方法、装置、设备及计算机可读存储介质 | |
CN112035671B (zh) | 状态检测方法、装置、计算机设备及存储介质 | |
CN110502959A (zh) | 性别判断方法、装置、存储介质及电子设备 | |
Zhang et al. | Online modeling of esthetic communities using deep perception graph analytics | |
CN116401552A (zh) | 一种分类模型的训练方法及相关装置 | |
CN112069338A (zh) | 图片处理方法、装置、电子设备及存储介质 | |
CN111626058A (zh) | 基于cr2神经网络的图像-文本双编码实现方法及系统 | |
CN114611692A (zh) | 模型训练方法、电子设备以及存储介质 | |
US11816181B2 (en) | Blur classification and blur map estimation | |
CN108595013A (zh) | 握持识别方法、装置、存储介质及电子设备 | |
Bourouis et al. | Unsupervised learning using expectation propagation inference of inverted beta-liouville mixture models for pattern recognition applications | |
CN112529078A (zh) | 一种业务处理方法、装置及设备 | |
CN117009878A (zh) | 基于超图的分类方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210302 |