WO2018120662A1 - 一种拍照方法,拍照装置和终端 - Google Patents
一种拍照方法,拍照装置和终端 Download PDFInfo
- Publication number
- WO2018120662A1 WO2018120662A1 PCT/CN2017/088143 CN2017088143W WO2018120662A1 WO 2018120662 A1 WO2018120662 A1 WO 2018120662A1 CN 2017088143 W CN2017088143 W CN 2017088143W WO 2018120662 A1 WO2018120662 A1 WO 2018120662A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- image
- face
- score
- preview image
- value
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Definitions
- the device further includes an expression color value score calculation module, configured to calculate, according to a similarity probability between the face region and the positive sample in the preview image. The facial expression value of the preview image is scored.
- the terminal provided by the embodiment of the invention can intelligently remind the user to adjust the photographing posture and the photographing parameter, obtain a satisfactory photographed picture that satisfies the satisfaction, and enhance the photographing experience.
- the I/O interface 712 provides an interface between the processing component 702 and the peripheral interface module, which may be a keyboard, a click wheel, a button, or the like. These buttons may include, but are not limited to, a home button, a volume button, a start button, and a lock button.
- the terminal provided by the embodiment of the invention can intelligently remind the user to adjust the photographing posture and the photographing parameter, obtain a satisfactory photographed picture that satisfies the satisfaction, and enhance the photographing experience.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
一种拍照方法,所述方法包括:检测摄像头采集的预览图像中的人脸区域;通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
Description
本发明实施例涉及拍照技术领域,尤其涉及一种通过卷积神经网络提升用户拍照体验的方法,拍照装置和终端。
拍照成为是社会主流,几乎所有的智能手机都配备摄像头,有的手机甚至配备了前置或后置的双摄像头,在市场上也深受消费者的欢迎。但是拍照时,很多消费者不知道该如何调整自己的拍照姿势或拍照参数,以获得满意的照片。
发明内容
本发明实施例的第一方面,提供了一种拍照方法,所述方法包括:
检测摄像头采集的预览图像中的人脸区域;通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。
本发明实施例提供的拍照方法,可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
在本发明实施例的第一方面的一些实施例中,所述方法还包括:检测第一图像中人脸的以下至少一个特征:眼角,鼻头或嘴角;其中所述第一图像为一张包含人脸区域的图像;根据所述第一图像中人脸的至少一个特征,判断所述第一图像中人脸的黄金分割比例;若所述第一图像中人脸的黄金分割比例大于预设比例,则所述第一图像中人脸的表情或颜值大于预设值;若所述第一图像中人脸的黄金分割比例小于预设比例,则所述第一图像中人脸的表情或颜值小于预设值。
即通过人脸特征与黄金分割比例的关系,自动判断人脸的表情和颜值,提升判断效率。
在本发明实施例的第一方面的一些实施例中,所述提示用户调整拍照姿势具体为,提示用户执行以下至少一个动作:侧脸或抬头;所述提示用户调整拍照参数具体为,提示用户调整以下至少一个拍照参数:光照,焦距,感光度或白平衡。智能的提醒拍照调整拍照姿势和参数,获得令用户满意的拍摄图片。
在本发明实施例的第一方面的一些实施例中,所述方法还包括,根据所述预览图像中的人脸区域与所述正样本的相似概率,计算所述预览图像的表情颜值分值,通过卷积神经网络计算人脸的表情颜值分值,不依赖于人脸特征点,是深度学习的一种体验,效果更准确。
在本发明实施例的第一方面的一些实施例中,通过以下步骤计算图像基础特征分值中的至少一个:根据所述预览图像中人脸区域的灰度直方图,计算所述预览图像的亮度分值;根据所述预览图像中人脸区域的灰度直方图或基于人脸视觉系统HVS的灰度信息,计算所述预览图像的对比度分值;根据所述预览图像中人脸区域的高频和低频数据的分布,计算所述预览图像的白噪声分值;根据所述预览图像中人脸区域的图像边界宽度分布,计算所述预览图像的清晰度分值。
在本发明实施例的第一方面的一些实施例中,所述方法还包括,在终端的显示屏上,显示以下至少一个分值:表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值。给用户更直观的拍摄照片好坏的体验。
在本发明实施例的第一方面的一些实施例中,根据表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值中的至少一个分值,计算总得分;在终端的显示屏上显示所述总得分。给用户更直观的拍摄照片好坏的体验。
本发明实施例第二方便提供了拍照装置,所述装置包括:第一检测模块,用于检测摄像头采集的预览图像中的人脸区域;卷积神经网络模块,用于计算所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;图像基础特征计算模块,用于计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;提示模块,用于根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。
本发明实施例提供的拍照装置,可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
在本发明实施例的第二方面的一些实施例中,所述装置还包括:第二检测模块,用于检测第一图像中人脸的以下至少一个特征:眼角,鼻头或嘴角;其中所述第一图像为一张包含人脸区域的图像;判断模块,用于根据所述第一图像中人脸的至少一个特征,判断所述第一图像中人脸的黄金分割比例;若所述第一图像中人脸的黄金分割比例大于预设比例,则所述第一图像中人脸的表情或颜值大于预设值;若所述第一图像中人脸的黄金分割比例小于预设比例,则所述第一图像中人脸的表情或颜值小于预设值。
在本发明实施例的第二方面的一些实施例中,所述装置还包括表情颜值分值计算模块,用于根据所述预览图像中的人脸区域与所述正样本的相似概率,计算所述预览图像的表情颜值分值。
在本发明实施例的第二方面的一些实施例中,所述装置还包括图像基础特征分值计算模块,用于图像基础特征分值中的至少一个:根据所述预览图像中人脸区域的灰度直方图,计算所述预览图像的亮度分值;根据所述预览图像中人脸区域的灰度直方图或基于人脸视觉系统HVS的灰度信息,计算所述预览图像的对比度分值;根据所述预览图像中人脸区域的高频和低频数据的分布,计算所述预览图像的白噪声分值;根据所述预览图像中人脸区域的图像边界宽度分布,计算所述预览图像的清晰度分值。
在本发明实施例的第二方面的一些实施例中,所述装置还包括:第一显示装置,用于显示以下至少一个分值:表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值。
在本发明实施例的第二方面的一些实施例中,所述装置还包括:总得分计算模块,用于根据表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值中的至少一个分值,计算总得分;第二显示装置,用于显示所述总得分。
本发明实施例的第三方便提供了一种终端,包括处理器,存储器,摄像头和显示屏;所述摄像头用于拍摄静态或动态的图像;所述存储器用于存储所述摄像头拍摄的图像;所述显示屏用于显示所述摄像头拍摄的图像;所述摄像头还用于采集预览图像,所述处理器用于执行以下步骤:检测所述预览图像中的人脸区域;通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。
本发明实施例提供的终端,可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
在本发明实施例第三方面的一些实施例中,本发明实施例的第三方便提供的终端,用于
执行本发明实施例第一方面提供的拍照方法。
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的一种拍照方法的示意图;
图2是本发明实施例提供的一种卷积神经网络的结构示意图;
图3是本发明实施例提供的一种终端的结构框图。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当本发明实施例提及“第一”、“第二”等序数词时,除非根据上下文其确实表达顺序之意,应当理解为仅仅是起区分之用。
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更优的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度,卷积神经网络需要估计的参数更少,使之成为一种颇具吸引力的深度学习结构。
在使用卷积神经网络之前,首先需要对卷积神经网络进行训练。对卷积神经网络进行训练的样本分为正样本和负样本。正样本指图像中人脸表情或颜值高于预设值的人脸图像,负样本指图像中表情和/或颜值低于预设值的人脸图像。根据人脸图像中眼角,鼻头或嘴角等人脸的特征,判断图像中人脸的黄金分割比例。图像中的人脸越是靠近黄金分割比例,则该图像中的人脸表情或颜值越高,反之,图像中的人脸越是远离黄金分割比例,则该图像中的人脸表情或颜值越低。为了卷积神经网络的训练更精确,可以选择预设数量的样本,比如选择5万张正样本,和5万张负样本,对卷积神经网络进行训练。
为了得到人脸的表情和/或颜值的分值,也可以采用人工标定的方式。在对该卷积神经网络进行训练之前,可以准备预设数量的人脸图像样本,下面简称人脸样本,并且对这些人脸样本在设定个数的任务训练,对人脸样本进行标定打分,例如,准备5万张人脸样本,然后按照用户对这些人脸样本中的表情和/或颜值的主观看法,对这5万张人脸样本进行标定打分,标定分值的范围例如为1到10分。
卷积神经网络建模包括以下步骤:
(1)卷积核设置(根据实验确认各卷积层使用的卷积核大小):
例如:输入层使用5x5卷积核,隐藏层之间使用3x3卷积核。
(2)确定卷积神经网络层数;
例如:输入层+3个卷积层+输出层的结构,具体中间多少层卷积层,卷积层之间是否需要丢弃部分参数,在哪几层之间需要丢弃参数可以通过实验确定。
(3)确定隐藏层之间链接结构(局部连接或全链接);
例如:输入层至第一层使用局部连接,卷积层之间使用局部连接,输出层采用全连接
的结构
例如:定义各卷积层之间的pooling大小为2x2
(4)确定隐藏层的激活函数
例如:选用何种Sigmoid函数作为激活函数,比如tanh,relu,softmax等
(5)输出层激活函数。卷积神经网络隐藏层输出也可作为特征,在输出层使用回归算法或贝叶斯算法计算正负样本概率。
最终的输出为一个偏向正样本的概率,具体使用哪个激活函数可以根据实验结果确定。
卷积网络输出也可作为bottleneck特征,最后的概率计算可以选用回归模型或概率模型,例如LR,SVR,NB,GBRT等适用于回归问题的方法,各方法的运行参数可以实验确定。
完成卷积神经网络的建模,并准备好正负样本之后,接下来对卷积神经网络进行训练,可以基于预设数量的人脸样本对卷积神经网络进行所述设定个数的任务训练;在确定卷积神经网络的迭代次数达到预设次数或者卷积神经网络的训练损失函数小于预设阈值时,停止对卷积神经网络的训练。其中,迭代次数可以根据对卷积神经网络的训练结果来确定,本发明实施例对迭代次数不做限制。
图1给出了本发明实施例提供的一种拍照方法的示意图。
S101:检测摄像头采集的预览图像中的人脸区域。
用户打开前置摄像头或后置摄像头,摄像头会采集预览图像。通过Cascade,AdaBoost等人脸检测算法,检测预览图像中的人脸区域。Cascade和AdaBoost是目前两种较为稳定且表现较好的人脸检测算法。具体的可以参见http://blog.csdn.net/sgamble/article/details/52891953。本发明实施条例通过引用的方式结合在此。
S102:通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率。
为了训练卷则神经网络,首先收集足够多(比如5万张)表情和颜值较高的人脸图像作为模型训练用正样本;收集足够多表情和颜值较低的人脸图像作为模型训练用负样本。为了提高建模准确度,正负样本图像基础特征要求尽可能好。考虑到国家和地区人群审美不同,可能需要针对不同国家和地区建立正负样本集。所谓表情和颜值高或低,可以人工标定,也可以通过上述提到的人脸特征与黄金分割比例的关系判断。
使用人脸检测算法检测和定位预览图像中的人脸区域,提取定位后的人脸区域,缩小至卷积神经网络需求大小,例如64x64,128x128。
对提取后的人脸区域进行简单的旋转,例如步长为11度旋转1-2圈,保证图像各个角度都能用于建模。旋转后可带切分图片,细化各个部位特征细节。各切后子图片允许有互相重叠部分。
使用上述正负样本集,训练卷积神经网络。由于训练模型需要强大的计算能力和系统资源,优选的,在云端侧训练卷积神经网络。云端侧训练的模型可预置于终端侧或同步到终端侧。当然,也可以直接在终端侧训练卷积神经网络。
训练样本集,还可以根据用户标记或上传至云端的人脸图片,使用用户提供的样本集训练卷积神经网络。这样拍出来的照片,更能体现用户的审美观和喜好。
S103:计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度。
图像的基础特征包括图像的亮度,对比度,白噪声和清晰度。
S104:根据所述相似概率,提示用户调整拍照姿势。
所述相似概率是指预览图像中的人脸与正样本的相似概率。所以预览图像中的人脸与正样本的相似概率越高,说明预览图像中的人脸的表情和/或颜值越高,说明用户的拍照姿势是正确的。反之,可以提醒用户调整拍照姿势,提高自己在预览图像中的人脸与正样本的相似
概率。比如,提醒用户侧脸,抬头等,以拍出更好的图像。
S105:根据所述预览图像的图像基础特征,提示用户调整拍照参数。
比如,提醒用户调整光照,焦距,感光度或白平衡中的至少一个拍照参数。这里的提醒用户调整光照参数可以是提醒用户从阴暗的地方走到明亮的地方。
S104和S105不分先后顺序。
通过本发明实施例提供的拍照方法,可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
可选的,本发明实施例根据上述卷积神经网络计算得到的相似概率和图像基础特征,还可以实现人脸打分,包括以下步骤:
(1)根据所述预览图像中的人脸区域与所述正样本的相似概率,计算所述预览图像的表情颜值分值;
(2)通过以下步骤计算图像基础特征分值中的至少一个:
根据所述预览图像中人脸区域的灰度直方图,计算所述预览图像的亮度分值;
根据所述预览图像中人脸区域的灰度直方图或基于人脸视觉系统HVS的灰度信息,计算所述预览图像的对比度分值;
根据所述预览图像中人脸区域的高频和低频数据的分布,计算所述预览图像的白噪声分值;
根据所述预览图像中人脸区域的图像边界宽度分布,计算所述预览图像的清晰度分值。
在计算得到图像基础特征分值之后,还根据图像基础特征分值,即根据表情颜值分值,亮度分值,对比度分值,白噪声分值和清晰度分值,计算所述预览图像的总得分。
(3)在终端的显示屏上显示以下至少一个分值:表情颜值分值,亮度分值,对比度分值,白噪声分值,清晰度分值或总得分。
可选的,可以根据各个分值,提醒用户调整拍照姿势或拍照参数。
在用户拍照时提示用户调整姿势和拍照参数,优化拍摄的人脸原片。即使后期使用PS,美图秀秀等修图软件修图,一个好的原片(优秀的表情和拍设环境)是修图的基础。
图像基础特征分值可以为其他功能提供服务,例如自动对修图美肤工具提供修改参数,例如发现亮度评分较低,自动设置提高全局亮度的参数等。
关于卷积神经网络的训练,还可以通过下述方法实现。
在一实施例中,设定个数可以根据对人脸评分的训练任务来确定,例如,如果从五官、皮肤、图像质量3个训练任务,则设定个数为3,如果仅有五官1个训练任务,则设定个数为1,如果为上述三个方面的任意两个方面来训练,则设定个数可以为2,如果还需要将光照作为训练任务,则设定个数为4,由此可知,本公开对设定个数不做限制,只要能够将训练任务参与到卷积神经网络的训练,并在确定人脸颜值时将训练任务对应的系数应用在卷积神经网络中即可。在一实施例中,预测层可以通过卷积神经网络中的softmax函数实现。
作为一个示例性场景,如图2所示,卷积神经网络包括3个卷积层,1个全连接层和3个预测层。从预览图像(也可以称为原始图像)中检测人脸区域,根据人脸区域从预览图像上截取人脸所在的区域,例如,原始图像的分辨率为1000×1000,人脸所在的区域的分辨率为200×200。如果卷积神经网的输入层的维数为128×128,则可以将该包含有人脸所在的区域进行仿射变换,得到分辨率为128×128的人脸图像。
在一实施例中,卷积层11、卷积层12、卷积层13的卷积核大小分别为5×5、3×3、2×2,在卷积层11、卷积层12、卷积层13上,同时还可以具有对人脸图像依次进行下采样的功能,例如,128×128大小的人脸图像通过卷积层11的卷积处理后得到64×64大小的局部特征,64×64大小的局部特征通过卷积层12的卷积处理后得到32×32大小的局部特征,32×32大小的局部特征通过卷积层13的卷积处理后得到16×16大小的局部特征,通过各卷积层的卷积处理,可以使局部特征能够充分表示人脸在五官、皮肤、图像质量等方面的真实
特征。
在全连接层14支持设定长度为8的情形下,全连接层14需要将16×16大小的局部特征变换为1*256的一维向量,再将该一维向量通过一个8×256的映射矩阵映射得到一个设定长度为8的一维向量。
在预测层151、预测层152、预测层153表示卷积神经网络需要学习的3个任务,分别对应人脸图像上的人脸的五官、人脸的皮肤以及图像质量。因此通过将该设定长度为8的一维向量输入到预测层151、预测层152、预测层153,预测层151、预测层152、预测层153根据其已经训练到的权重系数计算得到上述关于人脸的五官、人脸的皮肤以及人脸的图像质量的评分值。
本实施例中,由于卷积神经网络已经进行了多任务(本发明实施例提供的设定个数的训练任务)训练,由于设定个数的预测层对应了不同的训练任务,因此从设定个数的预测层对人脸图像进行打分更能体现原始图像在实际拍摄场景中的情形,从而通过各个预测层的评分值给用户更具体的关于人脸颜值的反馈提示,使用户能够根据评分值拍照过程做出更具针对性的调整,以提升后续所拍照片的图像质量。
本发明实施例还提供一种拍照装置,所述装置包括:
第一检测模块,用于检测摄像头采集的预览图像中的人脸区域;
卷积神经网络模块,用于计算所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;
图像基础特征计算模块,用于计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;
提示模块,用于根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。
可选的,所述装置还包括:
第二检测模块,用于检测第一图像中人脸的以下至少一个特征:眼角,鼻头或嘴角;其中所述第一图像为一张包含人脸区域的图像;
判断模块,用于根据所述第一图像中人脸的至少一个特征,判断所述第一图像中人脸的黄金分割比例;
若所述第一图像中人脸的黄金分割比例大于预设比例,则所述第一图像中人脸的表情或颜值大于预设值;
若所述第一图像中人脸的黄金分割比例小于预设比例,则所述第一图像中人脸的表情或颜值小于预设值。
可选的,所述装置还包括表情颜值分值计算模块,用于根据所述预览图像中的人脸区域与所述正样本的相似概率,计算所述预览图像的表情颜值分值。
可选的,所述装置还包括图像基础特征分值计算模块,用于图像基础特征分值中的至少一个:
根据所述预览图像中人脸区域的灰度直方图,计算所述预览图像的亮度分值;
根据所述预览图像中人脸区域的灰度直方图或基于人脸视觉系统HVS的灰度信息,计算所述预览图像的对比度分值;
根据所述预览图像中人脸区域的高频和低频数据的分布,计算所述预览图像的白噪声分值;
根据所述预览图像中人脸区域的图像边界宽度分布,计算所述预览图像的清晰度分值。
可选的,所述装置还包括:第一显示装置,用于显示以下至少一个分值:表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值。
可选的,所述装置还包括:
总得分计算模块,用于根据表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值中的至少一个分值,计算总得分;
第二显示装置,用于显示所述总得分。
本发明实施例提供的拍照装置,与本发明实施例提供的拍照方法相对应。比如,第一检测模块与S101对应,卷积神经网络模块与S102对应等,其他的对应方式类似,在此不再赘述。
本发明实施例提供的拍照装置,可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
图3是根据一示例性实施例示出的一种终端的框图。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理部件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件706为装置700的各种组件提供电力。电力组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到设备700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的
位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明实施例提供的终端,用于执行本发明实施例提供的拍照方法实施例。具体的,下面以本发明实施例提供的终端执行与步骤S101至S105对应的方法为例进行说明,本发明实施例提供的终端如何执行本发明实施例提供的其他方法,与之类似,在此不再赘述。
本发明实施例提供的终端,至少包括处理器,存储器,摄像头和显示屏;
所述摄像头用于拍摄静态或动态的图像;
所述存储器用于存储所述摄像头拍摄的图像;
所述显示屏用于显示所述摄像头拍摄的图像;
所述摄像头还用于采集预览图像,所述处理器用于执行以下步骤:
检测所述预览图像中的人脸区域;
通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;
计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;
根据所述相似概率,提示用户调整拍照姿势;
根据所述预览图像的图像基础特征,提示用户调整拍照参数。
本发明实施例提供的终端,可以智能的提醒用户调整拍照姿势和拍照参数,获得令满足的满意的拍摄图片,提升拍摄体验。
Claims (14)
- 一种拍照方法,其特征在于,所述方法包括:检测摄像头采集的预览图像中的人脸区域;通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。
- 根据权利要求1所述的方法,其特征在于,所述方法还包括:检测第一图像中人脸的以下至少一个特征:眼角,鼻头或嘴角;其中所述第一图像为一张包含人脸区域的图像;根据所述第一图像中人脸的至少一个特征,判断所述第一图像中人脸的黄金分割比例;若所述第一图像中人脸的黄金分割比例大于预设比例,则所述第一图像中人脸的表情或颜值大于预设值;若所述第一图像中人脸的黄金分割比例小于预设比例,则所述第一图像中人脸的表情或颜值小于预设值。
- 根据权利要求1或2所述的方法,其特征在于:所述提示用户调整拍照姿势具体为,提示用户执行以下至少一个动作:侧脸或抬头;所述提示用户调整拍照参数具体为,提示用户调整以下至少一个拍照参数:光照,焦距,感光度或白平衡。
- 根据权利要求1所述的方法,其特征在于,所述方法还包括,根据所述预览图像中的人脸区域与所述正样本的相似概率,计算所述预览图像的表情颜值分值。
- 根据权利要求1所述的方法,其特征在于,通过以下步骤计算图像基础特征分值中的至少一个:根据所述预览图像中人脸区域的灰度直方图,计算所述预览图像的亮度分值;根据所述预览图像中人脸区域的灰度直方图或基于人脸视觉系统HVS的灰度信息,计算所述预览图像的对比度分值;根据所述预览图像中人脸区域的高频和低频数据的分布,计算所述预览图像的白噪声分值;根据所述预览图像中人脸区域的图像边界宽度分布,计算所述预览图像的清晰度分值。
- 根据权利要求4或5所述的方法,其特征在于,所述方法还包括,在终端的显示屏上,显示以下至少一个分值:表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值。
- 根据权利要求4或5所述的方法,其特征在于,根据表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值中的至少一个分值,计算总得分;在终端的显示屏上显示所述总得分。
- 一种拍照装置,其特征在于,所述装置包括:第一检测模块,用于检测摄像头采集的预览图像中的人脸区域;卷积神经网络模块,用于计算所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;图像基础特征计算模块,用于计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;提示模块,用于根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像 基础特征,提示用户调整拍照参数。
- 根据权利要求1所述的装置,其特征在于,所述装置还包括:第二检测模块,用于检测第一图像中人脸的以下至少一个特征:眼角,鼻头或嘴角;其中所述第一图像为一张包含人脸区域的图像;判断模块,用于根据所述第一图像中人脸的至少一个特征,判断所述第一图像中人脸的黄金分割比例;若所述第一图像中人脸的黄金分割比例大于预设比例,则所述第一图像中人脸的表情或颜值大于预设值;若所述第一图像中人脸的黄金分割比例小于预设比例,则所述第一图像中人脸的表情或颜值小于预设值。
- 根据权利要求8所述的装置,其特征在于,所述装置还包括表情颜值分值计算模块,用于根据所述预览图像中的人脸区域与所述正样本的相似概率,计算所述预览图像的表情颜值分值。
- 根据权利要求8所述的装置,其特征在于,所述装置还包括图像基础特征分值计算模块,用于图像基础特征分值中的至少一个:根据所述预览图像中人脸区域的灰度直方图,计算所述预览图像的亮度分值;根据所述预览图像中人脸区域的灰度直方图或基于人脸视觉系统HVS的灰度信息,计算所述预览图像的对比度分值;根据所述预览图像中人脸区域的高频和低频数据的分布,计算所述预览图像的白噪声分值;根据所述预览图像中人脸区域的图像边界宽度分布,计算所述预览图像的清晰度分值。
- 根据权利要求10或11所述的装置,其特征在于,所述装置还包括:第一显示装置,用于显示以下至少一个分值:表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值。
- 根据权利要求10或11所述的装置,其特征在于,所述装置还包括:总得分计算模块,用于根据表情颜值分值,亮度分值,对比度分值,白噪声分值或清晰度分值中的至少一个分值,计算总得分;第二显示装置,用于显示所述总得分。
- 一种终端,包括处理器,存储器,摄像头和显示屏;所述摄像头用于拍摄静态或动态的图像;所述存储器用于存储所述摄像头拍摄的图像;所述显示屏用于显示所述摄像头拍摄的图像;所述摄像头还用于采集预览图像,所述处理器用于执行以下步骤:检测所述预览图像中的人脸区域;通过卷积神经网络,得到所述预览图像中的人脸区域与所述卷积神经网络的正样本的相似概率,其中所述卷积神经由正样本和负样本训练得到,所述正样本指表情或颜值高于预设值的人脸图像,所述负样本指表情或颜值低于所述预设值的人脸图像;计算所述预览图像的图像基础特征,其中所述图像基础特征至少包括以下特征中的一个:亮度,对比度,白噪声或清晰度;根据所述相似概率,提示用户调整拍照姿势;根据所述预览图像的图像基础特征,提示用户调整拍照参数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611225000 | 2016-12-27 | ||
CN201611225000.7 | 2016-12-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018120662A1 true WO2018120662A1 (zh) | 2018-07-05 |
Family
ID=62706821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2017/088143 WO2018120662A1 (zh) | 2016-12-27 | 2017-06-13 | 一种拍照方法,拍照装置和终端 |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2018120662A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657612A (zh) * | 2018-12-19 | 2019-04-19 | 苏州纳智天地智能科技有限公司 | 一种基于人脸图像特征的质量排序系统及其使用方法 |
CN109934196A (zh) * | 2019-03-21 | 2019-06-25 | 厦门美图之家科技有限公司 | 人脸姿态参数评估方法、装置、电子设备及可读存储介质 |
CN110276730A (zh) * | 2019-06-13 | 2019-09-24 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备 |
CN110338759A (zh) * | 2019-06-27 | 2019-10-18 | 嘉兴深拓科技有限公司 | 一种正面疼痛表情数据采集方法 |
CN110716778A (zh) * | 2019-09-10 | 2020-01-21 | 阿里巴巴集团控股有限公司 | 应用兼容性测试方法、装置及系统 |
EP3611915A1 (en) * | 2018-08-17 | 2020-02-19 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for image processing, and mobile terminal |
CN111080667A (zh) * | 2019-12-17 | 2020-04-28 | 杭州趣维科技有限公司 | 一种快速人像照片的自动构图裁剪方法及系统 |
CN113012089A (zh) * | 2019-12-19 | 2021-06-22 | 北京金山云网络技术有限公司 | 一种图像质量评价方法及装置 |
CN113706502A (zh) * | 2021-08-26 | 2021-11-26 | 重庆紫光华山智安科技有限公司 | 一种人脸图像质量评估方法及装置 |
CN115734069A (zh) * | 2022-11-16 | 2023-03-03 | 安徽宝信信息科技有限公司 | 一种自动追踪抓取图像系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120230553A1 (en) * | 2009-09-01 | 2012-09-13 | Lg Innotek Co., Ltd. | Apparatus and method for detecting eye state |
US20140241627A1 (en) * | 2013-02-28 | 2014-08-28 | Kabushiki Kaisha Toshiba | Environment evaluation apparatus, method and program |
CN105205462A (zh) * | 2015-09-18 | 2015-12-30 | 北京百度网讯科技有限公司 | 一种拍照提示方法及装置 |
CN105205479A (zh) * | 2015-10-28 | 2015-12-30 | 小米科技有限责任公司 | 人脸颜值评估方法、装置及终端设备 |
-
2017
- 2017-06-13 WO PCT/CN2017/088143 patent/WO2018120662A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120230553A1 (en) * | 2009-09-01 | 2012-09-13 | Lg Innotek Co., Ltd. | Apparatus and method for detecting eye state |
US20140241627A1 (en) * | 2013-02-28 | 2014-08-28 | Kabushiki Kaisha Toshiba | Environment evaluation apparatus, method and program |
CN105205462A (zh) * | 2015-09-18 | 2015-12-30 | 北京百度网讯科技有限公司 | 一种拍照提示方法及装置 |
CN105205479A (zh) * | 2015-10-28 | 2015-12-30 | 小米科技有限责任公司 | 人脸颜值评估方法、装置及终端设备 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3611915A1 (en) * | 2018-08-17 | 2020-02-19 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for image processing, and mobile terminal |
US11006046B2 (en) | 2018-08-17 | 2021-05-11 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Image processing method and mobile terminal |
CN109657612B (zh) * | 2018-12-19 | 2023-12-12 | 苏州纳智天地智能科技有限公司 | 一种基于人脸图像特征的质量排序系统及其使用方法 |
CN109657612A (zh) * | 2018-12-19 | 2019-04-19 | 苏州纳智天地智能科技有限公司 | 一种基于人脸图像特征的质量排序系统及其使用方法 |
CN109934196A (zh) * | 2019-03-21 | 2019-06-25 | 厦门美图之家科技有限公司 | 人脸姿态参数评估方法、装置、电子设备及可读存储介质 |
CN110276730B (zh) * | 2019-06-13 | 2023-03-28 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备 |
CN110276730A (zh) * | 2019-06-13 | 2019-09-24 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备 |
CN110338759B (zh) * | 2019-06-27 | 2020-06-09 | 嘉兴深拓科技有限公司 | 一种正面疼痛表情数据采集方法 |
CN110338759A (zh) * | 2019-06-27 | 2019-10-18 | 嘉兴深拓科技有限公司 | 一种正面疼痛表情数据采集方法 |
CN110716778A (zh) * | 2019-09-10 | 2020-01-21 | 阿里巴巴集团控股有限公司 | 应用兼容性测试方法、装置及系统 |
CN110716778B (zh) * | 2019-09-10 | 2023-09-26 | 创新先进技术有限公司 | 应用兼容性测试方法、装置及系统 |
CN111080667A (zh) * | 2019-12-17 | 2020-04-28 | 杭州趣维科技有限公司 | 一种快速人像照片的自动构图裁剪方法及系统 |
CN111080667B (zh) * | 2019-12-17 | 2023-04-25 | 杭州小影创新科技股份有限公司 | 一种快速人像照片的自动构图裁剪方法及系统 |
CN113012089A (zh) * | 2019-12-19 | 2021-06-22 | 北京金山云网络技术有限公司 | 一种图像质量评价方法及装置 |
CN113706502A (zh) * | 2021-08-26 | 2021-11-26 | 重庆紫光华山智安科技有限公司 | 一种人脸图像质量评估方法及装置 |
CN113706502B (zh) * | 2021-08-26 | 2023-09-05 | 重庆紫光华山智安科技有限公司 | 一种人脸图像质量评估方法及装置 |
CN115734069A (zh) * | 2022-11-16 | 2023-03-03 | 安徽宝信信息科技有限公司 | 一种自动追踪抓取图像系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018120662A1 (zh) | 一种拍照方法,拍照装置和终端 | |
CN105809704B (zh) | 识别图像清晰度的方法及装置 | |
CN107909113B (zh) | 交通事故图像处理方法、装置及存储介质 | |
RU2577188C1 (ru) | Способ, аппарат и устройство для сегментации изображения | |
CN104125396B (zh) | 图像拍摄方法和装置 | |
CN105631408B (zh) | 基于视频的面孔相册处理方法和装置 | |
TWI755833B (zh) | 一種圖像處理方法、電子設備和儲存介質 | |
WO2016011747A1 (zh) | 肤色调整方法和装置 | |
WO2020019873A1 (zh) | 图像处理方法、装置、终端及计算机可读存储介质 | |
CN105528786B (zh) | 图像处理方法及装置 | |
WO2017016146A1 (zh) | 图像显示方法及装置 | |
RU2628494C1 (ru) | Способ и устройство для генерирования фильтра изображения | |
WO2017031901A1 (zh) | 人脸识别方法、装置及终端 | |
CN105653032B (zh) | 显示调整方法及装置 | |
WO2016138752A1 (zh) | 拍摄参数调整方法和装置 | |
CN105205479A (zh) | 人脸颜值评估方法、装置及终端设备 | |
CN108668080B (zh) | 提示镜头脏污程度的方法及装置、电子设备 | |
WO2017124899A1 (zh) | 一种信息处理方法及装置、电子设备 | |
CN106408603A (zh) | 拍摄方法及装置 | |
US20200312022A1 (en) | Method and device for processing image, and storage medium | |
CN106600530B (zh) | 照片合成方法及装置 | |
TWI752105B (zh) | 特徵圖像的獲取方法及獲取裝置、使用者認證方法 | |
CN105208284B (zh) | 拍摄提醒方法及装置 | |
CN105427228B (zh) | 照片水印处理方法及装置 | |
US8913142B2 (en) | Context aware input system for focus control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17885942 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 17885942 Country of ref document: EP Kind code of ref document: A1 |