CN110969085B - 脸部特征点定位方法及电子设备 - Google Patents
脸部特征点定位方法及电子设备 Download PDFInfo
- Publication number
- CN110969085B CN110969085B CN201911047006.3A CN201911047006A CN110969085B CN 110969085 B CN110969085 B CN 110969085B CN 201911047006 A CN201911047006 A CN 201911047006A CN 110969085 B CN110969085 B CN 110969085B
- Authority
- CN
- China
- Prior art keywords
- face
- target
- training sample
- facial
- facial feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001815 facial effect Effects 0.000 title claims abstract description 187
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012549 training Methods 0.000 claims description 147
- 238000012545 processing Methods 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 80
- 230000006870 function Effects 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/329—Power saving characterised by the action undertaken by task scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种脸部特征点定位方法及电子设备。其中,脸部特征点定位方法包括:获取目标脸部图像;根据目标脸部图像的脸部角度,在多个预设脸部角度范围中确定目标脸部图像所属的目标脸部角度范围;根据目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状;将目标脸部图像和目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。利用本发明实施例能够解决检测脸部特征点的过程中所显示的特征点存在抖动现象,以及脸部识别模型所占用的内存资源较大的问题。
Description
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种脸部特征点定位方法及电子设备。
背景技术
在利用电子设备对脸部图像进行图像处理时,一般首先利用脸部识别模型检测脸部图像中的脸部特征点,然后基于所检测到的脸部特征点进行图像处理。
但是,现有的脸部特征点检测方法,在检测脸部图像中的脸部特征点的过程中,所显示的特征点会存在抖动现象,并且,用于检测脸部特征点的脸部识别模型所占用的内存资源较大。
发明内容
本发明实施例提供一种脸部特征点定位方法及电子设备,以解决检测脸部特征点的过程中所显示的特征点存在抖动现象,以及脸部识别模型所占用的内存资源较大的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种脸部特征点定位方法,应用于电子设备,方法包括:
获取目标脸部图像;
根据目标脸部图像的脸部角度,在多个预设脸部角度范围中确定目标脸部图像所属的目标脸部角度范围;
根据目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状;
将目标脸部图像和目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。
第二方面,本发明实施例提供了一种电子设备,包括:
图像获取模块,用于获取目标脸部图像;
角度识别模块,用于根据目标脸部图像的脸部角度,在多个预设脸部角度范围中确定目标脸部图像所属的目标脸部角度范围;
形状确定模块,用于根据目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状;
模型处理模块,用于将目标脸部图像和目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。
第三方面,本发明实施例提供了一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现如第一方面所述的脸部特征点定位方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如第一方面所述的脸部特征点定位方法的步骤。
在本发明实施例中,能够在获取目标脸部图像之后,根据目标脸部图像的脸部角度所属的目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状,并利用脸部识别模型根据目标初始脸部特征形状,得到该目标脸部图像的脸部特征点,以实现利用仅具有一组模型参数的脸部识别模型,对不同脸部角度的目标脸部图像进行高精度的脸部特征点定位,从而能够解决在检测脸部特征点的过程中,所显示的特征点存在抖动现象的问题。另外,由于脸部识别模型仅具有一组模型参数,使得模型参数的数量较少,脸部识别模型所占用的内容资源较少,从而可以降低电子设备检测脸部特征点的计算量和功耗,提高电子设备的续航时间。
附图说明
从下面结合附图对本发明的具体实施方式的描述中可以更好地理解本发明其中,相同或相似的附图标记表示相同或相似的特征。
图1为本发明一个实施例提供的脸部特征点定位方法的流程示意图;
图2为本发明一个实施例提供的模型训练步骤的流程示意图;
图3为本发明一个实施例提供的脸部识别模型训练流程的流程示意图;
图4为本发明一个实施例提供的电子设备的结构示意图;
图5为实现本发明各个实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的脸部特征点检测方法所使用的脸部识别模型包括:基于深度神经网络训练得到的脸部识别模型和基于传统机器学习方法训练得到的脸部识别模型。
其中,虽然基于深度神经网络训练得到的脸部识别模型的检测精确度较高,但是,深度神经网络所占用的内部资源较大,使得检测脸部特征点的耗电量较大,会减少电子设备电池的续航时间,并且,深度神经网络的计算过程比较复杂,使得检测脸部特征点的速度较慢,无法达到实时检测,因此,基于深度神经网络训练得到的脸部识别模型难以满足现实应用需求。
现有的基于传统机器学习方法训练得到的脸部识别模型分为两类,一类为多初始形状形式,另一类为单初始形状形式。
一般情况下,多初始形状形式中的每个初始形状均需要对应一个子模型,使得需要存储的模型参数较多,导致脸部识别模型所占用的内部资源较大,并且,不同的子模型之间进行切换时,被检测的脸部图像上所显示的脸部特征点会存在明显的抖动现象。而单初始形状形式的精度较低,导致所检测到的脸部特征点的准确性较差。因此,现有的基于传统机器学习方法训练得到的脸部识别模型也不能满足现实应用需求。
为了解决现有技术中存在的问题,本发明实施例提供了一种脸部特征点定位方法、电子设备及介质。下面,首先对脸部特征点定位方法进行详细说明。
图1示出了本发明一个实施例提供的脸部特征点定位方法的流程示意图。如图1所示,该脸部特征点定位方法可以包括:
S110、获取目标脸部图像;
S120、根据目标脸部图像的脸部角度,在多个预设脸部角度范围中确定目标脸部图像所属的目标脸部角度范围;
S130、根据目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状;
S140、将目标脸部图像和目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。
本发明实施例所述的脸部特征点定位方法可以应用于电子设备,也可以应用于为电子设备提供图像处理功能的服务器。
本发明实施例所述的脸部特征点定位方法可以应用于人、动物等的脸部特征点定位。
在本发明实施例中,能够在获取目标脸部图像之后,根据目标脸部图像的脸部角度所属的目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状,并利用脸部识别模型根据目标初始脸部特征形状,得到该目标脸部图像的脸部特征点,以实现利用仅具有一组模型参数的脸部识别模型,对不同脸部角度的目标脸部图像进行高精度的脸部特征点定位,从而能够解决在检测脸部特征点的过程中,所显示的特征点存在抖动现象的问题。另外,由于脸部识别模型仅具有一组模型参数,使得模型参数的数量较少,脸部识别模型所占用的内容资源较少,从而可以降低电子设备检测脸部特征点的计算量和功耗,提高电子设备的续航时间。
下面,以脸部特征点定位方法应用于对人脸的人脸特征点定位为例进行详细说明。
在本发明一些实施例的步骤S110中,目标脸部图像可以为一张人脸图像,也可以为多张人脸图像。
在本发明一些实施例的步骤S120中,预设脸部角度范围可以包括脸部上下翻转角度范围和/或脸部左右翻转角度范围。
在一些实施例中,预设脸部角度范围可以仅包括脸部上下翻转角度范围,此时,仅针对脸部上下翻转角度对目标脸部图像所属的预设脸部角度范围进行分类。在另一些实施例中,预设脸部角度范围可以仅包括脸部左右翻转角度范围,此时,仅针对脸部左右翻转角度对目标脸部图像所属的预设脸部角度范围进行分类。在又一些实施例中,预设脸部角度范围可以同时包括脸部上下翻转角度范围和脸部左右翻转角度范围,此时,可以同时利用脸部上下翻转角度和脸部左右翻转角度对目标脸部图像所属的预设脸部角度范围进行分类。例如,先利用脸部左右翻转角度对目标脸部图像所属的脸部左右翻转角度范围进行分类,然后再利用脸部上下翻转角度对目标脸部图像所属的脸部上下翻转角度范围再次分类,得到目标脸部图像在所属的脸部左右翻转角度范围分类下,所属的脸部上下翻转角度范围,从而最终确定目标脸部图像所属的预设脸部角度范围。
以预设脸部角度范围包括脸部左右翻转角度范围为例,可以将脸部左右翻转角度定义为yaw角度,同时将脸部向左侧时yaw角度定义为小于零,最小为-90°,脸部向右侧时yaw角度定义为大于零,最大为90°。
在本发明一些实施例中,至少两个预设脸部角度范围之间存在交集。例如,每两个相邻的预设脸部角度范围之间存在交集,即具有重合角度范围。
继续以预设脸部角度范围包括脸部左右翻转角度范围为例,可以将 yaw角度分为[-90°,-25°]、[-35°,35°]和[25°,90°]三个预设脸部角度范围。
由此,在所检测的目标脸部样本的脸部角度不精确或者处于两个预设脸部角度范围的边界时,可以提高初始脸部特征形状的鲁棒性,从而提高检测结果的准确性。
在本发明一些实施例的步骤S130中,根据目标脸部角度范围确定目标脸部图像对应的目标初始脸部特征形状的具体方法可以包括:
获取目标脸部角度范围对应的预先设定的初始脸部特征形状,作为该目标脸部图像对应的目标初始脸部特征形状。
其中,预先设定的方法可以为人工设定,也可以为根据目标脸部角度范围对应的训练样本确定。具体地,根据训练样本确定的方法将在下文详细描述。
在本发明一些实施例的步骤S140中,当目标脸部图像为多张人脸图像时,需要将每个目标脸部图像和该目标脸部图像对应的目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。
其中,脸部特征点可以包括脸部轮廓特征点和/或五官特征点。
在本发明一些实施例中,在步骤S130之前,还可以包括利用多个训练样本训练脸部识别模型的模型训练步骤。在本发明另一些实施例中,该模型训练步骤还可以在步骤S110或步骤S120之前进行。
图2示出了本发明一个实施例提供的模型训练步骤的流程示意图。如图2所示,该模型训练步骤可以具体包括:
S210、获取分别对应不同预设脸部角度范围的多组训练样本集,其中,每组训练样本集内所有的训练样本的脸部角度均处于与该组训练样本集相对应的预设脸部角度范围内,且至少两个预设脸部角度范围之间存在交集;
S220、针对每一组训练样本集,对该组训练样本集内的训练样本进行初始化处理,得到与该组训练样本集相对应的初始脸部特征形状;
S230、根据每组训练样本集及与该组训练样本集相对应的初始脸部特征形状之间的映射关系,得到脸部识别模型。
在本发明一些实施例的步骤S210中,预设脸部角度范围可以包括脸部上下翻转角度范围和/或脸部左右翻转角度范围。并且,确定训练样本所属的预设脸部角度范围与上述的确定目标脸部图像所属的目标脸部角度范围的方法相似,在此不再赘述。
在本发明一些实施例的步骤S220中,对一组训练样本集内的训练样本进行初始化处理的具体方法可以为:为该组训练样本集人工预设一个平均脸部特征形状,作为与该组训练样本集相对应的初始脸部特征形状。
在本发明另一些实施例的步骤S220中,对一组训练样本集内的训练样本进行初始化处理的具体方法可以包括:
对该组训练样本集内的训练样本进行归一化处理,得到归一化样本;
确定归一化样本的平均脸部特征形状,作为与该组训练样本集对应的初始脸部特征形状。
由于本发明实施例中,多组训练样本集是对训练样本按照不同的预设脸部角度范围进行了有重叠分类所形成的,并且为将训练样本集的平均脸部特征形状作为与该组训练样本集对应的初始脸部特征形状,使得初始脸部特征形状能够很好地表征对应的训练样本集中的样本特征,因此,可以使机器学习模型需要学习的趋势更加统一,有利于机器学习模型更好的学习,在迭代次数相同时,所得到的脸部识别模型收敛效果更好,同时这种趋势的统一性不是强统一,不会出现过拟合,因此实际场景中对于不同脸部角度的脸部图像都能获得更好的脸部特征点定位效果。
在本发明实施例的步骤S230中,可以利用每个训练样本和该训练样本所属的训练样本集对应的初始脸部特征形状进行机器学习模型的训练,学习每个训练样本及该训练样本所属的训练样本集对应的初始脸部特征形状之间的映射关系,并根据所学到的映射关系确定机器学习模型的一组模型参数,从而得到脸部识别模型。
具体地,每个训练样本都会从其初始脸部特征形状开始进行迭代,每次迭代都会向脸部特征标定点移动一小步,这个过程也就是训练机器学习模型的过程。由于初始脸部特征形状能够很好地表征对应的训练样本的样本特征,因此,可以学习从初始脸部特征形状到脸部特征标定点的过程中的映射关系及规律,从而有利于机器学习模型更好的学习,使得训练得到的脸部识别模型用于实际场景时具有更好的定位效果。
在本发明实施例中,由于脸部识别模型所使用的不同初始脸部特征形状共用同一套模型参数,使得脸部识别模型回归得到的不同脸部角度的脸部特征点会更加稳定,能够尽可能的避免检测脸部特征点时所显示的脸部特征点存在抖动现象的问题。
在本发明一些实施例中,训练样本可以包括脸部图像和脸部图像中的脸部特征标定点。
在本发明一些实施例中,对训练样本进行归一化处理得到归一化样本的具体方法可以包括:
首先,利用人脸检测器对训练样本中的脸部图像中进行脸部检测,得到脸部图像的脸部框信息;其中,脸部框信息包括人脸矩形框的定位点坐标、人脸矩形框的分辨率以及人脸平面内旋转角度。其中,人脸矩形框的定位点坐标可以为人脸矩形框左上角点的坐标,人脸矩形框的分辨率可以包括人脸矩形框的宽度信息和高度信息。
然后,根据脸部框信息,提取脸部图像中的脸部区域图像。
当得到脸部区域图像后,可以根据预定规则对脸部区域图像进行归一化处理,得到脸部区域图像所属的训练样本对应的归一化脸部图像。其中,预定规则为将人脸平面内旋转角度旋转为零,即使脸部区域图像中的双眼连线基本处于水平状态,以及脸部区域图像的分辨率缩放至预定尺寸,从而保证不同的脸部区域图像的分辨率相同、人脸平面内旋转角度相同。
由此,可以在不同尺寸的脸部图像中的不同位置提取标记有脸部特征标定点的脸部区域图像,并将脸部区域图像归一化为相同的脸部平面内旋转角度以及相同的分辨率,然后将归一化脸部图像及归一化脸部图像中的脸部特征标定点,作为训练样本对应的归一化样本,从而使所确定的平均脸部特征形状的准确性更好,以保证所训练的脸部特征点模型的检测准确性。
在本发明另一些实施例中,对训练样本进行归一化处理得到归一化样本的具体方法可以包括:
先旋转脸部图像,使脸部图像的脸部平面内旋转角度旋转为零,然后对脸部图像进行缩放处理,使脸部图像中的脸部区域图像达到预定尺寸,然后提取脸部图像中的归一化脸部图像和归一化脸部图像中的脸部特征标定点,作为训练样本对应的归一化样本。
在本发明又一些实施例中,提取脸部图像样本的脸部图像中的脸部区域图像的具体方法可以包括:利用卷积神经网络提取脸部图像样本的脸部图像中的脸部区域图像。
在这些实施例中,确定归一化样本的平均脸部特征形状作为与该组训练样本集对应的初始脸部特征形状的具体方法可以包括:
针对每一个归一化样本,根据脸部特征标定点在脸部图像中的标定点坐标,确定该归一化样本对应的归一化坐标;
根据归一化坐标,计算归一化样本对应的平均归一化坐标,作为与该组训练样本集相对应的初始脸部特征形状。
以脸部特征标定点包括脸部轮廓特征点和五官特征点为例,需要提取出脸部轮廓特征点和五官特征点中每个特征点在归一化脸部图像中的归一化坐标,然后计算出脸部轮廓特征点和五官特征点中每个特征点的平均归一化坐标,作为与该组训练样本集相对应的初始脸部特征形状。
图3示出了本发明一个实施例提供的脸部识别模型训练流程的流程示意图。如图3所示,以训练样本中的脸部图像为人脸图像、脸部特征点为人脸特征点为例,该脸部识别模型训练流程具体可以包括:
S301、多组训练样本集;
S302、获取当前的第一组待处理的训练样本集中的第一个待处理的训练样本;
S303、利用人脸检测器,提取训练样本中的人脸图像的人脸框信息,并根据人脸框信息从人脸图像中提取具有人脸特征标定点的人脸区域图像;
S304、对人脸区域图像进行归一化处理,得到归一化人脸图像和归一化人脸图像中的人脸特征标定点,作为该训练样本对应的归一化样本;
S305、判断当前处理的训练样本是否为当前训练样本集中的最后一个待处理的训练样本,如果是,则执行步骤S306,如果不是,则执行步骤 S302;
S306、提取当前训练样本集对应的全部归一化样本,并根据脸部特征标定点在脸部图像中的标定点坐标,确定每个归一化样本对应的归一化坐标后,计算归一化样本对应的平均归一化坐标,得到当前训练样本集对应的初始脸部特征形状;
S307、判断当前训练样本集是否为最后一组待处理的训练样本集,如果是,则执行步骤S308,如果不是,则执行步骤S302;
S308、利用每组训练样本集中的每个训练样本以及该训练样本所属的训练样本集相对应的初始脸部特征形状训练机器学习模型,得到训练后的脸部识别模型。
综上所述,本发明实施例提供的脸部识别模型训练方法所训练的脸部识别模型,既能够达到实时处理的定位速度,又能保持较小的内存占用量,并且解决脸部角度切换时脸部特征点抖动的问题,并且能够对不同的脸部角度的脸部图像进行高精度的人脸特征点定位。
图4示出了本发明一个实施例提供的电子设备的结构示意图。如图4 所示,该电子设备包括:
图像获取模块410,用于获取目标脸部图像;
角度识别模块420,用于根据目标脸部图像的脸部角度,在多个预设脸部角度范围中确定目标脸部图像所属的目标脸部角度范围;
形状确定模块430,用于根据目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状;
模型处理模块440,用于将目标脸部图像和目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。
本发明实施例所述的电子设备可以对人、动物等的脸部特征点进行定位。
在本发明实施例中,能够在获取目标脸部图像之后,根据目标脸部图像的脸部角度所属的目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状,并利用脸部识别模型根据目标初始脸部特征形状,得到该目标脸部图像的脸部特征点,以实现利用仅具有一组模型参数的脸部识别模型,对不同脸部角度的目标脸部图像进行高精度的脸部特征点定位,从而能够解决在检测脸部特征点的过程中,所显示的特征点存在抖动现象的问题。另外,由于脸部识别模型仅具有一组模型参数,使得模型参数的数量较少,脸部识别模型所占用的内容资源较少,从而可以降低电子设备检测脸部特征点的计算量和功耗,提高电子设备的续航时间。
在本发明一些实施例中,预设脸部角度范围包括脸部上下翻转角度范围和/或脸部左右翻转角度范围。
在本发明一些实施例中,电子设备还可以包括:
样本获取模块,用于获取分别对应不同预设脸部角度范围的多组训练样本集,其中,每组训练样本集内所有的训练样本的脸部角度均处于与该组训练样本集相对应的预设脸部角度范围内,且至少两个预设脸部角度范围之间存在交集;
样本处理模块,用于针对每一组训练样本集,对该组训练样本集内的训练样本进行初始化处理,得到与该组训练样本集相对应的初始脸部特征形状;
模型生成模块,用于根据每组训练样本集及与该组训练样本集相对应的初始脸部特征形状之间的映射关系,得到脸部识别模型。
在本发明实施例中,由于脸部识别模型所使用的不同初始脸部特征形状共用同一套模型参数,使得脸部识别模型回归得到的不同脸部角度的脸部特征点会更加稳定,能够尽可能的避免检测脸部特征点时所显示的脸部特征点存在抖动现象的问题。
在本发明一些实施例中,样本处理模块可以具体包括:
样本归一单元,用于对该组训练样本集内的训练样本进行归一化处理,得到归一化样本;
形状生成单元,用于确定归一化样本的平均脸部特征形状,作为与该组训练样本集相对应的初始脸部特征形状。
由于本发明实施例中,多组训练样本集是对训练样本按照不同的预设脸部角度范围进行了有重叠分类所形成的,并且为将训练样本集的平均脸部特征形状作为与该组训练样本集对应的初始脸部特征形状,使得初始脸部特征形状能够很好地表征对应的训练样本集中的样本特征,因此,可以使机器学习模型需要学习的趋势更加统一,有利于机器学习模型更好的学习,在迭代次数相同时,所得到的脸部识别模型收敛效果更好,同时这种趋势的统一性不是强统一,不会出现过拟合,因此实际场景中对于不同脸部角度的脸部图像都能获得更好的脸部特征点定位效果。
在本发明一些实施例中,训练样本包括脸部图像和脸部图像中的脸部特征标定点。此时,形状生成单元还可以具体包括:
坐标确定单元,用于针对每一个归一化样本,根据脸部特征标定点在脸部图像中的标定点坐标,确定该归一化样本对应的归一化坐标;
形状计算单元,用于根据归一化坐标,计算归一化样本对应的平均归一化坐标,作为与该组训练样本集相对应的初始脸部特征形状。
本发明实施例提供的电子设备能够实现图1至图3的方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
图5为实现本发明各个实施例的一种电子设备的硬件结构示意图。如图5所示,该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于:获取目标脸部图像;根据目标脸部图像的脸部角度,在多个预设脸部角度范围中确定目标脸部图像所属的目标脸部角度范围;根据目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状;将目标脸部图像和目标初始脸部特征形状输入脸部识别模型,得到目标脸部图像的脸部特征点。
在本发明实施例中,能够在获取目标脸部图像之后,根据目标脸部图像的脸部角度所属的目标脸部角度范围,确定目标脸部图像对应的目标初始脸部特征形状,并利用脸部识别模型根据目标初始脸部特征形状,得到该目标脸部图像的脸部特征点,以实现利用仅具有一组模型参数的脸部识别模型,对不同脸部角度的目标脸部图像进行高精度的脸部特征点定位,从而能够解决在检测脸部特征点的过程中,所显示的特征点存在抖动现象的问题。另外,由于脸部识别模型仅具有一组模型参数,使得模型参数的数量较少,脸部识别模型所占用的内容资源较少,从而可以降低电子设备检测脸部特征点的计算量和功耗,提高电子设备的续航时间。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501 包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与电子设备500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头) 获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器 509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
电子设备500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板 5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与电子设备500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备500内的一个或多个元件或者可以用于在电子设备500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等) 等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
电子设备500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备500包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述脸部特征点定位方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述脸部特征点定位方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read- Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (10)
1.一种脸部特征点定位方法,应用于电子设备,其特征在于,所述方法包括:
获取目标脸部图像;
根据所述目标脸部图像的脸部角度,在多个预设脸部角度范围中确定所述目标脸部图像所属的目标脸部角度范围,多个所述预设脸部角度范围之间存在交集;
根据所述目标脸部角度范围,确定所述目标脸部图像对应的目标初始脸部特征形状;
将所述目标脸部图像和所述目标初始脸部特征形状输入脸部识别模型,得到所述目标脸部图像的脸部特征点,所述脸部识别模型仅具有一组模型参数,
其中,所述脸部识别模型是根据多组训练样本集中每组所述训练样本集及与其相对应的初始脸部特征形状之间的映射关系得到,所述初始脸部特征形状由针对与其所对应的训练样本集内的训练样本进行初始化处理得到,多组所述训练样本集对应不同预设脸部角度范围,且每组所述训练样本集内所有的训练样本的脸部角度均处于与该组所述训练样本集相对应的所述预设脸部角度范围内。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标脸部角度范围,确定所述目标脸部图像对应的目标初始脸部特征形状之前,所述方法还包括:
获取分别对应不同预设脸部角度范围的多组训练样本集,其中,每组所述训练样本集内所有的训练样本的脸部角度均处于与该组所述训练样本集相对应的所述预设脸部角度范围内;
针对每一组所述训练样本集,对该组训练样本集内的训练样本进行初始化处理,得到与该组所述训练样本集相对应的初始脸部特征形状;
根据每组所述训练样本集及与该组所述训练样本集相对应的所述初始脸部特征形状之间的映射关系,得到所述脸部识别模型。
3.根据权利要求2所述的方法,其特征在于,所述对该组训练样本集内的训练样本进行初始化处理,得到与该组所述训练样本集相对应的初始脸部特征形状,包括:
对该组训练样本集内的训练样本进行归一化处理,得到归一化样本;
确定所述归一化样本的平均脸部特征形状,作为与该组所述训练样本集相对应的初始脸部特征形状。
4.根据权利要求3所述的方法,其特征在于,所述训练样本包括脸部图像和所述脸部图像中的脸部特征标定点。
5.根据权利要求4所述的方法,其特征在于,所述确定所述归一化样本的平均脸部特征形状,作为与该组所述训练样本集相对应的初始脸部特征形状,包括:
针对每一个所述归一化样本,根据所述脸部特征标定点在所述脸部图像中的标定点坐标,确定该归一化样本对应的归一化坐标;
根据所述归一化坐标,计算所述归一化样本对应的平均归一化坐标,作为与该组所述训练样本集相对应的初始脸部特征形状。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述预设脸部角度范围包括脸部上下翻转角度范围和/或脸部左右翻转角度范围。
7.一种电子设备,其特征在于,包括:
图像获取模块,用于获取目标脸部图像;
角度识别模块,用于根据所述目标脸部图像的脸部角度,在多个预设脸部角度范围中确定所述目标脸部图像所属的目标脸部角度范围,多个所述预设脸部角度范围之间存在交集;
形状确定模块,用于根据所述目标脸部角度范围,确定所述目标脸部图像对应的目标初始脸部特征形状;
模型处理模块,用于将所述目标脸部图像和所述目标初始脸部特征形状输入脸部识别模型,得到所述目标脸部图像的脸部特征点,所述脸部识别模型仅具有一组模型参数。
8.根据权利要求7所述的电子设备,其特征在于,还包括:
样本获取模块,用于获取分别对应不同预设脸部角度范围的多组训练样本集,其中,每组所述训练样本集内所有的训练样本的脸部角度均处于与该组所述训练样本集相对应的所述预设脸部角度范围内;
样本处理模块,用于针对每一组所述训练样本集,对该组训练样本集内的训练样本进行初始化处理,得到与该组所述训练样本集相对应的初始脸部特征形状;
模型生成模块,用于根据每组所述训练样本集及与该组所述训练样本集相对应的所述初始脸部特征形状之间的映射关系,得到所述脸部识别模型,
其中,所述脸部识别模型是根据多组训练样本集中每组所述训练样本集及与其相对应的初始脸部特征形状之间的映射关系得到,所述初始脸部特征形状由针对与其所对应的训练样本集内的训练样本进行初始化处理得到,多组所述训练样本集对应不同预设脸部角度范围,且每组所述训练样本集内所有的训练样本的脸部角度均处于与该组所述训练样本集相对应的所述预设脸部角度范围内。
9.根据权利要求8所述的电子设备,其特征在于,所述样本处理模块包括:
样本归一单元,用于对该组训练样本集内的训练样本进行归一化处理,得到归一化样本;
形状生成单元,用于确定所述归一化样本的平均脸部特征形状,作为与该组所述训练样本集相对应的初始脸部特征形状。
10.根据权利要求9所述的电子设备,其特征在于,所述训练样本包括脸部图像和所述脸部图像中的脸部特征标定点;
其中,形状生成单元包括:
坐标确定单元,用于针对每一个所述归一化样本,根据所述脸部特征标定点在所述脸部图像中的标定点坐标,确定该归一化样本对应的归一化坐标;
形状计算单元,用于根据所述归一化坐标,计算所述归一化样本对应的平均归一化坐标,作为与该组所述训练样本集相对应的初始脸部特征形状。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911047006.3A CN110969085B (zh) | 2019-10-30 | 2019-10-30 | 脸部特征点定位方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911047006.3A CN110969085B (zh) | 2019-10-30 | 2019-10-30 | 脸部特征点定位方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110969085A CN110969085A (zh) | 2020-04-07 |
CN110969085B true CN110969085B (zh) | 2024-03-19 |
Family
ID=70030170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911047006.3A Active CN110969085B (zh) | 2019-10-30 | 2019-10-30 | 脸部特征点定位方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110969085B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704812A (zh) * | 2017-09-18 | 2018-02-16 | 维沃移动通信有限公司 | 一种人脸识别方法及移动终端 |
CN109101919A (zh) * | 2018-08-03 | 2018-12-28 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109145765A (zh) * | 2018-07-27 | 2019-01-04 | 华南理工大学 | 人脸检测方法、装置、计算机设备和存储介质 |
CN109325437A (zh) * | 2018-09-17 | 2019-02-12 | 北京旷视科技有限公司 | 图像处理方法、装置和系统 |
WO2019196308A1 (zh) * | 2018-04-09 | 2019-10-17 | 平安科技(深圳)有限公司 | 人脸识别模型的生成装置、方法及计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010044214A1 (ja) * | 2008-10-14 | 2010-04-22 | パナソニック株式会社 | 顔認識装置および顔認識方法 |
-
2019
- 2019-10-30 CN CN201911047006.3A patent/CN110969085B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704812A (zh) * | 2017-09-18 | 2018-02-16 | 维沃移动通信有限公司 | 一种人脸识别方法及移动终端 |
WO2019196308A1 (zh) * | 2018-04-09 | 2019-10-17 | 平安科技(深圳)有限公司 | 人脸识别模型的生成装置、方法及计算机可读存储介质 |
CN109145765A (zh) * | 2018-07-27 | 2019-01-04 | 华南理工大学 | 人脸检测方法、装置、计算机设备和存储介质 |
CN109101919A (zh) * | 2018-08-03 | 2018-12-28 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109325437A (zh) * | 2018-09-17 | 2019-02-12 | 北京旷视科技有限公司 | 图像处理方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110969085A (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223143B (zh) | 关键点检测方法、装置及计算机可读存储介质 | |
CN108153422B (zh) | 一种显示对象控制方法和移动终端 | |
CN107977652B (zh) | 一种屏幕显示内容的提取方法及移动终端 | |
CN108427873B (zh) | 一种生物特征识别方法及移动终端 | |
CN108683850B (zh) | 一种拍摄提示方法及移动终端 | |
CN111401463B (zh) | 检测结果输出的方法、电子设备及介质 | |
CN111031234B (zh) | 一种图像处理方法及电子设备 | |
WO2021164760A1 (zh) | 参数调整方法、电子设备 | |
WO2021164730A1 (zh) | 指纹图像处理方法及电子设备 | |
CN111522613B (zh) | 截屏方法及电子设备 | |
KR20210013127A (ko) | 대상 인식 방법 및 이동 단말 | |
CN109618055B (zh) | 一种位置共享方法及移动终端 | |
CN108932505B (zh) | 一种图像处理方法和电子设备 | |
CN111028161A (zh) | 图像校正方法及电子设备 | |
CN110740265B (zh) | 图像处理方法及终端设备 | |
CN111432122B (zh) | 一种图像处理方法及电子设备 | |
CN109189517B (zh) | 一种显示切换的方法及移动终端 | |
CN108628508B (zh) | 一种调整剪裁窗口的方法及移动终端 | |
CN111328132A (zh) | 一种发射功率的调整方法及电子设备 | |
CN108108608B (zh) | 一种移动终端的控制方法及移动终端 | |
CN110969085B (zh) | 脸部特征点定位方法及电子设备 | |
CN111523286B (zh) | 图片显示方法、装置、电子设备及计算机可读存储介质 | |
CN111405226B (zh) | 一种视频会话方法及电子设备 | |
CN109358792B (zh) | 一种显示对象的选取方法及终端 | |
CN109492451B (zh) | 一种编码图像识别方法及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |