CN112861579B - 三维面部标志自动检测方法 - Google Patents
三维面部标志自动检测方法 Download PDFInfo
- Publication number
- CN112861579B CN112861579B CN201911182688.9A CN201911182688A CN112861579B CN 112861579 B CN112861579 B CN 112861579B CN 201911182688 A CN201911182688 A CN 201911182688A CN 112861579 B CN112861579 B CN 112861579B
- Authority
- CN
- China
- Prior art keywords
- candidate
- face
- nose
- dimensional
- mouth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请实施例提供一种自动检测三维面部标志的方法,涉及机器学习和模式识别技术领域。该检测方法包括:使用三维局部形状描述符粗略地检测鼻子;利用人脸的对称性等特征对鼻尖进行准确定位;根据人类面部特征的分布确定眼睛和嘴巴所在的区域;使用卷积神经网络最小化组合损失,提供眼角和嘴角的候选对象;根据候选点及其邻点的特征最大化候选点和真实标志之间的相似性,迭代地更新候选对象,实现对眼角和嘴角的准确检测。该方法在仅使用三维面部数据的情况下,实现了高精度的面部标志自动检测,对于面部表情和姿态稳健,其实用性更高。
Description
技术领域
本发明涉及人脸模式识别领域,具体而言,涉及一种自动检测三维面部标志的方法。
背景技术
准确的面部标志检测对于许多科研及应用十分重要,如:人脸识别,人脸动画,表情识别,目标跟踪等。二维人脸图片提供给研究者们丰富的纹理信息,但是对背景、照明、姿态等非常敏感。而基于三维人脸的标志检测方法使用人脸的三维坐标,对于不均匀的照明和变化的姿势都具有鲁棒性。目前大多数三维面部标志检测方法都需要纹理作为附加输入,而在实际采集场景中,纹理并不一定完全与其三维面部数据一致,甚至一些面部三维重建方法根本无法提供纹理数据。因此,研究仅依靠三维数据来检测面部标志是非常有必要的。另外,在实际的场景中,所检测目标的刚性变形(即姿势变化)和非刚性变形(即表情变化)也使检测更加具有挑战性。
发明内容
本发明的目的在于提供一种检测三维面部标志的方法,以实现对面部标志的自动检测,并且能够适应面部的刚性变形和非刚性变形。
为了实现上述目的,本发明实施例采用的技术方案如下:
本发明实施例提供了一种面部标志检测法,所述方法包括:利用三维局部形状描述符作为卷积神经网络的输入进行训练,以粗略地检测鼻子,根据鼻子区域的特征进行得分来精确检测鼻尖;利用面部的分布规律约束眼角和嘴角的位置,从而减少候选者的数量;候选者的局部形状描述符构成了第二个卷积神经网络的输入,通过最小化欧几里德距离损失和结构损失,卷积神经网络提供眼角和嘴角的最相似候选者;最后,候选者根据候选者及其邻居和真实标志的相似性迭代地得分以检测标志。其中,更具有区分度的眼睛和眉毛的内侧会协助检测其对应的外侧。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的面部标志检测方法的流程图;
图2 为本申请实施例提供的高度卷积中心计算方法举例图;
图3 为本申请实施例提供的眼睛和嘴部的角度约束图;
图4为本申请实施例提供的结构误差计算方法举例图;
图5 为本申请实施例提供的对存在表情或姿态的对象的标志检测测试图;
图6 为本申请实施例提供的在Bosphorus数据库中不同绝对距离误差下的人脸标志检测准确率测试结果图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,是本发明实施例提供的一种面部标志检测方法的流程示意图,该方法包括:
步骤110,提取三维局部形状描述符,粗略地检测鼻子。
局部形状描述符可以描述三维数据局部邻域的特征,以区分具有不同分布的三维点云。使用单个三维局部形状描述符通常不能很好地进行区分。因此,本发明实施例结合多种局部形状描述符构成向量,将其归一化形成特征向量以描述每个三维点处的局部形状,使用的三维局部形状描述符包括以下几种:
1.均值
面部五官的每个标志往往都分布在特定的位置附近。
2.方差
对于不同标志,其邻域的范围和离散程度也存在差异。
3.法线
将三维面部点云三角化,每个点作为三角形的顶点,顶点处的法线可以表示为具有不同权重的相邻三角形面的法线之和:
其中c是常数,N是一个点的法线。Ni是点周围的第i个三角面的法线,wi是它的权重(0 <i <n-1,n是相邻面的数量)。Vi和Vi+1是邻面的顶点,αi与邻面的边长有关。
4.曲率
曲率表示了特定点处曲线的弯曲程度,通常被定义为曲线内切圆半径的倒数。通过在三维曲面 上的点处计算其二维正交平面的曲率,曲率的概念可以扩展到三维。在三维曲面上的点处存在无数对正交平面,其中存在曲率最大的,并且其相应的正交曲率最小。这两个曲率被定义为主曲率,代表了曲率的极值,最大值对应的称作第一主曲率,最小值对应的称作第二主曲率。这两个曲率很少直接使用,通常用于计算其他曲率。本发明实施例中采用高斯曲率和平均曲率,计算方法为
其中K是高斯曲率,H是平均曲率,k1和k2分别是第一和第二主曲率。
5.球形图像
球形图像类似于旋转图像。旋转图像描述符提取围绕法线旋转的平面,将这些平面中点的信息存储在直方图中,包含了半径和高度。球形图像是一维区间矢量,提取以一个点为中心的多个连续球体之间点的信息,通常包含了点的个数。本发明实施例添加了法向量以加强效果。
相比于形状指数,Willmore能量,对数微分映射等描述符,以上的局部形状描述符都更容易计算,在描述符提取阶段以及卷积神经网络训练阶段的计算量都很低。
步骤120,鼻子部位根据特征进行得分,对鼻尖进行准确定位。
一般来说,鼻尖是局部最高点。但实际在鼻尖处,存在一个极其微小的平坦区域。三维重建过程中往往对人脸进行采样,这会对仅采用高度来判断鼻尖的方法更加不利。所以,除了高度这一特征之外,鼻尖的候选者得分还依据人脸的对称性。
如果卷积神经网络提供的鼻尖为NO(xo, yo, zo),那么NO附近的若干点的集合N={N 1, N 2…N i …N n , 1<i≤n,n是候选点的数量}是鼻尖的候选者,他们对应的高度为h={z(N 1), z(N 2)…z(N i )…z(N n )},其中z(N i ) 是N i 的z轴坐标。
由人脸的对称性,如果N i 为鼻尖位置,那么以N i 为中心的裁片,其左右部分的高度卷积中心一般为最大值。请参照图2,以N i (x i , y i )为中心的裁片,边上有m个点,在它的左边有一个点N li (x i -δx, yi-δy),以N i 所在位置的竖直线为对称轴,N li 的对称点为N ri (x i +δx, y i -δy),裁片的左右部分的高度卷积中心是c i ,计算公式为:
对于候选者集合N中每一个元素计算其高度卷积中心,构成集合c={ c 1, c 2…c i …c n },c一定程度上反应了N i 是鼻尖的概率。并且c由N i 周围的若干点共同决定,对于个别异常值更加稳健。所以,本发明实施例用h和c来共同计算鼻尖得分,计算公式为:
其中αn和βn是权重。
步骤130,根据人类面部特征的分布确定眼睛和嘴巴所在的区域。
眼睛和嘴部虽然在不同人脸上存在差别,但是它们在面部的位置分布都符合一定的规律。即使在一些强度比较大的动作及表情下,这种规律依然不会被打破。比如,眼睛一般近似对称分布在鼻子上方的左右两侧,嘴部一般对称分布在鼻子下方的左右两侧。特别是当们已经采取了一些方法精确地确定了鼻尖的位置,那么用鼻尖位置对眼角和嘴角位置进行约束,就可以缩小需要查询的范围。
本发明实施例统计了100个个体的人脸器官分布规律,请参照图3,眼角和嘴角的候选者在人脸上的分布范围为:
其中,θeye代表左右眼角与鼻尖连线与人脸对称线的夹角角度,θmouth代表左右嘴角与鼻尖连线与人脸对称线的夹角角度。
步骤140,卷积神经网络最小化组合损失,提供眼角和嘴角的候选对象。
本发明实施例将二维结构损失扩展到三维,并将欧几里德距离损失和结构损失同时用作组合损失以优化结果。结构损失包含标志之间的相关性。
针对一个标志L1 (x1, y1, z1),有一个候选点集合C1={c1 1, c1 2…c1 i…c1 m1, 1<i≤m1, m1是候选点的数量},那么C1 i (x1 i, y1 i, z1 i)和L1之间的欧氏距离差异为:
请参照图4,对于存在于一个器官中的标志L1和L2,C1={c1 1, c1 2…c1 i…c1 m1, 1<i≤m1, m1是L1候选点的数量}是L1的候选点集合,C2 ={c2 1, c2 2…c2 i…c2 m2,, 1<j≤m2, m2是L2候选点的数量}是L2的候选点集合。那么对于C1中的c1 i,它的结构误差lS是c1 i和集合C2中每个元素构成的向量与L1L2差值的最小值,如:
所以,最终最小化的目标为:
其中,α和β分别lE和lS的权重。
步骤150,根据候选点及其邻点的特征,迭代地更新候选对象,直至收敛。
本发明实施例采用不到三个具有更大相似性的候选者及其邻点,并根据曲率、邻域以及结构差异的相似性进行得分。首先采用卷积神经网络提供的最高相似度的候选者及其邻点进行得分,如:
其中K,B和lS分别是高斯曲率,球形图像和结构差异,αe,βe和γe分别是它们的权重。迭代地计算新候选者及其邻点的得分,随着邻点数量减少,当当前候选者和新候选者是相同点时,迭代过程结束。如果迭代没有收敛到局部最小值,将用较少相似的候选者重复上述步骤。应该注意的是,在迭代过程中,候选者必须始终满足步骤130中的约束。
为了验证本发明实施例提供的三维面部标志检测法的有效性,下面通过实验进行说明。
实验采用i7-4790 CPU,实验对象为Bosphorus数据库。请参照图5,是本发明实施例提供的一次面部标志检测结果。请参照图6,是是本发明实施例以不同绝对距离误差为阈值检测人脸标志的准确率。
综上所述,本发明实施例提供了一种自动面部标志检测方法,该方法由粗到细地对人脸上11个标志进行自动检测。该方法对面部表情及轻微姿态的人脸有效。由此可见,本发明实施例实用性更高。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
Claims (6)
1.一种三维人脸标志检测方法,其特征在于,所述方法包括:提取面部三维数据的局部形状描述符,粗略地检测鼻子;鼻子点云利用特征得分,对鼻尖进行准确定位;根据人类面部特征的分布,确定眼睛和嘴巴所在的区域;卷积神经网络最小化组合损失,提供眼角和嘴角的候选对象;根据候选点及其邻点的特征,迭代地更新候选对象,直至收敛,其方法利用组合损失来训练卷积神经网络,可以让区分性更明显的标志来促进区分性不够明显的标志的检测,组合损失的计算方法为:
l=αlE+βlS
其中,α和β分别距离损失lE和结构损失lS的权重,距离损失的计算方法为:
其中,(x1,y1,z1)为标志L1的三维坐标,(x1 i,y1 i,z1 i)是L1的候选点的三维坐标,结构损失的计算方法为:
其中,L1和L2是存在于一个器官中的两个标志,C1和C2分别是L1和L2的候选点集合,m2是L2候选点的数量。
2.如权利要求1所述的方法,其特征在于,融合了多种人脸局部描述符,包括:均值,方差,法线,曲率,球形图像。
4.如权利要求1所述的方法,其特征在于,利用面部的分布规律,合理地减少了检测范围,面部标志的分布规律应满足:15°≤θeye≤75° 24°≤θmouth≤50°
其中θeye代表左右眼角与鼻尖连线与人脸对称线的夹角角度,θmouth代表左右嘴角与鼻尖连线与人脸对称线的夹角角度。
5.如权利要求1所述的方法,其特征在于,当分类器不能提供一个准确的候选者时有限地产生新的候选者,分类器所提供的候选者并不是最终结果,该候选者会根据曲率、邻域以及结构差异的相似性进行得分,计算方法为如:
se=αeK+βeB+γelS
其中K,B和lS分别是高斯曲率,球形图像和结构差异,αe,βe和γe分别是它们的权重,由得分结果迭代地更新候选者,当当前候选者和新候选者是相同点时,迭代过程结束。
6.如权利要求1所述的方法,其特征在于不依赖于特定的假设,不要求鼻尖是面部最高位置;
不要求三维重建方法提供二维纹理,适用性更广。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911182688.9A CN112861579B (zh) | 2019-11-27 | 2019-11-27 | 三维面部标志自动检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911182688.9A CN112861579B (zh) | 2019-11-27 | 2019-11-27 | 三维面部标志自动检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112861579A CN112861579A (zh) | 2021-05-28 |
CN112861579B true CN112861579B (zh) | 2022-10-18 |
Family
ID=75984736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911182688.9A Active CN112861579B (zh) | 2019-11-27 | 2019-11-27 | 三维面部标志自动检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112861579B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834919A (zh) * | 2015-05-20 | 2015-08-12 | 东南大学 | 一种基于轮廓线的三维人脸迭代预处理和特征点提取方法 |
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN109271884A (zh) * | 2018-08-29 | 2019-01-25 | 厦门理工学院 | 人脸属性识别方法、装置、终端设备和存储介质 |
CN109697399A (zh) * | 2017-10-24 | 2019-04-30 | 普天信息技术有限公司 | 一种人脸表情识别方法及装置 |
CN109766866A (zh) * | 2019-01-22 | 2019-05-17 | 杭州美戴科技有限公司 | 一种基于三维重建的人脸特征点实时检测方法和检测系统 |
CN110119676A (zh) * | 2019-03-28 | 2019-08-13 | 广东工业大学 | 一种基于神经网络的驾驶员疲劳检测方法 |
CN110175529A (zh) * | 2019-04-30 | 2019-08-27 | 东南大学 | 一种基于降噪自编码网络的三维人脸特征点定位方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170000748A (ko) * | 2015-06-24 | 2017-01-03 | 삼성전자주식회사 | 얼굴 인식 방법 및 장치 |
US9959455B2 (en) * | 2016-06-30 | 2018-05-01 | The United States Of America As Represented By The Secretary Of The Army | System and method for face recognition using three dimensions |
-
2019
- 2019-11-27 CN CN201911182688.9A patent/CN112861579B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834919A (zh) * | 2015-05-20 | 2015-08-12 | 东南大学 | 一种基于轮廓线的三维人脸迭代预处理和特征点提取方法 |
CN109697399A (zh) * | 2017-10-24 | 2019-04-30 | 普天信息技术有限公司 | 一种人脸表情识别方法及装置 |
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN109271884A (zh) * | 2018-08-29 | 2019-01-25 | 厦门理工学院 | 人脸属性识别方法、装置、终端设备和存储介质 |
CN109766866A (zh) * | 2019-01-22 | 2019-05-17 | 杭州美戴科技有限公司 | 一种基于三维重建的人脸特征点实时检测方法和检测系统 |
CN110119676A (zh) * | 2019-03-28 | 2019-08-13 | 广东工业大学 | 一种基于神经网络的驾驶员疲劳检测方法 |
CN110175529A (zh) * | 2019-04-30 | 2019-08-27 | 东南大学 | 一种基于降噪自编码网络的三维人脸特征点定位方法 |
Non-Patent Citations (2)
Title |
---|
"Accurate 3D Face Reconstruction With Weakly-Supervised Learning: From Single Image to Image Set";Yu Deng etc;《2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW)》;20190617;全文 * |
《基于改进的CNN人脸关键点检测算法研究及应用》;晋振杰;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190215;正文第22-34页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112861579A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10049262B2 (en) | Method and system for extracting characteristic of three-dimensional face image | |
CN106203400A (zh) | 一种人脸识别方法及装置 | |
CN108090830B (zh) | 一种基于面部画像的信贷风险评级方法和装置 | |
JP4414401B2 (ja) | 顔特徴点検出方法および装置並びにプログラム | |
CN108052942B (zh) | 一种飞机飞行姿态的视觉图像识别方法 | |
US8280150B2 (en) | Method and apparatus for determining similarity between surfaces | |
CN108629336A (zh) | 基于人脸特征点识别的颜值计算方法 | |
CN109598196B (zh) | 一种多形变多姿态人脸序列的特征点定位方法 | |
CN106778468A (zh) | 3d人脸识别方法及设备 | |
CN111291701B (zh) | 一种基于图像梯度和椭圆拟合算法的视线追踪方法 | |
CN106778489A (zh) | 人脸3d特征身份信息库的建立方法及设备 | |
WO2020248096A1 (zh) | 基于局部特征的三维人脸识别方法和系统 | |
CN109409298A (zh) | 一种基于视频处理的视线追踪方法 | |
CN104732247B (zh) | 一种人脸特征定位方法 | |
CN110544310A (zh) | 一种双曲共形映射下三维点云的特征分析方法 | |
CN106682575A (zh) | Elm算法的人眼点云特征定位 | |
Chen et al. | Eyes localization algorithm based on prior MTCNN face detection | |
CN106980845B (zh) | 基于结构化建模的人脸关键点定位方法 | |
CN106778491A (zh) | 人脸3d特征信息的获取方法及设备 | |
CN112861579B (zh) | 三维面部标志自动检测方法 | |
CN109886091A (zh) | 基于带权重局部旋度模式的三维人脸表情识别方法 | |
Liu et al. | Shape detection from line drawings with local neighborhood structure | |
CN111680571A (zh) | 基于lda降维的多特征融合的植物叶片识别方法 | |
CN110008902B (zh) | 一种融合基本特征和形变特征的手指静脉识别方法及系统 | |
CN117112963A (zh) | 一种基于最大纵深的道格拉斯-普克算法的改进方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |