WO2023019699A1

WO2023019699A1 - 一种基于3d人脸模型的俯角人脸识别方法及系统

Info

Publication number: WO2023019699A1
Application number: PCT/CN2021/122347
Authority: WO
Inventors: 王中元; 吴浩; 黄宝金; 王光成; 曾康利
Original assignee: 武汉大学
Priority date: 2021-08-16
Filing date: 2021-09-30
Publication date: 2023-02-23
Also published as: CN113705393A

Abstract

一种基于3D人脸模型的俯角人脸识别方法及系统，通过将人脸样本库中清晰正脸转成与待识别的俯角人脸相同的角度进行识别。首先，采集清晰正脸图片构建人脸样本库，并将样本库中正脸图片生成3D人脸模型；然后，使用人脸姿态估计算法估计待识别俯角人脸图片的角度，并将3D人脸模型转成与俯角人脸图片相同的角度；最后，将生成的俯角人脸和待识别俯角人脸一起输入到人脸识别网络中进行识别。上述方法针对实际的俯视监控场景下的人脸识别难题，显著改善了俯角人脸的识别精度。

Description

一种基于3D人脸模型的俯角人脸识别方法及系统

技术领域

本发明属于计算机视觉技术领域，涉及一种监控视频的俯角人脸识别方法及系统，具体涉及一种基于3D人脸模型的俯角人脸识别方法及系统。

技术背景

公安机关通过监控摄像头拍摄和记录视频图像，利用人脸识别技术追踪目标嫌疑人，锁定犯罪分子的身份。然而，公共监控摄像头通常安放在电线杆、房檐等比较高的位置，拍摄角度通常呈俯视姿态，俯视摄像采集的往往是侧脸、俯角、低清的人脸图片。俯角人脸存在下巴信息缺失、形变严重等问题，使得Arcface、Facenet等通用人脸识别技术的性能急剧下降。

目前的多姿态人脸识别方案主要基于人脸转正和基于多帧信息互补的原理。多姿态人脸转正的目标是在给定变角度人脸图像的情况下利用算法合成正脸，生成对抗网络(Generative Adversarial Networks，GAN)成为人脸转正的主流方案。基于GAN的方法利用人脸左右对称性的原理，将采集到的侧脸图片校正到正脸姿态来提高识别精度。然而，由于俯视人脸缺少侧脸那样可利用的左右对称性，导致下巴自遮挡部分难以估计，直接将GAN多姿态人脸识别方案应用到俯角人脸识别上，并不能取得预期效果。此外，训练GAN网络需要海量数据，训练数据集过小会导致生成的正脸图片质量低下。基于视频序列的人脸识别使用多帧信息互补的人脸图片合成单个识别特征，由于需要多帧不同角度的图片进行特征融合，无法用于单张俯角人脸的识别。

总之，社会治安场合的监控摄像头通常高位安装，摄录的俯角人脸图像难以被现有的人脸识别系统准确识别，亟待为俯视监控场景下的人脸识别任务提出有效方案。

发明内容

为了解决上述技术问题，本发明结合3D人脸模型和人脸姿态估计，将人脸样本库中正脸图片转成与待识别俯角人脸相同角度的人脸，再进行识别。由于3D人脸模型旋转和渲染可以应用于任意角度，而不会丢失细节，所以首先将样本库中清晰正脸图片建立成3D人脸模型；然后使用人脸姿态估计算法估计待识别俯角人脸图片的角度并将3D人脸模型转成与俯角人脸图片相同的角度；最后，将生成的俯角人脸和待识别俯角人脸图片一起输入到人脸识别网络中进行识别。由于正脸转俯角人脸是由信息多图片转为信息少的图片，因而有效避免人脸失真现象。

本发明的方法所采用的技术方案是：一种基于3D人脸模型的俯角人脸识别方法，包括以下步骤：

步骤1：俯角人脸样本库的构建；

采集一张人脸正脸图片，将人脸正脸图片输入到3D人脸重建网络，生成3D人脸模型，并按照预设角度间隔旋转3D人脸模型，将其重新映射回2D人脸图片，保存到俯角人脸样本库中；

步骤2：当新输入一张待识别俯角人脸图片时，估计人脸俯角信息，从俯角人脸样本库中选取所有与其最相近的角度的人脸图片，进行人脸识别。

本发明的系统所采用的技术方案是：一种基于3D人脸模型的俯角人脸识别系统，包括以下模块：

模块1，用于俯角人脸样本库的构建；

模块2，用于当新输入一张待识别俯角人脸图片时，估计人脸俯角信息，从俯角人脸样本库中选取所有与其最相近的角度的人脸图片，进行人脸识别。

现有的基于姿态校正的多姿态人脸识别方案中，人脸库存储正面脸图片，识别时，将输入的变姿态人脸校正为正脸后与人脸库中的正脸进行比对。将变姿态人脸校正为正脸的过程系由信息亏损对象转换为信息完整对象的处理，因而难免存在失真，从而影响了后续的人脸识别精度。本发明采取相反的策略，将不同姿态的人脸直接保存到人脸库中(本发明采取3D建模的方式生成正脸的多姿态版本)，直接对输入的变姿态人脸进行识别，而不用事先校正，从而避免了姿态校正带来的失真效应。因此，与现有的多姿态人脸识别方法相比，本发明具有以下的优点与积极效果：

(1)本发明提出了基于3D人脸模型的正脸转俯角人脸的俯角人脸识别方案。该方案不仅可以克服俯角人脸缺少对称性信息的问题，而且由于正脸转俯角人脸是由信息多图片转为信息少的图片，有效避免人脸失真现象。

(2)本发明方法不需要俯角人脸数据集进行训练。采用通用3D人脸模型重建人脸只需要重建人脸正脸图片，计算俯角人脸旋转角度所需要的人脸关键点检测只需要通用人脸数据集。本发明方法在训练过程中均采用通用的人脸数据集，从而避免了俯角人脸数据集缺少的问题。

附图说明

图1：本发明实施例的方法原理框图。

图2：本发明实施例的俯角人脸样本库构建的流程图。

图3：本发明实施例的人脸识别的流程图。

图4：本发明实施例采集的不同俯视角度的人脸图片样例。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施案例对本发明做进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

俯角人脸识别系统与正常人脸识别系统在样本库构建上有所不同，普通人脸识别的样本库只需要正脸，记录对应该人脸的ID和姓名信息，然后在人脸识别过程中，每当输入一张新的待识别人脸图片，就可以直接对库中所有人脸进行检索。但是本发明提出的俯角人脸识别在样本库的构建中增加了3D人脸重建及合成俯角人脸图片的步骤。

俯角人脸识别系统与正常人脸识别系统在人脸识别上有所不同。普通人脸识别直接将待识别人脸与样本库中所有人脸图片进行比较。本发明所提出的俯角人脸识别系统在输入一张待识别人脸图片的时候，对待识别人脸图片的角度进行估计，并从样本库中每个用户ID下角度与之最相近的人脸图片进行比较。

请见图1，本发明提供的一种基于3D人脸模型的俯角人脸识别方法，包括以下步骤：

步骤1：俯角人脸样本库的构建；

首先使用摄像头拍摄人脸正脸图片，将正脸图片输入到3D人脸重建网络，产生3D人脸模型，并按照一定角度间隔旋转3D人脸模型，将其重新映射回2D人脸图片，保存到俯角人脸样本库中。

本实施例中，3D人脸重建网络采用现有的网络，如Prnet，3DDFA-V2。

请见图2，本实施例中，步骤1的具体实现包括以下子步骤：

步骤1.1：首先使用摄像头拍摄一张新用户ID的高清人脸正脸图片。

步骤1.2：使用人脸检测算法RetinaFace检测出人脸正脸图片中的人脸边框，根据人脸边框对人脸图片进行裁剪，裁剪完人脸后，使用3D人脸重建网络生成3D人脸模型。

先利用人脸对齐算法Face_Alignment回归人脸的关键点坐标(68关键点、96关键点、106关键点或者更加稠密的关键点)；再根据人脸关键点坐标将2D人脸映射到3D人脸模型上，得到人脸3D形状信息V＝[v ₁,v ₂,…,v _n]，n表示3D人脸模型的顶点个数，v _i＝[x _i,y _i,z _i] ^T表示顶点的空间位置；然后使用纹理坐标映射获得人脸纹理信息T＝[t ₁,t ₂,…,t _n]，t _i＝[r _i,g _i,b _i] ^T表示顶点的纹理颜色信息；最后将人脸3D形状信息V和人脸纹理信息T进行融合，形成最终的3D人脸模型M＝{V,T}。

步骤1.3：将人脸正脸图片建立出的3D模型按照15°角度间隔进行转换，角度变换公式为：

V _transform＝s*o*R*V+h

其中，s代表3D人脸模型的缩放因子，o是正交矩阵，R是旋转矩阵，h是偏移矩阵。

这样，俯角人脸样本库中每一个用户ID中存储的图片为：原始的真实正脸图片、利用3D人脸模型变换所获得的不同俯角的生成人脸图片，记作：

I _set＝{I ₁,I ₂,…，I _M}

Θ＝{θ ₁,θ ₂,…，θ _n}

其中，I _k表示数据库中存储着用户ID为k的所有人脸角度图片。I _set表示数据库中存储的所有图片，根据用户ID进行分类。Θ表示数据库中保存的人脸图像的角度。具体的角度的个数和角度值不固定，需要综合实验评价和样本库的存储消耗确定。

本实施例将高清正脸人脸图片和经过步骤1.3获得的多张人脸图片共同编号为同一ID，并且根据角度信息命名文件。在数据库的表中新建一个用户ID，里面存储图片的信息。

本实施例为了增加人脸样本库中人脸图片的存储效率和提高人脸识别的速度，本发明采用数据库存储人脸样本库。本发明设计的数据库的表采用MySQL数据库。其中，表的主键为人脸图片的ID号，每一个ID表示每个人的一组图片。每个ID号中包含同一个人的不同角度图片，根据表中的键θ进行区分和检索。其中只有最小的角度θ ₁所在的图片路径为真实收集的人脸图片，其余{θ ₂,…,θ _n}所表示的图片路径均是建立出的合成人脸图片。

步骤2：当新输入一张待识别俯角人脸图片时，利用人脸姿态估计算法估计人脸俯角信息，从俯角人脸样本库中选取所有与其相近的角度的样本库图片，进行人脸识别。

本实施例中，选择现有的人脸姿态估计算法，如PFLD，FSA-Net。

请见图3，本实施例中，步骤2的具体实现包括以下子步骤：

步骤2.1：检测输入图片中人脸所在位置，裁剪人脸区域。

步骤2.2：对待识别人脸进行姿态估计，使用人脸姿态估计算法估计待识别人脸的俯角信息

具体过程如下：

以98个人脸关键点为例，令(x _i,y _i)表示检测到的人脸关键点i的坐标，用d表示人脸关键点之间连线的距离：

其中，A＝y ₁-y ₃₁,B＝x ₃₁-x ₁,C＝x ₁y ₂-x ₂y ₁。(x ₁,y ₁)、(x ₂,y ₂)、(x ₃₁,y ₃₁)、(x ₅₁,y ₅₁)分别代表人脸的第1、2、31、51个关键点的坐标。

则俯角

的计算公式为：

然后在数据库中保存的人脸图像角度Θ中查找一个与待识别人脸图像角度

最接近的角度θ _i，即：找到一个θ _i∈Θ,s.t

有

步骤2.3：将待识别人脸图片和样本库中所有id中角度为θ _i的人脸图片输入到现有的人脸识别网络ArcFace中获得人脸特征向量。并两两之间进行比较，找出相似度最大的两张人脸。

步骤2.4：如果相似度大于设定的阈值ξ则表明相似度最大的两张图片为同一个人，否则表明待识别人脸图片不在样本库中。

在具体的人脸识别过程中，为了提高本算法的俯角人脸识别的精度和速度，本发明设定了阈值ξ，即使用人脸姿态估计算法估计待识别人脸图片的俯角姿态时，当待识别人脸图片俯角θ≤ξ时,直接将待识别人脸图片与人脸样本库中正脸图片进行相似度比较。

本发明采集真实的俯角人脸样本进行了实验，部分人脸样例如图4所示。表1显示了不同俯角时人脸识别精度的结果，可以看出，在15°、30°等低度俯角时，ArcFace直接识别的精度更高，但在45°、60°、75°等高度俯角时，本发明方法的精度明显提升，尤其在75°时，精度提高了10％以上。

表1

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

一种基于3D人脸模型的俯角人脸识别方法，其特征在于，包括以下步骤：

步骤1：俯角人脸样本库的构建；

采集一张人脸正脸图片，将人脸正脸图片输入到3D人脸重建网络，生成3D人脸模型，并按照预设角度间隔旋转3D人脸模型，将其重新映射回2D人脸图片，保存到俯角人脸样本库中；

步骤2：当新输入一张待识别俯角人脸图片时，估计人脸俯角信息，从俯角人脸样本库中选取所有与其最相近的角度的人脸图片，进行人脸识别。
根据权利要求1所述的基于3D人脸模型的俯角人脸识别方法，其特征在于：步骤1中，使用人脸检测算法检测出人脸正脸图片中的人脸边框，根据人脸边框对人脸图片进行裁剪，使用3D人脸重建网络按如下过程生成3D人脸模型：

先利用人脸对齐算法回归人脸的关键点坐标；再根据人脸关键点坐标将2D人脸映射到3D人脸模型上，得到人脸3D形状信息V＝[v ₁,v ₂,…,v _n]，n表示3D人脸模型的顶点个数，v _i＝[x _i,y _i,z _i] ^T表示顶点的空间位置；然后使用纹理坐标映射获得人脸纹理信息T＝[t ₁,t ₂,…,t _n]，t _i＝[r _i,g _i,b _i] ^T表示顶点的纹理颜色信息；最后将人脸3D形状信息V和人脸纹理信息T进行融合，形成最终的3D人脸模型M＝{V,T}。
根据权利要求2所述的基于3D人脸模型的俯角人脸识别方法，其特征在于：步骤1中，将人脸正脸图片建立出的3D模型按照15°角度间隔进行转换，获得俯角人脸样本库，角度变换公式为：

V _transform＝s*o*R*V+h

其中，s代表3D人脸模型的缩放因子，o是正交矩阵，R是旋转矩阵，h是偏移矩阵。

所述俯角人脸样本库中每一个用户ID中存储的图片包括：原始的真实正脸图片、利用3D人脸模型变换所获得的不同俯角的生成人脸图片，记作：

I _set＝{I ₁,I ₂,…，I _N}

Θ＝{θ ₁,θ ₂,…，θ _n}

其中，I _k表示数据库中存储着用户ID为k的所有人脸角度图片，其中只有最小的角度θ ₁所在的图片路径为真实收集的人脸图片，其余{θ ₂,…,θ _n}所表示的图片路径均是建立出的合成人脸图片；I _set表示数据库中存储的所有图片，根据用户ID进行分类，N表示用户总数；Θ表示数据库中保存的人脸图像的角度。
根据权利要求1所述的基于3D人脸模型的俯角人脸识别方法，其特征在于，步骤2的具体实现包括以下子步骤：

步骤2.1：检测输入图片中人脸所在位置，裁剪人脸区域；

步骤2.2：对待识别人脸进行姿态估计，估计待识别人脸的俯角信息
然后在俯角人脸样本库中保存的人脸图像角度Θ中查找一个与待识别人脸图像角度
最接近的角度θ _i；

步骤2.3：将待识别人脸图片和俯角人脸样本库中所有用户ID中角度为θ _i的人脸图片输入到人脸识别网络中获得人脸特征向量；并两两之间进行比较，找出相似度最大的两张人脸；

步骤2.4：如果相似度大于设定的阈值ε，则表明相似度最大的两张图片为同一个人，否则表明待识别人脸图片不在俯角人脸样本库中。
根据权利要求4所述的基于3D人脸模型的俯角人脸识别方法，其特征在于：步骤2.2中所述俯角信息
计算方法：

其中，d表示人脸关键点之间连线的距离，(x _i,y _i)表示人脸关键点i的坐标，y ₅₁、y ₃₁表示第51、31个关键点的y坐标。
一种基于3D人脸模型的俯角人脸识别系统，其特征在于，包括以下模块：

模块1，用于俯角人脸样本库的构建；

采集一张人脸正脸图片，将人脸正脸图片输入到3D人脸重建网络，生成3D人脸模型，并按照预设角度间隔旋转3D人脸模型，将其重新映射回2D人脸图片，保存到俯角人脸样本库中；

模块2，用于当新输入一张待识别俯角人脸图片时，估计人脸俯角信息，从俯角人脸样本库中选取所有与其最相近的角度的人脸图片，进行人脸识别。