CN101373514A

CN101373514A - 人脸识别方法和系统

Info

Publication number: CN101373514A
Application number: CNA200710148229XA
Authority: CN
Inventors: 李树德
Original assignee: Individual
Current assignee: IatopiaCom Ltd
Priority date: 2007-08-24
Filing date: 2007-08-24
Publication date: 2009-02-25

Abstract

本发明涉及一种人脸识别方法和系统。所述人脸识别方法包括：检测所捕捉到的图像中的人脸；从所检测到的人脸中提取人脸轮廓并获得多个人脸标志特征向量；根据获得的多个人脸标志特征向量生成动态链接属性图；比较生成的属性图与人脸数据库中的属性图以确定是否匹配。所述人脸识别系统包括服务器子系统和一个或多个客户端子系统。本发明的人脸识别系统是一种全自动和智能的人脸检测和验证系统。本发明使用人脸轮廓图的动态链接模型实现人脸图像的高效存储和识别，可以获得很高的正确识别率。

Description

人脸识别方法和系统

技术领域

本发明涉及生物特征识别技术，更具体地说，涉及一种智能的人脸识别方法和系统。

背景技术

传统的验证方案采用通过安全传输层例如SSL协议由用户使用用户名和密码登录的机制。尽管这一机制能够提供安全的用户验证方案，但是这种机制需要用户先登入用户系统才能获得访问权，这一过程降低了系统的可用性，特别是在客户忘记用户名和密码的情况下，明显降低线上购物站点的用户友好性。使用数字签名的验证机制看起来似乎提供了可行的方案，但是这种技术存在潜在的缺点。首先，数字证书需要存储在用户的PC或笔记本电脑内，这便影响了移动性。尽管新近研发出来的智能卡可以将数字证书嵌入其中，但是如果不能在大部分公共场合例如网吧、酒店等提供这种智能卡读卡器，便仍不能解决移动性的问题。使用生物特征例如指纹、手掌和虹膜识别的其它自动验证机制虽然提供了可行的解决方案，但是都存在上述的各种问题。

从移动性的角度考虑，人脸识别不会存在这一问题。与其它生物特征识别技术例如指纹、虹膜扫描、签名不同的是，人脸识别更加友好和方便，不需要与采集装置有任何物理接触。而且，人脸识别是唯一能够与视频监视系统结合使用的生物特征识别技术。人脸识别技术尤其在法律领域具有很重要的作用，特别在照片是可用于识别某个目标的唯一证据的情况下。从照片中读取和检测罪犯的指纹或虹膜是不可能的，但是通过人脸识别技术，便可以仅仅从一张照片中找出目标。

而且，由于桌面视频会话的广泛流行，数字视频摄像头已经成为桌面型和笔记本电脑的标准外设。换言之，使用人脸识别技术的用户验证不需要担心是否有人脸图像采集设备的问题。此外，这种验证方案能够提供真正的自动验证，用户不需要提供任何身份信息或数据，更重要的是，用户不需要提供任何私秘的个人数据例如指纹和虹膜模本。

因此，人脸识别技术已经成为近二十年来最受关注的研究课题，人脸识别是用于用户验证和访问控制的最有用技术之一。鉴于人脸识别很容易在各种条件下执行，大量的研究都把重点放在开发自动人脸识别系统，在保证相同性能的情况下提供更快的速度和更高的准确性。

目前已经研究出了多种人脸识别技术，这些技术在某种程度上都允许在受控环境下采集的存储在数据库中的人脸图像与在非受控环境中采集的输入人脸图像之间存在差别。这些技术在识别从相近角度采集的、在大小比例、方向上都存在小的偏差的人脸图像方面都已经取得了一些进步。但是这一进步不仅很有限，而且计算复杂、昂贵且速度很慢。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述不足，提供一种识别率高且高效智能的人脸识别方法和系统。

本发明解决其技术问题所采用的技术方案是：提出一种人脸识别方法，包括如下步骤：

(a)检测所捕捉到的图像中的人脸；

(b)从所检测到的人脸中提取人脸轮廓并获得多个人脸标志特征向量；

(c)根据获得的多个人脸标志特征向量生成动态链接属性图；

(d)比较生成的属性图与人脸数据库中的属性图以确定是否匹配。

上述人脸识别方法中，所述步骤(a)进一步包括：使用人脸模板比较所捕捉到的图像，将匹配人脸模板的图像部分分割出来。

上述人脸识别方法中，所述步骤(b)进一步包括：

(b1)使用活动轮廓模型(Active Contour Model，简称为ACM)提取出人脸轮廓；

(b2)使用Gabor特征提取器从所述人脸轮廓中多个标志部分提取出多个特征向量。

上述人脸识别方法中，所述步骤(c)进一步包括：使用弹性图动态链接模型(Elastic Graph Dynamic Link Model，简称为EGDLM)建立所述多个特征向量的属性图。

上述人脸识别方法中，所述步骤(d)进一步包括：判断所生成的属性图与人脸数据库中的属性图之间的偏差是否在允许偏差范围内，若是，则匹配。

本发明为解决其技术问题还提出一种人脸识别系统，所述系统包括：

一个或多个客户端子系统，所述客户端子系统进一步包括：

用于检测所捕捉到的图像中的人脸的人脸检测模块；

用于从所检测到的人脸中提取人脸轮廓并获得多个人脸标志特征向量的特征提取模块；

通过网络与所述一个或多个客户端子系统连接的服务器子系统，所述服务器子系统进一步包括：

用于根据获得的多个人脸标志特征向量生成动态链接属性图的动态链接初始化模块；

用于比较生成的属性图与人脸数据库中的属性图以确定是否匹配的弹性图匹配模块；

存储人脸模型的人脸数据库。

上述人脸识别系统中，所述特征提取模块进一步包括：用于提取出人脸轮廓的活动轮廓模型模块，和从所述人脸轮廓中多个标志部分提取出多个特征向量的Gabor特征提取器。

上述人脸识别系统中，所述客户端子系统还包括有用于将所提取到的人脸标志特征向量发送给服务器子系统并接收匹配结果的客户端通信模块，所述服务器端子系统还包括有接收客户端子系统发送的人脸标志特征向量并返回匹配结果的服务器端通信模块。

上述人脸识别系统中，所述客户端通信模块和服务器端通信模块通过有线或无线网络通信。

实施本发明的人脸识别方法和系统，具有以下有益效果：本发明的人脸识别系统是一种全自动和智能的人脸检测和验证系统。本发明不仅提供了一种便携、鲁棒、多样的验证系统，还提供了一种有效且高效的人脸识别方案。本发明的另一个显著特征是，使用人脸轮廓图的动态链接模型实现人脸图像的高效存储和识别，这一点对于web站点例如线上购物中心等的人脸数据库管理来说是非常重要的，因为他们每小时要验证数以千计的顾客。本发明的人脸识别系统已经从以下四个方面经过了评估，结果显示其可以获得很高的正确识别率。

试验中使用包含100个人脸图像的肖像集来对系统进行训练。训练中使用了一组1020个测试样本，产生自具有不同的脸部表情、视角和大小的人脸。该组测试用人脸样本使用提供标准视频信号的CCD摄像头捕捉到，为512×384像素，并具有8比特的分辨率。用于执行测试并测量该系统性能的计算机系统为SUN-Sparc20工作站。

1、人脸图像亮度测试

在亮度测试中，使用具有不同亮度的100个测试样本进行识别，其亮度变化范围为正常亮度的+30％到-30％，实验结果如下表1。

表1.亮度测试结果

亮度	+30％	+20％	+10％	正常	-10％	-20％	-30％
亮度	+30％	+20％	+10％	正常	-10％	-20％	-30％	正确识别率	80％	86％	92％	95％	91％	88％	79％

由表1可以看出，本发明的系统基本不受图像亮度级的影响，主要是因为活动轮廓模型的“亮度不变性”特性，平均可以达到85％的正确识别率。

2、观察视角测试

在这一测试中，所使用的100个人脸样本的视角在-30°到+30°的范围内变化(基于横轴和纵轴)，识别结果如下表2。

表2.视角测试结果

视角(相对于横轴)	正确识别率	视角(相对于纵轴)	正确识别率
视角(相对于横轴)	正确识别率	视角(相对于纵轴)	正确识别率	+30°	84％	+30°	86％
+20°	90％	+20°	88％	+30°	84％	+30°	86％
+20°	90％	+20°	88％	+10°	92％	+10°	91％
-10°	91％	-10°	92％	+10°	92％	+10°	91％
-10°	91％	-10°	92％	-20°	89％	-20°	87％

-30°

85％

-30°

82％

根据动态链接模型的“旋转不变性”，因此在弹性图匹配过程中，弹性图动态链接模型具有相同的特性，由表2可以看出，可以达到超过86％的正确识别率。

3、人脸图像扩张/收缩测试

这一测试使用了300个测试样本，局部收缩比例在-30％(样本收缩)到+30％(样本扩张)之间，获得的识别结果如表3所示。

表3.人脸样本扩张/收缩测试

源于弹性图动态链接模型的“弹性图匹配”特性，本发明的系统具有“扩张/收缩不变性”，整体的正确识别率可以达到85％。

4、人脸图像遮挡和扭曲测试

该测试将120个测试样本分为三个类别：第一类，带眼镜或其它装饰品；第二类，脸部部分被其它物体例如杯子、书等遮挡；第三类，脸部具有各种不同的表情，例如笑脸、生气的脸、欺骗的脸等。所获得的测试结果如下表4所示。

表4.脸部遮挡/扭曲的识别测试

遮挡/扭曲	正确识别率
遮挡/扭曲	正确识别率	带眼镜或其它装饰品	87％
脸部部分遮挡(例如书、杯子)	72％	带眼镜或其它装饰品	87％
脸部部分遮挡(例如书、杯子)	72％	脸部带表情(例如笑、生气、欺骗)	83％

比较上述的三类人脸，“带眼镜”对识别的影响最小，因为人脸的主要轮廓仍然呈现出来了。第二类的情况下，对识别率的影响主要取决于遮挡的比例以及被遮挡的部位。尽管如此，还是可以达到73％以上的平均正确识别率。带面部表情的人脸的识别结果最显著，这是因为采用了弹性图动态链接模型，该识别系统具有“扭曲不变性”特性，总体的正确识别率可以到达83％。

附图说明

图1是本发明人脸识别系统的一个实施例的结构示意图；

图2是本发明人脸识别方法的一个实施例的流程图；

图3是根据本发明一个实施例检测图像中的人脸的示意图；

图4是根据本发明一个实施例使用活动轮廓模型提取人脸轮廓的示意图；

图5是根据本发明一个实施例提取人脸标志特征的示意图。

具体实施方式

下面将结合附图及实施例对本发明作进一步说明：

如图1所示，本发明的人脸识别系统主要包括两个子系统，一个是位于客户端(例如客户的桌面电脑、安全接入点等)的客户端子系统100，另一个是位于服务器端(例如线上购物中心、安全控制中心等)的服务器端子系统300。客户端子系统100与服务器端子系统300之间通过有线或无线网络连接，例如，两者之间通过互联网200进行通信和信息传递。

在本发明的人脸识别系统中运行有两种类型的智能代理。客户端子系统100进一步包括人脸检测模块104、活动轮廓模型模块106、Gabor特征提取器108以及客户端通信模块110。其中，人脸检测模块104是固定代理，自动检测从客户端的数字摄像头102捕捉到的图像并将检测到的人脸分割出来。ACM模块106是固定代理，从人脸检测模块104检测到的人脸中提取人脸轮廓。Gabor特征提取器108是固定代理，用于从人脸轮廓中提取出人脸标志部分(Landmark)的多个特征向量。客户端通信模块110是用于传送信息的移动代理，一方面将提取出的人脸特征向量发送给服务器子系统300，另一方面将服务器子系统的匹配结果以及最新的状态信息返回给客户端设备。

服务器子系统300进一步包括服务器端通信模块302、动态链接初始化模块304、弹性图匹配模块306。其中，服务器端通信模块302是用于传送信息的移动代理，用于接收客户端子系统100传送过来的人脸特征向量，并将匹配结果返回给客户端子系统100。动态链接初始化模块304是位于服务器(例如线上购物中心、安全控制中心等)内的固定代理，主要任务是使用弹性图动态链接模型建立多个特征向量的属性图。弹性图匹配模块306是固定代理，用于将检测到的人脸的属性图与人脸数据库内的人脸模本进行比较。此外，服务器子系统300还包括存储人脸模本的人脸数据块，该人脸数据库也可以位于并非服务器本地的远端。

本发明的人脸识别系统所执行的识别过程如图2所示。当需要识别某用户时，本发明从步骤400开始，然后该系统所执行的主要流程如下：

步骤402：客户端的摄像头捕捉用户所在的场景图像。

步骤404：人脸检测模块检测捕捉到的场景图像中出现的人脸，并对人脸进行包络和分割。

步骤406：ACM模块从人脸图像中提取出人脸轮廓。

步骤408：Gabor特征提取器从人脸轮廓中提取出人脸标志部位的多个特征向量。

步骤410：使用弹性图动态链接模型建立所述多个特征向量的属性图。

步骤412：通过弹性图匹配模块比较生成的属性图与人脸数据库中人脸模本的属性图。

步骤414：判断所生成的属性图与人脸数据库中人脸模本的属性图是否在存在匹配。系统设置了一定的允许偏差，若二者之间存在的匹配偏差在系统允许的范围内，则视为二者匹配，在步骤416中，该户成功通过识别，可以继续后续操作。

若步骤414中判断出生成的属性图与人脸数据库中的模本不相匹配，则返回步骤402。

以下将具体介绍本发明人脸识别方法中的特征提取和匹配过程。首先，在客户端进行人脸特征提取。

步骤404中，在收到客户端的摄像头102(网络摄像头、数字摄像机、监视摄像头等)捕捉到的场景图像后，如图3所示，人脸检测模块104自动检测捕捉到的场景内的任何可能出现有人脸的区域。这时，人脸检测模块104可以利用经过预处理的人脸模板(例如，从FRET和Yale人脸数据库获得)对捕捉到的场景图象进行匹配。所有的人脸模板可以通过haar小波变换提取出来，并以XML的格式存储在判定树(decision tree)内。基于人脸模版检测到场景中出现人脸后，人脸检测模块104对该区域进行包络，将人脸502分割出来以用于特征提取。实际上，人脸检测模块104除了可以检测单个用户的人脸以用于一般的用户验证之外，还可以检测捕捉到的场景中的多个人脸，如图3所示。

步骤406中，活动轮廓模型模块106使用蛇形(snake)曲线600提取人脸轮廓，如图4所示。Snake曲线600为构成人脸初始状态(即人脸模板)的连续曲线，在人脸图像上动态地变形(504)。Snake曲线的形状由曲线本身的内力和图像数据的外力所控制。内力起平滑约束作用，保持人脸模板形状的平滑，而外力则引导snake曲线向人脸图像特征移动，最终使snake曲线达到一个新的平衡(506)。通过表示snake曲线拉伸的隔膜能(membrane energy)与表示snake曲线弯曲的薄板能(thin-plate energy)之和，可以得出以下snake能量：

E_int(u(s))＝αs)|u_s(s)|²+β(s)|u_ss(s)|² (1)

其中，u(s)＝(x(s)，y(s))即为snake曲线，s表示该曲线的弧长。弹性参数α和β控制snake曲线的平滑度。

snake曲线的变形受外力的控制。这些外力与势能P(x，y)有关，势能P(x，y)一般依据经高斯函数卷积积分的图像的梯度来定义：

P (x, y) = - | &dtri; (G (x, y) * I (x, y)) | - - - (2)

或者作为边缘点(edge point)的距离图(distance map)：

P (s, y) = d (x, y), P (x, y) = - e^{- d {(x, y)}^{2}} - - - (3)

其中，d(x，y)表示像素(x，y)与其最近边缘点之间的距离。Snake曲线在势位场的作用下移动进而凹陷，就好像受到地心引力的作用。

Snake曲线的总能量由以下能量函数之和来表示：

E_{snake} = {&Integral;}_{0}^{1} E_{int} + E_{ext} ds = {&Integral;}_{0}^{1} α (s) {| u_{s} (s) |}^{2} + β (s) {| u_{ss} (s) |}^{2} + P (u (s)) ds - - - (4)

Snake曲线能量的最小值满足欧拉-拉格朗日(Euler-Lagrange)方程及边界条件：

- \frac{d}{ds} ({αu}_{s} (s)) + \frac{d^{2}}{{ds}^{2}} ({βu}_{ss} (s)) + &dtri; P (u (s)) = 0 - - - (5)

步骤408中，Babor特征提取器108依据人脸模板内定义的50个人脸标志(例如，鼻子、眼睛、眉毛、嘴、脸型轮廓等)，使用具有15个不同频带(φ)和8个不同方向(θ)的Gabor滤波器，可以自动从这些标志部位提取出总共120个具有不同属性的特征向量，如图5所示。Gabor滤波器的函数如下：

g_{φ, θ} (x, y) = \frac{1}{σ \sqrt{π}} e^{(- \frac{x^{2} + y^{2}}{{2 σ}^{2}})} e^{2 πiφ (x \cos θ + y \sin θ)} - - - (6)

步骤410中，服务器端的动态链接初始化模块304在从服务器端通信模块302接收到客户端传来的人脸特征向量信息后，建立属性图(即弹性图)。在动态链接初始化过程中，生成的人脸属性图与人脸数据库中的属性图目标之间的动态链接(z_ij，kl)根据以下规则进行初始化：

z_ij，kl＝εJ_ijJ_kl (7)

for J_ij∈A，J_kl∈B.

其中，Js是从人脸标志中提取出来的特征向量，ε是0到1之间的参数值，A和B分别表示捕捉到的人脸的弹性图和人脸数据库内的弹性图。

然后步骤412中，在弹性图匹配模块内，通过最小化能量函数H(z)来将捕捉到的人脸图像的属性图与人脸数据库内每个存储的人脸模本的属性图进行匹配，其允许的匹配偏差为μ：

H (z) = - \underset{i, j &Element; B, k, l &Element; A}{Σ} z_{ij} z_{jl} z_{ik} z_{kl} + γ \underset{i &Element; B}{Σ} {(\underset{k &Element; A}{Σ} z_{ik} - 1)}^{2} + γ \underset{k &Element; A}{Σ} {(\underset{i &Element; B}{Σ} z_{ik} - 1)}^{2} - - - (8)

H(z)可使用梯度下降来最小化：

z_{ij} (t + 1) = {[z_{ij} (t) - η \frac{&PartialD; H (z (t))}{{&PartialD; z}_{ij (t)}}]}^{w} - - - (9)

其中，[...]^w表示被限制在[0，w]的范围内的z_ij的值。达到平衡时(位于选定的允许偏差μ的范围内)，H(z)被最小化，即找到匹配的人脸模本。若找到位于允许偏差范围内的人脸模本，则该用户通过识别。

本发明的人脸识别方法和系统可以应用于各个方面。例如，本发明可以替代配备有摄像头的桌面电脑、笔记本电脑等设备现有的由密码保护的屏保，提供一种基于人脸识别的屏幕保护。类似于设置密码，用户可以事先建立授权用户人脸数据库。除了屏保登录之外，本发明的系统还可以与Windows、MacOSX、Linux等系统结合，以提供基于人脸识别的登录系统。此外，本发明还可用来进行文件加密和保护。本发明的自动人脸检测特征还可以用于照相机自动图像聚焦系统，本发明只需要花0.1秒的时间便可以捕捉并检测出一张640x320像素的图像中出现的所有人脸，因此可以为照相机等类似设备提供高效的图像聚焦和光学控制。此外，本发明的人脸识别方法和系统还可以应用于访问控制领域，例如门禁系统。

Claims

1.一种人脸识别方法，其特征在于，所述方法包括如下步骤：

(a)检测所捕捉到的图像中的人脸；

(c)根据获得的多个人脸标志特征向量生成动态链接属性图；

2.根据权利要求1所述的人脸识别方法，其特征在于，所述步骤(a)进一步包括：使用人脸模板比较所捕捉到的图像，将匹配人脸模板的图像部分分割出来。

3.根据权利要求1所述的人脸识别方法，其特征在于，所述步骤(b)进一步包括：

(b1)使用活动轮廓模型提取出人脸轮廓；

4.根据权利要求1所述的人脸识别方法，其特征在于，所述步骤(c)进一步包括：使用弹性图动态链接模型建立所述多个特征向量的属性图。

5.根据权利要求1所述的人脸识别方法，其特征在于，所述步骤(d)进一步包括：判断所生成的属性图与人脸数据库中的属性图之间的偏差是否在允许偏差范围内，若是，则匹配。

6.一种人脸识别系统，其特征在于，所述系统包括：

一个或多个客户端子系统，所述客户端子系统包括：

用于检测所捕捉到的图像中的人脸的人脸检测模块；

通过网络与所述一个或多个客户端子系统连接的服务器子系统，所述服务器子系统包括：

存储人脸模型的人脸数据库。

7.根据权利要求6所述的人脸识别系统，其特征在于，所述特征提取模块进一步包括：

用于提取出人脸轮廓的活动轮廓模型模块；

从所述人脸轮廓中多个标志部分提取出多个特征向量的Gabor特征提取器。

8.根据权利要求6所述的人脸识别系统，其特征在于，所述客户端子系统还包括有用于将所提取到的人脸标志特征向量发送给服务器子系统并接收匹配结果的客户端通信模块，所述服务器端子系统还包括有接收客户端子系统发送的人脸标志特征向量并返回匹配结果的服务器端通信模块。

9.根据权利要求7所述的人脸识别系统，其特征在于，所述客户端通信模块和服务器端通信模块通过有线或无线网络通信。