WO2020001084A1

WO2020001084A1 - 一种在线学习的人脸识别方法

Info

Publication number: WO2020001084A1
Application number: PCT/CN2019/078474
Authority: WO
Inventors: 陆生礼; 庞伟; 周世豪; 向家淇; 李宇峰; 范雪梅
Original assignee: 东南大学
Priority date: 2018-06-30
Filing date: 2019-03-18
Publication date: 2020-01-02
Also published as: CN109145717B; CN109145717A

Abstract

一种在线学习的人脸识别方法，属于计算推算的技术领域，尤其涉及人脸识别的计算机视觉技术领域。该方法利用外部数据集训练人脸特征提取器，提取本地数据集中各成员对应的参考特征以构成参考特征空间，对比待测试样本的特征向量和参考特征以确定与待测试样本的特征向量最相似的参考特征，在与待测试样本的特征向量最相似的参考特征满足阈值要求时，以与待测试样本的特征向量最相似的参考特征所属成员的身份为待测试样本的身份，否则，返回待测试样本身份识别失败的消息，根据待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的差异更新参考特征空间，适应人脸特征随时间推移发生的变化，尤其适合频繁变更成员的场合。

Description

一种在线学习的人脸识别方法

技术领域

本发明公开了一种在线学习的人脸识别方法，属于计算推算的技术领域，尤其涉及人脸识别的计算机视觉技术领域。

背景技术

人脸识别技术已经广泛运用于门禁、安检、监控等方面，其主要任务是区分数据库中的不同个体并拒绝数据库之外的个体。在实际应用中，人的相貌特征会受到装扮、表情的影响且因姿势、光照而变化，同一个人的正面图片也会随时间的推移而出现不同。为增加算法的鲁棒性，在识别过程中，有必要在特定情况下更新模型。传统的方法是重新收集样本再次训练，这种做法费时费力，难以操作。我们希望人脸识别设备在运行时可以自行调整模型且适应数据集的变化，因此，迫切需要一种操作简单且效果良好的在线学习方法。

现有的在线学习方法通过提取人脸的浅层特征(如：Haar特征、LBP特征)进行比对，在视频中识别并跟踪给定的人脸。在这种应用场景下，把目标人脸和周围的一个或多个人脸区分开，只需要辨别很少的样本；同时，在视频包含的小段时间内，人脸特征变化较小，因此，图像的浅层特征可以在一定程度上表征人脸特征。但是，人脸门禁、考勤等任务需要分辨包含数百人的数据库，在相当长的一段时间内，每个人的相貌都会有所改变，浅层特征难以处理如此复杂的任务。

深度神经网络提高了模型的辨识度，但网络的训练耗费大量的运算资源和时间，变更模型时需要将在离线服务器上训练好的模型重新导入人脸识别设备；另一方面，神经网络结构固定，增加/删除成员时同样需要再次训练，为实际应用带来不便。为使人脸识别技术的使用更灵活且使用范围更广，需要一种简便精确的在线学习方法。

发明内容

本发明的发明目的是针对上述背景技术的不足，提供了一种在线学习的人脸识别方法，以有限的计算资源和简便的操作流程在终端设备实现了模型的训练和更新，解决了现有人脸识别技术在数据集变化时需重新训练模型的技术问题。

本发明为实现上述发明目的采用如下技术方案：

一种在线学习的人脸识别方法，

建立外部数据集：根据研究机构的公开人脸数据库或自行搜集的数据建立外部数据集，示例性地，人脸数据库可以选择CASIA-WebFace、VGG-FACE等公开数据库；也可以自行在网络上抓取公众人物的图片。每张图片都应含有身份标注，指明该图片属于哪个个体。应当收集尽可能多的个体，每个个体包含尽可能多的样本，同时减少数据集中错误标注样本的数量。样本数量和类别数量的增加会提高训练精度，且不会改变人脸特征提取器的结构或增加训练难度；

建立本地数据集：假设由m个人组成本地成员集合U＝{u ₁,u ₂,...,u _m}，给U中的每个成员u _i拍摄n张对应的人脸样本{x _i1,x _i2,...,x _in}，优选地，人脸样本应该是光照正常、表情自然的照片，当条件允许拍摄多张图片时，可以关注表情和姿态的多样性；

训练模型：使用卷积神经网络作为特征提取器，神经网络的输入为彩色图片，神经网络的输出为图片所属类别，分类层的长度等于外部数据集的类别数，损失函数可以采用softmaxloss，需要说明的是，神经网络采用外部数据集训练，因为外部数据集的样本数量和种类远超本地数据集，有利于神经网络学习到更好的特征，损失函数随着误差的反向传播不断下降，训练准确率不断上升，当损失函数收敛并不再继续下降时，保存卷积神经网络模型，把与分类层相连的l维向量作为输入图片的特征向量，特征向量的维度一般远小于类别数量，可以取几十到几百之间，记输入图片x到特征向量的映射为h(x)，用训练好的特征提取器提取本地数据集的样本特征，计算得到每个个体对应的参考特征

其中，n代表人脸库中第i个人的人脸样本个数，建立参考特征空间S＝{y ₁,y ₂,...,y _m}；

预测待测图片所属个体的身份：在视频帧中截取待测者的人脸区域图片，处理所截图片得到待测图片x，使用特征提取器提取待测图片x的特征向量y，y＝h(x)，对所有y _i∈S计算y与y _i的距离d：d _i＝||y-y _i|| ₂，d表征了两个特征之间的相似度。d越大表征特征差距就越大，更进一步地，当d足够大时，可以认为两个特征属于不同的个体，找出S中与y距离最近的参考向量

以及距离

i ^*＝argmin _{i∈{1,2,...,m}}d _i，设定相似度阈值δ，如果

输出

否则输出

u代表模型预测的待测者身份；

在线纠错：当待测者识别失败并希望更新自身特征时，暂停视频流，将待测者输入的身份标签u _T归入本地成员集合U，u _T∈U，系统根据如下公式更新特征空间：

其中：u _T代表待测者的真实身份，由待测者自行提供，u代表待测者的预测身份，y _T代表待测者在参考特征空间中对应的真实特征向量，y代表特征提取器从图片x提取的特征向量，

代表S中与y距离最近的参考向量，η代表表征模型纠错幅度的学习率，η∈(0,1)，需要说明的是，较小的η值表示模型更加信任本地数据集预先采集的图片，较大的η值表示模型更信任新采集的图片，特征空间更新完毕后，恢复视频流，继续执行识别功能。

为实现更高效卷积神经网络，在网络中增加了至少一个稠密连接块，每个稠密连接块至少包含两个依次连接的卷积层，当前卷积层输出的特征图和该卷积层之前所有卷积层输出的特征图拼接后作为至下一卷积层的输入特征图，每一个稠密连接块输出的特征图都经降采样后传输至下一稠密连接块的输入端，优选地，输入卷积神经网络的彩色人脸图片经多个等步长的卷积层和降采样层的处理后得到输入第一个稠密连接块的特征图，对最后一个稠密连接块输出的特征图再进行卷积操作和均值池化操作得到输入至分类层的特征向量。

进一步的，本申请还提供了一种添加/删除成员后无需重新训练模型的人脸识别方法，添加成员时，新成员完成一次人脸识别过程后提供自己的真实身份标签u _k，

暂停视频流传输，保存当前输入图片x及特征提取器从当前图片提取的特征向量y，更新本地成员集合为U′，U′＝U∪u _k，更新参考特征空间为S′，S′＝S∪y，更新完毕后恢复视频流；删除成员时，暂停视频流传输，在本地成员集合U和参考特征空间S中移除待删除成员的信息，恢复视频流。

本申请还提供了一种实现上述人脸识别方法的终端设备，该设备包括：存储器、处理器及存储在存储器上并在处理器上运行的计算机程序，处理器执行所述程序时实现以下步骤：利用外部数据集训练人脸特征提取器，提取本地数据集中各成员对应的参考特征以构成参考特征空间，对比待测试样本的特征向量和参考特征以确定与待测试样本的特征向量最相似的参考特征，在与待测试样本的特征向量最相似的参考特征满足阈值要求时，以与待测试样本的特征向量最相似的参考特征所属成员的身份为待测试样本的身份，否则，返回待测试样本身份识别失败的消息，根据待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的差异更新参考特征空间。

本发明采用上述技术方案，具有以下有益效果：

(1)本发明提出了一种在终端动态更新人脸识别模型、添加或删除成员的方法，该方法通过灵活调整从本地数据集提取的参考特征空间以适应数据集的变化，实现了人脸识别模型的离线更新，相比于重新收集样本再次训练的传统方法，操作简单，计算量小，可以更好地适应人脸特征随时间推移而发生的变化，尤其适合需要频繁变更成员的场合；

(2)本发明通过稠密连接的卷积神经网络实现特征提取，通过连接若干同步长的卷积层构成稠密连接层，每个卷积层的输出特征图和之前卷积层的所有输出特征图拼接后作出下一卷积层的输入特征图，强化了特征复用，提升了网络性能，减少了参数数量和运算量，鲁棒性更强，适用范围更广。

附图说明

图1是本方法的人脸识别流程图。

图2是数据集的人脸截取样例。

图3是本发明在线学习的流程图。

图4是稠密连接块的结构示意图。

具体实施方式

为了更清楚地说明本发明的特征，下面结合附图和具体实施方式进行进一步的详细描述。需要说明的是，以下的阐述提到了许多具体细节以便于充分理解本发明，本发明包括但不限于以下实施方例。

图1给出了根据本发明人脸识别方法的流程图，该人脸识别方法包括以下五个步骤。

步骤一、建立外部数据集：采用CASIA-WebFace数据库作为外部数据集，图2给出了经过处理的CASIA-WebFace数据库的样本实例，如图2所示，人脸框应该比较紧密地贴合人脸边缘，所有图片缩放成卷积神经网络的输入尺寸。如从其它数据集获取外部数据集，也需要遵循人脸框紧密地贴合人脸边缘以及图片满足神经网络输入图片尺寸要求的处理方式。

步骤二、建立本地数据集：拍摄十个人的脸部照片，拍摄每一个人表情和姿态不同的多张人脸样本图片。

步骤三、建立卷积神经网络：以外部数据集合为样本集训练人脸特征提取器：本申请涉及了一种更高效的卷积神经网络，如图4所示，神经网络的输入是160*160像素的彩色人脸图片，彩色人脸图片首先依次经过三个步长为1的卷积层和一个降采样层得到80*80的特征图，80*80的特征图随后输入至第一个稠密连接块做为第一个稠密连接块的输入特征图。稠密连接块包含三个卷积层，输入特征图首先输入卷积层1，输入特征图与卷积层1的输出特征图拼接后输入卷积层2；卷积层1和卷积层2的输出特征图拼接后输入卷积层3。将卷积层3的输出特征图降采样到40*40后输入下一个稠密连接块，重复相同的操作。经过三个稠密连接块后，特征图大小变为20*20，20*20的特征图随后经过两次步长为2的卷积层得到64个3*3的特征图，64个3*3特征图输入均值池化层得到64维特征向量。训练时，在分类层输出训练图片所属类别，计算误差并反向传播；测试时，在特征层输出待测图片的特征，训练神经网络直到损失函数收敛，记此时神经网络输入到输出的映射为h(x)。

步骤四、构建参考特征空间：由训练后的人脸特征提取器提取本地样本集的特征，计算得到每个个体对应的参考特征y _i，

本地样本集中各个体对应的参考特征构成参考特征空间S，S＝{y ₁,y ₂,...,y _m}。

步骤五、对比待测样本的预测特征向量和参考特征空间中的各参考特征向量确定待测样本所属个体：使用训练好的特征提取器预测待测图片x的特征向量y，y＝h(x)，对所有y _i∈S，计算y与y _i的距离：d _i＝||y-y _i|| ₂，找出S中与y距离最近的参考特征向量

以及距离

i ^*＝argmin _{i∈{1,2,...,m}}d _i，设定相似度阈值δ，如果

输出

否则，输出

较大的δ代表更宽松的判断标准，宽松的判断标准更倾向于把待测者看作本地数据集的某个成员；较小的δ反之。

在待测试样本识别失败并希望更新自身特征时，如图3所示，暂停视频流，将待测者输入的身份标签u _T归入本地成员集合U，u _T∈U，根据如下三种方式更新特征空间：

第一种：

第二种：

第三种：

更新完毕后恢复视频流。

第一种纠错方式针对将身份为本地成员的待测试者错误识别为本地成员集合中另一成员的情形，通过学习待测试样本的预测特征向量y和待测试样本在参考特征空间中对应的真实特征向量y _T的误差，增强待测试样本的预测特征向量y和待测试样本在参考特征空间中对应的真实特征向量y _T的相似度，降低错误身份对应的参考特征向量

与待测试样本的预测特征向量y的相似度。

第二种纠错方式针对将身份为本地成员的待测试者错误识别为非本地成员的情形，通过学习待测试样本的预测特征向量y和待测试样本在参考特征空间中对应的真实特征向量y _T的误差，增强待测试样本的预测特征向量y和待测试样本在参考特征空间中对应的真实特征向量y _T的相似度。

第三种纠错方式针对将非本地成员的待测试者误识别为本地成员的情形，通过学习待测试样本的预测特征向量y和待测试样本在参考特征空间中对应的真实特征向量y _T的误差，降低错误身份对应的参考特征向量

与待测试样本的预测特征向量y的相似度。

本申请提供的人脸识别方法可在终端设备上实现，该设备包括至少一个包含更新成员按键、一个删除成员按键、一个输入模块、存储有上述人脸识别方法的计算机软件程序的存储器及处理器。示例性的，输入模块可以是供待测者输入自己的身份标签的刷卡装置或键盘。系统暂停视频流传输，保存当次的输入图片x和预测结果。可选地，设备还可以包括获取权限模块。

本发明还提供了一种简便的添加/删除成员方式。添加成员时，新成员完成一次人脸识别过程，通过设备的输入模块提供自己的真实身份标签，发出添加成员指令(待测者按下更新成员按键)后，系统暂停视频流传输，保存当次的输入图片x和特征向量y，更新本地个体集合U′＝U∪u _k，更新参考特征空间S′＝S∪y _k，y _k＝y；删除成员时，待测试者通过输入模块提供待删除的成员标签，发出删除成员(待测试者按下删除成员按键)指令后，系统暂停视频流传输，在本地个体集合U和参考特征空间S中移除待删除成员的信息。通过设备的获取权限模块授予管理员添加/删除成员的权限。

Claims

一种在线学习的人脸识别方法，其特征在于，利用外部数据集训练人脸特征提取器，提取本地数据集中各成员对应的参考特征以构成参考特征空间，对比待测试样本的特征向量和参考特征以确定与待测试样本的特征向量最相似的参考特征，在与待测试样本的特征向量最相似的参考特征满足阈值要求时，以与待测试样本的特征向量最相似的参考特征所属成员的身份为待测试样本的身份，否则，返回待测试样本身份识别失败的消息，根据待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的差异更新参考特征空间。
根据权利要求1所述一种在线学习的人脸识别方法，其特征在于，在待测试样本身份识别失败为将身份为本地成员的待测试样本错误识别为另一本地成员的情形时，通过学习待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的误差，增强待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的相似度，降低错误身份对应的参考特征向量与待测试样本的预测特征向量的相似度。
根据权利要求1所述一种在线学习的人脸识别方法，其特征在于，在待测试样本身份识别失败为将身份为本地成员的待测试者样本识别为非本地成员的情形时，通过学习待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的误差，增强待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的相似度。
根据权利要求1所述一种在线学习的人脸识别方法，其特征在于，在待测试样本身份识别失败为将非本地成员的待测试样本误识别为本地成员的情形时，通过学习待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的误差，降低错误身份对应的参考特征向量与待测试样本的预测特征向量的相似度。
根据权利要求1所述一种在线学习的人脸识别方法，其特征在于，对比待测试样本的特征向量和参考特征以确定与待测试样本的特征向量最相似的参考特征的具体方法为：计算待测试样本的特征向量和所有参考特征的距离，以与待测试样本的特征向量距离最短的参考特征为最相似的参考特征。
根据权利要求1所述一种在线学习的人脸识别方法，其特征在于，添加本地成员时，将新添加成员的身份信息添加至本地数据集，提取新添加成员图片的特征并将所提取的特征添加至参考特征空间。
根据权利要求1所述一种在线学习的人脸识别方法，其特征在于，删除成员时，从本地数据集及参考特征空间移除待删除成员的数据。
根据权利要求1至7中任意一项所述在线学习的人脸识别方法，其特征在于，人脸特征提取器通过包含至少一个稠密连接块的卷积神经网络实现，每个稠密连接块包含至少两个依次连接的同步长卷积层，当前卷积层输出的特征图和该卷积层之前所有卷积层输出的特征图拼接后作为至下一卷积层的输入特征图，每一个稠密连接块输出的特征图都经降采样后传输至下一稠密连接块的输入端。
根据权利要求8所述在线学习的人脸识别方法，其特征在于，对最后一个稠密连接块输出的特征图再进行卷积操作和均值池化操作得到输入至分类层的特征向量。
一种人脸识别终端设备，包括：存储器、处理器及存储在存储器上并在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现以下步骤：利用外部数据集训练人脸特征提取器，提取本地数据集中各成员对应的参考特征以构成参考特征空间，对比待测试样本的特征向量和参考特征以确定与待测试样本的特征向量最相似的参考特征，在与待测试样本的特征向量最相似的参考特征满足阈值要求时，以与待测试样本的特征向量最相似的参考特征所属成员的身份为待测试样本的身份，否则，返回待测试样本身份识别失败的消息，根据待测试样本的预测特征向量与其在参考特征空间中对应的真实特征向量的差异更新参考特征空间。