CN105426857B

CN105426857B - 人脸识别模型训练方法和装置

Info

Publication number: CN105426857B
Application number: CN201510830359.6A
Authority: CN
Inventors: 张涛; 陈志军; 龙飞
Original assignee: Xiaomi Inc
Current assignee: Xiaomi Inc
Priority date: 2015-11-25
Filing date: 2015-11-25
Publication date: 2019-04-12
Anticipated expiration: 2035-11-25
Also published as: CN105426857A

Abstract

本公开是关于一种人脸识别模型训练方法和装置，该方法包括：获取原始人脸识别模型，所述原始人脸识别模型中包括N层特征系数；获取第二训练样本集，并确定第二训练样本集中的各样本人脸图像的第一原始分类标号；采用原始人脸识别模型的前M层特征系数对第二训练样本集中的各样本人脸图像进行编码，获得编码后的第二训练样本集；其中，编码后的第二训练样本集中包括与各样本人脸图像分别对应的各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号；根据编码后的第二训练样本集对原始人脸识别模型的后N‑M层特征系数进行训练，获得训练后的后N‑M层特征系数，从而获得更加优化的人脸识别模型。

Description

人脸识别模型训练方法和装置

技术领域

本公开涉及通信技术领域，尤其涉及一种人脸识别模型训练方法和装置。

背景技术

人脸识别是指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。在人脸识别的过程，主要包括人脸图像的匹配和识别过程，就是将提取到的待识别的人脸特征与已得到的存储在数据库中的人脸特征模板进行匹配，根据相似程度对人脸图像的身份信息进行判断。因此，能够提取到准确而丰富的人脸特征对于人脸识别的结果具有重要影响。

目前，大多的人脸特征提取方法为人工特征的提取，比如：尺度不变特征转换(Scale-invariant feature transform，SIFT)特征、局部二值模式(Local BinaryPatterns，LBP)特征、梯度直方图(Histogram of Oriented Gradient，HoG)特征等。基于上述人工特征提取方法提取的人脸特征，进行分类器的学习训练，从而得到各种人脸识别模型，采用这些人脸识别模型能够进行人脸图像的识别处理。

发明内容

本公开提供一种人脸识别模型训练方法和装置，用以实现对人脸识别模型的优化。

根据本公开实施例的第一方面，提供一种人脸识别模型训练方法，包括：

获取原始人脸识别模型，所述原始人脸识别模型是使用第一训练样本集对卷积神经网络进行训练后得到的，所述原始人脸识别模型中包括N层特征系数，N≥2；

获取第二训练样本集，并确定第二训练样本集中的各样本人脸图像对应的第一原始分类标号，所述各样本人脸图像是存储于云端人脸相册中的人脸图像；

采用所述原始人脸识别模型的前M层特征系数对所述第二训练样本集中的各样本人脸图像进行编码，获得编码后的第二训练样本集；其中，所述编码后的第二训练样本集中包括与各样本人脸图像分别对应的各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号，N≥M≥1；

根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数。

通过上述方案，为了对使用第一训练样本集对卷积神经网络进行训练后得到的包括N层特征系数的原始人脸识别模型进行优化，首先获得不同于传统第一训练样本集的第二训练样本集。其中，构成第一训练样本集中的各样本人脸图像是通过随机在网络上搜索得到的各人脸图像，样本噪声较大；而第二训练样本集中的各样本人脸图像是存储于云端人脸相册中的人脸图像，样本比较干净。由于第二训练样本集中各样本人脸图像涉及到用户隐私，为了保护用户隐私的同时采用第二训练样本集对原始人脸识别模型进行优化训练，首先为每个样本人脸图像进行标记即为每个样本人脸图像分配一个分类标号，进而采用原始人脸识别模型的前M层特征系数对第二训练样本集中的各样本人脸图像进行编码，即提取各样本人脸图像的前M层特征系数，从而经编码和分类标号标记的各样本人脸图像不会泄露对应的用户隐私。最后，以各编码后特征向量即经M层特征系数编码的各样本人脸图像以及与各编码后特征向量分别对应的分类标号为输入，对原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数，从而获得由原M层特征系数和训练后的后N-M层特征系数构成的优化后的人脸识别模型。由于优化后的人脸识别模型是基于干净的训练样本训练获得的，更加准确、可靠。

可选的，所述根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练更新后的后N-M层特征系数，包括：

对所述编码后的第二训练样本集中的各编码后特征向量进行随机分批处理，获得各批训练样本子集；

依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得经全部各批训练样本子集训练后得到的后N-M层特征系数。

其中，所述依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，包括：

依次以当前一批训练样本子集中的各编码后特征向量为输入，迭代执行如下处理，直到所述全部各批训练样本子集都被执行为止：

对所述原始人脸识别模型的后N-M层特征系数进行训练，得到与所述当前一批训练样本子集中的各编码后特征向量分别对应的第一输出分类标号；

根据预设距离度量方式，确定所述当前一批训练样本子集中的各编码后特征向量分别对应的第一原始分类标号与对应的第一输出分类标号间的距离；

根据各所述距离，确定所述当前一批训练样本子集对应的分类误差率；

若所述分类误差率大于预设阈值，则调整经所述当前一批训练样本子集中的各编码后特征向量对所述原始人脸识别模型的后N-M层特征系数进行训练后得到的后N-M层特征系数；

更新所述当前一批训练样本子集为所述当前一批训练样本子集的下一批训练样本子集。

其中，所述预设距离度量方式包括采用如下任一种距离的距离度量方式：

欧式距离、马氏距离、切比雪夫距离、余弦距离。

通过该分批迭代的方式对原始人脸识别模型的后N-M层特征系数进行训练，使得训练样本随机性较强，并且避免反复调整后N-M层特征系数，使得训练效率得到提高。

进一步地，所述依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得经全部各批训练样本子集训练后得到的后N-M层特征系数之后，所述方法还包括：

获取测试样本集，并确定测试样本集中的各测试人脸图像对应的第二原始分类标号，所述测试样本集中的各测试人脸图像与所述第二训练样本集中的各样本人脸图像不同；

根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，所述更新后的人脸识别模型中包括所述前M层特征系数和所述经全部各批训练样本子集训练后得到的后N-M层特征系数。

其中，所述根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，包括：

分别将所述各测试人脸图像输入到所述更新后的人脸识别模型中，获得所述更新后的人脸识别模型输出的各测试人脸图像分别对应的第二输出分类标号；

根据预设距离度量方式，确定所述各测试人脸图像对应的第二原始分类标号与对应的第二输出分类标号间的距离；

根据各所述距离，确定所述更新后的人脸识别模型的准确度。

通过采用上述测试样本集对训练获得的更新人脸识别模型进行准确度测试，能够及时发现该人脸识别模型的性能优劣。

进一步地，所述根据各所述距离，确定所述更新后的人脸识别模型的准确度之后，还包括：

若所述准确度小于预设准确度阈值，则迭代执行如下处理，直到达到最大迭代次数或准确度大于预设准确度阈值为止：

更新所述第二训练样本集；

根据更新后的第二训练样本集对前一次迭代对应的更新后人脸识别模型中的后N-M层特征系数进行训练，得到本次迭代对应的更新后人脸识别模型；

根据更新的测试样本集对本次迭代对应的更新后人脸识别模型进行准确度测试，确定对应的准确度。

进一步地，所述方法还包括：

确定各次迭代对应的准确度中的最大准确度；

确定与所述最大准确度对应的更新后人脸识别模型为目标人脸识别模型。

通过多次迭代训练、测试的过程，能够保证获得的目标人脸识别模型具有最佳的准确性。

根据本公开实施例的第二方面，提供一种人脸识别模型训练装置，包括：

第一获取模块，被配置为获取原始人脸识别模型，所述原始人脸识别模型是使用第一训练样本集对卷积神经网络进行训练后得到的，所述原始人脸识别模型中包括N层特征系数，N≥2；

第二获取模块，被配置为获取第二训练样本集，并确定第二训练样本集中的各样本人脸图像对应的第一原始分类标号，所述各样本人脸图像是存储于云端人脸相册中的人脸图像；

编码模块，被配置为采用所述原始人脸识别模型的前M层特征系数对所述第二训练样本集中的各样本人脸图像进行编码，获得编码后的第二训练样本集；其中，所述编码后的第二训练样本集中包括与各样本人脸图像分别对应的各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号，N≥M≥1；

训练模块，被配置为根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数。

可选的，所述训练模块包括：

分批处理子模块，被配置为对所述编码后的第二训练样本集中的各编码后特征向量进行随机分批处理，获得各批训练样本子集；

训练子模块，被配置为依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得经全部各批训练样本子集训练后得到的后N-M层特征系数。

其中，所述训练子模块被配置为：

以当前一批训练样本子集中的各编码后特征向量为输入对所述原始人脸识别模型的后N-M层特征系数进行训练，得到与所述当前一批训练样本子集中的各编码后特征向量分别对应的第一输出分类标号；

在所述分类误差率大于预设阈值时，调整经所述当前一批训练样本子集中的各编码后特征向量对所述原始人脸识别模型的后N-M层特征系数进行训练后得到的后N-M层特征系数；

通过上述分批迭代的方式对原始人脸识别模型的后N-M层特征系数进行训练，使得训练样本随机性较强，并且避免反复调整后N-M层特征系数，使得训练效率得到提高。

进一步地，所述装置还包括：

第三获取模块，被配置为获取测试样本集，并确定测试样本集中的各测试人脸图像对应的第二原始分类标号，所述测试样本集中的各测试人脸图像与所述第二训练样本集中的各样本人脸图像不同；

测试模块，被配置为根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，所述更新后的人脸识别模型中包括所述前M层特征系数和所述经全部各批训练样本子集训练后得到的后N-M层特征系数。

其中，所述测试模块包括：

测试子模块，被配置为分别将所述各测试人脸图像输入到所述更新后的人脸识别模型中，获得所述更新后的人脸识别模型输出的各测试人脸图像分别对应的第二输出分类标号；

第一确定子模块，被配置为根据预设距离度量方式，确定所述各测试人脸图像对应的第二原始分类标号与对应的第二输出分类标号间的距离；

第二确定子模块，被配置为根据各所述距离，确定所述更新后的人脸识别模型的准确度。

进一步地，所述装置还包括：

迭代处理模块，被配置为在所述准确度小于预设准确度阈值时，迭代执行如下处理，直到达到最大迭代次数或准确度大于预设准确度阈值为止：

更新所述第二训练样本集；

进一步地，所述装置还包括：

第一确定模块，被配置为确定各次迭代对应的准确度中的最大准确度；

第二确定模块，被配置为确定与所述最大准确度对应的更新后人脸识别模型为目标人脸识别模型。

根据本公开实施例的第三方面，提供一种人脸识别模型训练装置，包括：

处理器；

被配置为存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种人脸识别模型训练方法实施例一的流程图；

图2是卷积神经网络的网络结构示意图；

图3是根据一示例性实施例示出的一种人脸识别模型训练方法实施例二的流程图；

图4是根据一示例性实施例示出的一种人脸识别模型训练方法实施例三的流程图；

图5是根据一示例性实施例示出的一种人脸识别模型训练方法实施例四的流程图；

图6是根据一示例性实施例示出的一种人脸识别模型训练装置实施例一的框图；

图7是根据一示例性实施例示出的一种人脸识别模型训练装置实施例二的框图；

图8是根据一示例性实施例示出的一种人脸识别模型训练装置实施例三的框图；

图9是根据一示例性实施例示出的一种人脸识别模型训练装置实施例四的框图；

图10是根据一示例性实施例示出的一种人脸识别模型训练装置的框图；

图11是根据一示例性实施例示出的另一种人脸识别模型训练装置的框图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种人脸识别模型训练方法实施例一的流程图，如图1所示，该人脸识别模型训练方法包括以下步骤：

在步骤101中，获取原始人脸识别模型，所述原始人脸识别模型是使用第一训练样本集对卷积神经网络进行训练后得到的，所述原始人脸识别模型中包括N层特征系数，N≥2。

本实施例中，采用卷积神经网络构建人脸识别模型。卷积神经网络是人工神经网络的一种，已成为当前语音分析和图像识别领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络，降低了网络模型的复杂度，减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显，使图像可以直接作为网络的输入，避免了传统识别算法中复杂的特征提取和数据重建过程。

卷积神经网络的网络结构如图2所示，卷积神经网络是一个多层的神经网络，每层由多个二维平面组成，而每个平面由多个独立神经元组成。本实施例中，假设基于卷积神经网络获得的人脸识别模型具有N层结构，相邻两层隐层节点间的各个连接的权重系数由第一训练样本集训练确定，为描述方便，本公开实施例中将隐层节点间的连接的权重系数称为特征系数，从而，人脸识别模型具有N层特征系数。

本实施例中，使用第一训练样本集对卷积神经网络进行训练，得到原始人脸识别模型。其中，第一训练样本集由“线下数据”组成，比如是在网络上随机搜索获得的各人脸图像。因此，第一训练样本集中包含的各样本人脸图像中可能具有比较大的噪声，使得基于该第一训练样本集训练获得的原始人脸识别模型的准确性有待提高。

在步骤102中，获取第二训练样本集，并确定第二训练样本集中的各样本人脸图像对应的第一原始分类标号，所述各样本人脸图像是存储于云端人脸相册中的人脸图像。

本实施例中，为了对上述原始人脸识别模型进行优化，采用由“线上数据”构成的第二训练样本集。具体来说，“线上数据”是指第二训练样本集中的各样本人脸图像是存储于云端人脸相册中的人脸图像。其中，人脸相册是对某用户存储在云相册中的照片进行按人脸分类整理得到的。由于各用户上传存储到云端的照片一般都是经过其筛选选出的比较清晰的质量比较好的照片，因此，第二训练样本集中的各样本人脸图像的质量良好，具有更少的噪声。

由于第二训练样本集中的各样本人脸图像是从各用户的人脸相册中获得的，而这些样本人脸图像作为用户的隐私数据，如果直接用于人脸识别模型的训练，可能导致用户隐私数据的泄露，对用户产生不利影响。因此，本实施例中，为了采用质量更佳的样本对原始人脸识别模型进行优化，同时，避免用户隐私数据的泄露，对第二训练样本集中的各样本人脸图像进行分类标号即上述第一原始分类标号的配置。该分类标号用于区分各不同的样本人脸图像，相当于给每个样本人脸图像分配一个编号。

值得说明的是，对于同一个人，第二训练样本集中可能包含有其多张样本人脸图像，可以将对应于同一个人的各样本人脸图像设置相同的分类标号。

通过对各样本人脸图像进行分类标号设置，这样在对原始人脸识别模型进行训练时，通过比较输入分类标号与输出分类标号来确定人脸识别模型的分类结果是否正确，不会泄露对应的样本人脸图像对应的是谁这样的用户隐私信息。

在步骤103中，采用所述原始人脸识别模型的前M层特征系数对所述第二训练样本集中的各样本人脸图像进行编码，获得编码后的第二训练样本集。

其中，所述编码后的第二训练样本集中包括与各样本人脸图像分别对应的各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号，N≥M≥1。

在步骤104中，根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数。

本实施例中，为了避免用户隐私数据的泄露，除了上述分类标号之外，还对第二训练样本集中的各样本人脸图像进行编码处理，以基于编码后的第二训练样本集对原始人脸识别模型进行训练，以优化原始人脸识别模型。

具体来说，采用原始人脸识别模型的前M层特征系数对第二训练样本集中的各样本人脸图像进行编码，获得编码后的第二训练样本集。其中，采用原始人脸识别模型的前M层特征系数对第二训练样本集中的各样本人脸图像进行编码，相当于提取各样本人脸图像中的前M层特征系数。本实施例中，N≥M≥1，一般来说，为了更好地保证用户隐私的同时降低处理负载，M取2或3。

第二训练样本集中的各样本人脸图像经上述M层特征系数编码后，得到对应的各特征向量，称为编码后特征向量。由于每个样本人脸图像具有上述第一原始分类标号，从而，经编码处理后的各编码后特征向量也对应有个第一原始分类标号。

经过上述编码处理后，以编码后的第二训练样本集对原始人脸识别模型的后N-M层特征系数进行训练，即保持前M层特征系数不变，以各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号为输入，对原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数。从而，优化后的人脸识别模型包括原始人脸识别模型的前M层特征系数以及训练后的后N-M层特征系数。

本实施例中，为了对使用第一训练样本集对卷积神经网络进行训练后得到的包括N层特征系数的原始人脸识别模型进行优化，首先获得不同于传统第一训练样本集的第二训练样本集。其中，构成第一训练样本集中的各样本人脸图像是通过随机在网络上搜索得到的各人脸图像，样本噪声较大；而第二训练样本集中的各样本人脸图像是存储于云端人脸相册中的人脸图像，样本比较干净。由于第二训练样本集中各样本人脸图像涉及到用户隐私，为了保护用户隐私的同时采用第二训练样本集对原始人脸识别模型进行优化训练，首先为每个样本人脸图像进行标记即为每个样本人脸图像分配一个分类标号，进而采用原始人脸识别模型的前M层特征系数对第二训练样本集中的各样本人脸图像进行编码，即提取各样本人脸图像的前M层特征系数，从而经编码和分类标号标记的各样本人脸图像不会泄露对应的用户隐私。最后，以各编码后特征向量即经M层特征系数编码的各样本人脸图像以及与各编码后特征向量分别对应的分类标号为输入，对原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数，从而获得由原M层特征系数和训练后的后N-M层特征系数构成的优化后的人脸识别模型。由于优化后的人脸识别模型是基于干净的训练样本训练获得的，更加准确、可靠。

本公开实施例中，在采用编码后的第二训练样本集对原始人脸识别模型的后N-M层特征系数进行训练的过程中，可以依次将每个编码后特征向量和对应的分类标号输入到原始人脸识别模型中，根据原始人脸识别模型输出的分类标号与输入的分类标号之间的误差来确定是否需要调整当前的后N-M层特征系数。但是，这样的训练方式往往可能存在这样的问题：根据前一个样本调整后的后N-M层特征系数，很可能根据后一个样本再向相反的趋势调整，这样导致需要频繁地调整后N-M层特征系数。

为此，本公开实施例提供了一种分批迭代进行后N-M层特征系数的训练、调整的方式：

具体来说，对编码后的第二训练样本集中的各编码后特征向量进行随机分批处理，获得各批训练样本子集；

依次以每批训练样本子集对原始人脸识别模型的后N-M层特征系数进行训练，获得经全部各批训练样本子集训练后得到的后N-M层特征系数。

下面结合图3所示实施例，对上述分批迭代训练过程进行介绍。

图3是根据一示例性实施例示出的一种人脸识别模型训练方法实施例二的流程图，如图3所示，上述步骤104可以通过如下具体的分批迭代处理方式实现：

在步骤201中，对所述编码后的第二训练样本集中的各编码后特征向量进行随机分批处理，获得各批训练样本子集。

本实施例中，假设编码后的第二训练样本集中包含了10000个样本人脸图像对应的编码后特征向量，将这些编码后特征向量分为100个批次，每批100个样本。由于这10000个编码后特征向量中可能存在表征同一个人的多个编码后特征向量，为了更好地保证训练效果，每个批次的100个编码后特征向量是从这10000个编码后特征向量中随机选取的，以大大降低表征同一个人的多个编码后特征向量被划分到一个批次中的概率。

进而，依次以当前一批训练样本子集中的各编码后特征向量为输入，迭代执行如下处理，直到所述全部各批训练样本子集都被执行为止：

在步骤202中，以当前一批训练样本子集中的各编码后特征向量为输入，对所述原始人脸识别模型的后N-M层特征系数进行训练，得到与所述当前一批训练样本子集中的各编码后特征向量分别对应的第一输出分类标号。

在步骤203中，根据预设距离度量方式，确定所述当前一批训练样本子集中的各编码后特征向量分别对应的第一原始分类标号与对应的第一输出分类标号间的距离。

在步骤204中，根据各所述距离，确定所述当前一批训练样本子集对应的分类误差率，确定所述分类误差率是否大于预设阈值，若是，则执行步骤205，否则直接执行步骤206。

在步骤205中，调整经所述当前一批训练样本子集中的各编码后特征向量对所述原始人脸识别模型的后N-M层特征系数进行训练后得到的后N-M层特征系数。

在步骤206中，更新所述当前一批训练样本子集为所述当前一批训练样本子集的下一批训练样本子集。

在步骤206之后，继而重新执行步骤202。

针对当前一批训练样本子集来说，逐一将其中的各编码后特征向量输入到原始人脸识别模型中，分别得到经分类输出的分类标号，即各第一输出分类标号。

可以理解的是，各第一输出分类标号与对应的各第一原始分类标号会存在一定的误差。可以根据诸如欧式距离、马氏距离、切比雪夫距离、余弦距离等预设距离度量方式，分别计算各第一原始分类标号与对应的各第一输出分类标号间的距离。

进而，可以将计算获得的各距离与预设距离阈值进行比较，确定大于预设距离阈值的距离数量占当前一批训练样本子集包含的样本数量的比例，即确定当前一批训练样本子集对应的分类误差率。如果该当前一批训练样本子集对应的分类误差率大于预设阈值，说明当前一批训练样本子集训练获得的后N-M层特征系数不理想，需要进行调整，可以采用梯度下降法等方式进行后N-M层特征系数的调整。调整之后，以下一批训练样本子集为输入，重复上述训练过程。如果当前一批训练样本子集对应的分类误差率小于预设阈值，则说明当前一批训练样本子集训练获得的后N-M层特征系数比较理想，不需要进行调整，可以直接以下一批训练样本子集为输入，重复上述训练过程，直到所有批次的训练样本子集都执行完毕为止。

从而，通过上述分批迭代训练方式，最后获得了经全部各批训练样本子集训练后的后N-M层特征系数。从而，基于训练结果，更新原始人脸识别模型为更新后人脸识别模型，即更新后的人脸识别模型中包括原始人脸识别模型的前M层特征系数以及训练获得的后N-M层特征系数。

本实施例中，通过随机分批、迭代训练方式，对原始人脸识别模型的后N-M层特征系数进行训练，使得训练样本随机性较强，并且避免反复调整后N-M层特征系数，使得训练效率得到提高。

经过上述的基于少噪声的编码后第二训练样本集对原始人脸识别模型的后N-M层特征系数进行训练的训练过程，得到的训练后的后N-M层特征系数应该会更佳准确，但是，其准确性究竟如何，还需要进行测试过程才能最终确定。因此，结合如图4所示的实施例，介绍对更新后的人脸识别模型的测试过程。

图4是根据一示例性实施例示出的一种人脸识别模型训练方法实施例三的流程图，如图4所示，在上述步骤104之后，还包括如下测试的步骤：

在步骤301中，获取测试样本集，并确定测试样本集中的各测试人脸图像对应的第二原始分类标号。

其中，该测试样本集中的各测试人脸图像与上述第二训练样本集中的各样本人脸图像不同。

本实施例中，测试样本集中的各测试人脸图像与上述第二训练样本集中的各样本人脸图像相同，都是存在于云端人脸相册中的人脸图像。但是，为了保证测试的准确可靠，该测试样本集与第二训练样本集中不具有相同的人脸图像。

同样的，为了保证测试样本集中各测试人脸图像对应的用户的用户隐私，为各测试人脸图像设置分类标号即第二原始分类标号。

其中，上述更新后的人脸识别模型即是经分批、迭代训练后对原始人脸识别模型进行更新后得到的人脸识别模型，该更新后人脸识别模型中包括原始人脸识别模型的前M层特征系数和经全部各批训练样本子集训练后得到的后N-M层特征系数。

在获得测试样本集后，根据该测试样本集对更新后的人脸识别模型进行准确度测试，以确定更新后的人脸识别模型的准确度。

在步骤302中，分别将所述各测试人脸图像输入到所述更新后的人脸识别模型中，获得所述更新后的人脸识别模型输出的各测试人脸图像分别对应的第二输出分类标号。

在步骤303中，根据预设距离度量方式，确定所述各测试人脸图像对应的第二原始分类标号与对应的第二输出分类标号间的距离。

在步骤304中，根据各所述距离，确定所述更新后的人脸识别模型的准确度。

在测试过程中，分别将各测试人脸图像输入到更新后的人脸识别模型中，得到更新后的人脸识别模型分类输出的分类标号即第二输出分类标号。进而，根据每个第二输出分类标号与对应的第二原始分类标号的距离，确定更新后的人脸识别模型的准确度。

具体来说，根据诸如欧式距离、马氏距离、切比雪夫距离、余弦距离等预设距离度量方式，分别计算各第二原始分类标号与对应的各第二输出分类标号间的距离。

进而，可以将计算获得的各距离与预设距离阈值进行比较，确定小于或等于预设距离阈值的距离数量占测试样本集包含的样本数量的比例，即确定更新后的人脸识别模型的准确度。

如果该准确度大于一定较高的准确度阈值，则说明更新后的人脸识别模型的准确性良好，以该更新后的人脸识别模型用于后续的人脸识别处理中将会获得很好的识别效果。相反的，如果该准确度小于准确度阈值，说明还需要对该更新后的人脸识别模型进行再训练，以调整其后N-M层特征系数。

如果该准确度小于准确度阈值，需要对该更新后的人脸识别模型进行再训练，具体的再训练过程如图5所示。图5是根据一示例性实施例示出的一种人脸识别模型训练方法实施例四的流程图，如图5所示，若所述准确度小于预设准确度阈值，则迭代执行如下处理，直到达到最大迭代次数或准确度大于预设准确度阈值为止：

在步骤401中，更新所述第二训练样本集。

在步骤402中，根据更新后的第二训练样本集对前一次迭代对应的更新后人脸识别模型中的后N-M层特征系数进行训练，得到本次迭代对应的更新后人脸识别模型。

在步骤403中，根据更新的测试样本集对本次迭代对应的更新后人脸识别模型进行准确度测试，确定对应的准确度。

本实施例中，当需要对基于上述第二训练样本集对原始人脸识别模型进行训练获得的更新后人脸识别模型进行再训练时，首先需要更新第二训练样本集。更新后的第二训练样本集与之前的第二训练样本集不同。

为了区别描述清楚，对基于第一个第二训练样本集对原始人脸识别模型进行训练获得的更新后人脸识别模型，称为第一个更新后人脸识别模型。经过一次更新后的第二训练样本集为第二个第二训练样本集，基于第二个第二训练样本集对第一个更新后人脸识别模型进行训练的过程与对第一个更新后人脸识别模型的训练过程类似，都包括设置分类标号、编码、训练、分类误差率判断等步骤，在此不再赘述。

之后，也可以更新测试样本集，以更新后的测试样本集对第二个更新后的人脸识别模型的准确度进行测试。

可以理解的是，如果第二个更新后的人脸识别模型的准确度大于预设准确度阈值，则可以结束，以该第二个更新后的人脸识别模型作为目标人脸识别模型，以用于后续的人脸识别应用中。

但是，如果在达到最大迭代次数时，都没有获得准确度大于预设准确度阈值的人脸识别模型，则在迭代执行完最大迭代次数后，可以进行如下的处理：

在步骤404中，确定各次迭代对应的准确度中的最大准确度。

在步骤405中，确定与所述最大准确度对应的更新后人脸识别模型为目标人脸识别模型。

也就是说，如果对原始人脸识别模型经过全部迭代过程之后，都没有获得准确度大于预设准确度阈值的一个更新后人脸识别模型，则从各次迭代对应的准确度中确定出最大准确度，并最终确定与该最大准确度对应的更新后人脸识别模型为目标人脸识别模型，以将该目标人脸识别模型用于后续的人脸识别应用中。

以上实施例中，通过多次迭代训练、测试的过程，能够保证获得的目标人脸识别模型具有最佳的准确性。

图6是根据一示例性实施例示出的一种人脸识别模型训练装置实施例一的框图，如图6所示，该装置包括：第一获取模块11、第二获取模块12、编码模块13、训练模块14。

第一获取模块11，被配置为获取原始人脸识别模型，所述原始人脸识别模型是使用第一训练样本集对卷积神经网络进行训练后得到的，所述原始人脸识别模型中包括N层特征系数，N≥2。

第二获取模块12，被配置为获取第二训练样本集，并确定第二训练样本集中的各样本人脸图像对应的第一原始分类标号，所述各样本人脸图像是存储于云端人脸相册中的人脸图像。

编码模块13，被配置为采用所述原始人脸识别模型的前M层特征系数对所述第二训练样本集中的各样本人脸图像进行编码，获得编码后的第二训练样本集；其中，所述编码后的第二训练样本集中包括与各样本人脸图像分别对应的各编码后特征向量以及与各编码后特征向量分别对应的第一原始分类标号，N≥M≥1。

训练模块14，被配置为根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数。

图7是根据一示例性实施例示出的一种人脸识别模型训练装置实施例二的框图，如图7所示，在图6所示实施例的基础上，所述训练模块14包括：分批处理子模块141和训练子模块142。

分批处理子模块141，被配置为对所述编码后的第二训练样本集中的各编码后特征向量进行随机分批处理，获得各批训练样本子集。

训练子模块142，被配置为依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得经全部各批训练样本子集训练后得到的后N-M层特征系数。

其中，所述训练子模块142被配置为：

图8是根据一示例性实施例示出的一种人脸识别模型训练装置实施例三的框图，如图8所示，在上述实施例的基础上，所述装置还包括：第三获取模块21和测试模块22。

第三获取模块21，被配置为获取测试样本集，并确定测试样本集中的各测试人脸图像对应的第二原始分类标号，所述测试样本集中的各测试人脸图像与所述第二训练样本集中的各样本人脸图像不同。

测试模块22，被配置为根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，所述更新后的人脸识别模型中包括所述前M层特征系数和所述经全部各批训练样本子集训练后得到的后N-M层特征系数。

其中，所述测试模块22包括：测试子模块221，第一确定子模块222和第二确定子模块223。

测试子模块221，被配置为分别将所述各测试人脸图像输入到所述更新后的人脸识别模型中，获得所述更新后的人脸识别模型输出的各测试人脸图像分别对应的第二输出分类标号。

第一确定子模块222，被配置为根据预设距离度量方式，确定所述各测试人脸图像对应的第二原始分类标号与对应的第二输出分类标号间的距离。

第二确定子模块223，被配置为根据各所述距离，确定所述更新后的人脸识别模型的准确度。

图9是根据一示例性实施例示出的一种人脸识别模型训练装置实施例四的框图，如图9所示，在图8所示实施例基础上，该装置还包括：迭代处理模块31。

迭代处理模块31，被配置为在所述准确度小于预设准确度阈值时，迭代执行如下处理，直到达到最大迭代次数或准确度大于预设准确度阈值为止：

更新所述第二训练样本集；

进一步的，所述装置还包括：第一确定模块32和第二确定模块33。

第一确定模块32，被配置为确定各次迭代对应的准确度中的最大准确度。

第二确定模块33，被配置为确定与所述最大准确度对应的更新后人脸识别模型为目标人脸识别模型。

关于上述实施例中的人脸识别模型训练装置，其中各个模块、子模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

以上描述了人脸识别模型训练装置的内部功能和结构，如图10所示，实际中，该人脸识别模型训练装置可实现为：

处理器；

被配置为存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

上述实施例中，人脸识别模型训练装置为了对使用第一训练样本集对卷积神经网络进行训练后得到的包括N层特征系数的原始人脸识别模型进行优化，首先获得不同于传统第一训练样本集的第二训练样本集。其中，构成第一训练样本集中的各样本人脸图像是通过随机在网络上搜索得到的各人脸图像，样本噪声较大；而第二训练样本集中的各样本人脸图像是存储于云端人脸相册中的人脸图像，样本比较干净。由于第二训练样本集中各样本人脸图像涉及到用户隐私，为了保护用户隐私的同时采用第二训练样本集对原始人脸识别模型进行优化训练，首先为每个样本人脸图像进行标记即为每个样本人脸图像分配一个分类标号，进而采用原始人脸识别模型的前M层特征系数对第二训练样本集中的各样本人脸图像进行编码，即提取各样本人脸图像的前M层特征系数，从而经编码和分类标号标记的各样本人脸图像不会泄露对应的用户隐私。最后，以各编码后特征向量即经M层特征系数编码的各样本人脸图像以及与各编码后特征向量分别对应的分类标号为输入，对原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数，从而获得由原M层特征系数和训练后的后N-M层特征系数构成的优化后的人脸识别模型。由于优化后的人脸识别模型是基于干净的训练样本训练获得的，更加准确、可靠。

图11是根据一示例性实施例示出的另一种人脸识别模型训练装置的框图。例如，该人脸识别模型训练装置800可以是智能手机、PC机、便携式电脑、平板电脑、服务器等。

参照图11，人脸识别模型训练装置800可以包括以下一个或多个组件：处理组件802，存储器804，电力组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制人脸识别模型训练装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在人脸识别模型训练装置800的操作。这些数据的示例包括用于在人脸识别模型训练装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(RAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为人脸识别模型训练装置800的各种组件提供电力。电力组件806可以包括电源管理系统，一个或多个电源，及其他与为人脸识别模型训练装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述人脸识别模型训练装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当人脸识别模型训练装置800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816共享。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为人脸识别模型训练装置800提供各个方面的状态评估。例如，传感器组件814可以检测到人脸识别模型训练装置800的打开/关闭状态，组件的相对定位，例如所述组件为人脸识别模型训练装置800的显示器和小键盘，传感器组件814还可以检测人脸识别模型训练装置800或人脸识别模型训练装置800一个组件的位置改变，用户与装置800接触的存在或不存在，人脸识别模型训练装置800方位或加速/减速和人脸识别模型训练装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMO或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于人脸识别模型训练装置800和其他设备之间有线或无线方式的通信。人脸识别模型训练装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(AIC)、数字信号处理器(DP)、数字信号处理设备(DPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由人脸识别模型训练装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由人脸识别模型训练装置800的处理器执行时，使得人脸识别模型训练装置800能够执行上述即时通信消息处理方法，所述方法包括：

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种人脸识别模型训练方法，其特征在于，所述方法包括：

根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数；

所述确定第二训练样本集中的各样本人脸图像对应的第一原始分类标号，包括：

为所述第二训练样本集中的各样本人脸图像中的每个样本人脸图像分配对应的分类标号，并将对应于同一个人的样本人脸图像设置为相同的分类标号，得到所述第二训练样本集中的各样本人脸图像对应的第一原始分类标号。

2.根据权利要求1所述的方法，其特征在于，所述根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练更新后的后N-M层特征系数，包括：

3.根据权利要求2所述的方法，其特征在于，所述依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，包括：

4.根据权利要求2所述的方法，其特征在于，所述依次以每批训练样本子集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得经全部各批训练样本子集训练后得到的后N-M层特征系数之后，所述方法还包括：

获取测试样本集，并确定测试样本集中的各测试人脸图像对应的第二原始分类标号，所述测试样本集中的各测试人脸图像与所述第二训练样本集中的各样本人脸图像不同，所述第二原始分类标号是指为所述各测试人脸图像设置的分类标号；

根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，所述更新后的人脸识别模型中包括所述前M层特征系数和所述经全部各批训练样本子集训练后得到的后N-M层特征系数；

所述确定测试样本集中的各测试人脸图像对应的第二原始分类标号，包括：

为所述测试样本集中的各测试人脸图像中的每个测试人脸图像分配对应的分类标号，并将对应于同一个人的测试人脸图像设置为相同的分类标号，得到所述测试样本集中的各测试人脸图像对应的第二原始分类标号。

5.根据权利要求4所述的方法，其特征在于，所述根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据各所述距离，确定所述更新后的人脸识别模型的准确度之后，还包括：

更新所述第二训练样本集；

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

确定各次迭代对应的准确度中的最大准确度；

8.根据权利要求3或5所述的方法，其特征在于，所述预设距离度量方式包括采用如下任一种距离的距离度量方式：

欧式距离、马氏距离、切比雪夫距离、余弦距离。

9.一种人脸识别模型训练装置，其特征在于，所述装置包括：

训练模块，被配置为根据所述编码后的第二训练样本集对所述原始人脸识别模型的后N-M层特征系数进行训练，获得训练后的后N-M层特征系数；

所述获取模块，还被配置为为所述第二训练样本集中的各样本人脸图像中的每个样本人脸图像分配对应的分类标号，并将对应于同一个人的样本人脸图像设置为相同的分类标号，得到所述第二训练样本集中的各样本人脸图像对应的第一原始分类标号。

10.根据权利要求9所述的装置，其特征在于，所述训练模块包括：

11.根据权利要求10所述的装置，其特征在于，所述训练子模块被配置为：

12.根据权利要求10所述的装置，其特征在于，所述装置还包括：

测试模块，被配置为根据所述测试样本集对更新后的人脸识别模型进行准确度测试，确定所述更新后的人脸识别模型的准确度，所述更新后的人脸识别模型中包括所述前M层特征系数和所述经全部各批训练样本子集训练后得到的后N-M层特征系数；

13.根据权利要求12所述的装置，其特征在于，所述测试模块包括：

14.根据权利要求13所述的装置，其特征在于，所述装置还包括：

更新所述第二训练样本集；

15.根据权利要求14所述的装置，其特征在于，所述装置还包括：

16.一种人脸识别模型训练装置，其特征在于，包括：

处理器；

被配置为存储处理器可执行指令的存储器；

其中，所述处理器被配置为：