CN111241992A

CN111241992A - 人脸识别模型构建方法、识别方法、装置、设备及存储介质

Info

Publication number: CN111241992A
Application number: CN202010018116.3A
Authority: CN
Inventors: 奚昌凤; 沙文; 吴子扬; 李啸; 陆磊
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2020-01-08
Filing date: 2020-01-08
Publication date: 2020-06-05
Anticipated expiration: 2040-01-08
Also published as: CN111241992B

Abstract

本申请提供了一种人脸识别模型构建方法、识别方法、装置、设备及存储介质，其中，人脸识别模型构建方法包括：利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，获得多幅训练人脸图像分别对应的第一人脸特征；对多幅训练人脸图像分别对应的第一人脸特征进行聚类，并根据聚类结果确定多幅训练人脸图像分别所属类别的类中心；利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型，对作为学生模型的人脸识别模型训练至收敛，得到构建出的人脸识别模型。本申请提供的人脸识别模型构建方法能够构建出识别速度快、识别精度高的人脸识别模型。

Description

人脸识别模型构建方法、识别方法、装置、设备及存储介质

技术领域

本申请涉及人脸识别技术领域，尤其涉及一种人脸识别模型构建方法、识别方法、装置、设备及存储介质。

背景技术

人脸识别为一种重要的人机交互方式，随着人脸识别技术的发展，人脸识别这种人机交互方法已经渗透至生活的方方面面，比如，人脸支付、智慧社区、智能安防、社交娱乐等。

在实际的应用中，为了提高用户体验，通常需要识别精度高且识别速度快的人脸识别模型，而如何构建出这样的人脸识别模型是目前亟需解决的问题。

发明内容

有鉴于此，本申请提供了一种人脸识别模型构建方法、识别方法、装置、设备及存储介质，用以构建出识别精度高且识别速度快的人脸识别模型，其技术方案如下：

一种人脸识别模型构建方法，包括：

利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，获得所述多幅训练人脸图像分别对应的第一人脸特征；

对所述多幅训练人脸图像分别对应的第一人脸特征进行聚类，并根据聚类结果确定所述多幅训练人脸图像分别所属类别的类中心；

利用所述多幅训练人脸图像和所述多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型，对作为学生模型的人脸识别模型训练至收敛，得到构建出的人脸识别模型；

其中，作为学生模型的人脸识别模型的复杂度低于作为教师模型的人脸识别模型的复杂度。

可选的，所述作为教师模型的人脸识别模型为多个；

利用作为教师模型的人脸识别模型对同一类别的多幅训练人脸图像分别提取人脸特征，获得所述多幅训练人脸图像分别对应的第一人脸特征，包括：

利用作为教师模型的每个人脸识别模型对每幅训练人脸图像提取人脸特征，获得所述多幅训练人脸图像分别对应的多个第一人脸特征。

可选的，所述对所述多幅训练人脸图像分别对应的第一人脸特征进行聚类，包括：

确定由所述多幅训练人脸图像分别对应的第一人脸特征所组成的特征集对应的k近邻关系矩阵，其中，所述k近邻关系矩阵能够表征与所述特征集中的每个第一人脸特征最邻近的k个第一人脸特征；

利用图卷积神经网络和所述人脸特征集对应的k近邻关系矩阵，对所述人脸特征集中的第一人脸特征进行聚类。

可选的，所述根据聚类结果确定所述多幅训练人脸图像分别所属类别的类中心，包括：

若所述聚类结果中仅包括一个特征簇，则将该特征簇作为目标特征簇，确定所述目标特征簇的簇中心，作为每幅训练人脸图像所属类别的类中心；

若所述聚类结果中包括多个特征簇，则将所述多个特征簇处理成一个目标特征簇和至少一个非目标特征簇，其中，该目标特征簇由类别标注正确的所有训练人脸图像分别对应的第一人脸特征组成，每个所述非目标特征簇由一幅类别标注错误的训练人脸图像对应的第一人脸特征组成；

确定处理得到的所述目标特征簇的簇中心，作为类别标注正确的每个训练人脸图像所属类别的类中心，并确定每个所述非目标特征簇的簇中心，作为类别标注错误的对应训练人脸图像所属类别的类中心。

可选的，所述将所述多个特征簇处理成一个目标特征簇和至少一个非目标特征簇，包括：

根据每个特征簇中所包含的第一人脸特征的数量，从所述多个特征簇中确定出非噪声特征簇和噪声特征簇；

从所述非噪声特征簇中去除满足噪声条件的第一人脸特征，获得的特征簇作为目标特征簇；其中，若所述非噪声特征簇中的一第一人脸特征所属的训练人脸图像的部分第一人脸特征位于所述噪声特征簇中，则该第一人脸特征满足噪声条件；

将所述满足噪声条件的第一人脸特征与所述噪声特征簇中的所有第一人脸特征按训练人脸图像分类，以将同一训练人脸图像的第一人脸特征划分为一个噪声特征簇，得到的每个噪声特征簇作为一个非目标特征簇。

可选的，确定所述目标特征簇的簇中心，包括：

确定所述目标特征簇中各第一人脸特征的权重；

根据所述目标特征簇中的各第一人脸特征和所述目标特征簇中各第一人脸特征的权重，确定所述目标特征簇的簇中心；

确定所述非目标特征簇的簇中心，包括：

确定所述非目标特征簇中所有第一人脸特征的均值，作为所述非目标特征簇的簇中心。

可选的，所述确定所述目标特征簇中各第一人脸特征的权重，包括：

从所述目标特征簇选取最优的第一人脸特征；

根据所述目标特征簇中各第一人脸特征分别与所述最优的第一人脸特征的距离，确定所述目标特征簇中各第一人脸特征分别对应的权重。

可选的，所述利用所述多幅训练人脸图像和所述多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型，包括：

利用作为学生模型的人脸识别模型对所述多幅训练人脸图像分别提取人脸特征，获得所述多幅训练人脸图像分别对应的第二人脸特征；

至少根据所述多幅训练人脸图像分别对应的第二人脸特征和所述多幅训练人脸图像分别所属类别的类中心，更新所述作为学生模型的人脸识别模型的参数。

可选的，所述至少根据所述多幅训练人脸图像分别对应的第二人脸特征和所述多幅训练人脸图像分别所属类别的类中心，更新所述作为学生模型的人脸识别模型的参数，包括：

对于每幅训练人脸图像：

若该训练人脸图像的类别标注错误，则根据该训练人脸图像对应的第二人脸特征和该训练人脸图像所属类别的类中心，确定该训练人脸图像对应的预测损失；

若该训练人脸图像的类别标注正确，则根据该训练人脸图像对应的第二人脸特征预测该训练人脸图像所属的类别，根据预测的类别、该训练人脸图像标注的类别、该训练人脸图像对应的第二人脸特征和该训练人脸图像所属类别的类中心，确定该训练人脸图像对应的预测损失，其中，该训练人脸图像的类别是否标注错误根据该训练人脸图像所属类别的类中心确定；

将所述多幅训练人脸图像分别对应的预测损失求和，并根据求和得到的损失更新所述作为学生模型的人脸识别模型的参数。

一种人脸识别方法，包括：

获取待识别的人脸图像；

将待识别的人脸图像输入采用上述任一项所述的人脸识别模型构建方法构建的人脸识别模型中，获得所述待识别的人脸图像的识别结果。

一种人脸识别模型构建装置，包括：第一特征提取模块、聚类模块、类中心确定模块和模型训练模块；

所述第一特征提取模块，用于利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，获得所述多幅训练人脸图像分别对应的第一人脸特征；

所述聚类模块，用于对所述多幅训练人脸图像分别对应的第一人脸特征进行聚类；

所述类中心确定模块，用于根据所述聚类模块的聚类结果确定所述多幅训练人脸图像分别所属类别的类中心；

所述模型训练模块，用于利用所述多幅训练人脸图像和所述多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型，对作为学生模型的人脸识别模型训练至收敛，得到构建出的人脸识别模型；

一种人脸识别模型构建设备，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现上述任一项所述的人脸识别模型构建方法的各个步骤。

一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现上述任一项所述的人脸识别模型构建方法的各个步骤。

经由上述方案可知，本申请提供的人脸识别模型构建方法，首先利用教师模型(结构比较复杂、识别精度较高的人脸识别模型)对标注有同一类别的多幅训练人脸图像分别提取人脸特征，以获得多幅训练人脸图像分别对应的第一人脸特征，然后对多幅训练人脸图像分别对应的第一人脸特征进行聚类，并根据聚类结果确定多幅训练人脸图像分别所属类别的类中心，最后，利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心训练结构相对比较简单的人脸识别模型。本申请提供的人脸识别模型构建方法通过对教师模型提取的人脸特征进行聚类，来确定比较可靠的类中心，进而以类中心作为指导信息，指导作为学生模型的人脸识别模型进行训练，以使作为学生模型的人脸识别模型在训练的过程中对训练人脸图像提取的人脸特征尽量的去逼近训练人脸图像所属类别的类中心，从而能够获得识别效果好且识别速度快的人脸识别模型。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的人脸识别模型构建方法的流程示意图；

图2为本申请实施例提供的聚类结果仅包括一个特征簇的一示例；

图3为本申请实施例提供的非最优的第一人脸特征与最优的第一人脸特征之间距离的示意图；

图4为本申请实施例提供的聚类结果包括多个特征簇的一示例；

图5为本申请实施例提供的在聚类结果包括多个特征簇的情况下，根据聚类结果确定多幅训练人脸图像分别所属类别的类中心的流程示意图；

图6为本申请实施例提供的利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型的流程示意图；

图7为本申请实施例提供的构建人脸识别模型的整体流程的示意图；

图8为本申请实施例提供的人脸识别模型构建装置的结构示意图；

图9为本申请实施例提供的人脸识别模型构建设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了能够获得识别精度高且识别速度快的人脸识别模型，本案发明人进行了研究，起初的思路是：

采用多个作为教师模型的人脸识别模型对训练人脸图像提取人脸特征，并为每个教师模型分配一个权重，然后将作为教师模型的各个人脸识别模型提取的特征加权，得到的结果作为指导信息，指导作为学生模型的人脸识别模型训练，在训练的过程中，依据作为学生模型的人脸识别模型反传的信息更新权重。

然而，上述方案存在一定的问题，具体体现在：

首先，不同的教师模型在不同样本上的表现可能不同，最终权重大的教师模型在部分样本上的区分性差于权重小的模型，从而导致这部分样本加权后的特征不是最好的指导特征；其次，采用特征加权的方式，由于没有对噪声样本(噪声样本指的是标注类别与实际类别不一致的样本)进行判断，无法消除噪声样本带来的影响，当训练集中存在一定的噪声样本的情况下，这种做法不利于学生网络的学习，可能导致最终学生模型的识别效果不理想。

鉴于上述方案存在的缺陷，本案发明人进一步进行了研究，最终提供了一种效果较好的人脸识别模型构建方法，该方法能够构建出识别速度快、识别效果好的人脸识别模型，该人脸识别模型构建方法可应用于具有数据处理能力的终端，也可应用于服务器(服务器可以为一个，也可以为多个，还可以为服务器集群)。接下来通过下述实施例对本申请提供的人脸识别模型构建方法进行介绍。

请参阅图1，示出了本申请实施例提供的人脸识别模型构建方法的流程示意图，该方法可以包括：

步骤S101：利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，获得多幅训练人脸图像分别对应的第一人脸特征。

其中，作为教师模型的人脸识别模型为结构比较复杂、识别精度较高的模型，可选的，作为教师模型的人脸识别模型可以为resnet200、EfficientNet等复杂度较高的网络。

需要说明的是，作为教师模型的人脸识别模型预先训练得到，训练作为教师模型的人脸识别模型时，所采用的训练数据的场景最好尽可能的多，且训练数据中除了包括多个人的原始人脸图像外，最好还包括对原始人脸图像采用多种增强方式(比如旋转、遮挡、光照变化等)进行增强后的图像，以使人脸识别模型的适应性更强，即，即便同一人的两幅人脸图像差异较大，也能提取到比较相近的特征。另外，可训练多个人脸识别模型，从中挑选效果较好的人脸识别模型作为教师模型。

本实施例中，作为教师模型的人脸识别模型可以为一个，也可以为多个，优选为多个，若作为教师模型的人脸识别模型为多个，则多个人脸识别模型提取的人脸特征的维度应相同，另外，多个人脸识别模型的结构最好有差异。

另外，若作为教师模型的人脸识别模型为多个，则需要利用作为教师模型的每个人脸识别模型对每幅训练人脸图像提取人脸特征，如此可获得多幅训练人脸图像分别对应的多个第一人脸特征。

示例性的，人脸图像有10幅，作为教师模型的人脸识别模型有3个，分别为模型1、模型2和模型3，则用模型1分别对10幅人脸图像提取人脸特征，获得对应于模型1的10个人脸特征，用模型2分别对10幅人脸图像提取人脸特征，获得对应于模型2的10个人脸特征，用模型3分别对10幅人脸图像提取人脸特征，获得对应于模型3的10个人脸特征，如此，总共可获得30个人脸特征。

步骤S102：对多幅训练人脸图像分别对应的第一人脸特征进行聚类，并根据聚类结果确定多幅训练人脸图像分别所属类别的类中心。

其中，对多幅训练人脸图像分别对应的第一人脸特征进行聚类的聚类结果可能存在两种情况：第一种情况，聚类结果仅包括一个特征簇，这说明多幅训练人脸图像标注的类别均正确，即多幅训练人脸图像中没有噪声图像；第二种情况，聚类结果包括多个特征簇，这说明多幅训练人脸图像中存在类别标注错误的图像，即多幅训练人脸图像中存在噪声图像。由此可见，通过对多幅训练人脸图像分别对应的第一人脸特征进行聚类，能够从多幅训练人脸图像中筛选出噪声图像。

通过聚类获得特征簇后，可根据特征簇确定多幅训练人脸图像分别所属类别的类中心。需要说明的是，一幅训练人脸图像所属类别的类中心指的是该幅训练人脸图像实际所属的正确类别的类中心。

步骤S103：利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型。

对作为学生模型的人脸识别模型训练至收敛后，得到构建出的人脸识别模型。

具体的，利用作为学生模型的人脸识别模型对每幅训练人脸图像提取人脸特征，在训练时，使利用作为学生模型的人脸识别模型针对每幅训练人脸图像提取的人脸特征去逼近对应人脸图像所属类别的类中心。

需要说明的是，本实施例中作为学生模型的人脸识别模型的复杂度低于作为教师模型的人脸识别模型的复杂度。

可以理解的是，在某些应用场景(比如人脸支付场景)中，需要人脸识别模型具有较高的识别速度和较高的识别准确度，若要使人脸识别模型具有较高的识别速度快，就要使人脸识别模型的结构相对简单，而结构简单的人脸识别模型通常识别准确度不高，为了使得结构简单的人脸识别模型具有较高的识别准确度，本申请实施例将具有较高识别准确度的人脸识别模型作为教师模型，采用教师模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，通过对提取的人脸特征进行聚类来确定多幅训练人脸图像分别对应的类中心，进而使作为学生模型的人脸识别模型在训练的过程中对训练人脸图像提取的人脸特征尽量的去逼近训练人脸图像所属类别的类中心，从而获得具有较高识别速度和较高识别准确度的人脸识别模型。

在本申请的另一实施例中，对上述实施例中的“步骤S102：对多幅训练人脸图像分别对应的第一人脸特征进行聚类，并根据聚类结果确定多幅训练人脸图像分别所属类别的类中心”进行介绍。

首先介绍“对多幅训练人脸图像分别对应的第一人脸特征进行聚类”的实现过程。

对多幅训练人脸图像分别对应的第一人脸特征进行聚类的实现方式有多种，在一种可能的实现方式中，可采用K-means聚类算法对多幅训练人脸图像分别对应的第一人脸特征进行聚类。K-means聚类算法为现有技术中常用的聚类算法，本实施例在此不作赘述。

在另一种可能的实现方式中，可采用图卷积神经网络(Graph ConvolutionNetwork，GCN)对多幅训练人脸图像分别对应的第一人脸特征进行聚类。在本实施例中，可用精度较高的人脸识别模型对一个大型的人脸数据集进行特征提取，利用提取的特征训练GCN，以得到具有较好聚类效果的GCN。

具体的，采用GCN对多幅训练人脸图像分别对应的第一人脸特征进行聚类的过程可以包括：

步骤a1、确定由多幅训练人脸图像分别对应的第一人脸特征所组成的特征集对应的k近邻关系矩阵。

其中，k近邻关系矩阵能够表征与特征集中的每个第一人脸特征最邻近的k个第一人脸特征。

确定特征集对应的k近邻关系矩阵的过程可以包括：确定与特征集中的每个第一人脸特征最邻近的k个第一人脸特征，由每个第一人脸特征和与其最邻近的k个第一人脸特征组成k近邻关系矩阵，可选的，k近邻关系矩阵中的每一行为一个第一人脸特征和与其最邻近的k个第一人脸特征。

步骤a2、利用GCN和特征集对应的k近邻关系矩阵，对人脸特征集中的第一人脸特征进行聚类。

具体的，将特征集中的所有第一人脸特征和特征集对应的k近邻关系矩阵输入GCN，获得特征集中所有第一人脸特征的聚类结果。

接下来介绍“根据聚类结果确定多幅训练人脸图像分别所属类别的类中心”的实现过程。

前述内容提到，聚类结果可能包括两种情况，以下分情况介绍“根据聚类结果确定多幅训练人脸图像分别所属类别的类中心”的实现过程。

第一种情况：聚类结果仅包括一个特征簇。

请参阅图2，示出了聚类结果仅包括一个特征簇的示例，在这种情况下，根据聚类结果确定多幅训练人脸图像分别所属类别的类中心的过程包括：将聚类结果仅包括的一个特征簇作为目标特征簇，确定目标特征簇的簇中心，将目标特征簇的簇中心作为每幅训练人脸图像所属类别的类中心。

聚类结果仅包括的一个特征簇，这意味着所有训练人脸图像对应的第一人脸特征聚在了一起，说明多幅训练人脸图像属于同一个类别，即，多幅训练人脸图像标注的类别均正确，多幅训练人脸图像分别所属类别的类中心为同一类中心。

其中，确定目标特征簇的簇中心的实现方式有多种，在一种可能的实现方式中，可确定目标特征簇中所有第一人脸特征的均值，将确定的均值作为目标特征簇的簇中心。考虑到目标特征簇中有的特征较好(能够较好地表征人脸)，而有的特征相对较差些，为了降低相对较差的特征对最终类中心的贡献，本实施例提供了另一种较为优选的实现方式：

步骤b1、确定目标特征簇中各第一人脸特征的权重。

具体的，确定目标特征簇中各第一人脸特征的权重的过程可以包括：从目标特征簇选取最优的第一人脸特征，根据目标特征簇中各第一人脸特征分别与最优的第一人脸特征的距离，确定目标特征簇中各第一人脸特征分别对应的权重。

考虑到人脸特征的L2范数能够比较直接反映图像的质量，本实施例可计算目标特征簇中各第一人脸特征的L2范数，从目标特征簇中选取L2范数最大的第一人脸特征作为最优的第一人脸特征。

需要说明的是，一第一人脸特征与最优的第一人脸特征的距离越近，说明该第一人脸特征的重要度越高，反之，该第一人脸特征与最优的第一人脸特征的距离越远，说明该第一人脸特征的重要度越低。假设第一人脸特征x与最优的第一人脸特征的距离小于第一人脸特征y与最优的第一人脸特征的距离，则说明第一人脸特征x的重要度高于第一人脸特征y的重要度。基于此，本实施例在获得最优的第一人脸特征后，可将第一人脸特征对应的权重设定为1，对于其它第一人脸特征中的每个第一人脸特征，可先确定该第一人脸特征与最优的第一人脸特征之间的距离d，将1/(1+d)作为该第一人脸特征的权重。

如图3所示，图3中的第一人脸特征301为最优的第一人脸特征，第一人脸特征302与最优的第一人脸特征301之间的距离为d₁，第一人脸特征303与最优的第一人脸特征301之间的距离为d₂，则第一人脸特征302的权重为1/(1+d₁)，第一人脸特征303的权重为1/(1+d₂)，其中，d₁小于d₂，这说明第一人脸特征302的重要度高于第一人脸特征303。

假设目标特征簇中有M个第一人脸特征，分别为f₁、f₂、…、f_M，M个第一人脸特征分别对应的权重用ω₁、ω₂、ω₃、…、ω_M表示，假设f₂为最优的第一人脸特征，则ω₁＝1/(1+d₁)，ω₂＝1，ω₃＝1/(1+d₃)，…ω_M＝1/(1+d_M)，其中，d₁为f₁与最优的第一人脸特征f₂之间的距离，d_M为f_M与最优的第一人脸特征f₂之间的距离，其它以此类推。

在获得目标特征簇中M个第一人脸特征分别对应的权重用ω₁、ω₂、ω₃、…、ω_M后，需要对其进行归一化处理，以使归一化处理的所有权重的和为1，具体的，可按下式对M个第一人脸特征分别对应的权重用ω₁、ω₂、ω₃、…、ω_M进行归一化：

其中，ω_i'为M个第一人脸特征中的f_i对应的归一化后的权重。

通过上式可获得M个第一人脸特征分别对应的归一化后的权重ω₁'、ω₂'、ω₃'、…、ω_M'，每个第一人脸特征对应的归一化后的权重作为其最终的权重。

步骤b2、根据目标特征簇中的各第一人脸特征和目标特征簇中各第一人脸特征的权重，确定目标特征簇的簇中心。

具体的，对目标特征簇中的各第一人脸特征进行加权，得到目标特征簇的簇中心。其中，对目标特征簇中的各第一人脸特征进行加权的方式为：

其中，

为目标特征簇的簇中心，即为各个训练人脸图像所属类别的类中心。

第二种情况：聚类结果包括多个特征簇。

聚类结果包括多个特征簇，说明多幅训练人脸图像中存在类别标注错误的图像，即存在噪声图像，请参阅图4，图4示出了包括两个特征簇的情况，其中，圆圈外的特征为类别标注错误的训练人脸图像对应的第一人脸特征，即为噪声图像的第一人脸特征。

请参阅图5，示出了在聚类结果包括多个特征簇的情况下，根据聚类结果确定多幅训练人脸图像分别所属类别的类中心的流程示意图，可以包括：

步骤S501：将多个特征簇处理成一个目标特征簇和至少一个非目标特征簇。

其中，目标特征簇由类别标注正确的所有训练人脸图像分别对应的第一人脸特征组成，每个非目标特征簇由一幅类别标注错误的训练人脸图像对应的第一人脸特征组成。

具体的，将多个特征簇处理成一个目标特征簇和至少一个非目标特征簇的过程可以包括：

步骤c1、根据每个特征簇中所包含的第一人脸特征的数量，从多个特征簇中确定出非噪声特征簇和噪声特征簇。

可以理解的，多幅训练人脸图像中类别标注正确的图像通常较多，而类别标注错误的图像通常较少，相应的，非噪声特征簇中第一人脸特征的数量通常较多，而噪声特征簇中第一人脸图像特征的数量通常较少，有鉴于此，本实施例可通过各特征簇中所包含的第一人脸特征的数量确定各特征簇为非噪声特征簇还是为噪声特征簇。可选的，可设定一特征数量阈值，通过将各特征簇中第一人脸特征的数量与设定的特征数量阈值进行比较来确定各特征簇为非噪声特征簇还是为噪声特征簇。

步骤c2、从非噪声特征簇中去除满足噪声条件的第一人脸特征，获得的特征簇作为目标特征簇。

其中，对于非噪声特征簇中的任一第一人脸特征，若该第一人脸特征所属的训练人脸图像的部分第一人脸特征位于噪声特征簇中，则该第一人脸特征满足噪声条件。

本实施例除了将全部的第一人脸特征位于噪声特征簇的训练人脸图像作为噪声图像外，还将部分第一人脸特征位于非噪声特征簇、部分第一人脸特征位于噪声特征簇的训练人脸图像作为噪声图像，并将其位于非噪声特征簇中的第一人脸特征移出至噪声特征簇中。

示例性的，一训练人脸图像包括10个第一人脸特征，其中有3个第一人脸特征位于非噪声特征簇中，7个第一人脸特征位于噪声特征簇中，则本实施例将位于非噪声特征簇中的3个第一人脸特征移出至噪声特征簇中。

步骤c3、将满足噪声条件的第一人脸特征与步骤c1获得的噪声特征簇中的所有第一人脸特征按训练人脸图像分类，以将同一训练人脸图像的第一人脸特征划分为一个噪声特征簇，得到的每个噪声特征簇作为一个非目标特征簇。

在某些时候，可能存在同一噪声图像对应的多个第一人脸特征被聚到了不同的噪声特征簇中的情况，针对这种情况，本实施例将同一噪声图像的所有第一人脸特征放到一个噪声特征簇中，最终针对每个噪声图像获得一个噪声特征簇。

步骤S502：确定处理得到的目标特征簇的簇中心，作为类别标注正确的每个训练人脸图像所属类别的类中心，并确定每个非目标特征簇的簇中心，作为类别标注错误的对应训练人脸图像所属类别的类中心。

本步骤中“确定处理得到的目标特征簇的簇中心”的过程与上述聚类结果仅包括一个特征簇时，确定目标特征簇的簇中心的过程类似，本实施例在此不作赘述。

确定非目标特征簇的簇中心的过程可以包括：确定非目标特征簇中所有第一人脸特征的均值，将确定的均值作为非目标特征簇的簇中心。

假设一非目标特征簇包括J个第一人脸特征，分别为f₁、f₂、…、f_J，则该非目标特征簇的簇中心为

按上式可计算得到每个非目标特征簇的簇中心。

由于人脸识别任务，最终需要比对的是两幅人脸图像的人脸特征之间的距离，因此，对于同一个人，其任意两幅人脸图像的人脸特征之间的差异越小越好。通过对作为教师模型的人脸识别模型提取的第一人脸特征进行聚类再筛选(筛选过程即为上述将多个特征簇处理成一个目标特征簇和至少一个非目标特征簇的过程)的方式，一方面可以避免噪声图像将当前类别的类中心拉向噪声样本对应的类别，另一方面降低了相对不可靠特征对类中心的贡献，从而可以获得相对更加可靠的类中心。

经由上述过程可获得多幅训练人脸图像分别所属类别的类中心，接下来对上述实施例中的“步骤103：利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型”进行介绍。

请参阅图6，示出了利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型的流程示意图，可以包括：

步骤S601：利用作为学生模型的人脸识别模型对多幅训练人脸图像分别提取人脸特征，获得多幅训练人脸图像分别对应的第二人脸特征。

具体的，将每幅训练人脸图像输入作为学生模型的人脸识别模型进行特征提取，以获得每幅训练人脸图像对应的第二人脸特征。

步骤S602：至少根据多幅训练人脸图像分别对应的第二人脸特征和多幅训练人脸图像分别所属类别的类中心，更新作为学生模型的人脸识别模型的参数。

步骤S602的实现方式有多种，在一种可能的实现方式中，可只根据多幅训练人脸图像分别对应的第二人脸特征和多幅训练人脸图像分别所属类别的类中心，更新作为学生模型的人脸识别模型的参数。

具体的，根据多幅训练人脸图像分别对应的第二人脸特征和多幅训练人脸图像分别所属类别的类中心确定作为学生模型的人脸识别模型的预测损失，根据作为学生模型的人脸识别模型的预测损失更新作为学生模型的人脸识别模型的参数。

进一步的，可根据下式计算作为学生模型的人脸识别模型的预测损失L_KD：

其中，S为由标注有同一类别的b幅训练人脸图像组成的一训练样本集，即S＝{x¹,x²,…,x^b}，上式中的xi为S中的第i幅训练人脸图像，f_S(xⁱ)为第i幅训练人脸图像对应的第二人脸特征，

为第i幅训练人脸图像所属类别的类中心，

为第i幅训练人脸图像对应的特征预测损失，由上式可知，作为学生模型的人脸识别模型的预测损失L_KD通过对各幅训练人脸图像分别对应的特征预测损失求和得到。

为了使作为学生模型的人脸识别模型具有更好的效果，本实施例针对步骤S602提供了另一种比较优选的实现方式，具体的：

对于每幅训练人脸图像，若该训练人脸图像的类别标注错误，则根据该训练人脸图像对应的第二人脸特征和该训练人脸图像所属类别的类中心，确定该训练人脸图像对应的预测损失；若该训练人脸图像的类别标注正确，则根据该训练人脸图像对应的第二人脸特征预测该训练人脸图像所属的类别，根据预测的类别、该训练人脸图像标注的类别、该训练人脸图像对应的第二人脸特征和该训练人脸图像所属类别的类中心，确定该训练人脸图像对应的预测损失；通过上述过程可获得多幅训练人脸图像分别对应的预测损失，将多幅训练人脸图像分别对应的预测损失求和，并根据求和得到的损失更新作为学生模型的人脸识别模型的参数。

对于S＝{x¹,x²,…,x^b}中的第i幅训练人脸图像xⁱ，若xⁱ对应的类中心为

说明第i幅训练人脸图像xⁱ为类别标注正确的图像，此种情况下，训练人脸图像xⁱ对应的预测损失Lⁱ由特征预测损失L_KD ⁱ和类别预测损失L_C ⁱ组成，其中，训练人脸图像xⁱ对应的特征预测损失L_KD ⁱ根据训练人脸图像xⁱ对应的第二人脸特征f_S(xⁱ)和训练人脸图像xⁱ所属类别的类中心

确定，即

训练人脸图像xⁱ对应的类别预测损失L_C ⁱ根据训练人脸图像xⁱ对应的预测类别(根据f_S(xⁱ)预测的类别)、训练人脸图像xⁱ对应的标注类别以及分类损失函数(比如softmax loss、cosface、areface等)计算得到；若xⁱ对应的类中心为

说明第i幅训练人脸图像xⁱ为类别标注错误的图像，此种情况下，训练人脸图像xⁱ对应的预测损失Lⁱ即为特征预测损失L_KD ⁱ，其中，训练人脸图像xⁱ对应的特征预测损失根据训练人脸图像xⁱ对应的第二人脸特征f_S(xⁱ)和训练人脸图像xⁱ所属类别的类中心

确定，即

经由上述分析可获得如下表达式：

其中，Lⁱ即为训练人脸图像xⁱ对应的预测损失，α用于决定类别预测损失Lⁱ _C在Lⁱ中所占的比重，其可根据实际情况设定。

通过上述方式可确定出S＝{x¹,x²,…,x^b}中每幅训练人脸图像对应的预测损失，即获得了多幅训练人脸图像分别对应的预测损失，将多幅训练人脸图像分别对应的预测损失求和，便得到作为学生模型的人脸识别模型的预测损失，进而根据作为学生模型的人脸识别模型的预测损失更新作为学生模型的人脸识别模型的参数。

本实施例采用多个训练样本集按上述过程对作为学生模型的人脸识别模型进行训练，直至作为学生模型的人脸识别模型收敛，或者训练次数达到预设的训练次数。需要说明的是，用于训练的每个训练样本集均由标注有同一类别的多幅训练人脸图像组成，不同训练样本集中训练人脸图像的标注类别可以不同。

请参阅图7，示出了构建人脸识别模型的整体流程的示意图，假设作为教师模型的人脸识别模型有N个，将一个样本集S(由标注有同一类别的b幅训练人脸图像组成)中的每幅训练人脸图像输入作为教师模型的每个人脸识别模型进行特征提取，最终获得b*N个第一人脸特征，采用GCN对b*N个第一人脸特征进行聚类，根据聚类结果确定b幅训练人脸图像分别所属类别的类中心，利用作为学生模型的人脸识别模型对b幅训练人脸图像分别提取人脸特征，获得b幅训练人脸图像分别对应的第二人脸特征，按上述确定每幅训练人脸图像对应的预测损失的方式确定b幅训练人脸图像分别对应的预测损失，并将b幅训练人脸图像分别对应的预测损失求和，根据求和得到的损失更新作为学生模型的人脸识别模型的参数，至此完成对于作为学生模型的人脸识别模型的一次训练，采用不同的样本集按上述训练过程对作为学生模型的人脸识别模型进行多次训练，直至作为学生模型的人脸识别模型收敛，或者训练次数达到预设的训练次数。经由上述过程构建的人脸识别模型具有较高的识别速度和识别准确度。

另外，需要说明的是，在训练作为学生模型的人脸识别模型的过程中，作为教师模型的人脸识别模型和GCN均不进行参数的更新。

本申请实施例将具有较高识别准确度的人脸识别模型作为教师模型，采用教师模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，通过对提取的人脸特征进行聚类来确定多幅训练人脸图像分别对应的类中心，进而使作为学生模型的人脸识别模型在训练的过程中对训练人脸图像提取的人脸特征尽量的去逼近训练人脸图像所属类别的类中心，从而获得具有较高识别速度和较高识别准确度的人脸识别模型。

在上述实施例提供的人脸识别模型构建方法的基础上，本申请实施例还提供了一种人脸识别方法，该人脸识别方法的过程包括：获取待识别的人脸图像；将待识别的人脸图像输入采用上述实施例提供的人脸识别模型构建方法构建的人脸识别模型中，获得待识别的人脸图像的识别结果。

本申请实施例提供的人脸识别方法具有较高的识别准确率和较高的识别速度，用户体验较好。

下面对本申请实施例提供的人脸识别模型构建装置进行描述，下文描述的人脸识别模型构建装置与上文描述的人脸识别模型构建方法可相互对应参照。

请参阅图8，示出了本申请实施例提供的一种人脸识别模型构建装置的结构示意图，该人脸识别模型构建装置可以包括：第一特征提取模块801、聚类模块802、类中心确定模块803和模型训练模块804。

第一特征提取模块801，用于利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，获得所述多幅训练人脸图像分别对应的第一人脸特征。

聚类模块802，用于对所述多幅训练人脸图像分别对应的第一人脸特征进行聚类。

类中心确定模块803，用于根据所述聚类模块的聚类结果确定所述多幅训练人脸图像分别所属类别的类中心。

模型训练模块804，用于利用所述多幅训练人脸图像和所述多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型，对作为学生模型的人脸识别模型训练至收敛，得到构建出的人脸识别模型。

本申请实施例提供的人脸识别模型构建装置，将具有较高识别准确度的人脸识别模型作为教师模型，采用教师模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征，通过对提取的人脸特征进行聚类来确定多幅训练人脸图像分别对应的类中心，进而使作为学生模型的人脸识别模型在训练的过程中对训练人脸图像提取的人脸特征尽量的去逼近训练人脸图像所属类别的类中心，从而获得具有较高识别速度和较高识别准确度的人脸识别模型。

在一种可能的实现方式中，上述实施例中，作为教师模型的人脸识别模型为多个，则第一特征提取模块801，具体用于利用作为教师模型的每个人脸识别模型对每幅训练人脸图像提取人脸特征，获得所述多幅训练人脸图像分别对应的多个第一人脸特征。

在一种可能的实现方式中，上述实施例中的聚类模块802，具体用于确定由所述多幅训练人脸图像分别对应的第一人脸特征所组成的特征集对应的k近邻关系矩阵，其中，所述k近邻关系矩阵能够表征与所述特征集中的每个第一人脸特征最邻近的k个第一人脸特征；利用图卷积神经网络和所述人脸特征集对应的k近邻关系矩阵，对所述人脸特征集中的第一人脸特征进行聚类。

在一种可能的实现方式中，上述实施例中的类中心确定模块803包括：第一类中心确定模块、特征簇处理模块和第二类中心确定模块。

第一类中心确定模块，用于若所述聚类结果中仅包括一个特征簇，则将该特征簇作为目标特征簇，确定所述目标特征簇的簇中心，作为每幅训练人脸图像所属类别的类中心；

特征簇处理模块，用于若所述聚类结果中包括多个特征簇，则将所述多个特征簇处理成一个目标特征簇和至少一个非目标特征簇，其中，该目标特征簇由类别标注正确的所有训练人脸图像分别对应的第一人脸特征组成，每个所述非目标特征簇由一幅类别标注错误的训练人脸图像对应的第一人脸特征组成。

第二类中心确定模块，用于确定处理得到的所述目标特征簇的簇中心，作为类别标注正确的每个训练人脸图像所属类别的类中心，并确定每个所述非目标特征簇的簇中心，作为类别标注错误的对应训练人脸图像所属类别的类中心。

在一种可能的实现方式中，上述的特征簇处理模块，具体用于根据每个特征簇中所包含的第一人脸特征的数量，从所述多个特征簇中确定出非噪声特征簇和噪声特征簇；从所述非噪声特征簇中去除满足噪声条件的第一人脸特征，获得的特征簇作为目标特征簇；其中，若所述非噪声特征簇中的一第一人脸特征所属的训练人脸图像的部分第一人脸特征位于所述噪声特征簇中，则该第一人脸特征满足噪声条件；将所述满足噪声条件的第一人脸特征与所述噪声特征簇中的所有第一人脸特征按训练人脸图像分类，以将同一训练人脸图像的第一人脸特征划分为一个噪声特征簇，得到的每个噪声特征簇作为一个非目标特征簇。

在一种可能的实现方式中，上述的第一类中心确定模块和第二类中心确定模块在确定目标特征簇的簇中心时，具体用于确定所述目标特征簇中各第一人脸特征的权重；根据所述目标特征簇中的各第一人脸特征和所述目标特征簇中各第一人脸特征的权重，确定所述目标特征簇的簇中心。

在一种可能的实现方式中，上述的第二类中心确定模块在确定所述非目标特征簇的簇中心时，具体用于确定所述非目标特征簇中所有第一人脸特征的均值，作为所述非目标特征簇的簇中心。

在一种可能的实现方式中，上述的第一类中心确定模块和第二类中心确定模块在确定所述目标特征簇中各第一人脸特征的权重时，具体用于从所述目标特征簇选取最优的第一人脸特征；根据所述目标特征簇中各第一人脸特征分别与所述最优的第一人脸特征的距离，确定所述目标特征簇中各第一人脸特征分别对应的权重。

在一种可能的实现方式中，上述实施例中的模型训练模块804包括：第二特征提取模块和模型参数更新模块。

第二特征提取模块，用于利用作为学生模型的人脸识别模型对所述多幅训练人脸图像分别提取人脸特征，获得所述多幅训练人脸图像分别对应的第二人脸特征；

模型参数更新模块，用于至少根据所述多幅训练人脸图像分别对应的第二人脸特征和所述多幅训练人脸图像分别所属类别的类中心，更新所述作为学生模型的人脸识别模型的参数。

在一种可能的实现方式中，上述的模型参数更新模块可以包括：预测损失确定子模块和参数更新子模块。

预测损失确定子模块，用于对于每幅训练人脸图像：若该训练人脸图像的类别标注错误，则根据该训练人脸图像对应的第二人脸特征和该训练人脸图像所属类别的类中心，确定该训练人脸图像对应的预测损失；若该训练人脸图像的类别标注正确，则根据该训练人脸图像对应的第二人脸特征预测该训练人脸图像所属的类别，根据预测的类别、该训练人脸图像标注的类别、该训练人脸图像对应的第二人脸特征和该训练人脸图像所属类别的类中心，确定该训练人脸图像对应的预测损失，其中，该训练人脸图像的类别是否标注错误根据该训练人脸图像所属类别的类中心确定；

参数更新子模块，用于将多幅训练人脸图像分别对应的预测损失求和，并根据求和得到的损失更新所述作为学生模型的人脸识别模型的参数。

本申请实施例还提供了一种人脸识别模型构建设备，请参阅图9，示出了该人脸识别模型构建的结构示意图，该人脸识别模型构建可以包括：至少一个处理器901，至少一个通信接口902，至少一个存储器903和至少一个通信总线904；

在本申请实施例中，处理器901、通信接口902、存储器903、通信总线904的数量为至少一个，且处理器901、通信接口902、存储器903通过通信总线904完成相互间的通信；

处理器901可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路等；

存储器903可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)等，例如至少一个磁盘存储器；

其中，存储器存储有程序，处理器可调用存储器存储的程序，所述程序用于：

可选的，所述程序的细化功能和扩展功能可参照上文描述。

本申请实施例还提供一种可读存储介质，该可读存储介质可存储有适于处理器执行的程序，所述程序用于：

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人脸识别模型构建方法，其特征在于，包括：

2.根据权利要求1所述的人脸识别模型的构建方法，其特征在于，所述作为教师模型的人脸识别模型为多个；

3.根据权利要求2所述的人脸识别模型的构建方法，其特征在于，所述对所述多幅训练人脸图像分别对应的第一人脸特征进行聚类，包括：

4.根据权利要求2所述的人脸识别模型的构建方法，其特征在于，所述根据聚类结果确定所述多幅训练人脸图像分别所属类别的类中心，包括：

5.根据权利要求4所述的人脸识别模型的构建方法，其特征在于，所述将所述多个特征簇处理成一个目标特征簇和至少一个非目标特征簇，包括：

6.根据权利要求4所述的人脸识别模型的构建方法，其特征在于，确定所述目标特征簇的簇中心，包括：

确定所述目标特征簇中各第一人脸特征的权重；

确定所述非目标特征簇的簇中心，包括：

7.根据权利要求6所述的人脸识别模型的构建方法，其特征在于，所述确定所述目标特征簇中各第一人脸特征的权重，包括：

从所述目标特征簇选取最优的第一人脸特征；

8.根据权利要求1所述的人脸识别模型的构建方法，其特征在于，所述利用所述多幅训练人脸图像和所述多幅训练人脸图像分别所属类别的类中心，训练作为学生模型的人脸识别模型，包括：

9.根据权利要求8所述的人脸识别模型的构建方法，其特征在于，所述至少根据所述多幅训练人脸图像分别对应的第二人脸特征和所述多幅训练人脸图像分别所属类别的类中心，更新所述作为学生模型的人脸识别模型的参数，包括：

对于每幅训练人脸图像：

10.一种人脸识别方法，其特征在于，包括：

获取待识别的人脸图像；

将待识别的人脸图像输入采用如权利要求1～9中任意一项所述的人脸识别模型构建方法构建的人脸识别模型中，获得所述待识别的人脸图像的识别结果。

11.一种人脸识别模型构建装置，其特征在于，包括：第一特征提取模块、聚类模块、类中心确定模块和模型训练模块；

12.一种人脸识别模型构建设备，其特征在于，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如权利要求1～9中任一项所述的人脸识别模型构建方法的各个步骤。

13.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1～9中任一项所述的人脸识别模型构建方法的各个步骤。