CN110059604B

CN110059604B - 深度均匀人脸特征提取的网络训练方法及装置

Info

Publication number: CN110059604B
Application number: CN201910286518.9A
Authority: CN
Inventors: 鲁继文; 周杰; 段岳圻
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2019-04-10
Filing date: 2019-04-10
Publication date: 2021-04-27
Anticipated expiration: 2039-04-10
Also published as: CN110059604A

Abstract

本申请提出一种深度均匀人脸特征提取的网络训练方法及装置，其中，该方法包括：将人脸图像训练集合输入预设深度卷积神经网络；获取预设深度卷积神经网络输出的与人脸图像训练集合中的多个人脸图像子集合对应的多个人脸特征中心值；根据预设损失函数计算多个人脸特征中心值之间的均匀分布损失值，并检测均匀分布损失值是否小于预设阈值；若均匀分布损失值不小于预设阈值，则根据均匀分布损失值对预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于预设阈值时，完成对预设深度卷积神经网络的训练。由此，通过这种深度均匀人脸特征提取的网络训练方法，充分利用整个特征空间，提高了人脸识别的准确率。

Description

深度均匀人脸特征提取的网络训练方法及装置

技术领域

本申请涉及人脸识别技术领域，尤其涉及一种深度均匀人脸特征提取的网络训练方法及装置。

背景技术

人脸识别在智能监控、无人系统、安全门禁等实际应用中发挥着重要的作用。传统的人脸识别系统分为以下四个步骤：人脸检测、人脸对齐、人脸特征提取、人脸分类。人脸识别作为一个典型的模式识别问题，由于人脸受到背景、姿态、表情、光照等影响，同类图片具有较大的类内差异，因此提取区分力强的特征在系统中扮演着关键性的角色。

随着大数据时代的到来，深度学习在例如视觉识别、检测、检索、分割等多项视觉分析任务中取得了突破性的进展。因此，大量研究者也开展了基于深度特征学习的人脸识别方法。球人脸特征模型认为特征应存在于一个高维超球面上，并采用角度距离来进行度量特征间的相似性，取得了领先的识别效果。

然而，由于球人脸特征模型未对特征间的距离进行约束，因此无法保证整体的特征分布充分利用整个球面，使得人脸特征在球面上的分布不均匀。对于特征密集的局部区域，不同人脸图像的特征间距较小，易将不同人脸识别为同一人；而在其他特征分布较为离散的区域中，大部分特征空间均用于区分较易人脸(即差异较大的不同人脸)，未能充分利用整个特征空间，从而影响了人脸识别的准确率。

发明内容

本申请提出的深度均匀人脸特征提取的网络训练方法及装置，用于解决相关技术中，球人脸特征模型中的人脸特征在球面上的分布不均匀，未能充分利用整个特征空间，从而影响了人脸识别的准确率的问题。

本申请一方面实施例提出的深度均匀人脸特征提取的网络训练方法，包括：将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像；获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值；根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值；若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。

本申请另一方面实施例提出的深度均匀人脸特征提取的网络训练装置，包括：输入模块，用于将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像；获取模块，用于获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值；检测模块，用于根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值；更新模块，用于若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。

本申请实施例提供的深度均匀人脸特征提取的网络训练方法及装置，将人脸图像训练集合输入预设深度卷积神经网络，并获取预设深度卷积神经网络输出的与人脸图像训练集合中包括的多个人脸图像子集合对应的多个人脸特征中心值，之后根据预设损失函数计算多个人脸特征中心值之间的均匀分布损失值，并检测均匀分布损失值是否小于预设阈值，进而在均匀分布损失值不小于预设阈值时，根据均匀分布损失值对预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于预设阈值时，完成对预设深度卷积神经网络的训练。由此，通过根据预设深度卷积神经网络输出的多个人脸特征中心值之间的均匀分布损失值，对预设深度卷积神经网络的网络参数进行调整，以使得深度卷积神经网络输出的人脸特征在特征空间中均匀分布，从而实现了充分利用整个特征空间，提高了人脸识别的准确率。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请实施例所提供的一种深度均匀人脸特征提取的网络训练方法的流程示意图；

图2为本申请实施例所提供的另一种深度均匀人脸特征提取的网络训练方法的流程示意图；

图3-1为对分布在球面上的同种电荷进行电势能最小化的过程示意图；

图3-2为通过结合均匀分布损失函数与角度softmax损失函数对预设深度卷积神经网络的网络参数进行优化的示意图；

图4为本申请实施例所提供的一种深度均匀人脸特征提取的网络训练装置的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的要素。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

本申请实施例针对相关技术中，球人脸特征模型中的人脸特征在球面上的分布不均匀，未能充分利用整个特征空间，从而影响了人脸识别的准确率的问题，提出一种深度均匀人脸特征提取的网络训练方法。

本申请实施例提供的深度均匀人脸特征提取的网络训练方法，将人脸图像训练集合输入预设深度卷积神经网络，并获取预设深度卷积神经网络输出的与人脸图像训练集合中包括的多个人脸图像子集合对应的多个人脸特征中心值，之后根据预设损失函数计算多个人脸特征中心值之间的均匀分布损失值，并检测均匀分布损失值是否小于预设阈值，进而在均匀分布损失值不小于预设阈值时，根据均匀分布损失值对预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于预设阈值时，完成对预设深度卷积神经网络的训练。由此，通过根据预设深度卷积神经网络输出的多个人脸特征中心值之间的均匀分布损失值，对预设深度卷积神经网络的网络参数进行调整，以使得深度卷积神经网络输出的人脸特征在特征空间中均匀分布，从而实现了充分利用整个特征空间，提高了人脸识别的准确率。

下面参考附图对本申请提供的深度均匀人脸特征提取的网络训练方法及装置进行详细描述。

图1为本申请实施例所提供的一种深度均匀人脸特征提取的网络训练方法的流程示意图。

如图1所示，该深度均匀人脸特征提取的网络训练方法，包括以下步骤：

步骤101，将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像。

在本申请实施例中，可以根据实际需要，选择合适的深度卷积神经网络，作为预设深度卷积神经网络，对人脸图像训练集合中的各人脸图像进行特征提取。

需要说明的是，人脸图像训练集合中需要包含大量人脸图像，并且包括多个不同人脸图像子集合，其中，每个图像子集合中包括的多张人脸图像，为同一个用户在不同的背景、姿态、表情、光照下的多张人脸图像，以使通过人脸图像训练集合训练出的网络模型的可靠性更高。

步骤102，获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值。

其中，人脸图像子集合对应人脸特征中心值，是指该人脸图像子集合中各人脸图像分别对应的人脸特征值的平均值。

在本申请实施例中，将人脸图像训练集合中的每张人脸图像依次输入预设深度卷积神经网络，并利用预设深度卷积神经网络对每张人脸图像分别进行特征提取，以确定每张人脸图像对应的人脸特征值，进而预设深度卷积神经网络根据每个人脸图像子集合中各人脸图像的序号，以及确定出的每张人脸图像对应的人脸特征值的序号，确定出每个人脸图像子集合中各人脸图像分别对应的人脸特征值，并根据每个人脸图像子集合中各人脸图像分别对应的人脸特征值，确定出每个人脸图像子集合分别对应的人脸特征中心值。

作为一种可能的实现方式，可以将每个人脸图像子集合中各人脸图像分别对应的人脸特征值的平均值，确定为每个人脸图像子集合分别对应的人脸特征中心值。

具体的，人脸图像对应的人脸特征值可以是一个n维的向量(n为大于1的正整数)，人脸图像子集合对应的人脸特征中心值也为一个n维的向量。因此，人脸图像子集合对应的人脸特征中心值的每一维的取值，可以是该人脸图像子集合中各人脸图像分别对应的人脸特征值对应维取值的平均值，即人脸图像子集合对应的人脸特征中心值，可以通过公式(1)确定。

其中，b_m为一个人脸图像子集合对应的人脸特征中心值第m维的取值，x为该人脸图像子集合中包括的人脸图像的数量，a_k,m为该人脸图像子集合中第k个人脸图像对应的人脸特征值第m维的取值，m为该人脸图像子集合对应的人脸特征中心值以及人脸图像对应的人脸特征值的维度序号，k为该人脸图像子集合中包括的人脸图像的序号。

作为一种可能的实现方式，在通过预设神经卷积神经网络确定出人脸图像训练集合中每个人脸图像子集合分别对应的人脸特征中心值之后，即可根据预设深度卷积神经网络的输出，获取人脸图像训练集合中多个人脸图像子集合对应的多个人脸特征中心值。

步骤103，根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值。

在本申请实施例中，可以通过预设损失函数以及获取的多个人脸图像子集合分别对应的多个人脸特征中心值，确定预设损失函数的取值，即多个人脸特征中心值之间的均匀分布损失值，进而根据均匀分布损失值确定预设深度卷积神经网络的性能优劣，并根据均匀分布损失值对预设深度卷积神经网络的网络参数进行调整，以优化预设深度卷积神经网络的性能。

需要说明的是，在对深度卷积神经网络进行训练的过程中，通过损失函数对深度卷积神经网络的网络参数进行优化时，损失函数的取值越小，则说明深度卷积神经网络当前的性能越好，即在本申请实施例中，通过预设损失函数计算的多个人脸特征中心值之间的均匀分布损失值越小，预设深度卷积神经网络的性能越好。

作为一种可能的实现方式，可以预设多个人脸特征中心值之间的均匀分布损失值的阈值，并根据多个人脸特征中心值之间的均匀分布损失值与预设的阈值的关系，判断预设深度卷积神经网络当前的性能是否符合要求，以及是否需要对预设深度卷积神经网络的网络参数进行更新。

需要说明的是，实际使用时，均匀分布损失值的阈值可以根据实际需要预设，本申请实施例对此不做限定。

具体的，若确定多个人脸特征中心值之间的均匀分布损失值小于预设阈值，则可以确定预设深度卷积神经网络当前的性能符合要求，即不需要对预设深度卷积神经网络的网络参数进行更新；若确定多个人脸特征中心值之间的均匀分布损失值不小于预设阈值，则可以确定预设深度卷积神经网络当前的性能不符合要求，即需要对预设深度卷积神经网络的网络参数进行更新，以优化预设神经卷积神经网络的性能。

步骤104，若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。

在本申请实施例中，在确定多个人脸特征中心值之间的均匀分布损失值不小于预设阈值，则可以根据均匀分布损失值对预设深度卷积神经网络的网络参数进行更新，并将人脸图像训练集合中的人脸图像依次输入更新后的深度卷积神经网络，进而根据更新后的深度卷积神经网络输出的多个人脸特征中心值以及预设损失函数，重新计算多个人脸特征中心值之间的均匀分布损失值，进而进一步检测新的均匀分布损失值是否小于阈值，若不小于，则需要根据均匀分布损失值，再一次对深度卷积神经网络的网络参数进行更新，直至深度卷积神经网络输出的多个人脸特征中心值之间的均匀分布损失值小于阈值，则可以完成对预设深度卷积神经网络的训练；若小于，则可以确定更新后的深度卷积神经网络的性能符合要求，即无需继续调整深度卷积神经网络的网络参数，从而完成对预设深度卷积神经网络的训练。

在本申请一种可能的实现形式中，可以将每个人脸图像子集合对应的人脸特征中心值看作同种点电荷，并根据物理学中的库仑斥力公式，计算出每两个人脸特征中心值间的库仑斥力，进而将每两个人脸特征中心值间的库仑斥力之和的平均值公式，确定为均匀分布损失函数，并将确定出的均匀分布损失函数，确定为预设损失函数，以对预设深度卷积神经网络的性能进行优化。

下面结合图2，对本申请实施例提供的深度均匀人脸特征提取的网络训练方法进行进一步说明。

图2为本申请实施例所提供的另一种深度均匀人脸特征提取的网络训练方法的流程示意图。

如图2所示，该深度均匀人脸特征提取的网络训练方法，包括以下步骤：

步骤201，将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像。

步骤202，获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值。

上述步骤201-202的具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述。

步骤203，根据

计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值。

其中，L_u为均匀分布损失值，M为多个人脸图像子集合的数量，λ为超参数，c_j1、c_j2分别为第j1个人脸特征中心值与第j2个人脸特征中心值，d(c_j1,c_j2)为第j1个人脸特征中心值与第j2个人脸特征中心值的距离，j1、j2为人脸特征中心值的序号。

优选的，d(c_j1,c_j2)为c_j1与c_j2的欧式距离，λ＝1。

需要说明的是，在球人脸特征中，人脸特征值分布在一个超高维球面上，因此，为使得人脸特征值在超高维球面上均匀分布，可以对多个人脸图像子集合对应的多个人脸特征中心值间的距离进行约束。

作为一种可能的实现方式，可以根据物理学中，球面上随机分布同种电荷在斥力作用下电势能逐渐减小，并且电势能在电荷在球面上均匀分布时达到最低值的原理，获得均匀分布损失函数L_u。如图3-1所示，为对分布在球面上的同种电荷进行电势能最小化的过程示意图。从如3-1中可以容易看出，当电荷C₁、C₂、C₃在球面上均匀分布时，它们两两之间的库仑斥力之和最小，即电势能最小。

在本申请实施例中，可以将过个人脸图像子集合对应的多个人脸特征中心值看作同种点电荷，并将两个人脸特征中心值间的欧式距离看作其对应的点电荷间的距离，将常数K换做常数1，从而可以获得多个人脸图像子集合对应的多个人脸特征中心值的库仑斥力的平均值为

进一步的，为提高确定的均匀分布损失函数的通用性，可以在多个人脸图像子集合对应的多个人脸特征中心值的库仑斥力的平均值公式中引入超参数λ，以便于最终获得的均匀分布损失函数与其他损失函数结合，共同对预设深度卷积神经网络的参数进行优化，以进一步提高对预设深度卷积神经网络的优化效果。从而可以得到均匀分布损失函数

在本申请实施例中，多个人脸特征中心值之间的均匀分布损失值越小，则可以确定多个人脸特征中心值间的分布越均匀，即说明深度卷积神经网络当前的性能越好；多个人脸特征中心值之间的均匀分布损失值越大，则可以确定多个人脸特征中心值间的分布越不均匀，即说明深度卷积神经网络当前的性能越差。

作为一种可能的实现方式，可以根据公式

计算多个人脸特征中心值之间的均匀分布损失值，并预设多个人脸特征中心值之间的均匀分布损失值的阈值，进而根据多个人脸特征中心值之间的均匀分布损失值与预设的阈值的关系，判断预设深度卷积神经网络当前的性能是否符合要求，以及是否需要对预设深度卷积神经网络的网络参数进行更新。

具体的，若确定多个人脸特征中心值之间的均匀分布损失值小于预设阈值，则可以确定多个人脸特征中心值分布的均匀程度符合要求，即预设深度卷积神经网络当前的性能符合要求，即不需要对预设深度卷积神经网络的网络参数进行更新；若确定多个人脸特征中心值之间的均匀分布损失值不小于预设阈值，则可以确定多个人脸特征中心值分布的均匀程度不符合要求，即预设深度卷积神经网络当前的性能不符合要求，即需要对预设深度卷积神经网络的网络参数进行更新，以优化预设神经卷积神经网络的性能。

进一步的，为进一步提高预设神经卷积神经网络的性能，还可以将其他损失函数与本申请提出的均匀分布损失函数L_u结合，作为预设损失函数，以共同对预设深度卷积神经网络的性能进行优化。即在本申请实施例一种可能的实现形式中，上述步骤203之前，还可以包括：

根据均匀分布损失函数和角度softmax损失函数，确定所述预设损失函数。

其中，所述角度softmax损失函数为：

其中，L_ang为角度softmax损失函数值，N为所述人脸图像训练集合中的人脸图像的数量，x_i为所述人脸图像训练集合中的第i个样本，yi为x_i所属的人脸图像子集合，θ_yi,i为x_i与其所属的人脸图像子集合yi间的角度，ψ(θ_yi,i)为x_i与其所属的人脸图像子集合yi间的余弦距离，i为人脸图像子集合的序号，h为所述人脸图像训练集合中与yi不同的其他人脸图像子集合的序号，θ_h,i为x_i与第h个其他人脸图像子集合间的角度。

具体的，在将均匀分布损失函数L_u与角度softmax函数进行结合，以共同对预设深度卷积神经网络的参数进行优化训练时，可以将均匀分布损失函数L_u与角度softmax函数之和，确定为预设损失函数。即在本申请实施例一种可能的实现形式中，上述根据均匀分布损失函数和角度softmax损失函数，确定所述预设损失函数，可以包括：

将所述均匀分布损失函数L_u与所述角度softmax损失函数L_ang之和，确定为所述预设损失函数。

作为一种可能的实现方式，若将均匀分布损失函数Lu与角度softmax损失函数L_ang之和，确定为预设损失函数，则可以根据人脸图像训练集合中人脸图像的数量、多个人脸图像子集合以及多个人脸图像子集合对应的多个人脸特征中心值，确定均匀分布损失函数L_u与角度softmax损失函数L_ang之和的取值，即预设损失函数的取值，进而根据预设损失函数的取值与预设的阈值的关系，确定是否需要对预设深度卷积神经网络的网络参数进行更新。

具体的，若确定预设损失函数的取值小于预设阈值，则可以确定预设深度卷积神经网络当前的性能符合要求，即不需要对预设深度卷积神经网络的网络参数进行更新；若确定预设损失函数的取值不小于预设阈值，则可以确定预设深度卷积神经网络当前的性能不符合要求，即需要对预设深度卷积神经网络的网络参数进行更新，以优化预设神经卷积神经网络的性能。如图3—2所示，为通过结合均匀分布损失函数与角度softmax损失函数对预设深度卷积神经网络的网络参数进行优化的示意图。其中，C表示预设深度卷积神经网络的卷积层，P表示预设深度卷积神经网络的Max-pooling层，FC表示预设深度卷积神经网络的全连接层。

需要说明的是，通过结合均匀分布损失函数和角度softmax损失函数，共同对预设深度卷积神经网络的性能进行优化时，可以通过调整超参数λ的取值，对均匀分布损失函数及角度softmax损失函数在预设深度卷积神经网络的性能优化中所起的作用进行平衡。

在本申请实施例一种可能的实现形式中，均匀分布损失函数L_u与角度softmax损失函数L_ang的取值范围可能存在较大差异，从而导致其中一个损失函数在优化预设深度卷积神经网络的网络参数时，几乎不起作用，从而导致最终获得的预设深度卷积神经网络的性能较差。比如，均匀分布损失函数L_u的取值范围(如[0，100])远大于角度softmax损失函数L_ang的取值范围(如[0，1])，则会导致角度softmax损失函数L_ang在优化预设深度卷积神经网络的网络参数时，几乎不起作用，从而可以通过调整超参数λ的取值，使得均匀分布损失函数Lu的取值范围与角度softmax损失函数L_ang的取值范围相同或相近，从而使得两个损失函数可以在优化预设深度卷积神经网络的网络参数时，均起到良好的作用，从而进一步提高预设深度卷积神经网络的优化效果。

举例来说，若均匀分布损失函数L_u的取值范围为[0，100]，角度softmax损失函数L_ang的取值范围为[0，1]，则可以将超参数λ的取值确定为0.01；若均匀分布损失函数L_u的取值范围为[0，1]，角度softmax损失函数L_ang的取值范围也为[0，1]，则可以将超参数λ的取值确定为1。

步骤204，若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。

上述步骤204的具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述。

进一步的，在对预设深度卷积神经网络训练完成之后，即可以利用训练完成的深度卷积神经网络进行人脸识别或分类。即在本申请实施例一种可能的实现形式中，上述步骤204之后，还可以包括：

获取待处理人脸图像集合，并将所述待处理人脸图像集合输入训练完成的深度卷积神经网络，其中，所述待处理人脸图像集合中包含多个待处理人脸图像子集合，每个待处理人脸图像子集合中包含同一个用户的多张待处理人脸图像；

获取所述训练完成的深度卷积神经网络输出的与所述多个待处理人脸图像子集合对应的多个待处理人脸特征中心值，并根据所述多个待处理人脸特征中心值将所述待处理人脸图像集合对应的人脸特征投影至高维超球面。

其中，待处理人脸图像集合中包含多个待处理人脸图像子集合，每个待处理人脸图像子集合中包含同一个用户的多张待处理人脸图像，即待处理人脸图像集合的结构与人脸图像训练集合相同。

需要说明的是，待处理人脸图像集合可以是训练预设深度卷积神经网络时所使用的人脸图像训练集合，也可以是重新获取的与人脸图像训练集合结构相同的人脸图像集合。实际使用时，可以根据实际需要确定待处理人脸图像集合，本申请实施例对此不做限定。

在本申请实施例中，在将待处理人脸图像集合输入训练完成的深度卷积神经网络之后，训练完成的深度卷积深度神经网络即可输出与待处理人脸图像集合中包括的多个待处理人脸图像子集合对应的多个待处理人脸特征中心值，进而根据多个待处理人脸特征中心值将待处理人脸图像集合对应的各人脸特征投影值高维超球面。其中，每个待处理人脸图像子集合中的各人脸特征均以该待处理人脸图像子集合对应的待处理人脸特征中心值为中心，并且各人脸特征均匀的分布在高维超球面上。

进一步的，在利用训练完成的深度卷积神经网络对待处理人脸图像集合中的各人脸图像进行深度特征提取，并将各人脸特征投影值高维超球面之后，即可以根据获取到的待处理人脸图像集合的各人脸特征，训练分类器，以利用分类器对人脸图像测试集中的图像进行分类。即在本申请实施例一种可能的实现形式中，上述根据所述多个待处理人脸特征中心值将所述待处理人脸图像集合对应的人脸特征投影至高维超球面之后，还可以包括：

利用预设的分类器算法对所述待处理人脸图像集合对应的人脸特征进行识别处理，以生成分类模型；

利用所述分类模型对人脸图像测试集合进行识别处理，以对所述人脸图像测试集中的人脸图像进行分类。

在本申请实施例中，利用训练完成的深度卷积神经网络对待处理人脸图像集合中的各人脸图像进行深度特征提取，可以获得非常可靠的深度特征，从而提高人脸识别的准确性。因此，可以利用预设的分类器算法对待处理人脸图像集合对应的人脸特征进行识别处理，以生成可靠的分类模型，进而利用生成的分类模型对人脸图像测试集合中的各人脸图像进行识别处理，以对人脸图像测试集中的人脸图像进行分类。

本申请实施例提供的深度均匀人脸特征提取的网络训练方法，可以将人脸图像训练集合输入预设深度卷积神经网络，并获取预设深度卷积神经网络输出的与人脸图像训练集合中包括的多个人脸图像子集合对应的多个人脸特征中心值，之后根据

计算多个人脸特征中心值之间的均匀分布损失值，并检测均匀分布损失值是否小于预设阈值，进而在均匀分布损失值不小于预设阈值时，根据均匀分布损失值对预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于预设阈值时，完成对预设深度卷积神经网络的训练。由此，通过根据预设深度卷积神经网络输出的多个人脸特征中心值之间的均匀分布损失值，对预设深度卷积神经网络的网络参数进行调整，以使得深度卷积神经网络输出的人脸特征在特征空间中均匀分布，从而实现了充分利用整个特征空间，进一步提高了人脸识别的准确率。

为了实现上述实施例，本申请还提出一种深度均匀人脸特征提取的网络训练装置。

图4为本申请实施例提供的一种深度均匀人脸特征提取的网络训练装置的结构示意图。

如图4所示，该深度均匀人脸特征提取的网络训练装置30，包括：

输入模块31，用于将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像；

第一获取模块32，用于获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值；

检测模块33，用于根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值；

更新模块34，用于若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。

在实际使用时，本申请实施例提供的深度均匀人脸特征提取的网络训练装置，可以被配置在任意电子设备中，以执行前述深度均匀人脸特征提取的网络训练方法。

本申请实施例提供的深度均匀人脸特征提取的网络训练装置，可以将人脸图像训练集合输入预设深度卷积神经网络，并获取预设深度卷积神经网络输出的与人脸图像训练集合中包括的多个人脸图像子集合对应的多个人脸特征中心值，之后根据预设损失函数计算多个人脸特征中心值之间的均匀分布损失值，并检测均匀分布损失值是否小于预设阈值，进而在均匀分布损失值不小于预设阈值时，根据均匀分布损失值对预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于预设阈值时，完成对预设深度卷积神经网络的训练。由此，通过根据预设深度卷积神经网络输出的多个人脸特征中心值之间的均匀分布损失值，对预设深度卷积神经网络的网络参数进行调整，以使得深度卷积神经网络输出的人脸特征在特征空间中均匀分布，从而实现了充分利用整个特征空间，提高了人脸识别的准确率。

在本申请一种可能的实现形式中，上述预设损失函数为：

其中，L_u为所述均匀分布损失值，M为所述多个人脸图像子集合的数量，λ为超参数，c_j1、c_j2分别为第j1个人脸特征中心值与第j2个人脸特征中心值，d(c_j1，c_j2)为第j1个人脸特征中心值与第j2个人脸特征中心值的距离，j1、j2为人脸特征中心值的序号。

进一步的，在本申请另一种可能的实现形式中，上述深度均匀人脸特征提取的网络训练装置30，还包括：

确定模块，用于根据均匀分布损失函数和角度softmax损失函数，确定所述预设损失函数。

进一步的，在本申请再一种可能的实现形式中，上述角度softmax损失函数为：

其中，L_ang为角度softmax损失函数值，N为所述人脸图像训练集合中的人脸图像的数量，x_i为所述人脸图像训练集合中的第i个样本，yi为x_i所属的人脸图像子集合，θ_yi，i为x_i与其所属的人脸图像子集合yi间的角度，ψ(θ_yi，i)为x_i与其所属的人脸图像子集合yi间的余弦距离，i为人脸图像子集合的序号，h为所述人脸图像训练集合中与yi不同的其他人脸图像子集合的序号，θ_h，i为x_i与第h个其他人脸图像子集合间的角度。

进一步的，在本申请又一种可能的实现形式中，上述确定模块，具体用于：

将所述均匀分布损失函数Lu与所述角度softmax损失函数L_ang之和，确定为所述预设损失函数。

进一步的，在本申请又一种可能的实现形式中，上述d(c_j1，c_j2)为c_j1与c_j2的欧式距离，λ＝1。

第二获取模块，用于获取待处理人脸图像集合，并将所述待处理人脸图像集合输入训练完成的深度卷积神经网络，其中，所述待处理人脸图像集合中包含多个待处理人脸图像子集合，每个待处理人脸图像子集合中包含同一个用户的多张待处理人脸图像；

第三获取模块，用于获取所述训练完成的深度卷积神经网络输出的与所述多个待处理人脸图像子集合对应的多个待处理人脸特征中心值，并根据所述多个待处理人脸特征中心值将所述待处理人脸图像集合对应的人脸特征投影至高维超球面。

进一步的，在本申请另再一种可能的实现形式中，上述深度均匀人脸特征提取的网络训练装置30，还包括：

生成模块，用于利用预设的分类器算法对所述待处理人脸图像集合对应的人脸特征进行识别处理，以生成分类模型；

分类模块，用于利用所述分类模型对人脸图像测试集合进行识别处理，以对所述人脸图像测试集中的人脸图像进行分类。

需要说明的是，前述对图1、图2所示的深度均匀人脸特征提取的网络训练方法实施例的解释说明也适用于该实施例的深度均匀人脸特征提取的网络训练装置30，此处不再赘述。

本申请实施例提供的深度均匀人脸特征提取的网络训练装置，可以将人脸图像训练集合输入预设深度卷积神经网络，并获取预设深度卷积神经网络输出的与人脸图像训练集合中包括的多个人脸图像子集合对应的多个人脸特征中心值，之后根据

本领域技术人员在考虑说明书及实践这里申请的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种深度均匀人脸特征提取的网络训练方法，其特征在于，包括：

将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像；

获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值；

根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值，其中，所述预设损失函数为：

其中，L_u为所述均匀分布损失值，M为所述多个人脸图像子集合的数量，λ为超参数，c_j1、c_j2分别为第j1个人脸特征中心值与第j2个人脸特征中心值，d(c_j1,c_j2)为第j1个人脸特征中心值与第j2个人脸特征中心值的距离，j1、j2为人脸特征中心值的序号；

若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。

2.如权利要求1所述的方法，其特征在于，所述根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值之前，还包括：

3.如权利要求2所述的方法，其特征在于，

所述角度softmax损失函数为：

4.如权利要求3所述的方法，其特征在于，所述根据均匀分布损失函数与角度softmax损失函数，确定所述预设损失函数，包括：

5.如权利要求1所述的方法，其特征在于，d(c_j1,c_j2)为c_j1与c_j2的欧式距离，λ＝1。

6.如权利要求1-5任一所述的方法，其特征在于，还包括：

7.如权利要求6所述的方法，其特征在于，所述根据所述多个待处理人脸特征中心值将所述待处理人脸图像集合对应的人脸特征投影至高维超球面之后，还包括：

8.一种深度均匀人脸特征提取的网络训练装置，其特征在于，包括：

输入模块，用于将人脸图像训练集合输入预设深度卷积神经网络，其中，所述人脸图像训练集合中包含多个人脸图像子集合，每个人脸图像子集合中包含同一个用户的多张人脸图像；

获取模块，用于获取所述预设深度卷积神经网络输出的与所述多个人脸图像子集合对应的多个人脸特征中心值；

检测模块，用于根据预设损失函数计算所述多个人脸特征中心值之间的均匀分布损失值，并检测所述均匀分布损失值是否小于预设阈值，其中，所述预设损失函数为：

更新模块，用于若所述均匀分布损失值不小于所述预设阈值，则根据所述均匀分布损失值对所述预设深度卷积神经网络的网络参数进行更新，直到更新后的深度卷积神经网络对应的均匀分布损失值小于所述预设阈值时，完成对所述预设深度卷积神经网络的训练。