WO2021083241A1

WO2021083241A1 - 人脸图像质量评价方法、特征提取模型训练方法、图像处理系统、计算机可读介质和无线通信终端

Info

Publication number: WO2021083241A1
Application number: PCT/CN2020/124546
Authority: WO
Inventors: 颜波
Original assignee: Oppo广东移动通信有限公司
Priority date: 2019-10-31
Filing date: 2020-10-28
Publication date: 2021-05-06
Also published as: CN110866471A

Abstract

本申请实施例公开了一种人脸图像质量评价方法、特征提取模型的训练方法、图像处理系统、计算机可读介质和无线通信终端，该评价方法包括：获取包含人脸的待处理图像；对所述待处理图像进行检测以获取对应的人脸图像；将人脸图像输入已训练的基于移动人脸识别网络的特征提取模型，对所述人脸图像进行特征提取以获取特征数据；将所述特征数据输入连续设置的第一全连接层和第二全连接层进行处理，以获取所述人脸图像的人脸质量评分。本申请实施例的方法、装置、系统、无线通信终端和计算机可读介质，能够实现对人脸图像质量的快速评估，同时保证质量评估结果的准确性。

Description

人脸图像质量评价方法、特征提取模型训练方法、图像处理系统、计算机可读介质和无线通信终端

本申请要求在2019年10月31日提交的申请号为201911055879.9、发明名称为“人脸图像质量评价方法及装置、计算机可读介质、通信终端”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及地图构建及图像识别领域，并且更具体地，涉及一种人脸图像质量评价方法、特征提取模型的训练方法、人脸图像质量评价装置、特征提取模型的训练装置、图像处理系统、计算机可读介质和无线通信终端。

背景技术

在现有基于特征工程的图像处理匹配方法和基于深度学习的方法中，对人脸质量进行评价时，存在一定的问题和不足。例如，人脸图像的评分标注需要依靠人工来完成，需要花费大量的时间和精力并且具有一定的主观性，而且影响人脸质量的因素较多，人工标注无法全面地考虑到多方面因素的影响，导致标注样本不准确，进而影响模型的准确性。另外，越来越多的模型需要应用在智能移动终端设备上，因此对模型大小和性能有着更高的要求，现有的人脸质量评估方法在模型大小和运行时间上都很难满足要求。

发明内容

有鉴于此，本申请实施例提供了一种人脸图像质量评价方法、特征提取模型的训练方法、人脸图像质量评价装置、特征提取模型的训练装置、图像处理系统、计算机可读介质和无线通信终端，有利于实现快速对人脸质量进行评价。

第一方面，提供了一种人脸图像质量评价方法，该方法包括：获取包含人脸的待处理图像；对所述待处理图像进行检测以获取对应的人脸图像；将所述人脸图像输入已训练的基于移动人脸识别网络的特征提取模型，对所述人脸图像进行特征提取以获取特征数据；将所述特征数据输入连续设置的第一全连接层和第二全连接层进行卷积处理，以获取所述人脸图像的人脸质量评分。

第二方面，提供了一种特征提取模型的训练方法，该方法包括：响应于图像业务系统的图像处理指令，获取包含人脸的样本图像；将所述样本图像输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果；将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数；利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果；利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本图像对应的人脸特征数据；将所述人脸特征数据输入损失函数模型中以计算损失参数，并基于所述损失参数进行优化以迭代训练特征提取模型。

第三方面，提供了一种人脸图像质量评价装置，该装置包括：待处理图像获取模块，用于获取包含人脸的待处理图像；人脸图像提取模块，用于对所述待处理图像进行检测以获取对应的人脸图像；人脸特征数据提取模块，用于将所述人脸图像输入已训练的基于移动人脸识别网络的特征提取模型，对所述人脸图像进行特征提取以获取特征数据；人脸质量评分模块，用于将所述特征数据输入连续设置的第一全连接层和第二全连接层进行卷积处理，以获取所述人脸图像的人脸质量评分。

第四方面，提供了一种特征提取模型的训练装置，该装置包括：样本数据获取模块，用于响应于图像业务系统的图像处理指令，获取包含人脸的样本图像；第一卷积结果生成模块，用于将所述样本图像输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果；第二卷积结果生成模块，用于将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数；第三卷积结果生成模块，用于利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果；人脸特征数据生成模块，用于利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本图像对应的人脸特征数据；迭代训练模块，用于将所述人脸特征数据输入损失函数模型中以计算损失参数，并基于所述损失参数进行优化以迭代训练特征提取模型。

第五方面，提供了一种图像处理系统，该系统包括：业务模块，用于获取待处理图像；图像处理模块，用于响应所述业务模块发出的业务处理指令以执行如上述实施例中任一项所述的人脸图像质量评价方法，以获取所述待处理图像的评分结果。

第六方面，提供了一种无线通信终端，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行上述第一方面或第二方面中的方法。

第七方面，提供了一种计算机可读介质，用于储存为执行上述第一方面或第二方面中的方法所用的计算机软件指令，其包含用于执行上述各方面所设计的程序。

本申请中，无线通信终端以及定位系统等的名字对设备本身不构成限定，在实际实现中，这些设备可以以其他名称出现。只要各个设备的功能和本申请类似，属于本申请权利要求及其等同技术的范围之内。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

图1示出了本申请实施例的人脸图像质量评价方法的示意图。

图2示出了本申请实施例的基于移动人脸识别网络的特征提取模型的架构示意图。

图3示出了本申请实施例的步长为1的瓶颈结构层的架构示意图。

图4示出了本申请实施例的步长为2的瓶颈结构层的架构示意图。

图5示出了本申请实施例的人脸图像质量评价模型的整体架构示意图。

图6示出了本申请实施例的特征提取模型的训练方法的示意图。

图7示出了本申请实施例的人脸图像质量评价装置的组成示意图。

图8示出了本申请实施例的特征提取模型的训练装置的组成示意图。

图9示出了本申请实施例的图像处理系统的组成示意图。

图10示出了本申请实施例的无线通信终端的计算机系统的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

在相关技术中，通过采集视觉图像来构建环境地图时，现有方案只考虑传统的图像特征，而传统图像特征的抗噪能力差，定位成功率低。并且，在构建的地图中，若发生光线明暗变化或者季节变换导致环境特征发生改变，则可能导致无法进行定位。另外，现有方案在构建地图时大多只利用视觉图像的二维特征信息，定位自由度存在欠缺，定位鲁棒性较差。这样，就需要一种方法，解决上述的现有技术存在的缺点和不足。

应理解，本申请实施例的技术方案可以应用于图像处理。

现有技术在进行人脸图像质量评价时，现有技术中的基于深度学习的人脸质量评价方法，一方面，训练过程中人脸图像的评分标注依靠人工来完成，需要花费大量的时间和精力并且具有一定的主观性。另一方面，影响人脸质量的因素是多方面的，可以包括人脸姿态、人脸遮挡、对比度、分辨率、光照和背景等，人工标注无法全面地考虑到多方面因素的影响，这将会对人脸评估模型结果的准确度产生一定影响。此外，现在越来越多的图像评价方法需要应用在智能手机、平板电脑等智能移动终端设备上，因此对模型大小和性能有着更高的要求，现有的人脸质量评估方法在模型大小和运行时间上都很难满足要求，需要一种更轻量的人脸质量评估模型。

针对上述的现有技术的缺点和不足，本示例实施方式中提供了一种人脸图像质量评价方法，模型具有更小的量级，可以应用于手机、平板电脑等智能终端设备。

图1示出了本申请实施例的一种人脸图像质量评价方法的示意性。如图1所示，该方法包括以下部分或全部内容：

S11，获取包含人脸的待处理图像；

S12，对所述待处理图像进行检测以获取对应的人脸图像；

S13，将所述人脸图像输入已训练的基于移动人脸识别网络的特征提取模型，对所述人脸图像进行特征提取以获取特征数据；

S14，将所述特征数据输入连续设置的第一全连接层和第二全连接层进行卷积处理，以获取所述人脸图像的人脸质量评分。

具体地，上述的智能终端设备可以是配置有摄像模组的手机、平板电脑等智能终端。用户可以利用终端设备自带的摄像模组进行拍照，获取包含人脸的待处理图像。或者，用户也可以通过外接的摄像组件进行拍照来获取包含人脸的待处理图像。或者，也可以通过有线或无线网络接收其他设备发送的待处理图像。

可选地，在本申请实施例中，在获取待处理图像后，由于图像中可能包含背景、噪声等，因此可以对待处理图像进行预处理来获取对应的人脸图像。具体来说，上述的S12可以通过以下步骤来实现：

S121，对所述待处理图像进行人脸检测以获取人脸区域；

S122，对所述人脸区域进行人脸关键点检测以获取所述人脸区域的关键点；

S123，基于所述人脸区域的关键点对所述人脸区域进行对齐处理，以获取对齐处理后的人脸图像。

举例来说，可以利用已训练的人脸检测模型对对待处理图像进行人脸检测确定人脸区域，以及利用已训练的人脸关键点检测模型对人脸区域进行关键点检测来提取人脸的关键点信息。再利用预设的相似变换矩阵对人脸区域进行转换，变换到标准人脸。举例来说，相似变换矩阵可以包括下式：

其中，左上角2*2矩阵为旋转部分；t _x和t _y为平移因子，包括4个自由度，即旋转、x方向平移、y方向平移和缩放因子s。

对于人脸区域图像来说，相似变换前后长度比、夹角、圆心保持均保持不变。

此外，上述的人脸检测模型和人脸关键点检测模型使用常规技术即可以实现，本公开在此不做特殊限定。或者，在本公开的其他示例性实施方式中，也可以使用一个模型进行人脸检测以及人脸关键点信息的检测，例如，使用Hyper Face模型进行人脸检测和关键点定位和头部角度的估计。

可选地，在本申请实施例中，可以预先训练移动人脸识别网络(Mobile Face Nets)模型。具体来说，可以包括以下步骤：

S21，获取原始数据，并对所述原始数据进行预处理以获取样本数据。

S22，将所述样本数据输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果。

S23，将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数。

S24，利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果；

S25，利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本数据对应的人脸特征数据。

具体的，可以获取多个人在不同场景的人脸图像数据作为原始数据，例如，可以获取与人脸自身相关的不同状态下的图像作为原始数据，例如不同人脸姿态、遮挡以及表情等状态。或者，还可以获取在不同图像参数下的图像；例如，针对图像采集传感器来说，可以配置不同的对比度、分辨率或亮度等；针对图像采集环境来说，可以配置不同的光照、位置、背景等。

在获取原始数据后，可以利用训练好的人脸检测和人脸关键点检测模型，进行人脸检测和人脸关键点检测，然后根据相似变换将人脸变换到标准人脸。例如，使用如上述实施例中的方法对原始数据进行预处理，来获取样本数据。

具体的，参考图2所示，上述的卷积层的卷积核为3*3，步长s＝2；上述的深度卷积层的卷积核为3*3，步长s＝1。

具体的，可以将对其后的样本数据输入改进的移动人脸识别网络中。具体来说，本实施方式中的改进的移动人脸识别网络包括与现有技术不同数量的瓶颈结构(bottleneck)层，瓶颈结构包含不同的结构，以及改进的最后一层等。具体来说，参考图2所示，改进的移动人脸识别网络可以包括依次设置的：第一卷积层、深度卷积层、连续的六个瓶颈结构层、第二卷积层、线性全局深度卷积层以及全连接层。

其中，在连续的六个瓶颈结构层中，基于连续六层的瓶颈结构对各层中的步长以及执行的重复次数进行配置。例如，奇数层瓶颈结构层对应配置的预设步长为P，偶数层瓶颈结构层对应配置的预设步长为Q；其中，P>Q，且P、Q均为正整数。举例来说，可以配置P＝2，Q＝1。第一瓶颈结构层配置为步长s＝2，重复次数n＝1；第二瓶颈结构层配置为步长为s＝1，重复次数n＝4；第三瓶颈结构层配置为步长s＝2，重复次数n＝1；第四瓶颈结构层配置为步长s＝1，重复次数n＝6；第五瓶颈结构层配置为步长s＝2，重复次数n＝1；第六瓶颈结构层配置为步长s＝1，重复次数n＝2。

对于配置有不同预设步长的瓶颈结构层来说，被配置为步长s＝1时，参考图3所示，瓶颈结构包括依次设置的第一卷积层、深度卷积层、第二卷积层、积压激励网络(Squeeze and Excitation Network，SE-Net)层和求和计算(add)层。其中，第一卷积层的卷积核为1*1，使用PReLU(Parametric Rectified Linear Unit，参数校正线性单元)激活函数进行激活；深度卷积层的卷积核为3*3，使用PReLU激活函数进行激活；第二卷积层的卷积核为1*1，使用线性激活函数进行激活。初始输入参数输入第一卷积层进行卷积处理；第一卷积层的输出结果输入深度卷积层进行卷积处理；深度卷积层的输出结果输入第二卷积层进行卷积处理；第二卷积层的输出结果输入积压激励网络层对通道权重分配处理；积压激励网络层的输出结果和初始输入参数再输入求和计算层中进行计算，得到该瓶颈结构层的最终输出结果。

瓶颈结构层被配置为步长s＝2时，参考图4所示，瓶颈结构包括依次设置的第一卷积层、深度卷积层、第二卷积层和积压激励网络层。其中，第一卷积层的卷积核为1*1，使用PReLU激活函数进行激活；深度卷积层的卷积核为3*3，使用PReLU激活函数进行激活，并配置步长stride＝2；第二卷积层的卷积核为1*1，使用线性激活函数进行激活。

通过配置第一瓶颈结构层的步长s＝2，重复次数n＝1，以及配置第二瓶颈结构层的步长s＝1，重复次数n＝4；并且配置步长s＝1的瓶颈结构层采用残差结构，而步长s＝2的瓶颈结构层未使用残差结构。从而使得第二瓶颈结构层在多次重复操作时，重复使用残差结构，可以有效的缓解随着神经网络层数加深而带来的梯度弥散问题，从而更利于模型学习和收敛。

此外，通过修改瓶颈结构的结构，增加了积压激励(SE block)网络层，能够有效的考虑到每个通道的重要性可能不同。通过为每个通道添加一个重要性权重，然后再乘以每个通道原来的值，可以增加各个通道的特征表示能力。避免了现有技术方案中结构认为每个通道的重要性都是相同的缺陷。对于积压激励网络层来说，输入为初始的特征图谱，输出为1*1*C的向量作为每个通道的重要性权重，网络在训练过程中会自动学习各个通道的重要性，从而增强网络的特征提取和表达能力，提高模型的性能。

具体的，参考图2所示，S24中的卷积层的卷积核为1*1。线性全局深度卷积层的卷积核为7*7。最后一层设置为全连接层，最终的输出为128维向量。通过将最后一层设置为全连接层，能够对线性全局深度卷积层的输出结果进行降维，并保持较小的运算量。并且，通过实际运行验证，有效的提升了模型的精度。

可选地，在本申请实施例中，在上述的改进的基于移动人脸识别网络特征提取模型后还可以设置一标准化处理层。例如，使用基于L2范式的标准化处理层。

在利用上述的改进的特征提取模型对样本数据进行特征提取得到各样本数据对应的训练人脸特征数据后，利用L2范式对训练人脸特征数据进行标准化处理，从而得到标准化后的最终的人脸特征(embedding)。

举例来说，L2范式的公式可以包括：

其中，x为特征提取模型输出向量的元素，K为向量的长度，如上述实施例中所述，K＝128。

可选地，在本申请实施例中，在模型训练的过程中，在获取人脸特征后，可以将其输入ArcFace Loss函数模型中计算模型的损失。具体来说，ArcFace Loss函数的公式可以包括：

其中，L为总的损失，N为样本数量，n为类别数量，s和m为超参数，θ为人脸特征和各个类别权重之间的夹角。本示例性实施方式中，配置s＝64，m＝0.5。

具体的，获取总的损失后，根据反向传播算法，可将损失传递到embedding层，然后再传递到基于移动人脸识别网络的特征提取模型。再利用Adam优化算法对模型进行优化，设置初始学习率为0.1；然后根据训练数据和训练步数逐渐递减，最终获取可以对人脸进行实时、准确识别的改进的基于移动人脸识别网络的特征提取模型。该特征提取模型可以在智能移动终端设置中运行。

在对基于移动人脸识别网络的特征提取模型训练完成后，便可以将待处理图像对应的检测出的人脸图像输入该特征提取模型中，并提取对应的特征数据。

举例来说，在利用训练完成的特征提取模型对待处理图像对应的人脸图像进行特征提取时，可以将对齐后的人脸图像输入特征提取模型，由模型的卷积层、深度卷积层、连续设置的六个瓶颈结构层、卷积层、线性全局深度卷积层和全连接层依次进行处理，以及标准化处理，最终输出人脸图像的特征向量。

可选地，在本申请实施例中，在S14中，可以预先进行人脸图像质量评分的标注。具体来说，可以先选取每个对象的一张标准人脸图像作为参考图像，然后再计算该对象的其他人脸图像与参考对象的余弦相似度，将该相似度取值作为该人脸图像的质量评分。

当上述的特征提取模型的性能足够时，相似度与人脸质量评分成正比关系，参考图像作为高质量的图像，同一个人的其他人脸图像与参考图像做比较时，图像的质量越高相似度就会越高，相反，如果相似度越低则说明人脸图像的质量越差。

可选地，在本申请实施例中，在特征提取模型后，可以在上述的标准化处理层之后设置两层全连接层，作为质量评价模型。具体来说，可以配置第一全连接层的神经元个数为人脸特征(embedding)维度的二分之一，激活函数为relu激活函数；第二全连接层的神经元个数为1，激活函数为sigmoid激活函数，输出为0-1之间的人脸质量评分，从而将人脸特征空间映射到人脸质量评分空间。

基于上述的人脸图像评分标注结果，作为训练样本，对上述的质量评价模型进行有监督式的训练。质量评价模型的损失函数可以采用MSE(mean-square error，均方误差)损失函数，其公式可以包括：

其中，

为模型预测的人脸质量评分值，y _i为标注的人脸质量评分值。

在计算MES损失后，根据反向传播算法可将损失函数传递到全连接层，并利用Adam算法优化质量评价模型的两层全连接层，初始学习率设置为0.01，然后根据训练数据和训练步数逐渐递减。优化完成后，对于任意的人脸图像，便可利用该质量评价模型获取对应人脸质量评分。

可选地，在本申请实施例中，对于上述的基于移动人脸识别网络的特征提取模型和质量评价模型，在训练过程中，可以固定特征提取模型的网络权重不变。

可选地，在本申请实施例中，参考图5所示，通过在特征提取模型后增加两个全连接层来形成一个完整的人脸图像质量评价模型，并利用该两个全连接层来进行人脸质量评分，使得对图像的人脸特征提取和人脸质量评分在同一个网络内完成，可以充分保证模型的性能和普适性。另外，特征提取模型基于移动人脸识别网络模型构建，通过修改模型的结构，修改瓶颈结构层的配置，以及修改瓶颈结构层的具体结构，进而改进特征提取的具体处理过程，使特征提取模型的量级更小、精度更高，速度更快；并能够保证模型的大小和运行时间能够满足在移动端部署的要求，实现在移动端对人脸图像质量进行实时、准确的评估。上述的模型可以应用于智能手机、平板电脑等移动设备的人脸系别系统中，例如，从一段照片序列中挑选出人脸质量高的图像输入到人脸识别系统中，可以显著提高人脸识别系统的效率和性能；或者，应用于相机的抓拍和连拍等功能，利用人脸质量评估模型可以更方便地帮助用户挑选出满意的照片等。

可选地，在本申请实施例中，参考图6所示，还提供一种特征提取模型的训练方法。参考图6中所示，上述的特征提取模型的训练方法可以包括以下步骤：

S31，响应于图像业务系统的图像处理指令，获取包含人脸的样本图像；

S32，将所述样本图像输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果；

S33，将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数；

S34，利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果；

S35，利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本图像对应的人脸特征数据；

S36，将所述人脸特征数据输入损失函数模型中以计算损失参数，并基于所述损失参数进行优化以迭代训练特征提取模型。

举例来说，上述的图像业务系统可以用于处理人脸识别任务的业务系统；例如车站进站识别的业务系统，或者是处理监控图像的业务系统，或者是门禁系统等等。本公开对业务系统的具体内容不做特殊限定

可选地，在本申请实施例中，所述获取所述样本图像对应的人脸特征数据后，所述方法还包括：输入评分模型以训练评分模型，包括：

S41，将所述人脸特征数据输入连续设置的第一全连接层和第二全连接层进行处理，以获取所述样本图像的人脸质量评分；

S42，将所述人脸质量评分输入评分损失函数以获取评分损失参数，并基于上述评分损失参数进行优化以迭代训练评分模型。

具体的，所述特征提取模型中连续设置的n个瓶颈结构层中，奇数层瓶颈结构层对应的预设步长为P，偶数层瓶颈结构层对应的预设步长为Q；其中，P>Q，且P、Q均为正整数。

可选地，在本申请实施例中，所述方法还包括：基于各瓶颈结构层在所述连续n个瓶颈结构层中的所在层次，配置各所述瓶颈结构层的执行重复次数。

可选地，在本申请实施例中，将所述第一卷积结果输入所述瓶颈结构层后，所述方法包括：利用所述瓶颈结构层设置的第一卷积层、深度卷积层、第二卷积层、挤压激励网络层，对所述第一卷积结果依次进行卷积、深度度卷积、卷积以及通道权重分配处理，以获取第二卷积结果。

特征提取模型的训练方法的具体训练过程在上述的人脸图像质量评价方法中以做详细阐述，本实施例中不在复述。

应理解，本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上文中详细描述了根据本申请实施例的人脸图像质量评价方法，下面将结合附图，描述根据本申请实施例的人脸图像质量评价装置，方法实施例所描述的技术特征适用于以下装置实施例。

图7示出了本申请实施例的人脸图像质量评价装置70的示意性框图。如图7所示，该装置70包括：

待处理图像获取模块701，可以用于获取包含人脸的待处理图像。

人脸图像提取模块702，可以用于对所述待处理图像进行检测以获取对应的人脸图像。

人脸特征数据提取模块703，可以用于将所述人脸图像输入已训练的基于移动人脸识别网络的特征提取模型，对所述人脸图像进行特征提取以获取特征数据。

人脸质量评分模块704，可以用于将所述特征数据输入连续设置的第一全连接层和第二全连接层进行卷积处理，以获取所述人脸图像的人脸质量评分。

可选地，在本申请实施例中，所述待处理图像获取模块701可以包括：

人脸区域识别模块，用于对所述待处理图像进行人脸检测以获取人脸区域。

关键点检测模块，用于对所述人脸区域进行人脸关键点检测以获取所述人脸区域的关键点。

对齐处理模块，用于基于所述人脸区域的关键点对所述人脸区域进行对齐处理，以获取对齐处理后的人脸图像。

可选地，在本申请实施例中，所述装置70还包括：

标准化处理模块，用于对所述特征数据进行标准化处理以获取标准化处理后的特征数据。

可选地，在本申请实施例中，所述装置70还包括：

原始数据处理单元，用于获取原始数据，并对所述原始数据进行预处理以获取样本数据。

第一卷积处理单元，用于将所述样本数据输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果。

瓶颈结构处理单元，用于将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数。

第二卷积处理单元，用于利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果。

全连接处理单元，用于利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本数据对应的人脸特征数据。

可选地，在本申请实施例中，所述装置70还包括：

步长配置模块，用于对所述特征提取模型中连续设置的n个瓶颈结构层中，奇数层瓶颈结构层对应的预设步长为P，偶数层瓶颈结构层对应的预设步长为Q；其中，P>Q，且P、Q均为正整数。

可选地，在本申请实施例中，所述装置70还包括：

重复次数配置模块，用于基于各瓶颈结构层在所述连续n个瓶颈结构层中的所在层次，配置各所述瓶颈结构层的执行重复次数。

可选地，在本申请实施例中，所述瓶颈结构层可以利用所述瓶颈结构层设置的第一卷积层、深度卷积层、第二卷积层、挤压激励网络层，对所述第一卷积结果依次进行卷积、深度度卷积、卷积以及通道权重分配处理，以获取第二卷积结果。

图8示出了本申请实施例的特征提取模型的训练装置80的示意性框图。如图8所示，该装置80包括：

样本数据获取模块801，用于响应于图像业务系统的图像处理指令，获取包含人脸的样本图像。

第一卷积结果生成模块802，用于将所述样本图像输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果。

第二卷积结果生成模块803，用于将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数。

第三卷积结果生成模块804，用于利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果。

人脸特征数据生成模块805，用于利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本图像对应的人脸特征数据。

迭代训练模块806，用于将所述人脸特征数据输入损失函数模型中以计算损失参数，并基于所述损失参数进行优化以迭代训练特征提取模型。

可选地，在本申请实施例中，所述的装置80还可以包括：

评分单元，用于将所述人脸特征数据输入连续设置的第一全连接层和第二全连接层进行处理，以获取所述样本图像的人脸质量评分。

迭代训练单元，用于将所述人脸质量评分输入评分损失函数以获取评分损失参数，并基于上述评分损失参数进行优化以迭代训练评分模型。

可选地，在本申请实施例中，所述特征提取模型中连续设置的n个瓶颈结构层中，奇数层瓶颈结构层对应的预设步长为P，偶数层瓶颈结构层对应的预设步长为Q；其中，P>Q，且P、Q均为正整数。

可选地，在本申请实施例中，所述的装置80还可以包括：

图9示出了本申请实施例的图像处理系统900的示意性框图。如图9所示，该系统900包括：

业务模块901，用于获取待处理图像。

图像处理模块902，用于响应所述业务模块发出的业务处理指令以执行人脸图像质量评价方法，以获取所述待处理图像的评分结果。

模型训练模块903，用于响应所述业务模块发出的图像处理指令以执行特征提取模型的训练方法，以获取所述特征提取模型。

可选地，在本申请实施例中，上述的业务模块可以是监控系统、安检系统或者门禁系统等应用场景的相关业务应用。业务模块可以实时的采集包含脸的待处理图像并进行存储。

应理解，根据本申请实施例的人脸图像质量评价装置70、特征提取模型的训练装置80、图像处理系统900中的各个单元、模块和其它操作和/或功能分别为了实现人脸图像质量评价方法、特征提取模型的训练装方法中的相应流程，为了简洁，在此不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

图10示出了适于用来实现本发明实施例的无线通信终端的计算机系统的结构示意图。

需要说明的是，图10示出的电子设备的计算机系统1000仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图10所示，计算机系统1000包括中央处理单元(Central Processing Unit，CPU)1001，其可以根据存储在只读存储器(Read-Only Memory，ROM)1002中的程序或者从储存部分1008加载到随机访问存储器(Random Access Memory，RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中，还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(Input/Output，I/O)接口1005也连接至总线1004。

以下部件连接至I/O接口1005：包括键盘、鼠标等的输入部分1006；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分1007；包括硬盘等的储存部分1004；以及包括诸如LAN(Local Area Network，局域网)卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1010上，以便于从其上读出的计算机程序根据需要被安装入储存部分1008。

特别地，根据本发明的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1009从网络上被下载和安装，和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本发明实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现如图1所示的各个步骤。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，该单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

该作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

该功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

一种人脸图像质量评价方法，其特征在于，包括：

获取包含人脸的待处理图像；

对所述待处理图像进行检测以获取对应的人脸图像；

将所述人脸图像输入已训练的基于移动人脸识别网络的特征提取模型，对所述人脸图像进行特征提取以获取特征数据；

将所述特征数据输入连续设置的第一全连接层和第二全连接层进行处理，以获取所述人脸图像的人脸质量评分。
根据权利要求1所述的方法，其特征在于，所述对所述待处理图像进行预处理以获取对应的人脸图像，包括：

对所述待处理图像进行人脸检测以获取人脸区域；

对所述人脸区域进行人脸关键点检测以获取所述人脸区域的关键点；

基于所述人脸区域的关键点对所述人脸区域进行对齐处理，以获取对齐处理后的人脸图像。
根据权利要求2所述的方法，其特征在于，所述基于所述人脸区域的关键点对所述人脸区域进行对齐处理，以获取对齐处理后的人脸图像，包括：

利用预设相似变换矩阵对所述人脸区域进行转换以变换到标准人脸，且所述标准人脸与所述人脸区域对应的长度比参数、夹角参数、圆心参数保持不变。
根据权利要求1所述的方法，其特征在于，在获取所述特征数据后，方法还包括：

对所述特征数据进行标准化处理以获取标准化处理后的特征数据。
根据权利要求1所述的方法，其特征在于，所述方法还包括：预先训练所述基于移动人脸识别网络的特征提取模型，包括：

获取原始数据，并对所述原始数据进行预处理以获取样本数据；

将所述样本数据输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果；

将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数；

利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果；

利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本数据对应的人脸特征数据。
根据权利要求5所述的方法，其特征在于，所述特征提取模型中连续设置的n个瓶颈结构层中，奇数层瓶颈结构层对应的预设步长为P，偶数层瓶颈结构层对应的预设步长为Q；其中，P>Q，且P、Q均为正整数。
根据权利要求5或6所述的方法，其特征在于，所述方法还包括：

基于各瓶颈结构层在所述连续n个瓶颈结构层中的所在层次，配置各所述瓶颈结构层的执行重复次数。
根据权利要求6所述的方法，其特征在于，所述方法还包括：配置Q＝1，瓶颈结构包括依次设置的第一卷积层、深度卷积层、第二卷积层、积压激励网络层和求和计算层；以及

配置P＝2，瓶颈结构包括依次设置的第一卷积层、深度卷积层、第二卷积层和积压激励网络层。
根据权利要求5所述的方法，其特征在于，将所述第一卷积结果输入所述瓶颈结构层后，所述方法包括：

利用所述瓶颈结构层设置的第一卷积层、深度卷积层、第二卷积层、挤压激励网络层，对所述第一卷积结果依次进行卷积、深度度卷积、卷积以及通道权重分配处理，以获取第二卷积结果。
根据权利要求5所述的方法，其特征在于，所述移动人脸识别网络包括依次设置的：第一卷积层、深度卷积层、连续的六个瓶颈结构层、第二卷积层、线性全局深度卷积层以及全连接层。
根据权利要求1所述的方法，其特征在于，所述对所述人脸图像进行特征提取以获取特征数据后，所述方法还包括：

利用标准化处理层对所述特征数据进行标准化处理，以得到标准化后的特征数据。
一种特征提取模型的训练方法，其特征在于，包括：

响应于图像业务系统的图像处理指令，获取包含人脸的样本图像；

将所述样本图像输入连续设置的卷积层和深度卷积层进行连续的卷积处理以获取第一卷积结果；

将所述第一卷积结果输入连续设置的n个瓶颈结构层中进行连续的卷积处理以获取第二卷积结果；其中，n>5，且为正整数；

利用连续设置的卷积层和线性全局深度卷积层对所述第二卷积结果进行卷积处理以获取第三卷积结果；

利用全连接层对所述第三卷积结果进行全连接处理以获取所述样本图像对应的人脸特征数据；

将所述人脸特征数据输入损失函数模型中以计算损失参数，并基于所述损失参数进行优化以迭代训练特征提取模型。
根据权利要求12所述的方法，其特征在于，所述获取所述样本图像对应的人脸特征数据后，所述方法还包括：输入评分模型以训练评分模型，包括：

将所述人脸特征数据输入连续设置的第一全连接层和第二全连接层进行处理，以获取所述样本图像的人脸质量评分；

将所述人脸质量评分输入评分损失函数以获取评分损失参数，并基于上述评分损失参数进行优化以迭代训练评分模型。
根据权利要求12所述的方法，其特征在于，所述特征提取模型中连续设置的n个瓶颈结构层中，奇数层瓶颈结构层对应的预设步长为P，偶数层瓶颈结构层对应的预设步长为Q；其中，P>Q，且P、Q均为正整数。
根据权利要求12或13所述的方法，其特征在于，所述方法还包括：

基于各瓶颈结构层在所述连续n个瓶颈结构层中的所在层次，配置各所述瓶颈结构层的执行重复次数。
根据权利要求12所述的方法，其特征在于，将所述第一卷积结果输入所述瓶颈结构层后，所述方法包括：

利用所述瓶颈结构层设置的第一卷积层、深度卷积层、第二卷积层、挤压激励网络层，对所述第一卷积结果依次进行卷积、深度度卷积、卷积以及通道权重分配处理，以获取第二卷积结果。
一种图像处理系统，其特征在于，包括：

业务模块，用于获取待处理图像；

图像处理模块，用于响应所述业务模块发出的业务处理指令以执行如权利1至11中任一项所述的人脸图像质量评价方法，以获取所述待处理图像的评分结果。
根据权利要求17所述的系统，其特征在于，所述系统还包括：

模型训练模块，用于响应所述业务模块发出的图像处理指令以执行如权利12至16中任一项所述的特征提取模型的训练方法，以获取所述特征提取模型。
一种计算机可读介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述的人脸图像质量评价方法；或者，如权利要求12至16中任一项所述的特征提取模型的训练方法。
一种无线通信终端，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至11中任一项所述的人脸图像质量评价方法；或者，如权利要求12至16中任一项所述的特征提取模型的训练方法。