WO2020037898A1

WO2020037898A1 - 人脸特征点检测方法、装置、计算机设备及存储介质

Info

Publication number: WO2020037898A1
Application number: PCT/CN2018/120857
Authority: WO
Inventors: 戴磊
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-08-23
Filing date: 2018-12-13
Publication date: 2020-02-27
Also published as: CN109389030B; CN109389030A

Abstract

一种人脸特征点检测方法、装置、计算机设备及存储介质。所述方法包括：按照预设的划分比例，将样本数据集划分为训练数据集和测试数据集；使用训练数据集对包含K个并行卷积层、拼接层和全局池化层的人脸检测模型进行训练；使用测试数据集对人脸检测模型进行测试，并根据测试结果计算人脸检测模型对人脸特征点的定位准确率；若定位准确率小于预设的准确率阈值，则重新对样本数据集进行划分，并重新训练和测试，直到定位准确率大于或者等于预设的准确率阈值为止；将待检测的人脸图片输入训练好的人脸检测模型进行计算，得到人脸图片的特征点预测结果。该方法能有效提高人脸检测模型对人脸特征点的定位能力和预测准确率。

Description

人脸特征点检测方法、装置、计算机设备及存储介质

本申请以2018年8月23日提交的申请号为201810963841.0，名称为“人脸特征点检测方法、装置、计算机设备及存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及计算机领域，尤其涉及一种人脸特征点检测方法、装置、计算机设备及存储介质。

背景技术

目前，人脸识别已经被广泛应用在各种实际应用中，通过人脸识别进行身份验证也逐渐成为常用的身份验证方式，在人脸识别过程中，人脸特征点的检测是人脸识别及相关应用的前提和基础。

在现有的对人脸特征点进行检测的深度模型设计过程中，为了适用于实际应用场景，耗费较少的执行时间，通常需要将深度模型设计成小模型，但是，现有的采用这种小模型设计方式的深度模型预测能力差，预测准确率不高，使模型无法准确定位模糊人脸、大角度人脸、夸张表情人脸等人脸的特征点。

发明内容

本申请实施例提供一种人脸特征点检测方法、装置、计算机设备及存储介质，以解决目前深度模型对人脸特征点的预测准确率较低的问题。

一种人脸特征点检测方法，包括：

获取样本数据集，其中，所述样本数据集包含人脸样本图片和每个所述人脸样本图片的人脸特征点标注信息；

按照预设的划分比例，将所述样本数据集划分为训练数据集和测试数据集；

使用所述训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，所述初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个所述并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

使用所述测试数据集对所述训练过的人脸检测模型进行测试，并根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率；

若所述定位准确率小于预设的准确率阈值，则重新对所述样本数据集中的所述人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用所述新的训练数据集对所述训练过的人脸检测模型进行训练，以更新所述训练过的人脸检测模型，使用所述新的测试数据集对所述训练过的人脸检测模型进行测试，直到所述定位准确率大于或者等于所述预设的准确率阈值为止；

若所述定位准确率大于或等于所述预设的准确率阈值，则将定位准确率大于或等于所述预设的准确率阈值的所述训练过的人脸检测模型确定为训练好的人脸检测模型；

获取待检测的人脸图片；

将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果，其中，所述特征点预测结果包括目标特征点的属性信息和位置信息。

一种人脸特征点检测装置，包括：

第一获取模块，用于获取样本数据集，其中，所述样本数据集包含人脸样本图片和每个所述人脸样本图片的人脸特征点标注信息；

样本划分模块，用于按照预设的划分比例，将所述样本数据集划分为训练数据集和测试数据集；

模型训练模块，用于使用所述训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，所述初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个所述并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

模型测试模块，用于使用所述测试数据集对所述训练过的人脸检测模型进行测试，并根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率；

模型优化模块，用于若所述定位准确率小于预设的准确率阈值，则重新对所述样本数据集中的所述人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用所述新的训练数据集对所述训练过的人脸检测模型进行训练，以更新所述训练过的人脸检测模型，使用所述新的测试数据集对所述训练过的人脸检测模型进行测试，直到所述定位准确率大于或者等于所述预设的准确率阈值为止；

训练结果模块，用于若所述定位准确率大于或等于所述预设的准确率阈值，则将定位准确率大于或等于所述预设的准确率阈值的所述训练过的人脸检测模型确定为训练好的人脸检测模型；第二获取模块，用于获取待检测的人脸图片；

模型预测模块，用于将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果，其中，所述特征点预测结果包括目标特征点的属性信息和位置信息。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现上述人脸特征点检测方法的步骤。

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行上述人脸特征点检测方法的步骤。

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中人脸特征点检测方法的一应用环境示意图；

图2是本申请一实施例中人脸特征点检测方法的一流程图；

图3是本申请一实施例中人脸特征点检测方法中包含三个并行卷积层的人脸检测模型的网络结构示意图；

图4是本申请一实施例中人脸特征点检测方法的步骤S8的一流程图；

图5是本申请一实施例中人脸特征点检测方法的步骤S4中根据测试结果计算人脸检测模型对人脸特征点的定位准确率的一流程图；

图6是本申请一实施例中人脸特征点检测方法中步骤S1的一流程图；

图7是本申请一实施例中人脸特征点检测方法中步骤S14的一流程图；

图8是本申请一实施例中人脸特征点检测装置的一示意图；

图9是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的人脸特征点检测方法，可应用在如图1所示的应用环境中，该应用环境包括服务端和客户端，其中，服务端和客户端之间通过网络进行连接，该网络可以是有线网络或者无线网络，客户端具体包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。客户端将采集到的样本数据集和待检测的人脸图片发送给服务端，服务端根据接收到样本数据集进行模型训练，并使用训练好的人脸检测模型对待检测的人脸图片进行特征点检测。

在一实施例中，如图2所示，提供一种人脸特征点检测方法，以该方法应用在图1中的服务端为例进行说明，详述如下：

S1：获取样本数据集，其中，该样本数据集包含人脸样本图片和每个人脸样本图片的人脸特征点标注信息。

具体地，样本数据集可以是预先采集并保存在样本数据库中，样本数据集中包含若干人脸样本图片以及每个人脸样本图片的人脸特征点标注信息。

可以理解的，人脸样本图片和该人脸样本图片的人脸特征点标注信息关联存储在样本数据集中。

其中，人脸特征点标注信息可以包括人脸特征点的属性信息和位置信息。属性信息具体为人脸特征点所属的五官信息，位置信息具体为人脸特征点在人脸样本图片中的像素点坐标。

例如，一个具体的人脸特征点标注信息为“眼睛，(200，150)”，其中，“眼睛”为该人脸特征点所属的五官信息，即属性信息，“(200，150)”为该人脸特征点在人脸样本图片中的像素点坐标，即位置信息。

S2：按照预设的划分比例，将样本数据集划分为训练数据集和测试数据集。

具体地，按照预设的划分比例，对步骤S1获取到的样本数据集中的人脸样本图片进行随机划分，得到训练数据集和测试数据集。

例如，预设的划分比例为3:2，假设样本数据集中包含100万张人脸样本图片，则从样本数据集中随机选择60万张人脸样本图片作为训练数据集，剩余的40万张人脸样本图片作为测试数据集。

需要说明的是，预设的划分比例可以根据实际应用的需要进行设置，此处不做限制。

S3：使用训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，该初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数。

在本实施例中，初始人脸检测模型和训练过的人脸检测模型，以及下文中提到的训练好的人脸检测模型，均指包含层叠卷积神经网络结构的人脸检测模型，该人脸检测模型的卷积神经网络包含K个并行卷积层、拼接层和全局池化层，并且在每个并行卷积层设置不同预设尺度的视觉感知范围的卷积核，其中，K个并行卷积层按照预设的顺序排列，每个并行卷积层的输出数据均作为下一个并行卷积层的输入数据，并且每个并行卷积层的输出数据均作为拼接层的输入数据，拼接层的输出数据作为全局池化层的输入数据，全局池化层的输出数据即为人脸检测模型的输出结果，该输出结果包括人脸检测模型预测出的人脸样本图片中人脸特征点的属性信息和位置信息。

如图3所示，图3为一个包含三个并行卷积层的人脸检测模型的网络结构示意图。其中，该三个并行卷积层分别为卷积层A、卷积层B和卷积层C，每个并行卷积层对应的预设尺度的视觉感知范围分别为3×3、5×5和7×7的卷积核，卷积核的单位为像素点。

通过在每个并行卷积层使用不同尺度的视觉感知范围进行并行卷积计算，并通过拼接层将每个并行卷积层的计算结果拼接在一起，使得人脸检测模型能够同时捕捉不同尺度的细节特征，从而提高人脸检测模型的表达能力，并且，通过全局池化层的池化计算，能够使人脸检测模型的输出结果相对于位置具有不变性的特点，同时避免过拟合。这种层叠卷积神经网络结构能够提高人脸检测模型对人脸特征点的定位能力，尤其是对模糊人脸、大角度人脸、夸张表情人脸等人脸的特征点能够准确定位，从而有效提高人脸检测模型的预测准确率。

具体地，在使用训练数据集对初始人脸检测模型进行训练时，将训练数据集中的人脸样本图片输入该初始人脸检测模型，按照该初始人脸检测模型的层叠卷积神经网络结构进行逐层计算，得到的初始人脸检测模型的输出结果作为测试结果，并通过对测试结果和人脸样本图片的人脸特征点标注信息之间进行对比学习，根据对比学习的结果调整该层叠卷积神经网络结构中每层网络的参数，经过反复地训练和参数调整，得到训练过的人脸检测模型。

进一步地，在每一个并行卷积层进行卷积计算之前，还可以对该并行卷积层的输入数据进行标准化处理，该标准化处理具体可以包括全局归一化(Batch Normalization，BN)处理和单侧抑制处理。通过全局归一化处理能够防止梯度消失或爆炸，加快训练速度。单侧抑制处理使用修正线性单元(Rectified linear unit，ReLU)作为激活函数对全局归一化处理后的输出进行单侧抑制，使得稀疏后的人脸检测模型能够实现更准确地挖掘人脸特征点和拟合训练数据。同时，对标准化处理后的输入数据进行卷积计算，能够有效减少计算量，提高计算效率。

S4：使用测试数据集对训练过的人脸检测模型进行测试，并根据测试结果计算训练过的人脸检测模型对人脸特征点的定位准确率。

具体地，将测试数据集中的人脸样本图片输入到步骤S3得到的训练过的人脸检测模型中进行测试，得到人脸特征模型输出的测试结果，该测试结果包括人脸样本图片中每个人脸特征点的预测位置信息。

针对每个人脸样本图片，将该将人脸样本图片的测试结果与该人脸样本图片的人脸特征点标注信息中的每个人脸特征点的实际位置信息进行比较，判断测试结果是否准确，得到判断结果，并根据测试数据集中每个人脸样本图片的判断结果，计算训练过的人脸检测模型对人脸特征点的定位准确率。

在一具体实施例中，判断结果可以包括正确和错误两个值，当人脸样本图片的测试结果与该人脸样本图片的人脸特征点标注信息一致，则判断结果为正确，否则判断结果为错误，在测试数据集中统计判断结果为正确的人脸样本图片的数量，并将该数量与测试数据集包含的人脸样本图片的总数的比值作为定位准确率。

进一步地，还可以使用计算测试数据集的归一化平均误差(normalized mean error，NME)的方式得到定位准确率。

S5：若定位准确率小于预设的准确率阈值，则重新对样本数据集中的人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用新的训练数据集对训练过的人脸检测模型进行训练，以更新训练过的人脸检测模型，使用新的测试数据集对训练过的人脸检测模型进行测试，直到定位准确率大于或者等于预设的准确率阈值为止。

具体地，将步骤S4得到的定位准确率与预设的准确率阈值进行比较，若定位准确率小于准确率阈值，则确认训练过的人脸检测模型的训练未完成，需继续对该训练过的人脸检测模型进行网络参数调优。

按照预设的划分比例重新对样本数据集中的人脸样本图片进行随机选择，得到新的训练数据集和新的测试数据集，并使用该新的训练数据集，采用与步骤S3相同的训练过程对训练过的人脸检测模型进行训练，以更新训练过的人脸检测模型，并在训练完成后，使用新的测试数据集，采用与步骤S4相同的测试过程对训练过的人脸检测模型进行测试，并根据测试结果计算定位准确率。

若定位准确率仍然小于准确率阈值，则继续重复本步骤，反复训练和测试，直到定位准确率大于或者等于准确率阈值时结束训练和测试。

S6：若定位准确率大于或等于预设的准确率阈值，则将定位准确率大于或等于预设的准确率阈值的训练过的人脸检测模型确定为训练好的人脸检测模型。

具体地，若步骤S4得到的定位准确率大于或等于预设的准确率阈值，或者经过步骤S5反复训练和测试后得到的定位准确率大于或等于预设的准确率阈值，则此时得到的定位准确率大于或等于预设的准确率阈值的训练过的人脸检测模型即为训练好的人脸检测模型，可以使用该训练好的人脸检测模型进行人脸特征点的检测。

S7：获取待检测的人脸图片。

具体地，待检测的人脸图片具体可以为待进行身份识别的用户通过客户端输入的人脸图片，服务端从客户端获取该待检测的人脸图片。

S8：将待检测的人脸图片输入训练好的人脸检测模型进行计算，得到该人脸图片的特征点预测结果，其中，特征点预测结果包括目标特征点的属性信息和位置信息。

具体地，将步骤S7得到的人脸图片输入步骤S6得到的训练好的人脸检测模型中，并按照该训练好的人脸检测模型中的层叠卷积神经网络结构进行计算，得到该训练好的人脸检测模型的输出，该输出包括识别出的待检测的人脸图片中的目标特征点的属性信息和位置信息。即为待检测的人脸图片的特征点预测结果。

在本实施例中，一方面，构建包含多个并行卷积层、拼接层和全局池化层的卷积神经网络，作为人脸检测模型，其中，并行卷积层具有不同预设尺度的视觉感知范围，通过在每个并行卷积层使用不同尺度的视觉感知范围进行并行卷积计算，并通过拼接层将每个并行卷积层的计算结果拼接在一起，使得人脸检测模型能够同时捕捉不同尺度的细节特征，从而提高人脸检测模型的表达能力，并且，通过全局池化层的池化计算，能够使人脸检测模型的输出结果相对于位置具有不变性的特点，同时避免过拟合，采用上述这种卷积神经网络的网络结构，能够提高人脸检测模型对人脸特征点的定位能力，尤其是对模糊人脸、大角度人脸、夸张表情人脸等人脸的特征点能够准确定位，从而有效提高人脸检测模型的预测准确率；另一方面，通过获取由包含准确的人脸特征点标注信息的人脸样本图片组成的样本数据集，按照预设的比例将样本数据集划分为训练数据集和测试数据集，使用训练数据集对该人脸检测模型进行训练，并使用测试数据集对训练过的人脸检测模型进行测试，然后根据测试结果计算人脸检测模型的定位准确率，通过定位准确率判断训练过的人脸检测模型的预测能力，并通过对训练数据集和测试数据集的调整，不断优化对人脸检测模型的训练，直到达到满意的定位准确率，实现了对人脸检测模型的训练调优，进一步增强人脸检测模型的预测能力。

在一实施例中，如图4所示，K等于3，并且K个并行卷积层包括第一卷积层、第二卷积层和第三卷积层，在步骤S8中，将待检测的人脸图片输入训练好的人脸检测模型进行计算，得到该人脸图片的特征点预测结果具体包括如下步骤：

S81：对待检测的人脸图片进行标准化处理，得到第一人脸数据。

标准化处理包括全局归一化处理和单侧抑制处理，全局归一化处理即BN处理，通过全局归一化处理能够有效防止梯度消失或爆炸；单侧抑制处理即使用ReLU作为激活函数对全局归一化处理后的输出图像进行单侧抑制，避免过拟合。

具体地，对待检测的人脸图片进行全局归一化处理和单侧抑制处理后，得到第一人脸数据。

S82：将第一人脸数据输入第一卷积层进行卷积计算，得到第一卷积结果。

具体地，将步骤S81得到的第一人脸数据输入第一卷积层进行卷积计算，该卷积计算对第一人脸数据的图像矩阵进行卷积变换，通过第一卷积层的卷积核提取该图像矩阵的特征，输出特征图(Feature Map)，即第一卷积结果。

S83：对第一卷积结果进行标准化处理，得到第二人脸数据。

具体地，将步骤S82得到的第一卷积结果继续进行标准化处理，得到第二人脸数据。

其中，对第一卷积结果的标准化处理过程可采用与步骤S81相同的全局归一化处理和单侧抑制处理过程，此处不再赘述。

S84：将第二人脸数据输入第二卷积层进行卷积计算，得到第二卷积结果。

具体地，将步骤S83得到的第二人脸数据输入第二卷积层进行卷积计算，该卷积计算对第二人脸数据的图像矩阵进行卷积变换，通过第二卷积层的卷积核提取该图像矩阵的特征，输出第二卷积结果。

S85：对第二卷积结果进行标准化处理，得到第三人脸数据。

具体地，将步骤S84得到的第二卷积结果继续进行标准化处理，得到第三人脸数据。

其中，对第二卷积结果的标准化处理过程可采用与步骤S81相同的全局归一化处理和单侧抑制处理过程，此处不再赘述。

S86：将第三人脸数据输入第三卷积层进行卷积计算，得到第三卷积结果。

具体地，将步骤S85得到的第三人脸数据输入第三卷积层进行卷积计算，该卷积计算对第三人脸数据的图像矩阵进行卷积变换，通过第三卷积层的卷积核提取该图像矩阵的特征，输出第三卷积结果。

需要说明的是，第一卷积层的卷积核大小、第二卷积层的卷积核大小，以及第三卷积层的卷积核大小均可以预先根据实际应用的需要进行设置，其互相之间可以相同也可以不相同，此处不做限制。

S87：将第一卷积结果、第二卷积结果和第三卷积结果输入拼接层进行拼接计算，得到卷积输出结果。

具体地，将步骤S82得到的第一卷积结果、步骤S84得到第二卷积结果和步骤S86得到的第三卷积结果同时输入到拼接层进行拼接计算，得到卷积输出结果。

S88：将卷积输出结果输入全局池化层进行池化计算，得到待检测的人脸图片的特征点预测结果。

具体地，将步骤S87得到的卷积输出结果输入全局池化层进行池化计算，得到待检测的人脸图片特征点预测结果。

由于卷积输出结果中包含的特征参数个数较多，同时还可能存在没有实际意义或者重复等冗杂特征，因此通过全局池化层的池化计算，能够筛选掉冗杂特征，减少不必要的参数，避免过拟合。

进一步地，采用最大池化(Max Pooling)方法或平均池化(mean pooling)方法进行池化计算。其中，最大池化方法是将特征图区域的最大值作为该区域池化后的值。平均池化方法是计算特征图区域的平均值作为该区域的池化结果。

本实施例中，当人脸检测模型包含三个并行卷积层时，对待检测的人脸图片进行标准化处理，得到第一人脸数据后，将第一人脸数据输入第一卷积层进行卷积计算，得到第一卷积结果，然后对第一卷积结果继续进行标准化处理，得到第二人脸数据，再将第二人脸数据输入第二卷积层进行卷积计算，得到第二卷积结果，然后对第二卷积结果继续进行标准化处理，得到第三人脸数据，再将第三人脸数据输入第三卷积层进行卷积计算，得到第三卷积结果，之后将三个平行卷积层的输出均输入到拼接层进行拼接计算，得到卷积输出结果，最后将卷积输出结果输入全局池化层进行池化计算，得到待检测的人脸图片的特征点预测结果，待检测的人脸图片经过上述这种卷积神经网络的网络结构的计算，能够准确定位出人脸特征点，尤其是对模糊人脸、大角度人脸、夸张表情人脸等人脸的特征点能够准确定位，从而有效提高人脸检测模型的预测准确率。

在一实施例中，如图5所示，在步骤S4中，根据测试结果计算训练过的人脸检测模型对人脸特征点的定位准确率具体包括如下步骤：

S41：根据测试结果，计算该测试结果对应的测试数据集中每个测试样本的归一化平均误差。

具体地，测试结果包括该测试结果对应的测试数据集的测试样本中每个人脸特征点的预测位置信息，按照如下公式计算每个测试样本的归一化平均误差(normalized mean error，NME)：

其中，P为每个测试样本的归一化平均误差，N为该测试样本的人脸特征点的实际数量，x _k为该测试样本第k个人脸特征点的实际位置信息，y _k为该测试样本的测试结果中第k个人脸特征点的预测位置信息，|x _k-y _k|为第k个人脸特征点的实际位置和预测位置之间的距离，d为该测试样本的人脸图像尺寸。实际位置信息和预测位置信息具体可以是坐标信息，人脸图像尺寸具体可以是人脸图片的像素面积。

S42：将预设的误差阈值按照预设的间隔数值进行平均分割，得到P个子阈值，其中，P为正整数。

具体地，将从0到预设的误差阈值之间的数值，按照预设的间隔数值进行平均分割，得到P个子阈值。

需要说明的是，预设的误差阈值和预设的间隔数值均可以根据实际应用的需要进行设置，此处不做限制。

例如，预设的误差阈值为0.07，预设的间隔数值为0.001，则将0到0.07之间的数值按照0.001的间隔进行平均分割，得到70个子阈值。

需要说明的是，步骤S41和步骤S42之间没有必然的先后执行顺序，其也可以是并列执行的关系，此处不做限制。

S43：统计归一化平均误差小于每个子阈值的测试样本的统计数量，并计算该统计数量占测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值。

具体地，针对步骤S41得到的每个测试样本的归一化平均误差，将该测试样本的归一化平均误差与每个子阈值进行比较，并根据比较结果统计归一化平均误差小于每个子阈值的测试样本的统计数量，计算该统计数量与测试结果对应的测试数据集中测试样本总数之间的商，得到P个商，即P个百分比数值。

例如，若预设的误差阈值为0.2，预设的间隔数值为0.05，则P为4，4个子阈值分别为0.05、0.1、0.15和0.2。假设测试结果对应的测试数据集包含的测试样本总数为10个，每个测试样本的归一化平均误差分别为0.003、0.12、0.06、0.07、0.23、0.18、0.11、0.04、0.09和0.215。则统计可得：

小于0.05的归一化平均误差为0.003和0.04，即归一化平均误差小于0.05的测试样本的统计数量为2；

小于0.1的归一化平均误差为0.003、0.075、0.04、0.06、0.07和0.09，即归一化平均误差小于0.1的测试样本的统计数量为6；

小于0.15的归一化平均误差为0.003、0.075、0.04、0.06、0.07、0.09和0.11，即归一化平均误差小于0.15的测试样本的统计数量为7；

小于0.2的归一化平均误差为0.003、0.075、0.04、0.06、0.07、0.09、0.11和0.18，即归一化平均误差小于0.2的测试样本的统计数量为8；

按照本步骤的计算方式得到的4个百分比数值分别为：2/10＝20％、6/10＝60％、7/10＝70％和8/10＝80％。

S44：计算P个百分比数值的平均值，并将该平均值作为定位准确率。

具体地，根据步骤S43得到的P个百分比数值，计算该P个百分比数值的算术平均值，该算数平均值即为定位准确率。

继续以步骤S43的例子进行说明，4个百分比数值的平均值为(20％+60％+70％+80％)/4＝57.8％。

本实施例中，通过计算测试样本的归一化平均误差，并将预设的误差阈值按照预设的间隔数值进行平均分割，然后统计归一化平均误差小于每个子阈值的测试样本的统计数量，并计算该统计数量占测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值，将P个百分比数值的算术平均值作为定位准确率，通过本实施例的计算方法得到的定位准确率能够客观准确的反映训练过的人脸检测模型对特征点的预测准确程度，进而为进一步模型训练参数优化提供准确的判断依据。

在一实施例中，如图6所示，在步骤S1中，获取样本数据集具体包括如下步骤：

S11：获取视频数据和图片。

具体地，从预设的视频源渠道获取视频数据，其中，视频源渠道可以是监控设备中录制的视频数据、服务端数据库中保存的视频数据、视频应用中收集的视频数据等。从预设的图片源渠道获取图片，其中，图片源渠道可以是互联网公开的图片、服务端数据库中预存的图片等。

可以理解的，获取到的视频数据和图片均为多个。

S12：按照预设的帧提取频率和预设的最大帧数，从视频数据中提取目标视频帧图像。

具体地，对步骤S11获取到的每个视频数据进行处理，按照预设的帧提取频率和预设的最大帧数，从该视频数据的预设位置开始提取帧图像，得到目标视频帧图像。其中，预设位置可以是视频数据的第一帧位置，也可以是其他位置，此处不做限制。

需要说明的是，预设的帧提取频率通常可以设置为每连续2帧图像中随机提取1帧图像，预设的最大帧数通常为经验值，其取值范围可以在1700至1800之间，但并不限于此，预设的帧提取频率和预设的最大帧数均可以根据实际应用的需要进行设置，此处不做限制。

例如，假设预设的帧提取频率为每连续5帧图像中随机提取1帧图像，预设的最大帧数为1800，若视频数据的总帧数为2500帧，并从该视频数据的第一帧开始提取，则目标视频帧图像的数量为500帧。

S13：分别对目标视频帧图像和图片进行人脸特征点标注，分别得到目标视频帧图像的人脸特征点标注信息和图片的人脸特征点标注信息。

具体地，

对步骤S12得到的每个目标视频帧图像进行人脸特征点标注，得到每个目标视频帧图像的人脸特征点标注信息，同时，对步骤S11获取的图片进行人脸特征点标注，得到每个图片的人脸特征点标注信息，其中，人脸特征点标注信息包括人脸特征点的属性信息和位置信息。属性信息具体为人脸特征点所属的五官信息，位置信息具体为人脸特征点在人脸样本图片中的像素点坐标。进一步地，利用预设的人脸特征点标注工具和人工校正相结合的方式实现对目标视频帧图像和图片的人脸特征点标注，详述如下：

(1)分别将目标视频帧图像和图片输入预设的人脸特征点标注工具，通过该人脸特征点标注工具分别对目标视频帧图像和图片中的人脸进行人脸特征点标注，得到第一标注结果。

其中，预设的人脸特征点标注工具具体可以是现有的能够实现人脸特征点标注功能的神经网络工具，人脸特征点包括耳朵、眉毛、眼睛、鼻子、嘴唇以及脸型等脸部特征。

由于现有的能够实现人脸特征点标注功能的神经网络工具的标注准确性较低，因此，需要进一步进行人工校正。

(2)将第一标注结果发送给目标用户进行确认和调整，并接收目标用户返回的校正信息，根据该校正信息对第一标注结果中标注错误的信息进行更新，得到准确的人脸特征点标注信息。

S14：按照预设的加工方式，对图片进行加工处理，得到新图片和新图片的人脸特征点标注信息。

具体地，预设的加工方式包括但不限于水平翻转、顺时针随机旋转、逆时针随机旋转、平移、缩放和亮度增减等，按照预设的加工方式对步骤S11获取的图片进行加工处理后，得到新图片，并根据加工方式对应地同步更新图片的人脸特征点标注信息中的位置信息，得到新图片的人脸特征点标注信息。

需要说明的是，通过对图片按照预设的加工方式进行加工处理，得到新图片及其对应的人脸特征点标注信息，能够快速地丰富样本数据集，并且不需要重复进行步骤S13中的人脸特征点标注信息的标注过程，为人脸检测模型的训练和测试提供丰富多样的人脸样本图片，确保样本的多样性和均衡性，从而能够更好的支撑人脸检测模型的训练和测试。

S15：将目标视频帧图像、图片和新图片均作为人脸样本图片。

具体地，将步骤S12得到的目标视频帧图像、步骤S11得到的图片和步骤S14得到的新图片均作为样本数据集的人脸样本图片，目标视频帧图像、图片和新图片的人脸特征点标注信息即为人脸样本图片的人脸特征点标注信息。

在本实施例中，一方面，通过对视频数据进行视频帧提取，并对得到的目标视频帧图像进行人脸特征点标注，由于视频数据的连续帧图像中人脸姿态的变化较小，因此利用预设的人脸特征点标注工具和人工校正相结合的方式对目标视频帧图像进行人脸特征点标注时，能够实现低成本且准确的标注，得到大量准确的样本数据，同时，在提取目标视频帧图像时通过设定帧提取频率，避免视频数据中连续多帧人脸的姿态和表情变化不大导致的数据多样性不足，通过设定最大帧数避免长视频占主导而导致人脸检测模型的过拟合；另一方面，通过对图片进行加工处理，将图片数据增广扩充到跟视频数据同等数量级。本实施例实现了在降低人脸样本图片的标注成本的同时，得到包含丰富人脸样本图片的样本数据集，能够有效支撑人脸检测模型的训练和测试，从而提高人脸检测模型的训练准确率和预测能力。

在一实施例中，如图7所示，在步骤S14中，按照预设的加工方式，对图片进行加工处理，得到新图片和新图片的人脸特征点标注信息具体包括如下步骤：

S141：对图片进行水平翻转处理，得到第一图片和第一图片的人脸特征点标注信息。

具体地，对图片进行水平翻转处理，并对图片的人脸特征点标注信息中每个人脸特征点的位置信息按照水平翻转的对应关系同步对应调整，得到第一图片和第一图片的人脸特征点标注信息。

可以理解的是，图片和第一图片的数量相同，此时将图片的数量和第一图片的数量的总和作为第一数量，则第一数量为图片的数量的2倍。

S142：按照预设的旋转方式，分别对图片和第一图片进行旋转处理，得到第二图片和第二图片的人脸特征点标注信息。

具体地，按照预设的旋转方式，分别对图片和步骤S141得到的第一图片进行旋转处理，得到第二图片，并对图片和第一图片的人脸特征点标注信息中每个人脸特征点的位置信息，按照该预设的旋转方式的对应关系同步对应调整，得到第二图片的人脸特征点标注信息。

需要说明的是，预设的旋转方式具体可以是顺时针随机旋转或逆时针随机旋转等，但并不限于此，其可以根据实际应用的需要进行设置，此处不做限制。

可以理解的是，若预设的旋转方式为顺时针随机旋转和逆时针随机旋转两种方式，则得到的第二图片的数量为图片的数量的4倍，此时将第二图片的数量和第一数量的总和作为第二数量，则第二数量为图片的数量的6倍。

S143：按照预设的偏移量和预设的缩放比例，分别对图片、第一图片和第二图片中的人脸矩形框依次进行平移处理和缩放处理，得到第三图片和第三图片的人脸特征点标注信息。

具体地，按照预设的偏移量，分别对图片、第一图片和第二图片中的人脸矩形框进行平移处理，然后再按照预设的缩放比例，对平移处理后的图片、第一图片和第二图片中的人脸矩形框进行缩放处理，得到第三图片，同时，按照预设的偏移量和预设的缩放比例的对应关系，同步对应调整人脸特征点标注信息中每个人脸特征点的位置信息，得到第三图片的人脸特征点标注信息。

其中，预设的偏移量和预设的缩放比例可以是一个预设范围内的随机值。

可以理解的是，第三图片的数量为图片的数量的2×3×2＝12倍。

S144：按照预设的提取比例，从图片、第一图片、第二图片和第三图片中随机选取目标图片，并对目标图片进行随机亮度变化处理，得到第四图片和第四图片的人脸特征点标注信息。

具体地，从步骤S141得到的第一图片、步骤S142得到的第二图片、步骤S143得到的第三图片，以及图片中，按照预设的提取比例，随机选取目标图片。对选出的目标图片进行随机亮度变化处理，得到第四图片，并且目标图片的人脸特征点标注信息即为第四图片的人脸特征点标注信息。

其中，随机亮度变化处理包括对随机选择的像素点进行亮度增加或者亮度降低处理，增加幅度和降低幅度可随机产生，也可以由预设的幅度阈值确定。预设的提取比例通常可以设置为30％，但并不限于此，具体可以根据实际应用的需要进行设置。

可以理解的是，当预设的提取比例为30％时，第四图片的数量为图片的数量的12×1.3＝15.6倍。

S145：将第一图片、第二图片、第三图片和第四图片均作为新图片。

具体地，将步骤S141得到的第一图片、步骤S142得到的第二图片、步骤S143得到的第三图片，以及步骤S144得到的第四图片均作为新图片，第一图片、第二图片、第三图片和第四图片的人脸特征点标注信息即为新图片的人脸特征点标注信息。

例如，假设获取到的图片的数量为3300张，那么，通过本实施例进行增广后得到的新图片的数量约为5万张，有效扩充了样本数据集。

在本实施例中，通过对图片进行一系列的水平翻转处理、旋转处理、平移处理、缩放处理和随机亮度变化处理等，使得得到的新图片的数量呈级数增长，在不增加人脸特征点标注信息的标注成本的基础上，快速扩充样本数据集，提高样本数据集的获取效率，并得到包含丰富人脸样本图片的样本数据集，能够有效支撑人脸检测模型的训练和测试，从而提高人脸检测模型的训练准确率和预测能力。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种人脸特征点检测装置，该人脸特征点检测装置与上述实施例中人脸特征点检测方法一一对应。如图8所示，该人脸特征点检测装置包括第一获取模块81、样本划分模块82、模型训练模块83、模型测试模块84、模型优化模块85、训练结果模块86、第二获取模块87和模型预测模块88。各功能模块详细说明如下：

第一获取模块81，用于获取样本数据集，其中，该样本数据集包含人脸样本图片和每个人脸样本图片的人脸特征点标注信息；

样本划分模块82，用于按照预设的划分比例，将样本数据集划分为训练数据集和测试数据集；

模型训练模块83，用于使用训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，该初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

模型测试模块84，用于使用测试数据集对训练过的人脸检测模型进行测试，并根据测试结果计算训练过的人脸检测模型对人脸特征点的定位准确率；

模型优化模块85，用于若定位准确率小于预设的准确率阈值，则重新对样本数据集中的人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用新的训练数据集对训练过的人脸检测模型进行训练，以更新训练过的人脸检测模型，使用新的测试数据集对训练过的人脸检测模型进行测试，直到定位准确率大于或者等于预设的准确率阈值为止；

训练结果模块86，用于若定位准确率大于或等于预设的准确率阈值，则将定位准确率大于或等于预设的准确率阈值的训练过的人脸检测模型确定为训练好的人脸检测模型；

第二获取模块87，用于获取待检测的人脸图片；

模型预测模块88，用于将待检测的人脸图片输入训练好的人脸检测模型进行计算，得到该人脸图片的特征点预测结果，其中，特征点预测结果包括目标特征点的属性信息和位置信息。

进一步地，K等于3，并且K个并行卷积层包括第一卷积层、第二卷积层和第三卷积层，模型预测模块88包括：

第一标准化子模块881，用于对待检测的人脸图片进行标准化处理，得到第一人脸数据；

第一卷积计算子模块882，用于将第一人脸数据输入第一卷积层进行卷积计算，得到第一卷积结果；

第二标准化子模块883，用于对第一卷积结果进行标准化处理，得到第二人脸数据；

第二卷积计算子模块884，用于将第二人脸数据输入第二卷积层进行卷积计算，得到第二卷积结果；

第三标准化子模块885，用于对第二卷积结果进行标准化处理，得到第三人脸数据；

第三卷积计算子模块886，用于将第三人脸数据输入第三卷积层进行卷积计算，得到第三卷积结果；

拼接子模块887，用于将第一卷积结果、第二卷积结果和第三卷积结果输入拼接层进行拼接计算，得到卷积输出结果；

池化子模块888，用于将卷积输出结果输入全局池化层进行池化计算，得到待检测的人脸图片的特征点预测结果。

进一步地，模型测试模块84包括：

误差计算子模块841，用于根据测试结果，计算该测试结果对应的测试数据集中每个测试样本的归一化平均误差；

阈值分割子模块842，用于将预设的误差阈值按照预设的间隔数值进行平均分割，得到P个子阈值，其中，P为正整数；

占比计算子模块843，用于统计归一化平均误差小于每个子阈值的测试样本的统计数量，并计算该统计数量占测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值；

准确率计算子模块844，用于计算P个百分比数值的平均值，并将该平均值作为定位准确率。

进一步地，第一获取模块81包括：

数据获取子模块811，用于获取视频数据和图片；

视频帧提取子模块812，用于按照预设的帧提取频率和预设的最大帧数，从视频数据中提取目标视频帧图像；

标注子模块813，用于分别对目标视频帧图像和图片进行人脸特征点标注，分别得到目标视频帧图像的人脸特征点标注信息和图片的人脸特征点标注信息；

图片加工子模块814，用于按照预设的加工方式，对图片进行加工处理，得到新图片和新图片的人脸特征点标注信息；

样本增广子模块815，用于将目标视频帧图像、图片和新图片均作为人脸样本图片。

进一步地，图片加工子模块814包括：

翻转子模块8141，用于对图片进行水平翻转处理，得到第一图片和第一图片的人脸特征点标注信息；

旋转子模块8142，用于按照预设的旋转方式，分别对图片和第一图片进行旋转处理，得到第二图片和第二图片的人脸特征点标注信息；

平移缩放子模块8143，用于按照预设的偏移量和预设的缩放比例，分别对图片、第一图片和第二图片中的人脸矩形框依次进行平移处理和缩放处理，得到第三图片和第三图片的人脸特征点标注信息；

亮度处理子模块8144，用于按照预设的提取比例，从图片、第一图片、第二图片和第三图片中随机选取目标图片，并对目标图片进行随机亮度变化处理，得到第四图片和第四图片的人脸特征点标注信息；

新增样本子模块8145，用于将第一图片、第二图片、第三图片和第四图片均作为新图片。

关于人脸特征点检测装置的具体限定可以参见上文中对于人脸特征点检测方法的限定，在此不再赘述。上述人脸特征点检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储样本数据集。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种人脸特征点检测方法。

在一实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现上述实施例人脸特征点检测方法的步骤，例如图2所示的步骤S1至步骤S8。或者，处理器执行计算机可读指令时实现上述实施例中人脸特征点检测装置的各模块/单元的功能，例如图8所示模块81至模块88的功能。为避免重复，此处不再赘述。

在一实施例中，提供了一个或多个非易失性可读存储介质，其上存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时实现上述方法实施例中人脸特征点检测方法，或者，该计算机可读指令被一个或多个处理器执行时实现上述装置实施例中人脸特征点检测装置中各模块/单元的功能。为避免重复，此处不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种人脸特征点检测方法，其特征在于，所述人脸特征点检测方法包括：

获取样本数据集，其中，所述样本数据集包含人脸样本图片和每个所述人脸样本图片的人脸特征点标注信息；

按照预设的划分比例，将所述样本数据集划分为训练数据集和测试数据集；

使用所述训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，所述初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个所述并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

使用所述测试数据集对所述训练过的人脸检测模型进行测试，并根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率；

若所述定位准确率小于预设的准确率阈值，则重新对所述样本数据集中的所述人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用所述新的训练数据集对所述训练过的人脸检测模型进行训练，以更新所述训练过的人脸检测模型，使用所述新的测试数据集对所述训练过的人脸检测模型进行测试，直到所述定位准确率大于或者等于所述预设的准确率阈值为止；

若所述定位准确率大于或等于所述预设的准确率阈值，则将定位准确率大于或等于所述预设的准确率阈值的所述训练过的人脸检测模型确定为训练好的人脸检测模型；

获取待检测的人脸图片；

将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果，其中，所述特征点预测结果包括目标特征点的属性信息和位置信息。
如权利要求1所述的人脸特征点检测方法，其特征在于，K等于3，并且所述K个并行卷积层包括第一卷积层、第二卷积层和第三卷积层，所述将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果包括：

对所述待检测的人脸图片进行标准化处理，得到第一人脸数据；

将所述第一人脸数据输入所述第一卷积层进行卷积计算，得到第一卷积结果；

对所述第一卷积结果进行所述标准化处理，得到第二人脸数据；

将所述第二人脸数据输入所述第二卷积层进行卷积计算，得到第二卷积结果；

对所述第二卷积结果进行所述标准化处理，得到第三人脸数据；

将所述第三人脸数据输入所述第三卷积层进行卷积计算，得到第三卷积结果；

将所述第一卷积结果、所述第二卷积结果和所述第三卷积结果输入所述拼接层进行拼接计算，得到卷积输出结果；

将所述卷积输出结果输入所述全局池化层进行池化计算，得到所述特征点预测结果。
如权利要求1所述的人脸特征点检测方法，其特征在于，所述根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率包括：

根据所述测试结果，计算所述测试结果对应的测试数据集中每个测试样本的归一化平均误差；

将预设的误差阈值按照预设的间隔数值进行平均分割，得到P个子阈值，其中，P为正整数；

统计所述归一化平均误差小于每个所述子阈值的测试样本的统计数量，并计算所述统计数量占所述测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值；

计算P个百分比数值的平均值，并将所述平均值作为所述定位准确率。
如权利要求1至3任一项所述的人脸特征点检测方法，其特征在于，所述获取样本数据集包括：

获取视频数据和图片；

按照预设的帧提取频率和预设的最大帧数，从所述视频数据中提取目标视频帧图像；

分别对所述目标视频帧图像和所述图片进行人脸特征点标注，分别得到所述目标视频帧图像的人脸特征点标注信息和所述图片的人脸特征点标注信息；

按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息；

将所述目标视频帧图像、所述图片和所述新图片均作为所述人脸样本图片。
如权利要求4所述的人脸特征点检测方法，其特征在于，所述按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息包括：

对所述图片进行水平翻转处理，得到第一图片和所述第一图片的人脸特征点标注信息；

按照预设的旋转方式，分别对所述图片和所述第一图片进行旋转处理，得到第二图片和所述第二图片的人脸特征点标注信息；

按照预设的偏移量和预设的缩放比例，分别对所述图片、所述第一图片和所述第二图片中的人脸矩形框依次进行平移处理和缩放处理，得到第三图片和所述第三图片的人脸特征点标注信息；

按照预设的提取比例，从所述图片、所述第一图片、所述第二图片和所述第三图片中随机选取目标图片，并对所述目标图片进行随机亮度变化处理，得到第四图片和所述第四图片的人脸特征点标注信息；

将所述第一图片、所述第二图片、所述第三图片和所述第四图片均作为所述新图片。
一种人脸特征点检测装置，其特征在于，所述人脸特征点检测装置包括：

第一获取模块，用于获取样本数据集，其中，所述样本数据集包含人脸样本图片和每个所述人脸样本图片的人脸特征点标注信息；

样本划分模块，用于按照预设的划分比例，将所述样本数据集划分为训练数据集和测试数据集；

模型训练模块，用于使用所述训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，所述初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个所述并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

模型测试模块，用于使用所述测试数据集对所述训练过的人脸检测模型进行测试，并根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率；

模型优化模块，用于若所述定位准确率小于预设的准确率阈值，则重新对所述样本数据集中的所述人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用所述新的训练数据集对所述训练过的人脸检测模型进行训练，以更新所述训练过的人脸检测模型，使用所述新的测试数据集对所述训练过的人脸检测模型进行测试，直到所述定位准确率大于或者等于所述预设的准确率阈值为止；

训练结果模块，用于若所述定位准确率大于或等于所述预设的准确率阈值，则将定位准确率大于或等于所述预设的准确率阈值的所述训练过的人脸检测模型确定为训练好的人脸检测模型；

第二获取模块，用于获取待检测的人脸图片；

模型预测模块，用于将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果，其中，所述特征点预测结果包括目标特征点的属性信息和位置信息。
如权利要求6所述的人脸特征点检测装置，其特征在于，K等于3，并且所述K个并行卷积层包括第一卷积层、第二卷积层和第三卷积层，所述模型预测模块包括：

第一标准化子模块，用于对所述待检测的人脸图片进行标准化处理，得到第一人脸数据；

第一卷积计算子模块，用于将所述第一人脸数据输入所述第一卷积层进行卷积计算，得到第一卷积结果；

第二标准化子模块，用于对所述第一卷积结果进行所述标准化处理，得到第二人脸数据；

第二卷积计算子模块，用于将所述第二人脸数据输入所述第二卷积层进行卷积计算，得到第二卷积结果；

第三标准化子模块，用于对所述第二卷积结果进行所述标准化处理，得到第三人脸数据；

第三卷积计算子模块，用于将所述第三人脸数据输入所述第三卷积层进行卷积计算，得到第三卷积结果；

拼接子模块，用于将所述第一卷积结果、所述第二卷积结果和所述第三卷积结果输入所述拼接层进行拼接计算，得到卷积输出结果；

池化子模块，用于将所述卷积输出结果输入所述全局池化层进行池化计算，得到所述特征点预测结果。
如权利要求6所述的人脸特征点检测装置，其特征在于，所述模型测试模块包括：

误差计算子模块，用于根据所述测试结果，计算所述测试结果对应的测试数据集中每个测试样本的归一化平均误差；

阈值分割子模块，用于将预设的误差阈值按照预设的间隔数值进行平均分割，得到P个子阈值，其中，P为正整数；

占比计算子模块，用于统计所述归一化平均误差小于每个所述子阈值的测试样本的统计数量，并计算所述统计数量占所述测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值；

准确率计算子模块，用于计算P个百分比数值的平均值，并将所述平均值作为所述定位准确率。
如权利要求6至8任一项所述的人脸特征点检测装置，其特征在于，所述第一获取模块包括：

数据获取子模块，用于获取视频数据和图片；

视频帧提取子模块，用于按照预设的帧提取频率和预设的最大帧数，从所述视频数据中提取目标视频帧图像；

标注子模块，用于分别对所述目标视频帧图像和所述图片进行人脸特征点标注，分别得到所述目标视频帧图像的人脸特征点标注信息和所述图片的人脸特征点标注信息；

图片加工子模块，用于按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息；

样本增广子模块，用于将所述目标视频帧图像、所述图片和所述新图片均作为所述人脸样本图片。
如权利要求9所述的人脸特征点检测装置，其特征在于，所述图片加工子模块包括：

翻转子模块，用于对所述图片进行水平翻转处理，得到第一图片和所述第一图片的人脸特征点标注信息；

旋转子模块，用于按照预设的旋转方式，分别对所述图片和所述第一图片进行旋转处理，得到第二图片和所述第二图片的人脸特征点标注信息；

平移缩放子模块，用于按照预设的偏移量和预设的缩放比例，分别对所述图片、所述第一图片和所述第二图片中的人脸矩形框依次进行平移处理和缩放处理，得到第三图片和所述第三图片的人脸特征点标注信息；

亮度处理子模块，用于按照预设的提取比例，从所述图片、所述第一图片、所述第二图片和所述第三图片中随机选取目标图片，并对所述目标图片进行随机亮度变化处理，得到第四图片和所述第四图片的人脸特征点标注信息；

新增样本子模块，用于将所述第一图片、所述第二图片、所述第三图片和所述第四图片均作为所述新图片。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下步骤：

获取样本数据集，其中，所述样本数据集包含人脸样本图片和每个所述人脸样本图片的人脸特征点标注信息；

按照预设的划分比例，将所述样本数据集划分为训练数据集和测试数据集；

使用所述训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，所述初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个所述并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

使用所述测试数据集对所述训练过的人脸检测模型进行测试，并根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率；

若所述定位准确率小于预设的准确率阈值，则重新对所述样本数据集中的所述人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用所述新的训练数据集对所述训练过的人脸检测模型进行训练，以更新所述训练过的人脸检测模型，使用所述新的测试数据集对所述训练过的人脸检测模型进行测试，直到所述定位准确率大于或者等于所述预设的准确率阈值为止；

若所述定位准确率大于或等于所述预设的准确率阈值，则将定位准确率大于或等于所述预设的准确率阈值的所述训练过的人脸检测模型确定为训练好的人脸检测模型；

获取待检测的人脸图片；

将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果，其中，所述特征点预测结果包括目标特征点的属性信息和位置信息。
如权利要求11所述的计算机设备，其特征在于，K等于3，并且所述K个并行卷积层包括第一卷积层、第二卷积层和第三卷积层，所述将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果包括：

对所述待检测的人脸图片进行标准化处理，得到第一人脸数据；

将所述第一人脸数据输入所述第一卷积层进行卷积计算，得到第一卷积结果；

对所述第一卷积结果进行所述标准化处理，得到第二人脸数据；

将所述第二人脸数据输入所述第二卷积层进行卷积计算，得到第二卷积结果；

对所述第二卷积结果进行所述标准化处理，得到第三人脸数据；

将所述第三人脸数据输入所述第三卷积层进行卷积计算，得到第三卷积结果；

将所述第一卷积结果、所述第二卷积结果和所述第三卷积结果输入所述拼接层进行拼接计算，得到卷积输出结果；

将所述卷积输出结果输入所述全局池化层进行池化计算，得到所述特征点预测结果。
如权利要求11所述的计算机设备，其特征在于，所述根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率包括：

根据所述测试结果，计算所述测试结果对应的测试数据集中每个测试样本的归一化平均误差；

将预设的误差阈值按照预设的间隔数值进行平均分割，得到P个子阈值，其中，P为正整数；

统计所述归一化平均误差小于每个所述子阈值的测试样本的统计数量，并计算所述统计数量占所述测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值；

计算P个百分比数值的平均值，并将所述平均值作为所述定位准确率。
如权利要求11至13任一项所述的计算机设备，其特征在于，所述获取样本数据集包括：

获取视频数据和图片；

按照预设的帧提取频率和预设的最大帧数，从所述视频数据中提取目标视频帧图像；

分别对所述目标视频帧图像和所述图片进行人脸特征点标注，分别得到所述目标视频帧图像的人脸特征点标注信息和所述图片的人脸特征点标注信息；

按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息；

将所述目标视频帧图像、所述图片和所述新图片均作为所述人脸样本图片。
如权利要求14所述的计算机设备，其特征在于，所述按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息包括：

对所述图片进行水平翻转处理，得到第一图片和所述第一图片的人脸特征点标注信息；

按照预设的旋转方式，分别对所述图片和所述第一图片进行旋转处理，得到第二图片和所述第二图片的人脸特征点标注信息；

按照预设的偏移量和预设的缩放比例，分别对所述图片、所述第一图片和所述第二图片中的人脸矩形框依次进行平移处理和缩放处理，得到第三图片和所述第三图片的人脸特征点标注信息；

按照预设的提取比例，从所述图片、所述第一图片、所述第二图片和所述第三图片中随机选取目标图片，并对所述目标图片进行随机亮度变化处理，得到第四图片和所述第四图片的人脸特征点标注信息；

将所述第一图片、所述第二图片、所述第三图片和所述第四图片均作为所述新图片。
一个或多个存储有计算机可读指令的非易失性可读存储介质，其特征在于，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取样本数据集，其中，所述样本数据集包含人脸样本图片和每个所述人脸样本图片的人脸特征点标注信息；

按照预设的划分比例，将所述样本数据集划分为训练数据集和测试数据集；

使用所述训练数据集对初始人脸检测模型进行训练，得到训练过的人脸检测模型，其中，所述初始人脸检测模型为包含K个并行卷积层、拼接层和全局池化层的卷积神经网络，每个所述并行卷积层具有不同预设尺度的视觉感知范围，K为大于等于3的正整数；

使用所述测试数据集对所述训练过的人脸检测模型进行测试，并根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率；

若所述定位准确率小于预设的准确率阈值，则重新对所述样本数据集中的所述人脸样本图片进行划分，得到新的训练数据集和新的测试数据集，并使用所述新的训练数据集对所述训练过的人脸检测模型进行训练，以更新所述训练过的人脸检测模型，使用所述新的测试数据集对所述训练过的人脸检测模型进行测试，直到所述定位准确率大于或者等于所述预设的准确率阈值为止；

若所述定位准确率大于或等于所述预设的准确率阈值，则将定位准确率大于或等于所述预设的准确率阈值的所述训练过的人脸检测模型确定为训练好的人脸检测模型；

获取待检测的人脸图片；

将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果，其中，所述特征点预测结果包括目标特征点的属性信息和位置信息。
如权利要求16所述的非易失性可读存储介质，其特征在于，K等于3，并且所述K个并行卷积层包括第一卷积层、第二卷积层和第三卷积层，所述将所述待检测的人脸图片输入所述训练好的人脸检测模型进行计算，得到所述人脸图片的特征点预测结果包括：

对所述待检测的人脸图片进行标准化处理，得到第一人脸数据；

将所述第一人脸数据输入所述第一卷积层进行卷积计算，得到第一卷积结果；

对所述第一卷积结果进行所述标准化处理，得到第二人脸数据；

将所述第二人脸数据输入所述第二卷积层进行卷积计算，得到第二卷积结果；

对所述第二卷积结果进行所述标准化处理，得到第三人脸数据；

将所述第三人脸数据输入所述第三卷积层进行卷积计算，得到第三卷积结果；

将所述第一卷积结果、所述第二卷积结果和所述第三卷积结果输入所述拼接层进行拼接计算，得到卷积输出结果；

将所述卷积输出结果输入所述全局池化层进行池化计算，得到所述特征点预测结果。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述根据测试结果计算所述训练过的人脸检测模型对人脸特征点的定位准确率包括：

根据所述测试结果，计算所述测试结果对应的测试数据集中每个测试样本的归一化平均误差；

将预设的误差阈值按照预设的间隔数值进行平均分割，得到P个子阈值，其中，P为正整数；

统计所述归一化平均误差小于每个所述子阈值的测试样本的统计数量，并计算所述统计数量占所述测试结果对应的测试数据集中测试样本总数的百分比，得到P个百分比数值；

计算P个百分比数值的平均值，并将所述平均值作为所述定位准确率。
如权利要求16至18任一项所述的非易失性可读存储介质，其特征在于，所述获取样本数据集包括：

获取视频数据和图片；

按照预设的帧提取频率和预设的最大帧数，从所述视频数据中提取目标视频帧图像；

分别对所述目标视频帧图像和所述图片进行人脸特征点标注，分别得到所述目标视频帧图像的人脸特征点标注信息和所述图片的人脸特征点标注信息；

按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息；

将所述目标视频帧图像、所述图片和所述新图片均作为所述人脸样本图片。
如权利要求19所述的非易失性可读存储介质，其特征在于，所述按照预设的加工方式，对所述图片进行加工处理，得到新图片和所述新图片的人脸特征点标注信息包括：

对所述图片进行水平翻转处理，得到第一图片和所述第一图片的人脸特征点标注信息；

按照预设的旋转方式，分别对所述图片和所述第一图片进行旋转处理，得到第二图片和所述第二图片的人脸特征点标注信息；

按照预设的偏移量和预设的缩放比例，分别对所述图片、所述第一图片和所述第二图片中的人脸矩形框依次进行平移处理和缩放处理，得到第三图片和所述第三图片的人脸特征点标注信息；

按照预设的提取比例，从所述图片、所述第一图片、所述第二图片和所述第三图片中随机选取目标图片，并对所述目标图片进行随机亮度变化处理，得到第四图片和所述第四图片的人脸特征点标注信息；

将所述第一图片、所述第二图片、所述第三图片和所述第四图片均作为所述新图片。