CN109086697A

CN109086697A - 一种人脸数据处理方法、装置及存储介质

Info

Publication number: CN109086697A
Application number: CN201810803085.5A
Authority: CN
Inventors: 王同; 王一同; 季兴; 周正; 王浩; 李志鋒
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-07-20
Filing date: 2018-07-20
Publication date: 2018-12-25

Abstract

本申请提供了一种人脸数据处理方法，包括：对待处理的人脸记录中的各个人脸图像进行人脸特征提取，分别得到所述各个人脸图像对应的特征向量；确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，并从所述待处理的人脸记录中删除所述噪声图像，得到去噪的人脸记录；根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出所述去噪的人脸记录的特征向量代表；计算任意两个去噪的人脸记录的所述特征向量代表的相似度；以及当所述相似度大于或等于相似阈值时，将所述任意两个去噪的人脸记录合并为一个人脸记录。

Description

一种人脸数据处理方法、装置及存储介质

技术领域

本申请涉及信息技术领域，尤其涉及一种人脸数据处理方法、装置及存储介质。

背景技术

人脸识别是人工智能和计算机视觉领域中的一个重要的研究课题，而一个高质量的人脸数据库则是实现高精度人脸识别的关键之一。由于可以通过多个渠道来将数据增加至人脸数据库中，加入新数据后的人脸数据库不可避免地要不定期地进行人脸数据数据处理以保证人脸数据库的质量。

发明内容

本申请提供了一种人脸数据处理方法、装置及存储介质，能够有效消除人脸数据库中的噪声图像，提高人脸数据库的质量。

本申请实施例提供了一种人脸数据处理方法，包括：

对待处理的人脸记录中的各个人脸图像进行人脸特征提取，分别得到所述各个人脸图像对应的特征向量；

确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，并从所述待处理的人脸记录中删除所述噪声图像，得到去噪的人脸记录；

根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出所述去噪的人脸记录的特征向量代表；

计算任意两个去噪的人脸记录的所述特征向量代表的相似度；以及

当所述相似度大于或等于相似阈值时，将所述任意两个去噪的人脸记录合并为一个人脸记录。

本申请实施例提供了一种人脸数据处理装置，包括：

提取模块，对待处理的人脸记录中的各个人脸图像进行人脸特征提取，分别得到所述各个人脸图像对应的特征向量；

去噪模块，确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，并从所述待处理的人脸记录中删除所述噪声图像，得到去噪的人脸记录；

确定模块，根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出所述去噪的人脸记录的特征向量代表；

计算模块，计算任意两个去噪的人脸记录的所述特征向量代表的相似度；以及

合并模块，当所述相似度大于或等于相似阈值时，将所述任意两个去噪的人脸记录合并为一个人脸记录。

本申请实施例还提供了一种存储介质，存储有可读指令，可以使至少一个处理器执行上述人脸数据处理方法。

通过本申请提供的技术方案，一方面可以去除待处理的人脸记录中的噪声图像，消除了人脸数据库中不同人的人脸图像被划分到同一个人脸记录的情况。另一方面通过对人脸数据库中去噪的人脸记录进行两两对比，生成相似度矩阵，再根据相似度矩阵对去噪的人脸记录进行去重以及合并，消除了人脸数据库中同一个人具有两条不同的人脸记录的情况，也即两条不同的人脸记录标识对应同一个人的人脸图像的情况，提高了人脸数据库的准确性。

附图说明

图1为本申请一实施例的人脸数据处理方法所适用的系统结构示意图；

图2为本申请一实施例的人脸数据处理方法的流程图；

图3为本申请一实施例的人脸数据处理方法流程图；

图4为本申请一实施例的人脸数据处理装置的结构示意图；以及

图5为本申请一实施例的服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

为了描述上的简洁和直观，下文通过描述若干代表性的实施例来对本发明的方案进行阐述。实施例中大量的细节仅用于帮助理解本发明的方案。但是很明显，本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案，一些实施方式没有进行细致地描述，而是仅给出了框架。下文中，“包括”是指“包括但不限于”，“根据……”是指“至少根据……，但不限于仅根据……”。下文中没有特别指出一个成分的数量时，意味着该成分可以是一个也可以是多个，或可理解为至少一个。

本申请的实例提出了一种人脸数据处理方法，该方法可以能够有效消除人脸数据库中的噪声图像，提高人脸数据库的质量。

图1显示了本申请一些实施例的人脸数据处理方法所适用的系统结构示意图。如图1所示，本申请的人脸数据处理方法所适用的系统至少包括：用户终端11、网络12以及应用服务器13。

在本申请的一些实例中，上述用户终端11可以是个人计算机(PC)、笔记本电脑等智能终端设备，也可以是智能手机、平板电脑等智能移动终端设备。在本申请的一些实例中，在用户终端11上可以安装各种应用软件，用户可以通过用户终端11上的目标应用软件14，经由网络12，上传人脸图像至应用服务器13中的人脸数据库15。

网络12可以是无线网络也可以是有线网络。如图1所示，在接入网一侧，用户终端11是可以有线的方式或无线的方式接入到网络12；而在核心网一侧，应用服务器13一般是通过有线的方式接入网络12。当然，应用服务器13也可以通过无线方式连接到网络12。

应用服务器13为上述目标应用软件14的服务器。应用服务器13接收通过用户终端11上的目标应用软件14上传的人脸图像，并将该人脸图像保存至人脸数据库15。上述应用服务器13可以是单独的服务器也可以是多个服务器组成的集群服务器。

下面结合附图，通过几个实施例对本申请实例提供的应用程序的测试方法进行说明。

图2示出了本申请实例的人脸数据处理方法的流程图，其中各步骤的操作例如可以由应用服务器13执行。如图2所示，该人脸数据处理方法包括以下步骤：

步骤201：对待处理的人脸记录中的各个人脸图像进行人脸特征提取，分别得到所述各个人脸图像对应的特征向量。

在一些实例中，在对待处理的人脸记录中的各个人脸图像进行人脸特征提取之前，可以先获取所述待处理的人脸记录的人脸记录标识，将具有相同的所述人脸记录标识人脸记录合并为一个待处理的人脸记录。

在一些实例中，人脸记录标识可以是姓名，此时可以对所述人脸记录标识进行归一化处理以使各个人脸记录标识具有统一的格式，然后再执行所述将人脸记录标识相同的人脸记录合并为一个待处理的人脸记录的步骤。

在一些实例中，所述对所述人脸记录标识进行归一化处理，包括：将所述姓名进行格式转化，以使所述姓名中的名称在前、姓氏在后，或者姓氏在前、名称在后；和/或将所述姓名中包含的符号转化为预设符号。

在一些实例中，获取所述人脸图像的RGB像素，在基于神经网络的第一模型下，将获取的RGB像素转化为所述人脸图像对应的所述特征向量。

步骤202：确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，并从所述待处理的人脸记录中删除所述噪声图像，得到去噪的人脸记录。

在一些实例中，所述预设特征向量为聚类中心对应的特征向量；计算所述待处理的人脸记录的各个所述特征向量的聚类中心；确定各个所述特征向量与计算出的聚类中心的距离，并将所述距离与聚类阈值比较；当特征向量对应的所述距离小于或等于所述聚类阈值时，则确定所述特征向量对应的人脸图像不是所述噪声图像，否则，确定所述特征向量对应的人脸图像属于所述噪声图像。

在一些实例中，将所述待处理的人脸记录中的各个所述特征向量都作为一个类簇；计算两两类簇之间的距离，当所述距离小于或等于所述聚类阈值时，将所述距离对应的两个类簇合并，直至任意两个类簇之间的距离都小于或等于所述聚类阈值，以得到所述待处理的人脸记录的K个类簇；当所述K个类簇中存在包括特征向量数量小于或等于数量阈值的类簇时，将所述类簇中的特征向量对应的人脸图像作为噪声图像。

其中，当所述K个类簇中存在包括特征向量数量小于或等于数量阈值的类簇时，将所述类簇中的特征向量对应的人脸图像作为噪声图像，包括：将所述K个类簇中包括特征向量的数量最大的类簇中的特征向量对应的人脸图像作为所述待处理的人脸记录中的人脸图像，也即其余类簇中的特征向量对应的人脸图像为噪声图像。

步骤203：根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出所述去噪的人脸记录的特征向量代表。

在一些实例中，计算所述去噪的人脸记录中的各个人脸图像对应的特征向量的均值，并将所述均值作为所述特征向量代表。

在一些实例中，从所述去噪的人脸记录中选择任一人脸图像，获取选择的人脸图像的RGB像素，基于神经网络的第二模型，将获取的RGB像素转化为该人脸图像对应的所述特征向量，并将转化后的所述特征向量作为所述特征向量代表。

步骤204：计算任意两个去噪的人脸记录的所述特征向量代表的相似度。

在一些实例中，基于所述计算出的所述相似度，得到所述待处理的人脸记录所在人脸数据库的相似矩阵；在所述相似矩阵中确定出至少一个连通域；将所述至少一个连通域中的人脸记录合并为一个人脸记录。

在一些实例中，如果所述计算出的相似度大于或等于所述相似阈值，则将该相似度在所述相似矩阵中的位置的值置为1，否则，将该相似度在所述相似矩阵中的位置的值置为0。

在一些实例中，确定所述相似矩阵中值为1的矩阵元素；以所述值为1的矩阵元素为起点，向左、右、上、下分别扩展搜索其他矩阵元素，直至搜索到值为0的矩阵元素或搜索到所述相似矩阵的边界，得到所述连通域。

步骤205：当计算出的所述相似度大于或等于相似阈值时，将所述任意两个去噪的人脸记录合并为一个人脸记录。

通过本申请实施例提供的人脸数据处理方法，可以有效消除人脸记录中的噪声图像，以及对人脸数据库中的人脸记录进行去重合并，从而提高人脸记录所在的人脸数据库的质量。

下面结合附图，介绍本申请实施例提供的人脸数据处理方法。

图3为本申请一些实施例的人脸数据处理方法的流程图，其中的各个步骤操作可以由应用服务器13执行。如图3所示，该人脸数据处理方法包括以下步骤：

步骤301：获取所述待处理的人脸记录的人脸记录标识，将具有相同的所述人脸记录标识的人脸记录合并为一个待处理的人脸记录。

在一些实例中，所述待处理的人脸记录是人脸数据库中的任一条人脸记录，上述人脸数据库中包括至少一条待处理的人脸记录，每一条待处理的人脸记录中包括至少一个人脸图像，其中，上述至少一个人脸图像可以从多个渠道获得，具体可以是从互联网搜索获取的人脸图像或从应用软件获取的人脸图像，例如可以是从互联网通过爬虫算法爬取的人脸图像或从门禁系统获取的人脸图像等等。

在一些实例中，每一条上述待处理的人脸记录均具有独特的人脸记录标识，同一人脸数据库中的所有待处理的人脸记录对应的人脸记录标识组成人脸记录标识列表，存在于这些待处理的人脸记录所在的人脸数据库中。由于人脸数据库中的各个待处理的人脸记录的获取渠道不同，上述人脸记录标识列表中的人脸记录标识格式可能会不同，比如可以为“王晓红”、“Eason Li”以及“kevin_meng”等，因此当所述人脸记录标识为姓名时，需要对所述姓名进行归一化处理，以使各个人脸记录中的姓名具有统一的格式。

在一些实例中，上述归一化处理包括：将所述姓名进行格式转化，以使所述姓名中的名称在前，姓氏在后，例如将所有人名转化为英文格式，保证名称在前，姓氏在后，比如将“王晓红”转化为“xiaohong wang”，当然也可以转化为姓氏在后、名称在前的格式；和/或将所述姓名中包含的符号转化为预设符号，例如将“-”、“_”以及“@”等符号转化为空格，比如将“kevin_meng”转化为“kevin meng”。更进一步的，上述归一化处理还可以进一步包括：将所述姓名由大写转小写。

如前文所述，由于人脸图像来自于多个渠道、人脸记录标识的形式有所不同。在进行了归一化处理后，可出现人脸记录标识相同的情况，这就表明这些人脸记录标识对应的人脸记录中非常有可能包含的是同一人的人脸图像，那么就将这些人脸记录进行合并。在一些实例中，将具有相同的所述人脸记录标识对应的人脸记录合并为一个待处理的人脸记录，包括：获取所述人脸数据库的人脸记录标识列表，所述人脸记录标识列表中包括N个人脸记录标识；将第i个人脸记录标识分别与第i-1个至第1个人脸记录标识进行比较，2<＝i<＝N；当所述第i个人脸记录标识与第i-1个至第1个人脸记录标识中的一个人脸记录标识相同时，将第i个人脸记录标识对应的人脸记录中的人脸图像合并进与所述第i个人脸记录标识相同的人脸记录中，并将第i个人脸记录删除。

具体的，从上述人脸记录标识列表的第二个人脸记录标识起，检查人脸记录A的人脸记录标识是否和人脸记录A的人脸记录标识之前的其他人脸记录标识相同，如果有，则将人脸记录A中的人脸图像合并进与其相同的人脸记录标识对应的人脸记录中，并将人脸记录A删除。

步骤302：获取所述各个人脸图像的RGB像素，在基于神经网络的第一模型下，将获取的RGB像素转化为该人脸图像对应的所述特征向量。

在一些实例中，上述基于神经网络的第一模型可以是使用人脸数据库中的人脸图像训练好的基于卷积神经网络模型的分类模型，(CNN模型，Convolutional NeuralNetwork模型)，例如可以是利用残差网络(RESNet)结构和公开的人脸数据库比如CASIA-WebFace人脸数据库训练好的CNN分类模型，该基于神经网络的第一模型可以用于人脸图像的特征向量的提取。

在一些实例中，上述基于神经网络的第一模型将人脸图像的RGB像素作为输入，通过多层卷积神经网络的非线性变换，将上述人脸图像的RGB像素转化为归一化的特征向量。具体的，上述基于神经网络的第一模型把上述人脸图像中RGB像素代表的人脸信息转化为能表征该人脸信息的特征向量。其中，当上述基于神经网络的第一模型是利用残差网络(RESNet)结构训练得到时，该基于神经网络的第一模型输出的上述人脸图像的特征向量可以是一个向量模长为1的512维的特征向量。

更进一步的，上述基于神经网络的第一模型直接与分类器相连接，在对上述基于神经网络的第一模型的训练过程中，可以将S个不同的人，每人Y张人脸图像分别输入上述基于神经网络的第一模型，上述基于神经网络的第一模型在接收到S*Y张人脸图像后，分别提取该S*Y张人脸图像的人脸特征，并使用与其连接的分类器进行分类，显然，可以分为S个类。

例如，使用小李的20张人脸图像和小孟的20张人脸图像来训练上述基于神经网络的第一模型，首先将上述40张小李和小孟的人脸图像输入到上述基于神经网络的第一模型，当上述基于神经网络的第一模型接收到小李和小孟共40张人脸图像中的第一张人脸图像时，提取第一张人脸图像的人脸特征，并通过分类器将其归为第一类，当接收到第二张人脸图像时，提取上述第二张人脸图像的人脸特征后，计算上述第二张人脸图像的人脸特征与上述第一张人脸图像的人脸特征的距离，如果该距离小于预设阈值，则确定上述第二张人脸图像与上述第一张人脸图像相似，并将上述第二张人脸图像也归为上述第一类，否则认为上述第二张人脸图像与上述第一张人脸图像不相似，将其归为第二类。并将该分类结果和真实的结果进行比较，使用二者的误差来计算梯度，并将该梯度回传给上述基于神经网络的第一模型以使上述基于神经网络的第一模型更新。这样，通过上述40张小李和小孟的人脸图像输入上述基于神经网络的第一模型，直至上述基于神经网络的第一模型收敛，也即完成了对基于神经网络的第一模型的训练。这里，上述基于神经网络的第一模型收敛指的是与上述基于神经网络的第一模型已经学习完毕，与其连接的分类器已经基本可以通过小李和小孟这40张人脸图像区分小李和小孟。

因此，上述基于神经网络的第一模型输出的人脸图像对应的特征向量可以表现为：同一人的人脸图像的特征向量间的距离比较小，不同人的人脸图像的特征向量间的距离比较大。这里，上述距离可以为两个特征向量的余弦距离也可以是欧氏距离。

步骤303：确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，并从所述待处理的人脸记录中删除所述噪声图像，得到去噪的人脸记录。

在一些实例中，对得到的各个人脸图像对应的所述特征向量进行聚类分析时，，可以采用的聚类方法包括但不限于层次聚类、K-means聚类以及mean-shift聚类等等。

这里，上述噪声图像可以为不是其所在的人脸记录对应的人的人脸图像。由于上述各个人脸记录中的人脸图像可能是从互联网上获取的，因此可能会获取到噪声图像，比如当在互联网搜索“谢霆锋”时，会搜索出谢霆锋的照片，同时也可能会搜索出王菲以及张柏芝等与谢霆锋相关的人的照片，并和谢霆锋的照片一起保存在人脸数据库中，谢霆锋的人脸记录中作为谢霆锋的人脸图像，这里，王菲以及张柏芝等与谢霆锋相关的人的照片即为谢霆锋的人脸记录中的噪声图像。

在一些实例中，所述预设特征向量为聚类中心对应的特征向量；当使用K-means聚类方法对得到的各个人脸图像对应的所述特征向量进行聚类分析来确定出噪声图像时，包括以下步骤：

步骤3031：计算所述待处理的人脸记录的所述各个特征向量的聚类中心。

在一些实例中，在计算所述待处理的人脸记录的各个所述特征向量的聚类中心时，将类别个数预先设定为1，并根据聚类算法计算出所述各个特征向量的聚类中心。

步骤3032：确定各个所述特征向量与计算出的聚类中心的距离。

步骤3033：确定所述距离是否小于或等于聚类阈值，当所述距离小于或等于聚类阈值时，执行步骤3034；否则执行步骤3035。

在一些实例中，上述聚类阈值一般通过一组同一个人的人脸图像和一组不同人的人脸图像对统计得到，例如可以是为0.8～1.2之间的数。具体而言，假设第一组人脸图像为同一个人的人脸图像，第二组的人脸图像为不同人的人脸图像。计算第一组同一人的人脸图像的特征向量中两两特征向量的距离再计算第二组不同人的人脸图像的特征向量中两两特征向量的距离，然后根据统计分布寻找一个能将第一组和第二组的特征向量距离划分开来的比较恰当的值。例如，第一组同一个人的人脸图像的两两特征向量的距离分布一般为0.3-0.9，第而组不同人的人脸图像的两两特征向量的距离分布一般为0.8-1.1，因此，可以取聚类阈值为0.85。

步骤3034：确定所述特征向量对应的人脸图像不是所述噪声图像，也即所述特征向量对应的人脸图像属于上述待处理的人脸记录。

步骤3035：确定所述特征向量对应的人脸图像属于所述噪声图像。

在一些实例中，还可以使用层次聚类方法对得到的各个人脸图像对应的所述特征向量进行聚类分析来确定出噪声图像。层次聚类是一种不需要预先指定类别个数的聚类方法，通过上述聚类阈值对所有人脸图像完成自顶向下的划分或者自底向上的合并，从而完成聚类。具体的，将所述待处理的人脸记录中的各个所述特征向量都作为一个类簇；计算两两类簇之间的距离，当所述距离小于或等于所述聚类阈值时，将所述距离对应的两个类簇合并，直至任意两个类簇之间的距离都小于或等于所述聚类阈值，以得到所述待处理的人脸记录的K(K大于或等于1)个类簇；当所述K个类簇中存在包括特征向量数量小于或等于数量阈值的类簇时，将所述类簇中的特征向量对应的人脸图像作为噪声图像。

其中，当所述K个类簇中存在包括特征向量数量小于或等于数量阈值的类簇时，将所述类簇中的特征向量对应的人脸图像作为噪声图像，包括：将所述K个类簇中包括特征向量的数量最大的类簇中的特征向量对应的人脸图像作为所述待处理的人脸记录中的人脸图像，也即其余类簇中的特征向量对应的人脸图像为噪声图像。也即，通过上述聚类阈值进行层次聚类，可以得到K个类簇，然后我们将其中包括特征向量数量最多的类簇确定为上述待处理的人脸记录，该类簇中包括的特征向量对应的人脸图像为上述待处理的人脸记录中的人脸图像，其他的类簇中的特征向量中的人脸图像可认为不属于上述待处理的人脸记录，也即为上述待处理的人脸记录的噪声图像。

通过步骤301～步骤303的技术操作可以去除待处理的人脸记录中的噪声图像，消除了人脸数据库中不同人的人脸图像被划分到同一个人脸记录的情况，提高了人脸数据库的质量。

步骤304：计算所述去噪的人脸记录中的各个人脸图像对应的特征向量的均值，并将所述均值作为所述去噪的人脸记录的特征向量代表。

在一些实例中，在确定所述待处理的人脸记录的特征向量代表时，还可以从所述去噪的人脸记录中选择任一人脸图像，获取选择的人脸图像的RGB像素，基于神经网络的第二模型，将获取的RGB像素转化为该人脸图像对应的所述特征向量，并将转化后的所述特征向量作为所述特征向量代表。

这里，上述基于神经网络的第二模型可以与上述基于神经网络的第一模型相同，也可以不同。例如，上述基于神经网络的第二模型可以是基于VGGNet(Visual GeometryGroup Net)结构神经网络模型。

步骤305：计算任意两个去噪的人脸记录的所述特征向量代表的相似度。

在一些实例中，对于任意两个去噪的人脸记录A和B，人脸记录A的特征向量为F_A＝{f_A1，f_A2，…，f_AN}，人脸记录B的特征向量为F_B＝{f_B1，f_B2，…，f_BN}，N为特征向量F_A和特征向量F_B的长度，例如，当用于提取人脸记录中人脸图像对应的特征向量使用的模型为ResBet结构时，N为512，也即上述特征向量F_A和特征向量F_B的长度为512。则可以计算出上述特征向量F_A和特征向量F_B的相似度。

具体的，可以采用欧式距离公式来计算上述特征向量F_A和特征向量F_B的相似度：

步骤306：基于所述计算出的所述相似度，得到所述待处理的人脸记录所在人脸数据库的相似矩阵。

在一些实例中，对于包含N个去噪的人脸记录的人脸数据库，得到该人脸数据库中两两去噪的人脸记录的相似度后，可以得到N*N的相似度矩阵。

在一些实例中，如果所述计算出的相似度大于或等于相似阈值，则将该相似度在所述相似矩阵中的位置的值置为1，否则，将该相似度在所述相似矩阵中的位置的值置为0。也即1代表两个去噪的人脸记录足够相似，0代表这两个去噪的人脸记录不相似。这里，上述相似阈值为确定方法同上述聚类阈值的确定方法相似，一般为0.8～1.2之间的数。

步骤307：在所述相似矩阵中确定出至少一个连通域。

在一些实例中，在根据上述相似度的值将上述相似度矩阵中对应的位置的值置为0或1之后，将所述相似矩阵中值为1的位置为节点构建一个无向图；求解出该无向图中的至少一个连通域。上述连通域中的任意两个节点之间一定存在一个路径可以连接到对方。

这里，关于求解无向图的连通域可以使用预设算法，例如可以采用深度优先搜索或广度优先搜索的方式实现，也可以采用并查集的方式实现。采用深度优先搜索的方式，只需要从某一个未访问节点开始，选择一条边走到下一个节点，每到一个节点便标记此节点已到达。当来到一个标记过的节点时回退到上一个节点，再选择一条边来到达没有到达过的节点。当回退到的路口已没有可走的边时继续回退。并将被搜索的节点标为已访问，便可得到所有连通分量。其中，初始状态所有节点均被标记为未访问。

步骤308：将所述至少一个连通域中的人脸记录合并为一个人脸记录。

在一些实例中，将每个连通域中的各个人脸记录中的人脸图像合并到一个人脸记录中。

理想情况下，希望每条人脸记录仅对应同一个人的人脸图像，但实际上很有可能会出现同一个人的不同人脸图像被保存在多于一条的人脸记录之中，也有可能会出现不同人的人脸图像被保存在一条人脸记录之中。通过步骤304～步骤308的技术操作，可以对人脸数据库中去噪的人脸记录进行两两对比，生成相似度矩阵，再根据相似度矩阵对去噪的人脸记录进行去重以及合并，消除了人脸数据库中同一个人具有两条不同的人脸记录的情况，也即两条不同的人脸记录标识对应同一个人的人脸图像的情况，提高了数据准确性。

通过本申请实施例提供的人脸数据处理方法，一方面可以去除待处理的人脸记录中的噪声图像，消除了人脸数据库中不同的人的人脸图像被划分到同一个人脸记录的情况。另一方面对人脸数据库中去噪的人脸记录进行两两对比，生成相似度矩阵，再根据相似度矩阵对去噪的人脸记录进行去重以及合并，消除了人脸数据库中同一个人具有两条不同的人脸记录的情况，也即两条不同的人脸记录标识对应同一个人的人脸图像的情况，提高了人脸数据库的质量，同时使用处理后的人脸记录进行人脸识别模型的训练，可以提高人脸识别算法的准确度。

对应以上人脸数据处理方法，本申请还提供了实现上述方法的人脸数据处理装置400。图4示出了人脸数据处理装置400的结构图。如图4所示，该人脸数据处理装置400包括：提取模块401、去噪模块402、确定模块403、计算模块404以及合并模块405，其中，各模块具体如下：

提取模块401，对待处理的人脸记录中的各个人脸图像进行人脸特征提取，分别得到所述各个人脸图像对应的特征向量；

去噪模块402，确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，并从所述待处理的人脸记录中删除所述噪声图像，得到去噪的人脸记录；

确定模块403，根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出该人脸记录的特征向量代表；

计算模块404，计算任意两个去噪的人脸记录的所述特征向量代表的相似度；以及

合并模块405，当计算出的所述相似度大于或等于相似阈值时，将所述任意两个去噪的人脸记录合并为一个人脸记录。

在一些实例中，在提取模块401，对待处理的人脸记录中的各个人脸图像进行人脸特征提取之前，所述合并模块405获取所述待处理的人脸记录的人脸记录标识，将具有相同的所述人脸记录标识的人脸记录合并为一个待处理的人脸记录。

在一些实例中，所述人脸记录标识为姓名，所述提取模块401，进一步对所述人脸记录标识进行归一化处理后，所述合并模块405再执行所述将人脸记录标识相同的人脸记录合并为一个待处理的人脸记录的步骤。

在一些实例中，每一条上述待处理的人脸记录具有一个人脸记录标识，因此上述待处理的人脸记录所在的人脸数据库具有一个人脸记录标识列表。由于人脸数据库中的各个待处理的人脸记录的获取渠道不同，上述人脸记录标识列表中的人脸记录标识格式可能会不同，比如可以为“王晓红”、“Eason Li”以及“kevin_meng”等，因此当所述人脸记录标识为姓名时，需要对所述人脸记录标识对应的姓名进行归一化处理。

在一些实例中，所述归一化处理为：将所述姓名进行格式转化，并使所述姓名中的名称在前，姓氏在后；和/或将所述姓名中包含的符号转化为预设符号。

在一些实例中，所述提取模块401，获取所述各个人脸图像的RGB像素，在基于神经网络的第一模型下，将获取的RGB像素转化为该人脸图像对应的所述特征向量。

在一些实例中，所述预设特征向量为聚类中心对应的特征向量；所述去噪模块402计算所述待处理的人脸记录的各个所述特征向量的聚类中心；确定各个所述特征向量与计算出的聚类中心的距离，并将所述距离与聚类阈值比较；当特征向量对应的所述距离小于或等于所述聚类阈值时，则确定所述特征向量对应的人脸图像不是所述噪声图像，否则，确定所述特征向量对应的人脸图像属于所述噪声图像。

在一些实例中，所述去噪模块402，还可以将所述待处理的人脸记录中的各个所述特征向量都作为一个类簇；计算两两类簇之间的距离，当所述距离小于或等于所述聚类阈值时，将所述距离对应的两个类簇合并，直至任意两个类簇之间的距离都小于或等于所述聚类阈值，以得到所述待处理的人脸记录的K个类簇；当所述K个类簇中存在包括特征向量数量小于或等于数量阈值的类簇时，将所述类簇中的特征向量对应的人脸图像作为噪声图像。

在一些实例中，所述确定模块403，计算所述去噪的人脸记录中的各个人脸图像对应的特征向量的均值，并将所述均值作为所述特征向量代表。

在一些实例中，所述确定模块403，从所述去噪的人脸记录中选择任一人脸图像，获取选择的人脸图像的RGB像素，在基于神经网络的第二模型下，将获取的RGB像素转化为该人脸图像对应的所述特征向量，并将转化后的所述特征向量作为所述特征向量代表。

在一些实例中，所述计算模块404，进一步基于所述计算出的所述相似度，得到所述待处理的人脸记录所在人脸数据库的相似矩阵；并在所述相似矩阵中确定出至少一个连通域；所述合并模块405将所述至少一个连通域中的人脸记录合并为一个人脸记录。

在一些实例中，如果所述计算出的相似度大于或等于所述相似阈值，所述计算模块404，进一步将该相似度在所述相似矩阵中的位置的值置为1，否则，所述计算模块404将该相似度在所述相似矩阵中的位置的值置为0。

在一些实例中，所述计算模块404，确定所述相似矩阵中值为1的矩阵元素；确定所述相似矩阵中值为1的矩阵元素；以所述相似矩阵中值为1的矩阵元素为节点构建无向图；求解出所述无向图中所述至少一个连通域。

图5示出了实现人脸数据处理方法的人脸数据处理装置400所在的服务器500的组成结构图。如图5所示，该计算设备包括一个或者多个处理器(CPU)502、通信模块504、存储器506、用户接口510，以及用于互联这些组件的通信总线508。

处理器502可通过通信模块504接收和发送数据以实现网络通信和/或本地通信。

用户接口510包括一个或多个输出设备512，其包括一个或多个扬声器和/或一个或多个可视化显示器。用户接口510也包括一个或多个输入设备514，其包括诸如，键盘，鼠标，声音命令输入单元或扩音器，触屏显示器，触敏输入板，姿势捕获摄像机或其他输入按钮或控件等。

存储器506可以是高速随机存取存储器，诸如DRAM、SRAM、DDR RAM、或其他随机存取固态存储设备；或者非易失性存储器，诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备，或其他非易失性固态存储设备。

存储器506存储处理器502可执行的指令集，包括：

操作系统516，包括用于处理各种基本系统服务和用于执行硬件相关任务的程序；

应用518，包括用于实现人脸数据处理方法各种应用程序，该应用程序能够实现上述各实例中的处理流程，比如可以包括图5所示的人脸数据处理装置400中的部分或全部单元。各单元或模块401-405中的至少一个模块可以存储有机器可执行指令。处理器502通过执行存储器906中各模块401-405中至少一个模块中的机器可执行指令，进而能够实现上述各模块401-405中的至少一个模块的功能。

需要说明的是，上述各流程和各结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分，实际实现时，一个模块可以分由多个模块实现，多个模块的功能也可以由同一个模块实现，这些模块可以位于同一个设备中，也可以位于不同的设备中。

各实施例中的模块可以以硬件方式或硬件平台加软件的方式实现。上述软件包括机器可读指令，存储在非易失性存储介质中。因此，各实施例也可以体现为软件产品。

因此，本申请的一些实例还提供了一种计算机可读存储介质，其上存储有计算机指令，其中，所述计算机指令被处理器执行时实现上述图2-3中所述方法的步骤。

各例中，硬件可以由专门的硬件或执行机器可读指令的硬件实现。例如，硬件可以为专门设计的永久性电路或逻辑器件(如专用处理器，如FPGA或ASIC)用于完成特定的操作。硬件也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。

另外，本申请的每个实例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然，数据处理程序构成了本申请。此外，通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此，这样的存储介质也构成了本申请，本申请还提供了一种非易失性存储介质，其中存储有数据处理程序，这种数据处理程序可用于执行本申请上述方法实例中的任何一种实例。

图4中的模块对应的机器可读指令可以使计算机上操作的操作系统等来完成这里描述的部分或者全部操作。非易失性计算机可读存储介质可以是插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器。安装在扩展板或者扩展单元上的CPU等可以根据指令执行部分和全部实际操作。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种人脸数据处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其中，在对待处理的人脸记录中的各个人脸图像进行人脸特征提取之前，所述方法进一步包括：

获取所述待处理的人脸记录的人脸记录标识，将具有相同的所述人脸记录标识的待处理的人脸记录合并为一个待处理的人脸记录。

3.根据权利要求1所述的方法，其中，所述对待处理的人脸记录中的各个人脸图像进行人脸特征提取，分别得到所述各个人脸图像对应的特征向量，包括：

针对所述待处理的人脸记录中的每个人脸图像，获取所述人脸图像的RGB像素，在基于神经网络的第一模型下，将获取的RGB像素转化为所述人脸图像对应的所述特征向量。

4.根据权利要求1所述的方法，其中，所述预设特征向量为聚类中心对应的特征向量；所述确定各个特征向量与预设特征向量之间的距离，将所述距离与聚类阈值进行比较，根据比较结果确定出所述人脸记录中的噪声图像，包括：

确定所述待处理的人脸记录的各个所述特征向量的所述聚类中心；

针对每个特征向量，确定所述特征向量与所述聚类中心的距离，并将所述距离与聚类阈值比较；

当所述特征向量对应的所述距离小于或等于所述聚类阈值时，则确定所述特征向量对应的人脸图像不是所述噪声图像，否则，确定所述特征向量对应的人脸图像属于所述噪声图像。

5.根据权利要求1所述的方法，其中，所述根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出所述去噪的人脸记录的特征向量代表，包括：

计算所述去噪的人脸记录中的各个人脸图像对应的特征向量的均值，并将所述均值作为所述特征向量代表。

6.根据权利要求1所述的方法，其中，所述根据去噪的人脸记录中一个或多个人脸图像对应的特征向量，确定出所述去噪的人脸记录的特征向量代表，包括：

从所述去噪的人脸记录中选择任一人脸图像，获取选择的人脸图像的RGB像素，基于神经网络的第二模型，将获取的RGB像素转化为该人脸图像对应的所述特征向量，并将转化后的所述特征向量作为所述特征向量代表。

7.根据权利要求1所述的方法，所述当所述相似度大于或等于相似阈值时，将所述任意两个去噪的人脸记录合并为一个人脸记录，包括：

基于所述计算出的所述相似度，得到所述待处理的人脸记录所在人脸数据库的相似矩阵；

在所述相似矩阵中确定出至少一个连通域；

将所述至少一个连通域中的人脸记录合并为一个人脸记录。

8.根据权利要求7所述的方法，所述基于所述计算出的所述相似度，得到所述待处理的人脸记录所在人脸数据库的相似矩阵，包括：

如果所述计算出的相似度大于或等于所述相似阈值，则将该相似度在所述相似矩阵中的位置的值置为1，否则，将该相似度在所述相似矩阵中的位置的值置为0。

9.根据权利要求8所述的方法，其中，所述在所述相似矩阵中确定出至少一个连通域，包括：

确定所述相似矩阵中值为1的矩阵元素；

以所述相似矩阵中值为1的矩阵元素为节点构建无向图；

求解出所述无向图中所述至少一个连通域。

10.一种人脸数据处理装置，其特征在于，包括：