CN111860062B

CN111860062B - 人脸识别样本处理方法及装置

Info

Publication number: CN111860062B
Application number: CN201910357256.0A
Authority: CN
Inventors: 张少娜
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Group Hebei Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Group Hebei Co Ltd
Priority date: 2019-04-29
Filing date: 2019-04-29
Publication date: 2023-11-24
Anticipated expiration: 2039-04-29
Also published as: CN111860062A

Abstract

本发明公开了一种人脸识别样本处理方法及装置，该方法包括：输入待处理的人脸识别样本，判断所述待处理的人脸识别样本是否为第一个输入的人脸识别样本，若是，则确定所述待处理的人脸识别样本为第一类的聚类中心，若否，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。利用上述发明，通过聚类的方式将具有相似特征的人脸识别样本归为一类，这样能够得到与原样本集相似的由处于聚类中心的人脸识别样本构成的人脸识别样本集，以此降低样本的数量，大大降低了在进行样本存储时的计算资源与存储空间。

Description

人脸识别样本处理方法及装置

技术领域

本发明涉及计算机技术领域，具体涉及一种人脸识别样本处理方法及装置、电子设备、存储介质。

背景技术

随着人工智能技术的不断发展，人脸识别已逐步应用到人们的日常生活中，其应用场景日益丰富，如，在电信运营商方面，通过人脸识别技术在办理开户、销户和过户等业务的关键环节进行人脸识别，验证业务办理用户的身份，以此落实工信部针对在网用户实名制的要求。

目前，为了提高使用人脸识别技术识别人脸的精准度，在训练人脸识别模型时需要采集大量的样本，样本的数量也直接决定了人脸识别模型识别人脸的精准度。

但是在实际应用中，由于在采集的样本中存在大量的重复样本与噪声，使得在进行样本存储时会浪费巨大的计算资源与存储空间，因此，需要提供一种处理人脸识别样本的方法，以此降低样本的数量。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的人脸识别样本处理方法及装置、电子设备、存储介质。

根据本发明的一个方面，一种人脸识别样本处理方法，所述方法包括：

输入待处理的人脸识别样本；

判断所述待处理的人脸识别样本是否为第一个输入的人脸识别样本；

若是，则确定所述待处理的人脸识别样本为第一类的聚类中心；

若否，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。

根据本发明的另一方面，提供了一种人脸识别样本处理装置，所述装置包括：

输入模块，用于输入待处理的人脸识别样本；

判断模块，用于判断所述待处理的人脸识别样本是否为第一个输入的人脸识别样本；

确定模块，用于所述判断模块判断为是时，则确定所述待处理的人脸识别样本为第一类的聚类中心；所述判断模块判断为是时，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。

根据本发明的另一方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行以下操作：

输入待处理的人脸识别样本；

根据本发明的又一方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行以下操作：

输入待处理的人脸识别样本；

根据本发明提供的人脸识别样本处理方法及装置，该方法包括：输入待处理的人脸识别样本，判断所述待处理的人脸识别样本是否为第一个输入的人脸识别样本，若是，则确定所述待处理的人脸识别样本为第一类的聚类中心，若否，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。利用上述发明，通过聚类的方式将具有相似特征的人脸识别样本归为一类，并将该类别所包含的所有人脸识别样本由处于聚类中心的人脸识别样本来表征，这样能够得到与原样本集相似的由处于聚类中心的人脸识别样本构成的人脸识别样本集，以此降低样本的数量，大大降低了在进行样本存储时的计算资源与存储空间。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明一个实施例的人脸识别样本处理方法的流程图；

图2示出了根据本发明一个实施例的人脸识别样本处理装置的示意图；

图3示出了根据本发明实施例的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的人脸识别样本处理方法的流程图。如图1所示，该方法包括如下步骤：

S101：输入待处理的人脸识别样本。

在实际应用中，由于在采集的样本中存在大量的重复样本与噪声，使得在进行样本存储时会浪费巨大的计算资源与存储空间，因此，需要对人脸识别样本进行处理，以此降低样本的数量。

由于本发明是通过聚类算法将具有相似特征的人脸识别样本归为一类，并将该类别所包含的所有人脸识别样本由处于聚类中心的人脸识别样本来表征，以此降低样本的数量，因此，在本申请实施例中，降低样本的数量的处理方式可以是对所采集的的人脸识别样本进行有效的聚类，并将该类别所包含的所有人脸识别样本由处于聚类中心的人脸识别样本来表征，以此降低样本的数量。

在此需要说明的是，由于人脸面部结构由外轮廓、眉毛、眼睛、鼻子、嘴巴等结构构成，并且每个人的形状、大小及结构等存在差异，使得每个人的面孔各不相同，但同时这些结构特征的形状和位置相对稳定，随时间、表情等因素变化较小，因此，在本申请实施例中，可以利用人脸面部器官的结构特征对所采集的的人脸识别样本进行有效的聚类。

综上所述，本申请实施例在对所采集的的人脸识别样本进行有效聚类的过程中，需要获取已经采集的人脸识别样本集，其中，人脸识别样本由人脸面部器官的结构特征组成，如，一个人脸识别样本由倒八眉毛、单眼皮眼睛、高鼻梁鼻子和小嘴巴组成。

在此需要说明的是，由于聚类算法需要通过向量的方式来表征样本，因此，在本申请实施例中，人脸识别样本可以通过多维向量来表征，每个维度表示一种人脸面部器官，向量内的每个元素为该人脸识别样本的特征值，如，一个人脸识别样本的向量表示形式为(倒八眉毛，单眼皮眼睛，高鼻梁鼻子，小嘴巴)。

在此还需要说明的是，人脸识别样本的向量内维度的前后顺序是预先设定的，可根据实际情况来设定，另外，向量内每个维度在实际聚类运算中分别是对应一个运算字符的，如，假设眉毛有三个种类：倒八眉毛用1(运算字符)表示，一字眉毛用2(运算字符)表示，正八眉毛用3(运算字符)表示，眼睛有两个种类：单眼皮用8(运算字符)表示，双眼皮用9(运算字符)表示，假设所采集的人脸识别样本为倒八眉毛和单眼皮，则所采集的人脸识别样本用向量表示为(1，8)，其中，向量内的元素1和元素8均为所采集的人脸识别样本的特征值。

进一步的，本申请实施例在获取到人脸识别样本集后，需要输入待处理的人脸识别样本。

在此需要说明的是，待处理的人脸识别样本就是所获取的人脸识别样本集内的样本，另外，在输入待处理的人脸识别样本时是按照预设的顺序将人脸识别样本集内的人脸识别样本一个一个的输入。

S102：判断所述待处理的人脸识别样本是否为第一个输入的人脸识别样本。

由于聚类算法首先需要确定聚类中心，因此，在本申请实施例中，在输入待处理的人脸识别样本后，需要判断待处理的人脸识别样本是否为第一个输入的人脸识别样本若是，则执行步骤S103，若否，则执行步骤S104。

S103：确定所述待处理的人脸识别样本为第一类的聚类中心。

在此需要说明的是，当输入的待处理的人脸识别样本为第一个输入的人脸识别样本时，说明此时刚开始对所获取的的人脸识别样本集进行聚类，还没有聚类中心，因此，在本申请实施例中，当输入的待处理的人脸识别样本为第一个输入的人脸识别样本时，可确定所述待处理的人脸识别样本为第一类的聚类中心，并将该类别的频数加1，即，该类别当前所包含的人脸识别样本的数量为1。

S104：确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。

而当输入的待处理的人脸识别样本不是第一个输入的人脸识别样本时，说明此时已经存在聚类中心及其对应的类别了，因此，在本申请实施例中，当输入的待处理的人脸识别样本不是第一个输入的人脸识别样本时，需要确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。

在此需要说明的是，由于聚类中心是最能够反映出一个类别的特征的人脸识别样本，并且待处理的人脸识别样本与聚类中心的距离越近，说明人脸识别样本的特征与处于聚类中心的人脸识别样本的特征越相似，因此，在本申请实施例中，确定所述待处理的人脸识别样本与聚类中心之间的最小距离，也就是说，分别计算待处理的人脸识别样本与每个聚类中心之间的距离，再选取最小的距离，如，假设有三个聚类中心：聚类中心1、聚类中心2和聚类中心3，假设计算待处理的人脸识别样本与聚类中心1之间的距离为6，计算待处理的人脸识别样本与聚类中心1之间的距离为3，计算待处理的人脸识别样本与聚类中心1之间的距离为8，则确定待处理的人脸识别样本与聚类中心之间的最小距离为3。

另外，由于在实际应用中，虽然待处理的人脸识别样本与聚类中心的距离越近，说明人脸识别样本的特征与处于聚类中心的人脸识别样本的特征越相似，但是需要待处理的人脸识别样本与聚类中心的距离到底多近才可以归为聚类中心所对应的类别，因此，在本申请实施例中，需要设定一个临界距离，当所述待处理的人脸识别样本与聚类中心之间的最小距离低于预设的临界距离，则将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别，当所述待处理的人脸识别样本与聚类中心之间的最小距离超过预设的临界距离，则说明当前所输入的人脸识别样本不属于当前已有的任何类别，需要根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别。

在此需要说明的是，由于在将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别后，该类别的样本发布与之前的样本分布存在不同，该类别的聚类中心也会发生变化，因此，在本申请实施例中，在将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别后，需要重新确定该类别的聚类中心。

本申请实施例提供了一种更新该类别的聚类中心的方式，具体如下：

通过公式c_新＝(1-a)c_原+ax，重新确定该类别的聚类中心，将重新确定的聚类中心替换原来的聚类中心，其中，c_新为重新确定的聚类中心，c_原为原来的聚类中心，a为学习速率，x为所述待处理的人脸识别样本的特征值。

综上所述，在本申请实施例中，根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类具体可以如下：

确定待处理的人脸识别样本与聚类中心之间的最小距离，判断待处理的人脸识别样本与聚类中心之间的最小距离是否超过预设的第一阈值，若是，则确定聚类中心的数量，并根据聚类中心的数量以及预设的第二阈值，对所述待处理的人脸识别样本进行聚类，若否，则将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别，并更新该类别的聚类中心。

在此需要说明的是，第一阈值为临界距离，可根据实际情况来设定，第二阈值为类别数量最大值，场景越复杂，所需的类别越多，通常为10到20，并且，在本申请实施例中，根据聚类中心的数量以及预设的第二阈值，对所述待处理的人脸识别样本进行聚类具体可以如下：

判断聚类中心的数量是否超过预设的第二阈值，若是，则去除人脸识别样本数量最少的类别，并根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别，并将该类别的频数加1，若否，则根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别，并将该类别的频数加1。

在此需要说明的是，由于在实际应用中，出现频率高的类别应该对样本模型有较多的贡献，而出现频率低的类别对样本模型的贡献较少，因此，在本申请实施例中，需要去除人脸识别样本数量最少的类别，对样本模型的贡献较少的类别逐渐被抑制和取代。

另外，在本申请实施例中，可以将去除掉的类别所包含的人脸识别样本重新聚类，也就是说，重新通过步骤S101～步骤S104来重新聚类。

通过上述方法，通过聚类的方式将具有相似特征的人脸识别样本归为一类，并将该类别所包含的所有人脸识别样本由处于聚类中心的人脸识别样本来表征，这样能够得到与原样本集相似的由处于聚类中心的人脸识别样本构成的人脸识别样本集，以此降低样本的数量，大大降低了在进行样本存储时的计算资源与存储空间。

另外，本发明针对人体脸部特征的共同特性，对所采集的人脸识别样本集的关键特征进行聚类分析，使用聚类特征值来代替海量的样本值，这样大大降低了存储空间和计算资源，同时提升了计算效率，改善了系统性能，提升业务办理效率和成功率，更好地适应市场需求。

在实际应用中，有可能出现需要识别当前所采集的图片内是否存在人脸的情况，因此，在本申请实施例中，可以获取待识别的样本，针对每个聚类中心，确定所述待识别的样本属于该聚类中心对应的类别的分概率，根据每个所述待识别的样本属于该聚类中心对应的类别的分概率和预设的每个类别的权重，确定所述待识别的样本的总概率，根据所述待识别的样本的总概率和预设的第三阈值，识别所述待识别的样本是否为人脸。

在此需要说明的是，确定所述待识别的样本属于该聚类中心对应的类别的分概率具体可以通过公式确定所述待识别的样本为该聚类中心对应的类别的分概率，其中，Pr(x_t)为待识别的样本为该聚类中心对应的类别的分概率，x_t为待识别的样本的特征值，w_i为第i类别的权重，M为当前已有类别的数量，c_i为第i类别的聚类中心的特征值。

另外，根据每个所述待识别的样本属于该聚类中心对应的类别的分概率和预设的每个类别的权重，确定所述待识别的样本的总概率具体可以是，通过公式确定待识别的样本的总概率，其中x为待识别的样本的特征值，M为聚类后的类别的数量，w_i为第i类别的权重，Pr_i(x)为待识别的样本为该聚类中心对应的类别的分概率，Pr(x)为所述待识别的样本的总概率。

在此需要说明的是，通过以上的聚类过程，原本的N个样本x₁,x₂,...,x_N可以由M个小样本c₁,c₂,...,c_M来表示，c_i表示第i类的聚类中心，从而得到能够表示全样本关键特征的小样本集，其中，小样本集内包括了所有处于聚类中心的人脸识别样本，小样本集中的每个人脸识别样本对概率函数的贡献不同，其贡献度由每类出现的频数n_i，i＝1,2…M表示，每个类别的权重可以通过公式来确定第i类别的权重，其中，N为样本的总数量。

另外，根据所述待识别的样本的总概率和预设的第三阈值，识别所述待识别的样本是否为人脸具体可以是，当待识别的样本的总概率超过预设的第三阈值，则确定待识别的样本内包含人脸，后续，可以将该待识别的样本通过步骤S101～步骤S104来完善已有的类别，当待识别的样本的总概率未超过预设的第三阈值，则确定待识别的样本内部包含人脸。

以上是本申请实施例提供的人脸识别样本处理的方法，基于此，本申请实施例提供了一种人脸识别样本处理的装置，如图2所示，该装置包括：

输入模块201，用于输入待处理的人脸识别样本；

判断模块202，用于判断所述待处理的人脸识别样本是否为第一个输入的人脸识别样本；

确定模块203，用于所述判断模块202判断为是时，则确定所述待处理的人脸识别样本为第一类的聚类中心；所述判断模块202判断为是时，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类。

所述确定模块203具体用于，确定所述待处理的人脸识别样本与聚类中心之间的最小距离，判断所述待处理的人脸识别样本与聚类中心之间的最小距离是否超过预设的第一阈值，若是，则确定聚类中心的数量，并根据聚类中心的数量以及预设的第二阈值，对所述待处理的人脸识别样本进行聚类，若否，则将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别，并更新该类别的聚类中心。

所述确定模块203还用于，通过公式c_新＝(1-a)c_原+ax，重新确定该类别的聚类中心，将重新确定的聚类中心替换原来的聚类中心，其中，c_新为重新确定的聚类中心，c_原为原来的聚类中心，a为学习速率，x为所述待处理的人脸识别样本的特征值。

所述确定模块203具体用于，判断聚类中心的数量是否超过预设的第二阈值，若是，则去除人脸识别样本数量最少的类别，并根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别，若否，则根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别。

所述装置还包括：

去除模块204，用于将去除的类别所包含的人脸识别样本重新聚类。

所述装置还包括：

人脸识别模块205，用于获取待识别的样本，,针对每个聚类中心，确定所述待识别的样本属于该聚类中心对应的类别的分概率，根据每个所述待识别的样本属于该聚类中心对应的类别的分概率和预设的每个类别的权重，确定所述待识别的样本的总概率，根据所述待识别的样本的总概率和预设的第三阈值，识别所述待识别的样本是否为人脸。

所述人脸识别模块205具体用于，通过公式

确定所述待识别的样本为该聚类中心对应的类别的分概率，其中，Pr(x_t)为待识别的样本为该聚类中心对应的类别的分概率，x_t为待识别的样本的特征值，w_i为第i类别的权重，M为当前已有类别的数量，c_i为第i类别的聚类中心的特征值。

本申请实施例还提供了一种非易失性计算机存储介质，所述计算机存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的人脸识别样本处理方法。

图3示出了根据本发明实施例的一种电子设备的结构示意图，本发明具体实施例并不对电子设备的具体实现做限定。

如图3所示，该服务器可以包括：处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。

其中：

处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。

通信接口304，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器302，用于执行程序310，具体可以执行上述人脸识别样本处理方法实施例中的相关步骤。

具体地，程序310可以包括程序代码，该程序代码包括计算机操作指令。

处理器302可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器306，用于存放程序310。存储器306可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序310具体可以用于使得处理器302执行以下操作：

输入待处理的人脸识别样本；

可选地，程序310还可以用于使得处理器302执行以下操作：

确定所述待处理的人脸识别样本与聚类中心之间的最小距离；判断所述待处理的人脸识别样本与聚类中心之间的最小距离是否超过预设的第一阈值；若是，则确定聚类中心的数量，并根据聚类中心的数量以及预设的第二阈值，对所述待处理的人脸识别样本进行聚类；若否，则将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别，并更新该类别的聚类中心。

可选地，程序310还可以用于使得处理器302执行以下操作：

判断聚类中心的数量是否超过预设的第二阈值；若是，则去除人脸识别样本数量最少的类别，并根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别；若否，则根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别。

可选地，程序310还可以用于使得处理器302执行以下操作：

将去除的类别所包含的人脸识别样本重新聚类。

可选地，程序310还可以用于使得处理器302执行以下操作：

获取待识别的样本；针对每个聚类中心，确定所述待识别的样本属于该聚类中心对应的类别的分概率；根据每个所述待识别的样本属于该聚类中心对应的类别的分概率和预设的每个类别的权重，确定所述待识别的样本的总概率；根据所述待识别的样本的总概率和预设的第三阈值，识别所述待识别的样本是否为人脸。

可选地，程序310还可以用于使得处理器302执行以下操作：

通过公式确定所述待识别的样本为该聚类中心对应的类别的分概率，其中，Pr(x_t)为待识别的样本为该聚类中心对应的类别的分概率，x_t为待识别的样本的特征值，w_i为第i类别的权重，M为当前已有类别的数量，c_i为第i类别的聚类中心的特征值。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的人脸识别样本处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种人脸识别样本处理方法，包括：

输入待处理的人脸识别样本；

若否，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类；

2.根据权利要求1所述的方法，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类，具体包括：

确定所述待处理的人脸识别样本与聚类中心之间的最小距离；

判断所述待处理的人脸识别样本与聚类中心之间的最小距离是否超过预设的第一阈值；

若是，则确定聚类中心的数量，并根据聚类中心的数量以及预设的第二阈值，对所述待处理的人脸识别样本进行聚类；

若否，则将所述待处理的人脸识别样本归为与所述待处理的人脸识别样本之间距离最小的聚类中心对应的类别，并更新该类别的聚类中心。

3.根据权利要求2所述的方法，更新该类别的聚类中心，具体包括：

通过公式c_新＝(1-a)c_原+ax，重新确定该类别的聚类中心；

将重新确定的聚类中心替换原来的聚类中心，其中，c_新为重新确定的聚类中心，c_原为原来的聚类中心，a为学习速率，x为所述待处理的人脸识别样本的特征值。

4.根据权利要求2所述的方法，根据聚类中心的数量以及预设的第二阈值，对所述待处理的人脸识别样本进行聚类，具体包括：

判断聚类中心的数量是否超过预设的第二阈值；

若是，则去除人脸识别样本数量最少的类别，并根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别；

若否，则根据所述待处理的人脸识别样本，新建立以所述待处理的人脸识别样本为聚类中心的类别。

5.根据权利要求4所述的方法，所述方法还包括：

将去除的类别所包含的人脸识别样本重新聚类。

6.根据权利要求1-5中任一项所述的方法，确定所述待识别的样本为该聚类中心对应的类别的分概率，具体包括：

7.一种人脸识别样本处理装置，包括：

输入模块，用于输入待处理的人脸识别样本；

确定模块，用于所述判断模块判断为是时，则确定所述待处理的人脸识别样本为第一类的聚类中心；所述判断模块判断为是时，则确定所述待处理的人脸识别样本与各聚类中心之间的距离，并根据所述待处理的人脸识别样本与各聚类中心之间的距离与预设的第一阈值，对所述待处理的人脸识别样本进行聚类；

人脸识别模块，用于获取待识别的样本；针对每个聚类中心，确定所述待识别的样本属于该聚类中心对应的类别的分概率；根据每个所述待识别的样本属于该聚类中心对应的类别的分概率和预设的每个类别的权重，确定所述待识别的样本的总概率；根据所述待识别的样本的总概率和预设的第三阈值，识别所述待识别的样本是否为人脸。

8.一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-6中任一项所述的人脸识别样本处理方法对应的操作。

9.一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-6中任一项所述的人脸识别样本处理方法对应的操作。