CN109947965B

CN109947965B - 对象识别、数据集合的更新、数据处理方法与装置

Info

Publication number: CN109947965B
Application number: CN201710787773.2A
Authority: CN
Inventors: 于鲲
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2017-09-04
Filing date: 2017-09-04
Publication date: 2023-09-05
Anticipated expiration: 2037-09-04
Also published as: CN109947965A

Abstract

本申请公开了一种对象识别方法和装置。所述方法包括：确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据，根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的对象图片，采用删除对象图片后的对象图片集合进行对象识别。本申请可以使得剩余的对象图片之间的差异最大，对象图片之间的互补性最优，采用删除对象图片后的对象图片集合进行对象识别，继而使得设定图片数量的对象图片集合中对象图片多样化最好，提高了对象识别时的识别率。

Description

对象识别、数据集合的更新、数据处理方法与装置

技术领域

本申请涉及对象识别技术领域，具体涉及对象识别方法及其装置、数据集合的更新方法及其装置、数据处理方法及其装置、一种计算机设备和一种计算机可读存储介质。

背景技术

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术，可以应用在用户登录、门禁等验证身份的场景。通常的人脸识别系统由两个阶段组成，在人脸注册阶段，负责采集人脸图片，录入人脸名字等相关信息，提取人脸特征保存到数据库；在人脸验证阶段，采集人脸图片，提取人脸特征，与数据库中用户人脸比对，如果比对结果大于预设分值确认身份，完成相关授权，如果比对结果小于预设分值，则拒绝相关授权。

经申请人研究发现，由于人脸注册阶段用户手动录入图片有限，并且人脸识别时受光照、表情、姿态、衰老等因素影响，需要在人脸验证阶段添加更多的人脸图片来提高识别率，但是受各种条件限制，可以用于人脸识别的人脸图片集合中的图片数量是有限的，因此需要控制人脸图片数量。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种对象识别方法和装置、以及一种数据集合的更新方法和装置、以及一种数据处理方法和装置、以及一种计算机设备和一种计算机可读存储介质。

依据本申请的一个方面，提供了一种对象识别方法，包括：

确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据；

根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的对象图片；

采用删除对象图片后的对象图片集合进行对象识别。

可选地，所述删除从高到低排序最前的至少一个差异数据对应的对象图片包括：

按照所述对象图片集合中对象图片的数量要求，删除从高到低排序最前的至少一个差异数据对应的对象图片。

可选地，所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据包括：

针对从所述对象图片集合中抽取出对象图片后剩余的对象图片，确定两两对象图片之间的差异数据；

根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据。

可选地，所述根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据包括：

以所述两两对象图片之间的差异数据的均值或和值作为所述剩余的对象图片之间的差异数据。

可选地，在所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据之前，所述方法还包括：

将所述对象图片集合中的对象图片划分至多个类别；

确定所述多个类别中包含最多对象图片的最大类别；

所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据包括：

确定从所述最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据。

可选地，所述方法还包括：

判定所述最大类别对应的对象图片超出第一设定个数。

接收新增的至少一张对象图片，并添加至所述对象图片集合。

可选地，在所述接收新增的至少一张对象图片，并添加至所述对象图片集合之后，所述方法还包括：

判定添加对象图片后，所述对象图片集合中对象图片多于第二设定个数。

可选地，所述方法还包括：

若确定所述最大类别对应的对象图片未超出第一设定个数，则采用新增至所述对象图片集合的对象图片，替换最早添加至所述对象图片集合的至少一个对象图片。

可选地，所述最早添加至所述对象图片集合的至少一个对象图片，以及所述从对象图片集合中抽取出对象图片，不包括用户提交的专用于对象识别的对象图片。

可选地，在所述添加至所述对象图片集合之前，所述方法还包括：

判定新增的至少一个对象图片与所述对象图片集合中已有的对象图片的相似数据符合设定的相似区间，所述相似区间具有相似上限以及第一相似下限。

判定新增至所述对象图片集合的对象图片与所述对象图片集合中已有的对象图片的相似数据超出设定的第二相似下限。

依据本申请的另一个方面，提供了一种数据集合的更新方法，包括：

接收新增的至少一张对象图片，并添加至对象图片集合；

针对所述对象图片集合中的对象图片，确定从中抽取出所述对象图片后，剩余对象图片的差异数据；

选取差异数据从高到低排序最前的至少一张对象图片进行删除。

依据本申请的另一个方面，提供了一种数据处理方法，包括：

获取图像集合，所述图像包括生物特征；

获取所述图像集合中至少一个子图像集合的差异值，其中，所述子图像集合包括所述图像集合中的部分数据，剩余数据称为目标图像；

确定所述差异值达到预设阈值；

删除所述目标图像。

依据本申请的另一个方面，提供了一种对象识别装置，其中，所述装置包括差异数据确定模块，用于确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据；

图片删除模块，用于根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的对象图片；

对象识别模块，用于采用删除对象图片后的对象图片集合进行对象识别。

可选地，所述图片删除模块包括：

图片删除子模块，用于按照所述对象图片集合中对象图片的数量要求，删除从高到低排序最前的至少一个差异数据对应的对象图片。

可选地，所述差异数据确定模块包括：

第一数据确定子模块，用于针对从所述对象图片集合中抽取出对象图片后剩余的对象图片，确定两两对象图片之间的差异数据；

第二数据确定子模块，用于根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据。

可选地，所述第二数据确定子模块，具体用于以所述两两对象图片之间的差异数据的均值或和值作为所述剩余的对象图片之间的差异数据。

可选地，所述装置还包括：

类别划分模块，用于在所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据之前，将所述对象图片集合中的对象图片划分至多个类别；

最大类别确定模块，用于确定所述多个类别中包含最多对象图片的最大类别；

所述差异数据确定模块，具体用于确定从所述最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据。

可选地，所述装置还包括：

第一个数判定模块，用于判定所述最大类别对应的对象图片超出第一设定个数。

可选地，所述装置还包括：

图片添加模块，用于在所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据之前，接收新增的至少一张对象图片，并添加至所述对象图片集合。

可选地，所述装置还包括：

第二个数判定模块，用于在所述接收新增的至少一张对象图片，并添加至所述对象图片集合之后，判定添加对象图片后，所述对象图片集合中对象图片多于第二设定个数。

可选地，所述装置还包括：

图片替换模块，用于若确定所述最大类别对应的对象图片未超出第一设定个数，则采用新增至所述对象图片集合的对象图片，替换最早添加至所述对象图片集合的至少一个对象图片。

可选地，所述装置还包括：

区间判定模块，用于在所述添加至所述对象图片集合之前，判定新增的至少一个对象图片与所述对象图片集合中已有的对象图片的相似数据符合设定的相似区间，所述相似区间具有相似上限以及第一相似下限。

可选地，所述装置还包括：

下限判定模块，用于在所述添加至所述对象图片集合之前，判定新增至所述对象图片集合的对象图片与所述对象图片集合中已有的对象图片的相似数据超出设定的第二相似下限。

依据本申请的另一个方面，提供了一种数据集合的更新装置，包括：

图片添加模块，用于接收新增的至少一张对象图片，并添加至对象图片集合；

差异数据确定模块，用于针对所述对象图片集合中的对象图片，确定从中抽取出所述对象图片后，剩余对象图片的差异数据；

图片删除模块，用于选取差异数据从高到低排序最前的至少一张对象图片进行删除。

依据本申请的另一个方面，提供了一种数据处理装置，包括：

集合获取模块，用于获取图像集合，所述图像包括生物特征；

差异值获取模块，用于获取所述图像集合中至少一个子图像集合的差异值，其中，所述子图像集合包括所述图像集合中的部分数据，剩余数据称为目标图像；

子集合确定模块，用于确定所述差异值达到预设阈值；

图像删除模块，用于删除所述目标图像。

依据本申请的另一个方面，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如上述一个或多个的方法。

依据本申请的另一个方面，提供了一个计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如上述一个或多个的方法。

依据本申请实施例，通过确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据，在设定图片数量的情况下，从对象图片集合中，删除从高到低排序最前的至少一个差异数据对应的对象图片，使得剩余的对象图片之间的差异最大，对象图片之间的互补性最优，采用删除对象图片后的对象图片集合进行对象识别，继而使得设定图片数量的对象图片集合中对象图片多样化最好，提高了对象识别时的识别率。

进一步，通过在添加至所述对象图片集合之前，判定新增的至少一个对象图片与所述对象图片集合中已有的对象图片的相似数据符合设定的相似区间，从而使得添加到对象图片集合中的对象图片的相似程度不会过高也不会过低，对象图片更加可靠、而且互补性更强。

进一步，通过将所述对象图片集合中的对象图片划分至多个类别，确定所述多个类别中包含最多对象图片的最大类别，若确定所述最大类别对应的对象图片未超出第一设定个数，则采用新增至所述对象图片集合的对象图片，替换最早添加至所述对象图片集合的至少一个对象图片，使得对象图片集合中的对象图片时间更新，提高今后对象识别时的识别率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了人脸识别过程的示意图；

图2示出了根据本申请实施例一的一种对象识别方法实施例的流程图；

图3示出了根据本申请实施例二的一种对象识别方法实施例的流程图；

图4示出了根据本申请实施例三的数据集合的更新方法实施例的流程图；

图5示出了根据本申请实施例四的一种数据处理方法实施例的流程图；

图6示出了数据库中删除人脸的过程的示意图；

图7示出了更新人脸图片数据库的过程的示意图；

图8示出了人脸识别过程的示意图；

图9示出了根据本申请实施例五的一种对象识别装置实施例的结构框图；

图10示出了根据本申请实施例六的一种数据集合的更新装置实施例的结构框图；

图11示出了根据本申请实施例七的一种数据处理装置实施例的结构框图；

图12示出了可被用于实现本公开中所述的各个实施例的示例性系统。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为使本领域技术人员更好地理解本申请，以下对本申请涉及的概念进行说明：

对象包括人脸、身体、掌纹、虹膜等中的任一种，相应的，对象图片包括人脸图片、身体图片、掌纹图片、虹膜图片等中任一种，或者其他任意适用的，本申请实施例对此不做限制。

对象识别用于基于对象的特征信息进行身份识别，常见的对象识别包括识别图片中的人脸，在人脸识别中，通常需要至少一个脸部图像的图片来跟待识别的人脸进行比对。

对象图片集合包括多个对象图片，用于进行对象识别，例如，用于人脸识别的人脸图片集合。对象图片集合中的对象图片可以包括提交的专用于对象识别的对象图片，也可以包括在对象识别阶段新采集的对象图片，具体可以包括任意适用的对象图片，本申请实施例对此不做限制。

差异数据用于表征对象图片之间的差异的高低，具体可以通过比较对象图片的图像特征来得到差异数据，或者其他任意适用的方式，本申请实施例对此不做限制。差异数据可以是两个对象图片之间的差异数据，也可以是多个对象图片之间的差异数据，其中，多个对象图片之间的差异数据可以包括对象图片两两之间的差异数据的和值或者均值。

本申请实施例可以应用在对象识别的过程中，对象识别的识别率会受姿态、光照、表情、衰老等各种因素的影响，因此用于对象识别的对象图片集合中的对象图片如果一直没有变化，势必会因对象本身的变化、或者环境的变化、或者时间的推移，造成对象识别的识别率降低的问题。克服这一问题，需要增加更多不同的对象图片来提高对象识别的识别率。但是受各种条件限制，可以用于对象识别的对象图片集合中的图片数量是有限的，因此需要在新增对象图片时删除原有的对象图片，或者基于业务需求对对象图片集合中的图片进行删除，以控制对象图片集合中的图片数量。本申请实施例对此过程进行改进，从对象图片集合中删除可以使剩余的对象图片之间差异更高的部分对象图片，使得剩余的对象图片之间互补性更强，以实现在对象图片集合中图片数量相同的情况下，提高对象识别时的识别率。

如图1所示的人脸识别过程的示意图中，从人脸图片集合中抽取出人脸图片后，确定剩余的对象图片之间的差异数据，对差异数据从高到低进行排序，确定出排序最前的至少一个差异数据对应的人脸图片，从人脸图片集合中删除确定的人脸图片，采用删除人脸图片后的人脸图片集合进行人脸识别。

另外需说明的是，本申请实施例中各个步骤可以在客户端和/或服务器上执行，各个步骤可以都由客户端执行、也可以都由服务器执行、或者可以部分在客户端上执行，部分在服务器上执行。

参照图2，示出了根据本申请实施例一的一种对象识别方法实施例的流程图，该方法具体可以包括以下步骤：

步骤101，确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据。

在本申请实施例中，对象图片集合中有多个对象图片，从中抽取出一个或多个对象图片之后，通过比较剩余的对象图片，得到剩余的对象图片之间的差异数据。抽取对象图片的数量可以根据需要删除的图片数量确定，本申请实施例对此不做限制。抽取一个对象图片时，可以分别抽取对象图片集合中的每一个对象图片，也可以仅分别抽取对象图片集合中的部分对象图片。抽取多个对象图片时，可以分别抽取对象图片集合中每一种组合方式的多个对象图片，也可以分别按顺序分别抽取对象图片集合中的多个对象图片，或者其他任意适用的抽取方式，本申请实施例对此不做限制。

例如，人脸识别，从人脸图片集合中分别抽取出各个人脸图片，针对剩余的人脸图片，先计算人脸图片两两之间的差异数据，以两两之间的差异数据的和值作为剩余的人脸图片的差异数据，得到抽取各个人脸图片后对应的多个差异数据。

步骤102，根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的对象图片。

在本申请实施例中，差异数据可以表征对象图片之间的差异的高低，根据差异数据，从对象图片集合中删除对象图片时，可以选择能使得删除后剩余的对象图片之间的差异数据较大的对象图片。其中包括，从高到低排序最前的一个或多个差异数据，对应的一个或多个对象图片。或者，当对象图片集合中包括新添加的一个或多个对象图片时，选择不低于删除新添加的对象图片后剩余的对象图片之间的差异数据的差异数据，删除对应的一个或多个对象图片。

步骤103，采用删除对象图片后的对象图片集合进行对象识别。

在本申请实施例中，删除一个或多个对象图片后，对象图片集合中对象图片的数量被控制到需要的范围内，而且剩余的对象图片之间差异较高，互补性更强。实现对象识别的一种方式包括，提取待验证的对象图片的特征数据，与对象图片集合中存储的对象图片的特征模板进行搜索匹配，通过设定一个阈值，当相似度超过这一阈值，则把匹配得到的结果输出。例如，人脸识别就是将待识别的人脸特征与人脸图片集合中的人脸的人脸特征模板进行比较，根据相似程度对人脸的身份进行判断，这一过程可以分为两种实现方式，一种是确认方式，具体是一对一进行图片比较的过程，一种是辨认方式，具体是一对多进行图片匹配对比的过程。

在本申请的一种优选实施例中，受到各种条件限制，对象图片集合中的对象图片是有数量要求的，例如，由于存储图片占用空间受限，对象识别时运算效率的需求等原因。故删除从高到低排序最前的至少一个差异数据对应的对象图片的一种实现方式包括：按照所述对象图片集合中对象图片的数量要求，删除从高到低排序最前的至少一个差异数据对应的对象图片。一个差异数据可以对应一个或多个对象图片，根据删除前对象图片集合中对象图片的数量超过数量要求的个数，先确定从高到低排序最前的差异数据的数量，使得对应的对象图片的数量大于等于超过数量要求的个数，继而使得删除对象图片后，对象图片集合中的对象图片的数量可以在对象图片的数量要求的范围内。

在本申请的一种优选实施例中，多个对象图片之间的差异数据可以由两两对象图片之间的多个差异数据所确定，一种实现方式包括：针对从对象图片集合中抽取出对象图片后剩余的对象图片，确定两两对象图片之间的差异数据，根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据。两两对象图片之间的差异数据可以通过比较对象图片的图像特征得到，得到剩余对象图片中各种组合方式的两两对象图片之间的差异数据后，综合所有两两之间的差异数据，得到剩余的对象图片之间的差异数据。

在本申请的一种优选实施例中，由于两两对象图片之间的差异数据的均值或者和值可以反映出剩余的对象图片整体差异的高低，故根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据的一种实现方式包括：以所述两两对象图片之间的差异数据的均值或和值作为所述剩余的对象图片之间的差异数据。具体可以对两两对象图片之间的多个差异数据进行求和得到和值，还可以用得到的和值除以两两之间的差异数据的个数得到均值。

参照图3，示出了根据本申请实施例二的一种对象识别方法实施例的流程图，该方法具体可以包括以下步骤：

步骤201，接收新增的至少一张对象图片，并添加至所述对象图片集合。

在本申请实施例中，对象图片集合可以添加对象图片，新增的至少一张对象图片包括人工主动输入的对象图片、或者根据一定规则选取的对象图片，或者其他任意适用的对象图片，本申请实施例对此不做限制。接收新增的对象图片后，可以将其中全部的对象图片添加至对象图片集合，也可以将其中部分的对象图片添加至对象图片集合。

在本申请的一种优选实施例中，在添加至所述对象图片集合之前，还可以包括：判定新增至所述对象图片集合的对象图片与所述对象图片集合中已有的对象图片的相似数据超出设定的第二相似下限。相似数据表征对象图片之间相似程度的高低，包括基于比较对象图片的图像特征得到的图片相似度，或者其他任意适用的方式得到的相似数据，本申请实施例对此不做限制。相似数据可以是两两对象图片之间的，也可以是一个对象图片和对象图片集合中所有对象图片之间的。

针对每个新增至对象图片集合的对象图片，分别计算对象图片与对象图片集合中已有的各个对象图片之间的相似数据，再求得各个相似数据的均值或者和值作为新增对象图片与对象图片集合中已有的对象图片的相似数据。第二相似下限用于判断新增的对象图片对应的对象是否可以通过识别，如果相似数据超出设定的第二相似下限，则新增的对象图片与对象图片集合来自相同的对象，可以被添加到对象图片集合中。具体可以根据实际需要，设定任意适用的第二相似下限，本申请实施例对此不做限制。

例如，在人脸识别的人脸验证阶段，针对待识别的人脸，提取人脸的图像特征，判断与人脸图片集合中的人脸的相似分值是否大于设定的第二相似下限，如果大于第二相似下限，则待识别的人脸通过验证，确认人脸的身份存在于数据库中，可以将人脸图片添加到人脸图片集合中。

在本申请的一种优选实施例中，在添加至所述对象图片集合之前，还可以包括：判定新增的至少一个对象图片与所述对象图片集合中已有的对象图片的相似数据符合设定的相似区间。相似区间具有相似上限以及第一相似下限。其中，如果相似数据高于相似上限，表明新增的对象图片与已有的对象图片相似程度过高，互补性较小，起不到提高识别率的效果，无需添加到对象图片集合中；但是如果相似数据低于第一相似下限，表明新增的对象图片与已有的对象图片相似程度过低，很可能新增的对象图片和对象图片集合来自不同的对象，或者新增的对象图片中存在某些干扰因素，继而会降低对象识别的识别率，不可以添加到对象图片集合中。具体可以根据实际需要，对相似区间进行调整，本申请实施例对此不做限制。

例如，在人脸识别的人脸验证阶段，待识别的人脸通过了验证，确认人脸的身份存在于数据库中，还需要判定通过验证的人脸图片与人脸图片集合中已有的人脸图片的相似度在设定的相似区间内，才可以将该人脸图片添加到人脸图片集合中，从而使得添加到人脸图片集合中的人脸图片更加可靠、而且互补性更强。

步骤202，判定添加对象图片后，所述对象图片集合中对象图片多于第二设定个数。

在本申请实施例中，第二设定个数包括对象图片集合中图片数量的上限，或者其他任意适用的个数，本申请实施例对此不做限制。对象图片集合新添加了对象图片后，判断对象图片集合中的对象图片的数量是否多余第二设定个数，如果多于第二设定个数，表明需要从对象图片集合中删除对象图片，否则无需删除对象图片，直接采用添加了对象图片的对象图片集合进行对象识别即可。

步骤203，将所述对象图片集合中的对象图片划分至多个类别。

在本申请实施例中，对多个对象图片划分类别时，可以将相似程度接近的对象图片划分至一个类别，或者可以将添加到对象图片集合的时间接近的对象图片划分至一个类别，或者其他划分类别的方式，本申请实施例对此不做限制。

例如，利用HAC(Hierarchical Agglomerative Clustering，层次凝聚聚类算法)、BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies，利用层次方法的平衡迭代规约和聚类)等基于距离的聚类算法，对对象图片集合中的对象图片进行聚类，将相对来说相似的对象图片划分至同一个类别中，将相对来说不相似的对象图片划分至不同的类别中。

步骤204，确定所述多个类别中包含最多对象图片的最大类别。

在本申请实施例中，根据各个类别中对象图片的个数，确定包含最多对象图片的最大类别。

步骤205，若确定所述最大类别对应的对象图片未超出第一设定个数，则采用新增至所述对象图片集合的对象图片，替换最早添加至所述对象图片集合的至少一个对象图片。

在本申请实施例中，第一设定个数用于判断对象图片集合中划分至同一个类别的对象图片是否过多，如果最大类别对应的对象图片未超出第一设定个数，表明对象图片集合中对象图片较广的分布在各个类别中，对象图片集合中对象图片相互之间的互补性较高。此时，可以用新增至对象图片集合的至少一个对象图片替换最早添加至对象图片集合的至少一个对象图片，也就是删除最早添加至对象图片集合的至少一个对象图片，使得对象图片集合中的对象图片时间更新，提高今后对象识别时的识别率。

步骤206，判定所述最大类别对应的对象图片超出第一设定个数。

在本申请实施例中，如果最大类别对应的对象图片超出第一设定个数，表明对象图片集合中对象图片较集中的分布在一个类别中，对象图片集合中对象图片相互之间的互补性较低，需要删除可以使对象图片集合中对象图片之间的互补性提高的对象图片。步骤205和步骤204择一执行，如果执行步骤205判定最大类别对应的对象图片超出第一设定个数，则继续执行步骤207。如果执行步骤204判定最大类别对应的对象图片未超出第一设定个数，则可以继续执行步骤207，也可以退出执行。

步骤207，确定从所述最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据。

在本申请实施例中，针对最大类别对应的多个对象图片，从中抽取出一个或多个对象图片之后，通过比较剩余的对象图片，得到剩余的对象图片之间的差异数据。抽取对象图片的数量可以根据需要删除的图片数量确定，本申请实施例对此不做限制。抽取一个对象图片时，可以分别抽取最大类别中的每一个对象图片，也可以仅分别抽取最大类别中的部分对象图片。抽取多个对象图片时，可以分别抽取最大类别中每一种组合方式的多个对象图片，也可以分别按顺序分别抽取最大类别中的多个对象图片，或者其他任意适用的抽取方式，本申请实施例对此不做限制。

在本申请的一种优选实施例中，由于用户提交的专用于对象识别的对象图片是经人工确认过的，因此无论替换掉的最早添加至所述对象图片集合的至少一个对象图片，还是从对象图片集合中抽取出的对象图片，都不包括用户提交的专用于对象识别的对象图片，以避免准确的对象图片的丢失，防止逐渐偏离正常的对象识别功能。

步骤208，根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的对象图片。

在本申请实施例中，差异数据对应的对象图片都是最大类别中的对象图片，可以选择能使得删除后剩余的对象图片之间的差异数据较大的对象图片。其中包括，从高到低排序最前的一个或多个差异数据，对应的一个或多个对象图片。或者，当对象图片集合中包括新添加的一个或多个对象图片时，选择不低于删除新添加的对象图片后剩余的对象图片之间的差异数据的差异数据，删除对应的一个或多个对象图片。通过删除最大类别中的对象图片，减少集中分布在一个类别中的对象图片，增加对象图片之间的互补性，提供对象识别的识别率。

步骤209，采用删除对象图片后的对象图片集合进行对象识别。

依据本申请实施例，通过接收新增的至少一张对象图片，并添加至所述对象图片集合，判定添加对象图片后，所述对象图片集合中对象图片多于第二设定个数，确定对象图片集合中对象图片超量需要进行删除。

进一步，通过判定所述最大类别对应的对象图片超出第一设定个数，确定从最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据，在设定图片数量的情况下，从对象图片集合中，删除从高到低排序最前的至少一个差异数据对应的对象图片，使得剩余的对象图片之间的差异最大，对象图片之间的互补性最优，采用删除对象图片后的对象图片集合进行对象识别，继而使得设定图片数量的对象图片集合中对象图片多样化最好，提高了对象识别时的识别率。

参照图4，示出了根据本申请实施例三的数据集合的更新方法实施例的流程图，该方法具体可以包括以下步骤：

步骤301，接收新增的至少一张对象图片，并添加至对象图片集合。

步骤302，针对所述对象图片集合中的对象图片，确定从中抽取出所述对象图片后，剩余对象图片的差异数据。

步骤303，选取差异数据从高到低排序最前的至少一张对象图片进行删除。

依据本申请实施例，通过接收新增的至少一张对象图片，并添加至对象图片集合，针对所述对象图片集合中的对象图片，确定从中抽取出所述对象图片后，剩余对象图片的差异数据，在设定图片数量的情况下，在添加了新的对象图片后，选取差异数据从高到低排序最前的至少一张对象图片进行删除，使得剩余的对象图片之间的差异最大，对象图片之间的互补性最优，采用删除对象图片后的对象图片集合进行对象识别，继而使得设定图片数量的对象图片集合中对象图片多样化最好，提高了对象识别时的识别率。

参照图5，示出了根据本申请实施例四的一种数据处理方法实施例的流程图，该方法具体可以包括以下步骤：

步骤401，获取图像集合。

在本申请实施例中，生物特征包括生物所固有的生理特征或行为特征，其中，生理特征可以包括脸、虹膜、耳、指纹、掌纹、手掌静脉等，行为特征可以包括步态、体态等，或者其他任意适用于身份识别的特征，本申请实施例对此不做限制。图像集合包括多个图像，图像包括生物特征，例如，可用于人脸识别的人脸图像。

步骤402，获取所述图像集合中至少一个子图像集合的差异值。

在本申请实施例中，子图像集合包括图像集合中的部分数据，剩余数据称为目标图像。目标图像可以有任意适用的数量，本申请实施例对此不做限制。例如，分别抽取出图像集合中每个图像，将剩余图像作为子图像集合。

差异值用于表征图像之间的差异的高低，两两图像之间的差异值通过比较两个图像的图像特征来得到，对于多个图像，可以将所有图像两两之间的差异值的和值或者均值作为多个图像之间的差异值，或者其他任意适用的方式得到的差异值，本申请实施例对此不做限制。

在本申请实施例中，子图像集合中包括多个图像，子图像集合的差异值为其中多个图像之间的差异值。针对图像集合中至少一个子图像集合，分别获取子图像集合的差异值。

步骤403，确定所述差异值超过预设阈值的目标子图像集合。

在本申请实施例中，针对各个子图像集合，判断该子图像集合的差异值是否达到预设阈值，确定差异值达到预设阈值的子图像集合，其中预设阈值可以根据实际需要，设置任意适用的值，本申请实施例对此不做限制。

步骤504，删除所述目标子图像集合对应的目标图像。

在本申请实施例中，针对各个差异值超过预设阈值的子图像集合，相对图像集合，将子图像集合中不包括的目标图像删除，使得图像集合中剩余的图像之间的差异值可以达到预设阈值，在减少图像集合的图像数量的同时，保留下来的图像之间差异相对较高，互补性相对更好。

依据本申请实施例，通过获取图像集合，获取图像集合中至少一个子图像集合的差异值，确定差异值达到预设阈值，删除目标图像，使得图像集合中剩余图像之间的差异相对较高，删除了与其他图像互补性相对不好的图像，采用删除目标图像后的图像集合进行基于生物特征的身份识别时，继而使得相同图像数量的图像集合中图像多样化相对较好，提高了身份识别时的识别率。

为使本领域技术人员更好地理解本申请，以下通过具体的示例对本申请的一种实现方式进行说明。

如图6所示的数据库中删除人脸的过程的示意图。

步骤1、提取待更新的人脸图片的人脸特征。

步骤2、提取数据库中同一人的人脸图片的人脸特征。

步骤3、利用无监控聚类算法，对数据库中同一人的人脸图片的人脸特征与待更新人脸图片的人脸特征进行聚类。

步骤4、判断最大子类包含的人脸图片的数量是否大于阈值，如果大于阈值，则执行步骤5；否则执行步骤6。

步骤5、选取最大子类中自动更新入库的人脸，并且除它以外剩余人脸图片之间距离最远。聚类算法中以距离表征人脸图片之间的差异数据，选取可以使剩余人脸图片之间的差异最高的人脸图片为指定人脸图片。

步骤6、选取最大子类中最先自动更新入库的人脸图片，作为指定人脸图片。

步骤7、将步骤5或步骤6中指定的人脸图片，从数据库中删除。

如图7所示的更新人脸图片数据库的过程的示意图。

步骤1、提取通过识别的人脸图片的人脸特征。

步骤2、判断人脸图片和数据库中人脸图片的相似分值是否在预设区间内，其中，相似分值可以通过比较人脸图片的人脸特征得到。如果相似分值在预设区间内，则执行步骤3，否则执行步骤6。

步骤3、判断数据库中图片数量是否达到上限，如果达到上限，则执行步骤4，否则执行步骤5。

步骤4、对通过识别的人脸图片和数据库中人脸图片一起进行聚类，利用聚类结果更新数据库。更新数据库的具体实现方式包括：判断最大子类包含的人脸图片的数量是否大于阈值，如果大于阈值，则选取最大子类中自动更新入库的人脸，并且除它以外剩余人脸图片之间距离最远。聚类算法中以距离表征人脸图片之间的差异数据，以通过识别的人脸图片替换可以使剩余人脸图片之间的差异最高的人脸图片；否则以通过识别的人脸图片替换最大子类中最先自动更新入库的人脸图片。

步骤5、将通过识别的人脸图片添加到数据库中。

步骤6、结束更新人脸图片数据库的过程。

如图8所示的人脸识别过程的示意图。

步骤1、输入注册图片，用户提交的专用于人脸识别的人脸图片。

步骤2、提取注册图片的人脸特征。

步骤3、将注册图片保存到数据库中。

步骤4、输入待识别图片，人脸识别的使用阶段用户进行人脸识别。

步骤5、提取待识别图片的人脸特征。

步骤6、判断待识别图片与数据库中的人脸图片的比对分值是否大于阈值，具体可以通过比较人脸特征得到人脸图片的比对分值，以判断数据库中是否存在待识别图片对应的用户。如果比对分值小于阈值，则执行步骤7，否则执行步骤8。

步骤7、判定数据库中不存在待识别图片对应的用户，结合人脸识别。

步骤8、判定数据库中存在待识别图片对应的用户，输出相应的人物信息。

步骤9、判断待识别图片与数据库中已有图片之间的相似分值是否在预设区间内，其中，相似分值可以通过比较人脸图片的人脸特征得到。如果相似分值在预设区间内，则执行步骤10。

步骤10、基于识别引擎的更新规则，将待识别图片更新到数据库中。具体更新数据库的具体实现方式包括：判断最大子类包含的人脸图片的数量是否大于阈值，如果大于阈值，则选取最大子类中自动更新入库的人脸，并且除它以外剩余人脸图片之间距离最远。聚类算法中以距离表征人脸图片之间的差异数据，以通过识别的人脸图片替换可以使剩余人脸图片之间的差异最高的人脸图片；否则以通过识别的人脸图片替换最大子类中最先自动更新入库的人脸图片。

参照图9，示出了根据本申请实施例五的一种对象识别装置实施例的结构框图，具体可以包括：

差异数据确定模块501，用于确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据；

图片删除模块502，用于根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的对象图片；

对象识别模块503，用于采用删除对象图片后的对象图片集合进行对象识别。

在本申请的一种优选实施例中，所述图片删除模块包括：

在本申请的一种优选实施例中，所述差异数据确定模块包括：

在本申请的一种优选实施例中，所述第二数据确定子模块，具体用于以所述两两对象图片之间的差异数据的均值或和值作为所述剩余的对象图片之间的差异数据。

在本申请的一种优选实施例中，所述装置还包括：

在本申请的一种优选实施例中，所述最早添加至所述对象图片集合的至少一个对象图片，以及所述从对象图片集合中抽取出对象图片，不包括用户提交的专用于对象识别的对象图片。

在本申请的一种优选实施例中，所述装置还包括：

参照图10，示出了根据本申请实施例六的一种数据集合的更新装置实施例的结构框图，具体可以包括：

图片添加模块601，用于接收新增的至少一张对象图片，并添加至对象图片集合；

差异数据确定模块602，用于针对所述对象图片集合中的对象图片，确定从中抽取出所述对象图片后，剩余对象图片的差异数据；

图片删除模块603，用于选取差异数据从高到低排序最前的至少一张对象图片进行删除。

参照图11，示出了根据本申请实施例七的一种数据处理装置实施例的结构框图，具体可以包括：

集合获取模块701，用于获取图像集合，所述图像包括生物特征；

差异值获取模块702，用于获取所述图像集合中至少一个子图像集合的差异值，其中，所述子图像集合包括所述图像集合中的部分数据，剩余数据称为目标图像；

子集合确定模块703，用于确定所述差异值达到预设阈值；

图像删除模块704，用于删除所述目标图像。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开的实施例可被实现为使用任意适当的硬件，固件，软件，或及其任意组合进行想要的配置的系统。图12示意性地示出了可被用于实现本公开中所述的各个实施例的示例性系统(或装置)800。

对于一个实施例，图12示出了示例性系统800，该系统具有一个或多个处理器802、被耦合到(一个或多个)处理器802中的至少一个的系统控制模块(芯片组)804、被耦合到系统控制模块804的系统存储器806、被耦合到系统控制模块804的非易失性存储器(NVM)/存储设备808、被耦合到系统控制模块804的一个或多个输入/输出设备810，以及被耦合到系统控制模块804的网络接口812。

处理器802可包括一个或多个单核或多核处理器，处理器802可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中，系统800能够作为本申请实施例中所述的浏览器。

在一些实施例中，系统800可包括具有指令的一个或多个计算机可读介质(例如，系统存储器806或NVM/存储设备808)以及与该一个或多个计算机可读介质相合并被配置为执行指令以实现模块从而执行本公开中所述的动作的一个或多个处理器802。

对于一个实施例，系统控制模块804可包括任意适当的接口控制器，以向(一个或多个)处理器802中的至少一个和/或与系统控制模块804通信的任意适当的设备或组件提供任意适当的接口。

系统控制模块804可包括存储器控制器模块，以向系统存储器806提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。

系统存储器806可被用于例如为系统800加载和存储数据和/或指令。对于一个实施例，系统存储器806可包括任意适当的易失性存储器，例如，适当的DRAM。在一些实施例中，系统存储器806可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例，系统控制模块804可包括一个或多个输入/输出控制器，以向NVM/存储设备808及(一个或多个)输入/输出设备810提供接口。

例如，NVM/存储设备808可被用于存储数据和/或指令。NVM/存储设备808可包括任意适当的非易失性存储器(例如，闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如，一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备808可包括在物理上作为系统800被安装在其上的设备的一部分的存储资源，或者其可被该设备访问而不必作为该设备的一部分。例如，NVM/存储设备808可通过网络经由(一个或多个)输入/输出设备810进行访问。

(一个或多个)输入/输出设备810可为系统800提供接口以与任意其他适当的设备通信，输入/输出设备810可以包括通信组件、音频组件、传感器组件等。网络接口812可为系统800提供接口以通过一个或多个网络通信，系统800可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信，例如接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合进行无线通信。

对于一个实施例，(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器(例如，存储器控制器模块)的逻辑封装在一起。对于一个实施例，(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例，(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例，(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。

在各个实施例中，系统800可以但不限于是：浏览器、工作站、台式计算设备或移动计算设备(例如，膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中，系统800可具有更多或更少的组件和/或不同的架构。例如，在一些实施例中，系统800包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

其中，如果显示器包括触摸面板，显示屏可以被实现为触屏显示器，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。

本申请实施例还提供了一种非易失性可读存储介质，该存储介质中存储有一个或多个模块(programs)，该一个或多个模块被应用在终端设备时，可以使得该终端设备执行本申请实施例中各方法步骤的指令(instructions)。

在一个示例中提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如本申请实施例的方法。

在一个示例中还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本申请实施例的一个或多个的方法。

本申请实施例公开了一种对象识别方法和装置，示例1包括一种对象识别方法，包括确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据；

采用删除对象图片后的对象图片集合进行对象识别。

示例2可包括示例1所述的方法，其中，所述删除从高到低排序最前的至少一个差异数据对应的对象图片包括：

示例3可包括示例1和/或示例2所述的方法，其中，所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据包括：

示例4可包括示例1-示例3一个或多个所述的方法，其中，所述根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据包括：

示例5可包括示例1-示例4一个或多个所述的方法，其中，在所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据之前，所述方法还包括：

将所述对象图片集合中的对象图片划分至多个类别；

确定所述多个类别中包含最多对象图片的最大类别；

示例6可包括示例1-示例5一个或多个所述的方法，其中，所述方法还包括：

判定所述最大类别对应的对象图片超出第一设定个数。

示例7可包括示例1-示例6一个或多个所述的方法，其中，在所述确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据之前，所述方法还包括：

示例8可包括示例1-示例7一个或多个所述的方法，其中，在所述接收新增的至少一张对象图片，并添加至所述对象图片集合之后，所述方法还包括：

示例9可包括示例1-示例8一个或多个所述的方法，其中，所述方法还包括：

示例10可包括示例1-示例9一个或多个所述的方法，其中，所述最早添加至所述对象图片集合的至少一个对象图片，以及所述从对象图片集合中抽取出对象图片，不包括用户提交的专用于对象识别的对象图片。

示例11可包括示例1-示例10一个或多个所述的方法，其中，在所述添加至所述对象图片集合之前，所述方法还包括：

示例12可包括示例1-示例11一个或多个所述的方法，其中，在所述添加至所述对象图片集合之前，所述方法还包括：

示例13包括一种数据集合的更新方法，包括：

接收新增的至少一张对象图片，并添加至对象图片集合；

示例14包括一种数据处理方法，包括：

获取图像集合，所述图像包括生物特征；

确定所述差异值达到预设阈值；

删除所述目标图像。

示例15包括一种对象识别装置，其中，所述装置包括差异数据确定模块，用于确定从对象图片集合中抽取出对象图片后剩余的对象图片之间的差异数据；

示例16可包括示例15所述的装置，其中，所述图片删除模块包括：

示例17可包括示例15和/或示例16所述的装置，其中，所述差异数据确定模块包括：

示例18可包括示例15-示例17一个或多个所述的装置，其中，所述第二数据确定子模块，具体用于以所述两两对象图片之间的差异数据的均值或和值作为所述剩余的对象图片之间的差异数据。

示例19可包括示例15-示例18一个或多个所述的装置，其中，所述装置还包括：

示例20可包括示例15-示例19一个或多个所述的装置，其中，所述装置还包括：

示例21可包括示例15-示例20一个或多个所述的装置，其中，所述装置还包括：

示例22可包括示例15-示例21一个或多个所述的装置，其中，所述装置还包括：

示例23可包括示例15-示例22一个或多个所述的装置，其中，所述装置还包括：

示例24可包括示例15-示例23一个或多个所述的装置，其中，所述最早添加至所述对象图片集合的至少一个对象图片，以及所述从对象图片集合中抽取出对象图片，不包括用户提交的专用于对象识别的对象图片。

示例25可包括示例15-示例24一个或多个所述的装置，其中，所述装置还包括：

示例26可包括示例15-示例25一个或多个所述的装置，其中，所述装置还包括：

示例27包括一种数据集合的更新装置，包括：

示例28包括一种数据处理装置，包括：

子集合确定模块，用于确定所述差异值达到预设阈值；

图像删除模块，用于删除所述目标图像。

示例29、一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如示例1-14一个或多个的方法。

示例30、一个计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如示例1-14一个或多个的方法。

虽然某些实施例是以说明和描述为目的的，各种各样的替代、和/或、等效的实施方案、或计算来达到同样的目的实施例示出和描述的实现，不脱离本申请的实施范围。本申请旨在覆盖本文讨论的实施例的任何修改或变化。因此，显然本文描述的实施例仅由权利要求和它们的等同物来限定。

Claims

1.一种对象识别方法，其特征在于，包括：

将对象图片集合中的对象图片划分至多个类别；所述对象图片集合中的对象图片对应同一种对象；

确定所述多个类别中包含最多对象图片的最大类别；

确定从所述最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据；所述剩余的对象图片之间的差异数据是根据所述剩余的对象图片中两两对象图片之间的差异数据确定的；

根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的抽取对象图片；

采用删除对象图片后的对象图片集合进行对象识别；

在所述确定从所述最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据之前，所述方法还包括：

接收新增的至少一张对象图片；其中，新增的对象图片包括待识别图片；

判定新增至所述对象图片集合的对象图片与所述对象图片集合中已有的对象图片的相似数据超出设定的第二相似下限；所述第二相似下限用于判断所述新增的对象图片对应的对象是否可以通过对象识别；

将所述新增的对象图片添加到对象图片集合。

2.根据权利要求1所述的方法，其特征在于，所述删除从高到低排序最前的至少一个差异数据对应的对象图片包括：

3.根据权利要求1所述的方法，其特征在于，所述确定抽取出对象图片后剩余的对象图片之间的差异数据包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述两两对象图片之间的差异数据确定所述剩余的对象图片之间的差异数据包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

判定所述最大类别对应的对象图片超出第一设定个数。

6.根据权利要求1所述的方法，其特征在于，在所述接收新增的至少一张对象图片，并添加至所述对象图片集合之后，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

8.根据权利要求7所述的方法，其特征在于，所述最早添加至所述对象图片集合的至少一个对象图片，以及所述抽取出对象图片，不包括用户提交的专用于对象识别的对象图片。

9.根据权利要求1所述的方法，其特征在于，在所述添加至所述对象图片集合之前，所述方法还包括：

10.一种数据集合的更新方法，其特征在于，包括：

接收新增的至少一张对象图片，并添加至对象图片集合；

将所述对象图片集合中的对象图片划分至多个类别；所述对象图片集合中的对象图片对应同一种对象；

确定所述多个类别中包含最多对象图片的最大类别；

选取差异数据从高到低排序最前的至少一张抽取对象图片进行删除；

所述接收新增的至少一张对象图片，并添加至对象图片集合，包括：

接收所述新增的至少一张对象图片；其中，新增的对象图片包括待识别图片；

将所述新增的对象图片添加到对象图片集合。

11.一种数据处理方法，其特征在于，包括：

获取图像集合，所述图像包括生物特征；

将至少一个子图像集合中的对象图片划分至多个类别；所述至少一个子图像集合为所述图像集合的子集合，所述图像集合中的图像对应同一种对象；

确定所述子图像集合中，所述多个类别中包含最多图像的最大类别；

确定所述子图像集合中，从所述最大类别对应的多个图片中抽取出图片后剩余的图片之间的差异值，其中，所述子图像集合包括所述图像集合中的部分数据，剩余数据称为目标图像；所述剩余的图片之间的差异值是根据所述剩余的图片中两两图片之间的差异值确定的；

确定所述差异值达到预设阈值的目标子图像集合；

删除所述目标子图像集合对应的目标图像，以使得删除后，剩余的对象图片之间的差异数据达到阈值；

确定所述子图像集合中，从所述最大类别对应的多个图片中抽取出图片后剩余的图片之间的差异值之前，所述方法还包括：

判定新增至所述图像集合的对象图片与所述图像集合中已有的对象图片的相似数据超出设定的第二相似下限；所述第二相似下限用于判断所述新增的对象图片对应的对象是否可以通过对象识别；

将所述新增的对象图片添加到所述图像集合。

12.一种对象识别装置，其特征在于，包括：

类别划分模块，用于将对象图片集合中的对象图片划分至多个类别，所述对象图片集合中的对象图片对应同一种对象；

差异数据确定模块，用于确定从所述最大类别对应的多个对象图片中抽取出对象图片后剩余的对象图片之间的差异数据；所述剩余的对象图片之间的差异数据是根据所述剩余的对象图片中两两对象图片之间的差异数据确定的；

图片删除模块，用于根据所述差异数据，从所述对象图片集合中删除对象图片，其中包括：删除从高到低排序最前的至少一个差异数据对应的抽取对象图片；

对象识别模块，用于采用删除对象图片后的对象图片集合进行对象识别；

所述装置，还用于接收新增的至少一张对象图片，其中，新增的对象图片包括待识别图片；判定新增至所述对象图片集合的对象图片与所述对象图片集合中已有的对象图片的相似数据超出设定的第二相似下限；将所述新增的对象图片添加到对象图片集合；所述第二相似下限用于判断所述新增的对象图片对应的对象是否可以通过对象识别。

13.一种数据集合的更新装置，其特征在于，包括：

类别划分模块，用于将所述对象图片集合中的对象图片划分至多个类别，所述对象图片集合中的对象图片对应同一种对象；

最大类别确定模块，用于确确定所述多个类别中包含最多对象图片的最大类别；

图片删除模块，用于选取差异数据从高到低排序最前的至少一张抽取对象图片进行删除；

所述图片添加模块，具体用于接收所述新增的至少一张对象图片，其中，新增的对象图片包括待识别图片；判定新增至所述对象图片集合的对象图片与所述对象图片集合中已有的对象图片的相似数据超出设定的第二相似下限；所述第二相似下限用于判断所述新增的对象图片对应的对象是否可以通过对象识别；将所述新增的对象图片添加到对象图片集合；所述第二相似下限用于判断所述新增的对象图片对应的对象是否可以通过对象识别。

14.一种数据处理装置，其特征在于，包括：

类别划分模块，用于将至少一个子图像集合中的对象图片划分至多个类别；所述至少一个子图像集合为所述图像集合的子集合，所述图像集合中的图像对应同一种对象；

最大类别确定模块，用于确定所述子图像集合中，所述多个类别中包含最多图像的最大类别；差异值获取模块，用于确定所述子图像集合中，从所述最大类别对应的多个图片中抽取出图片后剩余的图片之间的差异值，其中，所述子图像集合包括所述图像集合中的部分数据，剩余数据称为目标图像；所述剩余的图片之间的差异值是根据所述剩余的图片中两两图片之间的差异值确定的；

子集合确定模块，用于确定所述差异值达到预设阈值的目标子图像集合；

图像删除模块，用于删除所述目标子图像集合对应的目标图像，以使得删除后，剩余的对象图片之间的差异数据达到阈值；

所述装置，还用于接收新增的至少一张对象图片，其中，新增的对象图片包括待识别图片；判定新增至所述图像集合的对象图片与所述图像集合中已有的对象图片的相似数据超出设定的第二相似下限；将所述新增的对象图片添加到所述图像集合；所述第二相似下限用于判断所述新增的对象图片对应的对象是否可以通过对象识别。

15.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-11任一项的方法。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-11任一项的方法。