CN110032933A

CN110032933A - 一种图像数据的获取方法、装置、终端及存储介质

Info

Publication number: CN110032933A
Application number: CN201910172776.4A
Authority: CN
Inventors: 梁喆; 朱雨
Original assignee: Beijing Megvii Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd
Priority date: 2019-03-07
Filing date: 2019-03-07
Publication date: 2019-07-19
Anticipated expiration: 2039-03-07
Also published as: CN110032933B

Abstract

本发明提供了一种图像数据的获取方法、装置、终端及存储介质，该方法包括：根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和所述第一图像序列对应的图像距离阈值，以便于之后根据待识别图像的特征数据，利用图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，对第三预设个数的样本序列中的所有样本图像和第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对待识别图像进行人脸识别的比对图像集合。因此，能够在较少的样本空间内确定图像距离阈值，以对剩余的样本数据进行筛选，进而降低对数据计算所需的资源耗费，减少人脸识别所需的耗时；保证准确率的同时，提高图像数据的获取效率。

Description

一种图像数据的获取方法、装置、终端及存储介质

技术领域

本发明属于图像处理领域，特别是涉及一种图像数据的获取方法、装置、终端及存储介质。

背景技术

目前，公安机关在进行人脸识别的时候会采用大库搜索，也就是在公安系统中已有的人脸图像数据中进行一一比对。由于中国的人口近14亿，也就是说公安机关需要在10亿以上的图像大库中进行人脸特征的检索。现有技术中，利用人脸识别技术进行大库搜索的方法，是首先对大库中的人脸图像抽取512维一个字节的特征，之后计算待识别人脸特征和大库中特征的欧式距离。理论上，欧式距离越小，说明待识别人脸与大库中的人脸越相似，但是通常为了降低所提取的特征的误差率，进而避免误识别的问题发生，往往需要人脸识别系统为一张待识别人脸生成1000张最接近的大库中的人脸图像，再由公安人员进行人工筛选。

由于要维护这1000张图像的列表，且经常要对列表进行查找、排序、删除和插入等操作，使得人脸识别不仅操作过程复杂，且会耗费大量时间和计算资源，响应速率低。

发明内容

有鉴于此，本发明提供一种图像数据的获取方法、装置、终端及存储介质，以便解决现有技术存在的操作复杂且耗时的问题。

依据本发明实施例的第一方面，提供了一种图像数据的获取方法，该方法可以包括：

根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和所述第一图像序列对应的图像距离阈值，所述第一样本集合中包括从多个样本图像中抽样得到的第一预设个数的样本图像，所述第一图像序列中包括第二预设个数的样本图像，所述第一预设个数大于所述第二预设个数；

根据所述待识别图像的特征数据，利用所述图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，所述第二样本集合中包括所述多个样本图像中除了所述第一样本集合中的所有样本图像之外的样本图像，每个样本序列中包括所述第二预设个数的样本图像；

对所述第三预设个数的样本序列中的所有样本图像和所述第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对所述待识别图像进行人脸识别的比对图像集合。

依据本发明实施例的第二方面，提供了一种图像数据的获取装置，该装置可以包括：

阈值确定模块，用于根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和所述第一图像序列对应的图像距离阈值，所述第一样本集合中包括从多个样本图像中抽样得到的第一预设个数的样本图像，所述第一图像序列中包括第二预设个数的样本图像，所述第一预设个数大于所述第二预设个数；

序列筛选模块，用于根据所述待识别图像的特征数据，利用所述图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，所述第二样本集合中包括所述多个样本图像中除了所述第一样本集合中的所有样本图像之外的样本图像，每个样本序列中包括所述第二预设个数的样本图像；

图像排序模块，用于对所述第三预设个数的样本序列中的所有样本图像和所述第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对所述待识别图像进行人脸识别的比对图像集合。

依据本发明实施例的第三方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的图像数据的获取方法的步骤。

依据本发明实施例的第四方面，提供了一种终端，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如第一方面项所述的图像数据的获取方法的步骤。

本发明实施例，首先根据待识别图像的特征数据，确定所述第一样本集合中的第一图像序列和所述第一图像序列对应的图像距离阈值，以便于之后根据所述待识别图像的特征数据，利用所述图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，对所述第三预设个数的样本序列中的所有样本图像和所述第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对所述待识别图像进行人脸识别的比对图像集合。因此，能够在较少的样本空间内(第一样本集合)确定图像距离阈值，以对剩余的样本数据(第二样本集合)进行筛选，从而能够降低对数据计算所需的资源耗费，减少人脸识别所需的耗时；保证准确率的同时，提高图像数据的获取效率。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例提供的一种图像数据的获取方法的步骤流程图；

图2是本发明实施例提供的一种图像数据的获取方法的具体步骤流程图；

图3是本发明实施例提供的一种图像数据的获取方法的具体步骤流程图；

图4是本发明实施例提供的一种图像数据的获取方法的具体步骤流程图；

图5是本发明实施例提供的一种图像数据的获取装置的框图；

图6是本发明实施例提供的一种终端结构的框图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

图1是本发明实施例提供的一种图像数据的获取方法的步骤流程图，如图1所示，该方法可以包括：

步骤101，根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和第一图像序列对应的图像距离阈值。

其中，第一样本集合中包括从多个样本图像抽样得到中的第一预设个数的样本图像，所述第一图像序列中包括第二预设个数的样本图像，第一预设个数大于第二预设个数。

在具体应用中，根据待识别人脸图像，生成对应的待识别图像的特征数据，例如是512维的特征向量，便于和大库中的图像数据进行人脸特征的比对；通过对公安系统中已有的大库的图像数据进行抽样采集，以获取其中少量的样本图像作为第一样本集合，进一步确定图像距离阈值。示例地，可以在10亿张大库的图像数据进行抽样提取，从中采样获取到10亿/32个(第一预设个数)样本图像，作为第一样本集合；再根据第一样本集合中10亿/32个图像的每个样本图像的人脸特征与该待识别图像的特征数据之间的欧式距离，生成一个包括128个(第二预设个数)样本图像的第一图像序列，再将第一图像序列中的欧式距离的最大值作为图像距离阈值，以进行下面步骤102的样本图像的继续筛选。

需要说明的是，欧式距离(对应L2范数)是常见的两点之间或多点之间的距离表示方法，又被称为欧几里得度量，它定义于欧几里得空间中，在n维空间中两个点x1(x11,x12,…,x1n)与x2(x21,x22,…,x2n)间的欧氏距离可以根据这两个点的各个元素平方和的1/2次方得到。根据对待测图像进行特征提取而生成一个512维的待识别图像的特征数据之后，对第一样本集合中的每个样本图像再进行特征提取，分别确定一个特征向量作为样本图像的特征数据，再计算两个特征向量之间的欧式距离即可生成第一图像序列。

步骤102，根据待识别图像的特征数据，利用图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列。

其中，第二样本集合中包括多个样本图像中除了第一样本集合中的所有样本图像之外的样本图像，每个样本序列中包括第二预设个数的样本图像。

示例地，本步骤将根据步骤101确定图像距离阈值，进一步对除了第一样本集合之外的剩余样本图像进行筛选，也就是说从10亿-10亿/32个样本图像组成的第二样本集合中，将与待识别图像的特征数据之间的欧式距离小于图像距离阈值的样本图像筛选出来，再进行优化而生成第三预设个数(32-1)的样本序列，且其中的每个样本序列中都包括与第一图像序列中样本图像个数(128个)相同的样本图像。

步骤103，对第三预设个数的样本序列中的所有样本图像和第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对待识别图像进行人脸识别的比对图像集合。

在具体应用中，通过上述步骤分别确定了第一样本集合中的128个样本图像和第三预设个数(31)的样本序列，也就是一共128+31*128＝4096个样本图像，本步骤通过对这4096个样本图像进行与待识别图像的特征数据之间的欧式距离排序，按照从小到大的次序，选择其中排序在前1000个的样本图像，进而生成比对图像集合，该对比图像集合则可以用于公安人员人工进行人脸识别；从而能够在大库中包括大量样本图像的情况下，仅基于较少的计算量确定出图像距离阈值，进而筛选出准确性较高的对比图像集合，以提升人脸识别的效果。

需要说明的是，本发明所采用的第一预设个数、第二预设个数、第三预设个数，均为优选数值，能够降低计算量的同时保证计算准确度。其他预设个数均可以应用于本发明提出的技术方案，具体不做限制。

综上所述，本发明提供的图像数据的获取方法，根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和所述第一图像序列对应的图像距离阈值，以便于之后根据待识别图像的特征数据，利用图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，对第三预设个数的样本序列中的所有样本图像和第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对待识别图像进行人脸识别的比对图像集合。因此，能够在较少的样本空间内确定图像距离阈值，以对剩余的样本数据进行筛选，以获取能够进行人脸识别的对比图像集合，降低对数据计算所需的资源耗费，减少人脸识别所需的耗时；保证准确率的同时，提高图像数据的获取效率。

可选的，图2是本发明实施例提供的一种图像数据的获取方法的具体步骤流程图，如图2所示，步骤101所述的根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和第一图像序列对应的图像距离阈值，可以包括：

步骤1011，在多个样本图像中抽样出第一预设个数的样本图像，作为第一样本集合。

步骤1012，分别获取第一样本集合中每个样本图像的特征数据。

示例地，为了进行样本图像与待识别图像之间的相似度计算，可以利用样本图像的特征数据与待识别图像的特征数据之间的欧式距离，因此在进行欧式距离计算之前，对第一样本集合中的所有样本图像进行特征提取，以获取每个样本图像对应的特征数据，便于进行下面步骤的计算。

步骤1013，利用迭代策略，通过对比第一样本集合中每个样本图像的特征数据与待识别图像的特征数据之间的欧式距离，获取第一图像序列。

在具体应用中，第一图像序列中始终包括有128个样本图像，对第一样本中的10亿/32个样本图像的特征数据分别计算与待识别图像的特征数据之间的欧式距离。如当新抽取的样本图像的特征数据与待识别图像的特征数据之间的欧式距离大于等于在第一图像序列的最大欧式距离时，则说明该新抽取到的样本图像的特征数据与待测图像的相似度不够高(相对于第一图像序列中已有的样本图像)，因此该新抽取到的样本图像不能够作为第一图像序列中的样本图像；否则，当新抽取的样本图像的特征数据与待识别图像的特征数据之间的欧式距离小于在第一图像序列中所有样本图像与待识别图像的特征数据之间的欧式距离最大值时，说明相对于第一图像序列中已有的样本图像，该新抽取的样本图像与待识别图像的特征数据具有较高的相似性，可以将该新抽取的样本图像替换在第一图像序列中具有欧式距离最大值的样本图像，进而保持第一图像序列中的128个样本图像，直至在第一样本集合中的10亿/32个样本图像全部完成上述欧式距离的对比。

步骤1014，将第一图像序列中所有样本图像与待识别图像的特征数据之间的欧式距离最大值，作为图像距离阈值。

示例地，从10亿/32个样本图像中筛选出128个样本图像作为第一图像序列之后，将这128个样本图像与待识别图像的特征数据之间的欧式距离的最大值，作为图像距离阈值，用以进行步骤102的继续筛选。需要说明的是，通过将从10亿个样本图像中抽取1/32部分的样本图像所生成的图像距离阈值作为对剩余的10亿*31/32个样本图像进行筛选的标准，能够将10亿个样本图像的处理过程简化，由于该图像距离阈值是根据从大的样本空间内随机选取的样本图像所确定的，因此也能够代表10亿个样本图像的特征，进一步利用该图像距离阈值进行下面步骤的筛选时，将大的样本空间进行分解处理，降低计算量的同时也能够保证最终效果的准确性。

可选的，图3是本发明实施例提供的一种图像数据的获取方法的具体步骤流程图，如图3所示，步骤102所述的根据待识别图像的特征数据，利用图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，可以包括：

步骤1021，将第二样本集合中所有样本图像分成第三预设个数的待筛选样本集合。

示例地，将10亿个样本图像除去步骤101抽取的10亿/32个样本图像之外的剩余样本图像，即(10亿*31/32)个样本图像再进行分组，生成31个待筛选样本集合，分别对这31个待筛选样本集合中的每个待筛选样本集合进行下面步骤的操作，也就是根据每个样本图像的特征数据，从每个待筛选样本集合中获取满足待合并条件的，包括第二预设个数的样本图像的样本序列，从而生成31个样本序列，其中的每个样本序列中均包括128个样本图像，这128个样本图像是对应的待筛选样本集合中的满足待合并条件的样本图像，且这些样本图像是该待筛选样本集合中与待识别图像的特征数据之间的欧式距离最大的128个，即从(10亿*31/32)个样本图像中筛选出128*31个样本图像，再进行步骤103的操作。

需要说明的是，可以利用本步骤从(10亿*31/32)个样本图像中随机抽样，获取一个待筛选样本集合(包括10亿/32个样本图像)，进行下面步骤1022-步骤1024的操作，以获取到包括128个样本图像的样本序列；之后再重复本步骤，即从剩下的(10亿*30/32)个样本图像中进行随机抽样，再进行步骤1022-步骤1024的操作，以此类推，直至生成31个，每个都包括128个样本图像的样本序列为止。或者，也可以先利用本步骤从(10亿*31/32)个样本图像中随机抽样生成31个待筛选样本集合后，再分别对这31个待筛选样本集合进行步骤1022-步骤1024的操作，以对应获取31个样本序列。本发明对于采用上述哪种方式不做具体限制。

步骤1022，分别获取每个待筛选样本集合中每个样本图像的特征数据。

示例地，类似于步骤1012，需要对每个样本集合进行样本图像的特征数据的提取，以进一步进行下面步骤的欧式距离比对，此处不再赘述。

步骤1023，分别判断每个待筛选样本集合中的所有样本图像的特征数据与待识别图像的特征数据之间的欧式距离是否满足待合并条件。

示例地，计算第一待筛选样本集合中的第一样本图像的特征数据与待识别图像的特征数据之间的第一欧式距离；在第一欧式距离小于图像距离阈值的情况下，确定第一样本图像满足待合并条件。

其中，该待合并条件包括：样本图像的特征数据与待识别图像的特征数据之间的欧式距离大于图像距离阈值；第一待筛选样本集合是第三预设个数的待筛选样本集合中的任一集合，第一样本图像是第一待筛选集合中的任一样本图像。

步骤1024，根据每个待筛选样本集合中满足待合并条件的样本图像，分别生成每个待筛选样本集合对应的样本序列，以获取第三预设个数的样本序列。

示例地，在将满足待合并条件的样本图像对应生成样本序列时，可以根据步骤101所述的迭代方式进行，也就是说，在每个待筛选样本集合中，依次获取一个满足待合并条件的样本图像，首先判断样本序列中的样本图像个数，若小于第二预设个数，则直接将该满足待合并条件的样本图像作为样本序列中的一个样本图像；否则，当样本序列中已有第二预设个数的样本图像时，则进行欧式距离的判断，也就是说，确定该满足待合并条件的样本图像的特征数据与待识别图像的特征数据之间的欧式距离是否小于在样本序列中的第二预设个数的样本图像的特征数据与待识别图像的特征数据之间的最大欧式距离。当小于该最大欧式距离，说明该满足待合并条件的样本图像比样本序列中的具有欧式距离最大值的样本图像，与待测图像之间的相似度更高，可以作为替换该具有欧式距离最大值的样本图像，以生成新的样本序列。

可选的，该步骤1024如图4所示，包括如下步骤：

步骤10241，判断第一样本序列中包括的样本图像个数是否等于第二预设个数。

其中，第一样本序列是第一待筛选样本集合所对应的样本序列，第一样本序列中包括第一待筛选样本集合中满足待合并条件的小于等于第二预设个数的样本图像。

可选的，在获取到一个满足待合并条件的样本图像后，在将其放入第一样本序列之前，先判断第一样本序列中样本图像的个数，在第一样本序列中包括的样本图像个数等于第二预设个数的情况下，对比第一欧式距离和第一样本序列中所有样本图像的特征数据与待识别图像的特征数据之间的最大欧式距离，也就是进行步骤10242的操作。否则，在第一样本序列中包括的样本图像个数小于第二预设个数的情况下，将进行步骤10243的操作。

示例地，当第一样本序列中已有128个样本图像时，则进行步骤10242，对比第一欧式距离与第一样本序列中所有样本图像的特征数据与待识别图像的特征数据之间的最大欧式距离；否则当第一样本序列中的样本图像个数小于128时，说明仍需获取新的样本图像存入第一图像序列中，可以将第一样本图像放入第一样本序列中。

步骤10242，判断第一欧式距离是否小于最大欧式距离。

示例地，当第一样本序列中已有128个样本图像时，继续对比第一欧式距离与最大欧式距离之间的大小。在第一欧式距离小于最大欧式距离的情况下，将第一样本序列中具有最大欧式距离的样本图像替换为第一样本图像；在第一欧式距离大于等于最大欧式距离的情况下，直接废弃(继续比对下一个图像样本)第一样本图像，说明该第一样本图像无法作为第一样本序列中的一个样本图像。

步骤10243，在第一样本序列中包括的样本图像个数小于第二预设个数的情况下，将第一样本图像作为第一样本序列中的一个样本图像。

图5是本发明实施例提供的一种图像数据的获取装置的框图，如图5所示，该装置500包括：

阈值确定模块510，用于根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和第一图像序列对应的图像距离阈值，第一样本集合中包括从多个样本图像中抽样得到的第一预设个数的样本图像，第一图像序列中包括第二预设个数的样本图像，第一预设个数大于第二预设个数。

序列筛选模块520，用于根据待识别图像的特征数据，利用图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，第二样本集合中包括多个样本图像中除了第一样本集合中的所有样本图像之外的样本图像，每个样本序列中包括第二预设个数的样本图像。

图像排序模块530，用于对第三预设个数的样本序列中的所有样本图像和第一样本集合中的所有样本图像进行排序，以获取目标个数的用于对待识别图像进行人脸识别的比对图像集合。

可选的，阈值确定模块，包括：

图像抽样子模块，用于在多个样本图像中抽样出第一预设个数的样本图像，作为第一样本集合；

数据获取子模块，用于分别获取第一样本集合中每个样本图像的特征数据；

距离比对子模块，用于利用迭代策略，通过比对第一样本集合中每个样本图像的特征数据与待识别图像的特征数据之间的欧式距离，获取第一图像序列；

阈值确定子模块，用于将第一图像序列中所有样本图像与待识别图像的特征数据之间的欧式距离最大值，作为图像距离阈值。

可选的，序列筛选模块，包括：

图像分类子模块，用于将第二样本集合中所有样本图像分成第三预设个数的待筛选样本集合；

数据获取子模块，用于分别获取每个待筛选样本集合中每个样本图像的特征数据；

条件判断子模块，用于分别判断每个待筛选样本集合中每个样本图像的特征数据与待识别图像的特征数据之间的欧式距离是否满足待合并条件；

序列确定子模块，用于根据每个待筛选样本集合中满足待合并条件的样本图像，分别生成每个待筛选样本集合对应的样本序列，以获取第三预设个数的样本序列；

其中，待合并条件包括：样本图像的特征数据与待识别图像的特征数据之间的欧式距离大于图像距离阈值。

可选的，条件判断子模块，包括：

距离计算单元，用于计算第一待筛选样本集合中的第一样本图像的特征数据与待识别图像的特征数据之间的第一欧式距离；

条件确定单元，用于在第一欧式距离小于图像距离阈值的情况下，确定第一样本图像满足待合并条件；

其中，第一待筛选样本集合是第三预设个数的待筛选样本集合中的任一集合，第一样本图像是第一待筛选集合中的任一样本图像。

可选的，序列确定子模块，包括：

距离对比单元，用于在第一样本序列中包括的样本图像个数等于第二预设个数的情况下，对比第一欧式距离和第一样本序列中所有样本图像的特征数据与待识别图像的特征数据之间的最大欧式距离；

样本替换单元，用于在第一欧式距离小于最大欧式距离的情况下，将第一样本序列中具有最大欧式距离的样本图像替换为第一样本图像；

样本确定单元，用于在第一样本序列中包括的样本图像个数小于第二预设个数的情况下，将第一样本图像作为第一样本序列中的一个样本图像；

另外，本发明实施例还提供一种终端，如图6所示，该终端600包括处理器620，存储器610以及存储在存储器610上并可在处理上运行的计算机程序，该计算机程序被处理器620执行时实现上述实施例所述的图像数据的获取方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述的图像数据的获取方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，可以为只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random AccessMemory，简称RAM)、磁碟或者光盘等。

对于上述装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是：上述各个实施例的任意组合应用都是可行的，故上述各个实施例之间的任意组合都是本发明的实施方案，但是由于篇幅限制，本说明书在此就不一一详述了。

在此提供的图像数据的获取方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造具有本发明方案的系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的数据获取方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种图像数据的获取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据待识别图像的特征数据，确定第一样本集合中的第一图像序列和所述第一图像序列对应的图像距离阈值，包括：

在所述多个样本图像中抽样出第一预设个数的样本图像，作为所述第一样本集合；

分别获取所述第一样本集合中每个样本图像的特征数据；

利用迭代策略，通过比对所述第一样本集合中每个样本图像的特征数据与所述待识别图像的特征数据之间的欧式距离，获取所述第一图像序列；

将所述第一图像序列中的样本图像与所述待识别图像的特征数据之间的欧式距离最大值，作为所述图像距离阈值。

3.根据权利要求1所述的方法，其特征在于，所述根据所述待识别图像的特征数据，利用所述图像距离阈值，在第二样本集合中筛选出第三预设个数的样本序列，包括：

将所述第二样本集合中所有样本图像分成所述第三预设个数的待筛选样本集合；

分别获取每个待筛选样本集合中每个样本图像的特征数据；

分别判断所述每个待筛选样本集合中每个样本图像的特征数据与所述待识别图像的特征数据之间的欧式距离是否满足待合并条件；

根据所述每个待筛选样本集合中满足所述待合并条件的样本图像，分别生成所述每个待筛选样本集合对应的样本序列，以获取所述第三预设个数的样本序列；

其中，所述待合并条件包括：所述样本图像的特征数据与所述待识别图像的特征数据之间的欧式距离大于所述图像距离阈值。

4.根据权利要求3所述的方法，其特征在于，所述分别判断所述每个待筛选样本集合中每个样本图像的特征数据与所述待识别图像的特征数据之间的欧式距离是否满足待合并条件，包括：

计算第一待筛选样本集合中的第一样本图像的特征数据与所述待识别图像的特征数据之间的第一欧式距离；

在所述第一欧式距离小于所述图像距离阈值的情况下，确定所述第一样本图像满足所述待合并条件；

其中，所述第一待筛选样本集合是所述第三预设个数的待筛选样本集合中的任一集合，所述第一样本图像是所述第一待筛选集合中的任一样本图像。

5.根据权利要求4所述的方法，其特征在于，所述根据所述每个待筛选样本集合中满足所述待合并条件的样本图像，分别生成所述每个待筛选样本集合对应的样本序列，以获取所述第三预设个数的样本序列，包括：

在第一样本序列中包括的样本图像个数等于所述第二预设个数的情况下，对比所述第一欧式距离和所述第一样本序列中所有样本图像的特征数据与所述待识别图像的特征数据之间的最大欧式距离；

在所述第一欧式距离小于所述最大欧式距离的情况下，将所述第一样本序列中具有所述最大欧式距离的样本图像替换为所述第一样本图像；

在所述第一样本序列中包括的样本图像个数小于所述第二预设个数的情况下，将所述第一样本图像作为所述第一样本序列中的一个样本图像；

其中，所述第一样本序列是所述第一待筛选样本集合所对应的样本序列，所述第一样本序列中包括所述第一待筛选样本集合中满足所述待合并条件的小于等于所述第二预设个数的样本图像。

6.一种图像数据的获取装置，其特征在于，所述方法包括：

7.根据权利要求6所述的装置，其特征在于，所述阈值确定模块，包括：

图像抽样子模块，用于在所述多个样本图像中抽样出第一预设个数的样本图像，作为所述第一样本集合；

数据获取子模块，用于分别获取所述第一样本集合中每个样本图像的特征数据；

距离比对子模块，用于利用迭代策略，通过比对所述第一样本集合中每个样本图像的特征数据与所述待识别图像的特征数据之间的欧式距离，获取所述第一图像序列；

阈值确定子模块，用于将所述第一图像序列中所有样本图像与所述待识别图像的特征数据之间的欧式距离最大值，作为所述图像距离阈值。

8.根据权利要求6所述的装置，其特征在于，所述序列筛选模块，包括：

图像分类子模块，用于将所述第二样本集合中所有样本图像分成所述第三预设个数的待筛选样本集合；

数据获取子模块，用于分别获取所述每个待筛选样本集合中每个样本图像的特征数据；

条件判断子模块，用于分别判断所述每个待筛选样本集合中的所有样本图像的特征数据与所述待识别图像的特征数据之间的欧式距离是否满足待合并条件；

序列确定子模块，用于根据所述每个待筛选样本集合中满足所述待合并条件的样本图像，分别生成所述每个待筛选样本集合对应的样本序列，以获取所述第三预设个数的样本序列；

其中，所述待合并条件包括所述样本图像的特征数据与所述待图像的特征数据之间的欧式距离大于所述图像距离阈值。

9.根据权利要求8所述的装置，其特征在于，所述条件判断子模块，包括：

距离计算单元，用于计算第一待筛选样本集合中的第一样本图像的特征数据与所述待识别图像的特征数据之间的第一欧式距离；

条件确定单元，用于在所述第一欧式距离小于所述图像距离阈值的情况下，确定所述第一样本图像满足所述待合并条件；

10.根据权利要求9所述的装置，其特征在于，所述序列确定子模块，包括：

距离对比单元，用于在第一样本序列中包括的样本图像个数等于所述第二预设个数的情况下，对比所述第一欧式距离和所述第一样本序列中所有样本图像的特征数据与所述待识别图像的特征数据之间的最大欧式距离；

样本替换单元，用于在所述第一欧式距离小于所述最大欧式距离的情况下，将所述第一样本序列中具有所述最大欧式距离的样本图像替换为所述第一样本图像；

样本确定单元，用于在所述第一样本序列中包括的样本图像个数小于所述第二预设个数的情况下，将所述第一样本图像作为所述第一样本序列中的一个样本图像；

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的图像数据的获取方法的步骤。

12.一种终端，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的图像数据的获取方法的步骤。