CN104573696A

CN104573696A - 用于处理人脸特征数据的方法和装置

Info

Publication number: CN104573696A
Application number: CN201410842742.9A
Authority: CN
Inventors: 陈世峰; 张维; 许春景
Original assignee: Hangzhou Huawei Digital Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-12-29
Filing date: 2014-12-29
Publication date: 2015-04-29
Anticipated expiration: 2034-12-29
Also published as: CN104573696B

Abstract

本发明实施例提供用于处理人脸特征数据的方法和装置，该方法包括：对人脸特征进行提取，确定目标特征并获取对应于该目标特征的第一特征向量，其中该第一特征向量包括N个特征值，该第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数；确定对应于该第一特征向量的第二特征向量，该第二特征向量包括M个特征值；从该第二特征向量中选择K个特征值组成确定第三特征向量，K为小于M的正整数。上述技术方案可以减少保存该目标特征的特征值所占用的空间并且提高进行特征检索时的速度。

Description

用于处理人脸特征数据的方法和装置

技术领域

本发明实施例涉及信息技术领域，并且更具体地，涉及用于处理人脸特征数据的方法和装置。

背景技术

为了实现人脸认证与人脸检测，可以对人脸特征进行编码。现有技术中，为了保证特征编码的精度，人脸的特征往往使用64位双精度浮点数进行编码并存储。随着用于表示人脸特征的特征向量趋向于高维，且图片数据增多，采用64位双精度浮点数进行编码并存储的方式会造成存储空间过大。同时，使用浮点数对特征属性进行运算时的计算量也会很大，这就使得进行特征检索时的速度较慢。

发明内容

本发明实施例提供用于处理人脸特征数据的方法和装置，可以减少保存该目标特征的特征值所占用的空间并且提高进行特征检索时的速度。

第一方面，本发明实施例提供一种处理人脸特征数据的方法，该方法包括：对人脸特征进行提取，获取对应于目标特征的第一特征向量，其中该第一特征向量包括N个特征值，该第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数；确定对应于该第一特征向量的第二特征向量，该第二特征向量包括M个特征值，M等于N，该第二特征向量中的M个特征值与该第一特征向量的N个特征值一一对应，该第二特征向量中的每个特征值为二进制数；确定第三特征向量，该第三特征向量包括K个特征值，K为小于M的正整数，该第三特征向量为对应于该目标特征的特征值集合。

结合第一方面，在第一方面的第一种可能的实现方式中，如权利要求1该的方法，该确定对应于该第一特征向量的第二特征向量，包括：将第N_i个特征值进行二进制转换，确定二进制化的第N_i个特征值，其中该二进制化的第N_i个特征值由P位数组成，该第N_i个特征值是该N个特征值中的第i个特征值；从该P位数中选择Q位数组成第M_i个特征值，其中该第M_i个特征值是该第二特征向量中的第i个特征值，P和Q均为正整数且Q小于P。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，从该P位数中选择Q位数组成第M_i个特征值，包括：根据压缩模板，确定该P位数中的Q个位置；确定使用该Q个位置的数值组成该第M_i个特征值。

结合第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，该压缩模板是根据以下方式获取的：获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；将该S个训练特征向量中的每个训练特征向量进行二进制转换，确定二进制化的该每个训练特征向量的每个特征值，其中该二进制化的该每个训练特征向量的该每个特征值由P位数组成；确定P个二进制位统计值，该P个二进制位统计值中的第p个二进制位统计值表示该二进制化的所有训练特征向量的所有特征值在该P位数中的第p位数的和；确定该P个二进制位统计值中最大的Q个二进制位统计值所对应的数的位置为该压缩模板。

结合第一方面或第一方面的上述任一种可能的实现方式，在第一方面的第四种可能的实现方式中，该确定第三特征向量，包括：根据降维模板，从该第二特征向量中选择K个特征值组成该第三特征向量。

结合第一方面的第四种可能的实现方式，在第一方面的第五种可能的实现方式中，该降维模板是通过以下方式确定的：获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；根据该训练特征向量集合中的舍弃特征值的维度，确定该降维模板，其中，该训练特征向量集合与第一集合的均方误差最小，其中该第一集合由该S个特征训练特征向量的特征值中除该舍弃特征值以外的特征值组成。

结合第一方面或第一方面的上述任一种可能的实现方式，在第一方面的第六种可能的实现方式中，该方法还包括：根据该第三特征向量和特征值数据库，确定该第三特征值对应的目标特征的类型。

第二方面，本发明实施例提供一种用于处理人脸特征数据的装置，该装置包括：特征提取单元，用于对人脸特征进行提取获取对应于目标特征的第一特征向量，其中该第一特征向量包括N个特征值，该第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数；第一确定单元，用于确定对应于该第一特征向量的第二特征向量，该第二特征向量包括M个特征值，M等于N，该第二特征向量中的M个特征值与该第一特征向量的N个特征值一一对应，该第二特征向量中的每个特征值为二进制数；第二确定单元，用于确定第三特征向量，该第三特征向量包括K个特征值，K为小于M的正整数；第三确定单元，用于确定该第三特征向量为对应于该目标特征的特征值集合。

结合第二方面，在第二方面的第一种可能的实现方式中，该第一确定单元，具体用于将第N_i个特征值进行二进制转换，确定二进制化的第N_i个特征值，其中该二进制化的第N_i个特征值由P位数组成，该第N_i个特征值是该N个特征值中的第i个特征值，其中P为小于256的正整数；从该P位数中选择Q位数组成第M_i个特征值，其中该第M_i个特征值是该第二特征向量中的第i个特征值，Q为小于P的正整数。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，该第一确定单元，具体用于根据压缩模板，确定该P位数中的Q个位置；确定使用该Q个位置的数值组成该第M_i个特征值。

结合第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，该第一确定单元，还用于获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；将该S个训练特征向量中的每个训练特征向量进行二进制转换，确定二进制化的该每个训练特征向量的每个特征值，其中该二进制化的该每个训练特征向量的该每个特征值由P位数组成；确定P个二进制位统计值，该P个二进制位统计值中的第p个二进制位统计值表示该二进制化的所有训练特征向量的所有特征值在该P位数中的第p位数的和；确定该P个二进制位统计值中最大的Q个二进制位统计值所对应的数的位置为该压缩模板。

结合第二方面或第二方面的上述任一种可能的实现方式，在第二方面的第四种可能的实现方式中，该第二确定单元，具体用于根据降维模板，从该第二特征向量中选择K个特征值组成该第三特征向量。

结合第二方面的第四种可能的实现方式，在第二方面的第五种可能的实现方式中，该第二确定单元，还用于获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；根据该训练特征向量集合中的舍弃特征值的维度，确定该降维模板，，其中，该训练特征向量集合与第一集合的均方误差最小，其中该第一集合由该S个特征训练特征向量的特征值中除该舍弃特征值以外的特征值组成。

结合第二方面或第二方面的上述任一种可能的实现方式，在第二方面的第六种可能的实现方式中，该装置还包括：第三确定单元，用于根据该第三特征向量和特征值数据库，确定该第三特征值对应的目标特征的类型。

上述技术方案中，对应于目标特征的特征向量集合从浮点数被转换为二进制数，且对应于该目标特征的特征向量的维度也降低了。这样，可以减少保存该目标特征的特征值所占用的空间。此外，由于特征向量的维度降低了，在进行检索时需要使用的特征值也就减少了。因此，可以提高进行特征检索时的速度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例提供的处理人脸特征数据的方法的示意性流程图。

图2是根据本发明实施例提供的用于处理人脸特征数据的装置的结构框图。

图3是根据本发明实施例提供的用于处理人脸特征数据的装置的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

101，对人脸特征进行提取，确定目标特征并获取对应于该目标特征的第一特征向量，其中该第一特征向量包括N个特征值，该第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数。

102，确定对应于该第一特征向量的第二特征向量，该第二特征向量包括M个特征值，M等于N，该第二特征向量中的M个特征值与该第一特征向量中的N个特征值一一对应，该第二特征向量中的每个特征值为二进制数。

103，从该第二特征向量中选择K个特征值组成确定第三特征向量，K为小于M的正整数。

根据图1所示的方法，对应于目标特征的特征向量集合从浮点数被转换为二进制数，且对应于该目标特征的特征向量的维度也降低了。这样，可以减少保存该目标特征的特征值所占用的空间。此外，由于特征向量的维度降低了，在进行检索时需要使用的特征值也就减少了。因此，可以提高进行特征检索时的速度。

可选的，该确定对应于该第一特征向量的第二特征向量，包括：将第N_i个特征值进行二进制转换，获得二进制化的第N_i个特征值，其中该二进制化的第N_i个特征值由P位数组成，该第N_i个特征值是该N个特征值中的第i个特征值；从该P位数中选择Q位数组成第M_i个特征值，其中该第M_i个特征值是该第二特征向量中的第i个特征值，Q为小于P的正整数，i＝1,2,…,N。通过上述过程，通过对特征值进行二进制化并使用二进制化后的部分位表示该特征值，能够将该特征值进行压缩，从而可以进一步降低保存该特征值所占用的空间。同时，由于特征值的位数降低，因此，可以进一步提高进行特征检索时的速度。

可选的，可以从P位数中任意选择Q位数组成该第M_i个特征值；也可以根据预设规则从该P位数中选择Q位数组成该第M_i个特征值。例如，可以选择P位数中的前Q位数组成该第M_i个特征值，还可以选择P位数中的后Q位数组成该第M_i个特征值。再如，还可以根据压缩模板，确定该P位数中的Q个位置；确定使用该Q个位置的数值组成该第M_i个特征值。

该压缩模板是根据以下方式获取的：获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个向量特征向量，该S个训练特征向量中的每个训练特征向量包括M个特征值；将该每个训练特征向量的每个特征值进行二进制转换，确定二进制化后的该每个训练特征向量的每个特征值，其中该二进制化的该每个训练特征向量的该每个特征值由P位数组成；确定P个二进制位统计值，该P个二进制位统计值中的第p个二进制位统计值表示该二进制化的该S个训练特征向量中的所有特征值在该P位数中的第p位数的和；确定该P个二进制位统计值中最大的Q个二进制为统计值所对应的数的位置为所述压缩模板。

具体地，该训练特征向量集合可以表示为F_all＝(F¹,F²,...,F^S)。F^s表示该训练特征向量集合中的第s个训练特征向量，其中s为大于1且小于S的正整数。用于表示该第s个训练特征向量的第m个特征值，其中m为大于1且小于M的正整数。可以使用长度为P的二进制数表示。具体地，可以使用以下公式表示：

f_{m}^{s} \approx Σ_{p = 1}^{P} 2^{- j} * b_{s, p},

……………………………………………………·公式1.1

其中，b_s,p表示在第p位的取值，在第p位的取值为0或1。

确定P个二进制位统计值，该P个二进制位统计值中的第p个二进制位统计值表示该二进制化的所有训练特征向量的所有特征值在该P位数中的第p位数的和。具体来说，第p个二进制位统计值可以通过以下公式表示：

P_{p} \approx Σ_{s = 1}^{S} 2^{- p} * b_{s, p},

……………………………………………………·公式1.2

其中，P_p表示第p个二进制位统计值，b_s,p表示P个二进制化后的训练特征值中的第s个训练特征向量的所有特征值在第p位的数值。将统计到的P个二进制位统计值从大到小排序，选择排名前Q的二进制位统计值对应的位置作为该压缩模板。这样，可以保证同等精度的情况下得到最小绝对值误差。

可选的，可以从该第二特征向量中选择K个特征值组成该第三特征向量。例如，可以随机从该第二特征向量中确定至少一个需要移除的特征值，将该至少一个需要移除的特征值从该M个特征值中移除，移除至少一个需要移除的特征值后的特征值集合即为该第三特征向量。再如，还可以根据预设规则确定该第三特征向量。例如，可以选择该第二特征值中的前K个特征值组成该第三特征向量。或者，还可以根据降维模板，从该第二特征向量中选择K个特征值组成该第三特征向量。

该降维模板是通过以下方式获取的：获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；根据该训练特征向量集合中的舍弃特征值的维度，确定该降维模板，其中，该训练特征向量集合与第一集合的均方误差最小，其中该第一集合由所述S个特征训练特征向量的特征值中除该舍弃特征值以外的特征值组成。需要注意的是，用于获取降维模板的训练特征向量集合和用于获取该压缩模板的训练特征向量集合是同一个训练特征向量集合。

具体来说，从S个特征向量中的每个特征向量去掉第j个特征值(j为大于1且小于M的正整数)后的预测结果的均方误差可以通过以下公式表示：

E_{j} = \frac{1}{S} * Σ_{s = 1}^{S} {(w_{j} * f_{j}^{s})}^{2} = \frac{w_{j}}{S} * Σ_{s = 1}^{S} {(f_{j}^{s})}^{2},

…………………………………·公式1.3

其中w_j表示权重W的第j位权重系数。权重W＝(w₀,w₁,w₁,....w_M)是描述对应于M个特征值在最终进行属性判断的时候的权重，可以通过现有技术(例如支持向量机(英文：Support Vector Machine，缩写：SVM)等)获得。表示该S个训练特征向量中的第s个特征向量的M个特征值中的第j个特征值。

设训练特征向量集合中的每个训练特征向量中每一维的分布均是一个随机变量f_j，且则式(7)可表示为：

E_{j} = w_{j}^{2} * (μ_{j}^{2} + σ_{j}^{2}),

………………………………………………·公式1.4

其中，公式1.4中的μ_j和σ_j表示是统计变量的均值和协方差，和均可以通过统计得到。因此，为了保证丢掉第j维后模型预测结果的均方误差最小，则应有：

\min_{j} E_{j} = \min_{j} w_{j}^{2} * (μ_{j}^{2} + σ_{j}^{2}),

…………………………………………·公式1.5

在此情况下，只需要计算并统计E_j的值，对其进行排序，将E_j值最小的一维对应的维度j舍弃即可。

若二进制化后的训练特征向量用于计算模型预测值，记其中F^s表示二进制化之前的训练特征向量集合中的S个训练特征向量中的第s个训练特征向量，表示二进制化后的第s个训练特征向量，ε_n表示二进制化过程中的误差，其中，s为大于1且小于S的正整数。在此情况下，公式1.3可以变为：

\begin{matrix} E_{j} = \frac{1}{S} * Σ_{s = 1}^{S} {(&lang; W, F^{s} &rang; - &lang; W_{- j}, \overset{&OverBar;}{F_{- j}^{s}} &rang;)}^{2} \\ = \frac{1}{S} * Σ_{s = 1}^{S} {(w_{j} * \overset{&OverBar;}{f_{j}^{s}} + Σ_{m = 1}^{M} (w_{m} * ϵ_{m}^{s}))}^{2} \\ = \frac{w_{j}^{2}}{S} * Σ_{s = 1}^{S} {(\overset{&OverBar;}{f_{j}^{s}})}^{2} + \frac{{2 w}_{j}}{S} * Σ_{s = 1}^{S} \overset{&OverBar;}{f_{j}^{s}} * Σ_{m = 1}^{M} (w_{m} * ϵ_{m}^{s}) + \frac{1}{S} * Σ_{s = 1}^{S} Σ_{m = 1}^{M} {(w_{m} * ϵ_{m}^{s})}^{2}, \end{matrix}

………·公式1.6

其中，表示二进制化后的第s个训练特征向量中由除该第s个训练特征向量的M个特征值中的第j个特征值以外的特征值组成。也就是说其中表示F^s中的第j-1个特征值二进制化后的数值。W表示权重，W_-j表示权重W除掉第j维后的权重系数向量。其中w_m表示第m维权重系数。根据公式1.6，可以得到以下公式：

\min_{j} E_{j} = \min_{j} \frac{w_{j}^{2}}{S} * Σ_{s = 1}^{S} {(\overset{&OverBar;}{f_{j}^{s}})}^{2} + \frac{{2 w}_{j}}{S} * Σ_{s = 1}^{S} \overset{&OverBar;}{f_{j}^{s}} * Σ_{m = 1}^{M} (w_{m} * ϵ_{m}^{s}),

…………………·公式1.7

公式1.7中的和可以由统计计算获得，因此只需要带入公式1.7，并对其从大到小排序，将最小值对应的维度确定为舍弃维度就能保证舍弃该维度后的均方误差最小。每个训练特征向量的第j维度的特征值是舍弃特征值。也就是说，由该S个训练特征向量中的所有特征值所组成的集合与由该S个训练特征向量中除了的每个训练特征向量中的舍弃特征值以外的特征值的均方误差最小。

进一步，在得到第三特征向量后，可以根据该第三特征向量进行进一步处理。例如可以根据该第三特征向量和特征数据库，确定该第三特征值对应的目标特征的类型。该特征值数据库包括特征向量和特征内容的对应关系，该特征数据库中的特征向量的也是通过上述过程得到的，在此就不必赘述。因此，可以从该特征数据库中找到与该第三特征值匹配的特征的类型，该与该第三特征向量匹配的特征的类型即是该第三特征值所对应的目标特征的类型。例如，该第三特征向量是用于描述“头发”这一特征的特征向量，可以根据该特征数据库中特征向量与特征的类型的对应关系，确定“头发”这一特征的具体内容，例如，可以根据特征向量以及对应于头发颜色的分类模型确定由该第三特征向量所描述的头发的颜色。利用特征向量和特征数据库的具体过程与现有技术类似，在此就不必赘述。再如，还可以根据该第三特征向量构造特征数据库，以便利用该特征数据库对其他特征向量进行特征识别。构造特征数据库的过程与现有构造数据库的过程类似，在此就不必赘述。但是，由于对应于目标特征的特征向量集合从浮点数被转换为二进制数，且对应于该目标特征的特征向量的维度也降低了，在进行检索时需要使用的特征值也就减少了。因此，可以提高进行特征检索时的速度。同时，由于特征数据库也是采用同样的方法构造的，因此，该特征数据库的所占的存储空间也会相应减小。

图2是根据本发明实施例提供的用于处理人脸特征数据的装置的结构框图。图2所示的装置能够执行图1所示的各个步骤。如图2所示装置200包括特征提取单元201、第一确定单元202、第二确定单元203和第三确定单元204。

特征提取单元201，用于对人脸特征进行提取，确定目标特征并获取对应于该目标特征的第一特征向量，其中该第一特征向量包括N个特征值，该第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数。

第一确定单元202，用于确定对应于该第一特征向量的第二特征向量，该第二特征向量包括M个特征值，M等于N，该第二特征向量中的M个特征值与该第一特征向量的N个特征值一一对应，该第二特征向量中的每个特征值为二进制数。

第二确定单元203，用于从该第二特征向量中选择K个特征值组成第三特征向量，K为小于M的正整数。

根据图2所示的装置，对应于目标特征的特征向量集合从浮点数被转换为二进制数，且对应于该目标特征的特征向量的维度也降低了。这样，可以减少保存该目标特征的特征值所占用的空间。此外，由于特征值集合的维度降低了，在进行检索时需要使用的特征值也就减少了。因此，可以提高进行特征检索时的速度。

可选的，第一确定单元202，具体用于将第N_i个特征值进行二进制转换，获得二进制化的第N_i个特征值，其中该二进制化的第N_i个特征值由P位数组成，该第N_i个特征值是该N个特征值中的第i个特征值，其中P为小于256的正整数；从该P位数中选择Q位数组成第M_i个特征值，其中该第Mi个特征值是该第二特征向量中的第i个特征值，Q为小于P的正整数，i＝1,2,…,N。

可选的，第一确定单元202，具体用于根据压缩模板，确定该P位数中的Q个位置；确定使用该Q个位置的数值组成该第M_i个特征值。

可选的，第一确定单元202，还用于获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个向量特征向量，该S个训练特征向量中的每个训练特征向量包括M个特征值；将该每个训练特征向量的每个特征值进行二进制转换，确定二进制化后的该每个训练特征向量的每个特征值，其中该二进制化的该每个训练特征向量的该每个特征值由P位数组成；确定P个二进制位统计值，该P个二进制位统计值中的第i个二进制位统计值表示该二进制化的该P个训练特征向量中的所有特征值在该P位数中的第i位数的和；确定该P个二进制位统计值中最大的Q个二进制为统计值所对应的数的位置为所述压缩模板。

可选的，第二确定单元203，具体用于根据降维模板，从该第二特征向量中选择K个特征值组成该第三特征向量。

可选的，第二确定单元203，还用于获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；根据该训练特征向量集合中的舍弃特征值的维度，确定该降维模板，其中，该训练特征向量集合与第一集合的均方误差最小，其中该第一集合由所述S个特征训练特征向量的特征值中除该舍弃特征值以外的特征值组成。需要注意的是，用于获取降维模板的训练特征向量集合和用于获取该压缩模板的训练特征向量集合是同一个训练特征向量集合。

可选的，作为一个实施例，装置200还包括：第三确定单元204，用于根据该第三特征向量和特征值数据库，确定该第三特征值对应的目标特征的类型，其中该特征数据库包括特征向量与特征的类型的对应关系。

可选的，作为另一个实施例，装置200还包括：第四确定单元205，用于根据该第三特征向量构造特征数据库，以便利用该特征数据库对其他特征向量进行特征识别。

图3是根据本发明实施例提供的用于处理人脸特征数据的装置的结构框图。图3所示的装置能够执行图1所示的各个步骤。如图3所示装置300包括处理器301和存储器302。

网络设备300中的各个组件通过总线系统303耦合在一起，其中总线系统303除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线系统303。

上述本发明实施例揭示的方法可以应用于处理器301中，或者由处理器301实现。处理器301可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器301中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器301可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(Random Access Memory，RAM)、闪存、只读存储器(Read-Only Memory，ROM)、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器302，处理器301读取存储器302中的指令，结合其硬件完成上述方法的步骤。

处理器301，用于对人脸特征进行提取获取对应于目标特征的第一特征向量，其中该第一特征向量包括N个特征值，该第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数。

处理器301，用于确定对应于该第一特征向量的第二特征向量，该第二特征向量包括M个特征值，M等于N，该第二特征向量中的M个特征值与该第一特征向量的N个特征值一一对应，该第二特征向量中的每个特征值为二进制数。

处理器301，用于从该第二特征向量中选择K个特征值组成第三特征向量，K为小于M的正整数。

根据图3所示的装置，对应于目标特征的特征向量集合从浮点数被转换为二进制数，且对应于该目标特征的特征向量的维度也降低了。这样，可以减少保存该目标特征的特征值所占用的空间。此外，由于特征值集合的维度降低了，在进行检索时需要使用的特征值也就减少了。因此，可以提高进行特征检索时的速度。

可选的，处理器301，具体用于将第N_i个特征值进行二进制转换，获得二进制化的第N_i个特征值，其中该二进制化的第N_i个特征值由P位数组成，该第N_i个特征值是该N个特征值中的第i个特征值，其中P为小于356的正整数；从该P位数中选择Q位数组成第M_i个特征值，其中该第Mi个特征值是该第二特征向量中的第i个特征值，Q为小于P的正整数，i＝1,2,…,N。

可选的，处理器301，具体用于根据压缩模板，确定该P位数中的Q个位置；确定使用该Q个位置的数值组成该第M_i个特征值。

可选的，处理器301，还用于获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个向量特征向量，该S个训练特征向量中的每个训练特征向量包括M个特征值；将该每个训练特征向量的每个特征值进行二进制转换，确定二进制化后的该每个训练特征向量的每个特征值，其中该二进制化的该每个训练特征向量的该每个特征值由P位数组成；确定P个二进制位统计值，该P个二进制位统计值中的第i个二进制位统计值表示该二进制化的该P个训练特征向量中的所有特征值在该P位数中的第i位数的和；确定该P个二进制位统计值中最大的Q个二进制为统计值所对应的数的位置为所述压缩模板。

可选的，处理器301，具体用于根据降维模板，从该第二特征向量中选择K个特征值组成该第三特征向量。

可选的，处理器301，还用于获取对应于该目标特征的训练特征向量集合，该训练特征向量集合包括S个训练特征向量；根据该训练特征向量集合中的舍弃特征值的维度，确定该降维模板，其中，该训练特征向量集合与第一集合的均方误差最小，其中该第一集合由所述S个特征训练特征向量的特征值中除该舍弃特征值以外的特征值组成。需要注意的是，用于获取降维模板的训练特征向量集合和用于获取该压缩模板的训练特征向量集合是同一个训练特征向量集合。

可选的，作为一个实施例，处理器301，还可以用于根据该第三特征向量和特征值数据库，确定该第三特征值对应的目标特征的类型，其中该特征值数据库包括特征向量与特征的类型的对应关系。

可选的，作为另一个实施例，处理器301，还可以用于根据该第三特征向量构造特征数据库，以便利用该特征数据库对其他特征向量进行特征识别。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内，因此本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种处理人脸特征数据的方法，其特征在于，所述方法，包括：

对人脸特征进行提取，确定目标特征并获取对应于所述目标特征的第一特征向量，其中所述第一特征向量包括N个特征值，所述第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数；

确定对应于所述第一特征向量的第二特征向量，所述第二特征向量包括M个特征值，M等于N，所述第二特征向量中的M个特征值与所述第一特征向量的N个特征值一一对应，所述第二特征向量中的每个特征值为二进制数；

从所述第二特征向量中选择K个特征值组成第三特征向量，K为小于M的正整数。

2.如权利要求1所述的方法，其特征在于，所述确定对应于所述第一特征向量的第二特征向量，包括：

将第N_i个特征值进行二进制转换，获得二进制化的第N_i个特征值，其中所述二进制化的第N_i个特征值由P位数组成，所述第N_i个特征值是所述N个特征值中的第i个特征值；

从所述P位数中选择Q位数组成第M_i个特征值，其中所述第M_i个特征值是所述第二特征向量中的第i个特征值，P和Q均为正整数且Q小于P，i＝1,2,…,N。

3.如权利要求2所述的方法，其特征在于，从所述P位数中选择Q位数组成第M_i个特征值，包括：

根据压缩模板，确定所述P位数中的Q个位置；

确定使用所述Q个位置的数值组成所述第M_i个特征值。

4.如权利要求3所述的方法，其特征在于，所述压缩模板是根据以下方式获取的：

获取对应于所述目标特征的训练特征向量集合，所述训练特征向量集合包括S个训练特征向量；

将所述S个训练特征向量中的每个训练特征向量进行二进制转换，确定二进制化的所述每个训练特征向量的每个特征值，其中所述二进制化的所述每个训练特征向量的所述每个特征值由P位数组成；

确定P个二进制位统计值，所述P个二进制位统计值中的第p个二进制位统计值表示所述二进制化的所述S个训练特征向量中的所有特征值在所述P位数中的第p位数的和；

确定所述P个二进制位统计值中最大的Q个二进制位统计值所对应的数的位置为所述压缩模板。

5.如权利要求1至4中任一项所述的方法，其特征在于，所述确定第三特征向量，包括：

根据降维模板，从所述第二特征向量中选择K个特征值组成所述第三特征向量。

6.如权利要求5所述的方法，其特征在于，所述降维模板是通过以下方式确定的：

根据所述训练特征向量集合中的舍弃特征值的维度，确定所述降维模板，其中，所述训练特征向量集合与第一集合的均方误差最小，其中所述第一集合由所述S个特征训练特征向量的特征值中除所述舍弃特征值以外的特征值组成。

7.如权利要求1至6中所述的方法，其特征在于，所述方法还包括：

根据所述第三特征向量和特征值数据库，确定所述第三特征值对应的目标特征的类型，其中所述特征值数据库包括特征向量与特征的类型的对应关系。

8.一种用于处理人脸特征数据的装置，其特征在于，所述装置包括：

特征提取单元，用于对人脸特征进行提取，确定目标特征并获取对应于所述目标特征的第一特征向量，其中所述第一特征向量包括N个特征值，所述第一特征向量中的每个特征值为大于0且小于1的数，N为大于或等于1的正整数；

第一确定单元，用于确定对应于所述第一特征向量的第二特征向量，所述第二特征向量包括M个特征值，M等于N，所述第二特征向量中的M个特征值与所述第一特征向量的N个特征值一一对应，所述第二特征向量中的每个特征值为二进制数；

第二确定单元，用于从所述第二特征向量中选择K个特征值组成第三特征向量，K为小于M的正整数。

9.如权利要求8所述的装置，其特征在于，所述第一确定单元，具体用于将第N_i个特征值进行二进制转换，获得二进制化的第N_i个特征值，其中所述二进制化的第N_i个特征值由P位数组成，所述第N_i个特征值是所述N个特征值中的第i个特征值，其中P为小于256的正整数；从所述P位数中选择Q位数组成第M_i个特征值，其中所述第M_i个特征值是所述第二特征向量中的第i个特征值，Q为小于P的正整数，i＝1,2,…,N。

10.如权利要求9所述的装置，其特征在于，所述第一确定单元，具体用于根据压缩模板，确定所述P位数中的Q个位置；确定使用所述Q个位置的数值组成所述第M_i个特征值。

11.如权利要求10所述的装置，其特征在于，所述第一确定单元，还用于获取对应于所述目标特征的训练特征向量集合，所述训练特征向量集合包括S个训练特征向量；将所述S个训练特征向量中的每个训练特征向量进行二进制转换，确定二进制化的所述每个训练特征向量的每个特征值，其中所述二进制化的所述每个训练特征向量的所述每个特征值由P位数组成；确定P个二进制位统计值，所述P个二进制位统计值中的第p个二进制位统计值表示所述二进制化的所述P个训练特征向量中的所有特征值在所述P位数中的第p位数的和；确定所述P个二进制位统计值中最大的Q个二进制位统计值所对应的数的位置为所述压缩模板。

12.如权利要求8至11中任一项所述的装置，其特征在于，所述第二确定单元，具体用于根据降维模板，从所述第二特征向量中选择K个特征值组成所述第三特征向量。

13.如权利要求12所述的装置，其特征在于，所述第二确定单元，还用于获取对应于所述目标特征的训练特征向量集合，所述训练特征向量集合包括S个训练特征向量；根据所述训练特征向量集合中的舍弃特征值的维度，确定所述降维模板，，其中，所述训练特征向量集合与第一集合的均方误差最小，其中所述第一集合由所述S个特征训练特征向量的特征值中除所述舍弃特征值以外的特征值组成。

14.如权利要求8至13中任一项所述的装置，其特征在于，所述装置还包括：第三确定单元，用于根据所述第三特征向量和特征值数据库，确定所述第三特征值对应的目标特征的类型，其中所述特征值数据库包括特征向量与特征的类型的对应关系。