CN111985336A

CN111985336A - 人脸图像聚类方法、装置、计算机设备和存储介质

Info

Publication number: CN111985336A
Application number: CN202010708111.3A
Authority: CN
Inventors: 李喆; 陈子涵; 王东骥; 赵世祥; 胡佳新; 宋书生; 吴中
Original assignee: Shenzhen Power Supply Bureau Co Ltd
Current assignee: Shenzhen Power Supply Bureau Co Ltd
Priority date: 2020-07-22
Filing date: 2020-07-22
Publication date: 2020-11-24

Abstract

本申请涉及一种人脸图像聚类方法、装置、计算机设备和存储介质。方法包括：获取待聚类的人脸图像集合对应的人脸向量集合；对所述人脸向量集合进行主成分分析运算，得到特征向量集合；对所述特征向量集合进行运算，得到距离矩阵和投影矩阵；所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度；根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化，直至所述距离矩阵和所述投影矩阵满足优化停止条件；所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束；基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。采用本方法能够提高人脸图像聚类准确性。

Description

人脸图像聚类方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种人脸图像聚类方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术的发展，人脸图像聚类技术在司法鉴定、住宅监控和人脸检索等领域中有广泛的应用。人脸图像聚类技术是将未标注的人脸数据集中的人脸图像划分为不同的类别。现有的人脸图像聚类方法对人脸图像分类的错误率较高，聚类误差较大。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高人脸图像聚类准确性的人脸图像聚类方法、装置、计算机设备和存储介质。

一种人脸图像聚类方法，所述方法包括：

获取待聚类的人脸图像集合对应的人脸向量集合；

对所述人脸向量集合进行主成分分析运算，得到特征向量集合；

对所述特征向量集合进行运算，得到距离矩阵和投影矩阵；所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度；

根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化，直至所述距离矩阵和所述投影矩阵满足优化停止条件；所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束；

基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。

在一个实施例中，所述获取待聚类的人脸图像集合对应的人脸向量集合包括：

对于待聚类的人脸图像集合中的每个人脸图像，将每列的像素值顺序拼接为人脸向量，获得各所述人脸图像的人脸向量构成的人脸向量集合；或者，

对于待聚类的人脸图像集合中的每个人脸图像，将每行的像素值顺序拼接为人脸向量，获得各所述人脸图像的人脸向量构成的人脸向量集合。

在一个实施例中，所述对所述人脸向量集合进行主成分分析运算，得到特征向量集合包括：

计算所述人脸向量集合的协方差矩阵；

计算所述协方差矩阵的特征值；

选取一部分的特征值对应的特征向量组成所述协方差矩阵的特征矩阵；

根据所述特征矩阵对所述人脸向量集合进行运算，得到所述特征向量集合。

在一个实施例中，所述先验条件包括空间紧密先验条件和稀疏表示先验条件；

所述空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

其中，W为距离矩阵，W_ij为距离矩阵的第i行第j列的元素，P为投影矩阵，y_i为所述特征向量集合中的第i列向量，y_j为所述特征向量集合中的第j列向量，Z为中间矩阵，I是单位矩阵，|Z|和|Z^T|分别表示计算Z和Z^T的模，||P^Ty_i-P^Ty_j||_F表示计算P^Ty_i-P^Ty_j的F范数，i为大于或者等于1的正整数，j为大于或者等于1的正整数；

所述稀疏表示先验条件为：在满足Y＝YZ,diag(Z)＝0的条件下计算||Z||₁；其中，Y为所述特征向量集合,diag(Z)＝0表示Z的对角线上元素为0，||Z||₁为Z的L₁范数；

根据所述先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。

在一个实施例中，所述根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化包括：

基于所述优化函数对所述投影矩阵进行优化，得到优化后的投影矩阵；

基于所述优化函数和所述优化后的投影矩阵对所述距离矩阵进行优化。

在一个实施例中，所述基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类包括：

以所述人脸向量集合中的人脸向量为节点，以所述距离矩阵中元素为对应节点间的权值，构建所述人脸向量集合的相似度权重图；

对所述相似度权重图进行分割，得到所述待聚类的人脸图像集合的聚类结果。

在一个实施例中，所述对所述相似度权重图进行分割，得到所述待聚类的人脸图像集合的聚类结果包括：

获取所述相似度权重图的分割向量；

基于所述分割向量将所述相似度权重图分割为两个子图；

当所述子图不满足分割停止条件时，基于不满足分割停止条件的所述子图的分割向量，继续对所述子图进行分割，直至分割后的所述相似度权重图的所有子图满足分割停止条件；

根据停止分割时所述相似度权重图的分割结果，得到所述待聚类的人脸图像集合的聚类结果。

一种人脸图像聚类装置，所述装置包括：

获取模块，用于获取待聚类的人脸图像集合对应的人脸向量集合；

主成分分析模块，用于对所述人脸向量集合进行主成分分析运算，得到特征向量集合；

运算模块，用于对所述特征向量集合进行运算，得到距离矩阵和投影矩阵；所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度；

迭代优化模块，用于根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化，直至所述距离矩阵和所述投影矩阵满足优化停止条件；所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束；

聚类模块，用于基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。

在一个实施例中，所述获取模块还用于：

在一个实施例中，所述主成分分析模块还用于：

计算所述人脸向量集合的协方差矩阵；

计算所述协方差矩阵的特征值；

所述空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

根据所述先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。

在一个实施例中，所述迭代优化模块还用于：

在一个实施例中，所述聚类模块还包括：

构建子模块，用于以所述人脸向量集合中的人脸向量为节点，以所述距离矩阵中元素为对应节点间的权值，构建所述人脸向量集合的相似度权重图；

分割子模块，用于对所述相似度权重图进行分割，得到所述待聚类的人脸图像集合的聚类结果。

在一个实施例中，所述分割子模块还用于：

获取所述相似度权重图的分割向量；

基于所述分割向量将所述相似度权重图分割为两个子图；

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现所述人脸图像聚类方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现所述人脸图像聚类方法的步骤。

上述实施例中，计算机设备通过对待聚类的人脸图像集合对应的人脸向量集合进行主成分分析运算，得到特征向量集合。并根据特征向量集合获取距离矩阵，距离矩阵中元素为特征向量集合中对应的特征向量之间的相似度。然后计算机设备根据基于先验条件构造的优化函数对距离矩阵进行优化。由于根据先验条件优化后的距离矩阵中元素的元素值能够更精确的表示特征向量之间的相似度，所以基于优化后的距离矩阵对待聚类的人脸图像集合进行聚类的聚类结果更加准确。

附图说明

图1为一个实施例中人脸图像聚类方法的应用环境图；

图2为一个实施例中人脸图像聚类方法的流程示意图；

图3为另一个实施例中人脸图像聚类方法的流程示意图；

图4a为当人脸图像类别数c＝2时，投影矩阵P_t的列向量个数l分别取5c、4c、3c、2c时，函数Φ的数值与迭代次数t之间的关系示意图；

图4b为当人脸图像类别数c＝3时，投影矩阵P_t的列向量个数l分别取5c、4c、3c、2c时，函数Φ的数值与迭代次数t之间的关系示意图；

图4c为当人脸图像类别数c＝5时，投影矩阵P_t的列向量个数l分别取5c、4c、3c、2c时，函数Φ的数值与迭代次数t之间的关系示意图；

图4d为当人脸图像类别数c＝8时，投影矩阵P_t的列向量个数l分别取5c、4c、3c、2c时，函数Φ的数值与迭代次数t之间的关系示意图；

图4e为当人脸图像类别数c＝10时，投影矩阵P_t的列向量个数l分别取5c、4c、3c、2c时，函数Φ的数值与迭代次数t之间的关系示意图；

图5为一个实施例中人脸图像聚类装置的结构框图；

图6为另一个实施例中人脸图像聚类装置的结构框图；

图7为一个实施例中计算机设备的内部结构图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的人脸图像聚类方法，可以应用于如图1所示的应用环境中。其中，计算机设备102基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。其中，计算机设备102可以是终端，也可以是服务器。终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种人脸图像聚类方法，以该方法应用于图1中的计算机设备为例进行说明，包括以下步骤：

S202，获取待聚类的人脸图像集合对应的人脸向量集合。

人脸图像聚类是将未作标记的人脸图像划分为不同的类别，例如老人、年轻人、中年人、小孩、男人、女人等。

其中，待聚类的人脸图像集合是所有待聚类的人脸图像组成的集合。待聚类的人脸图像可以为通过不同图像采集设备采集的图像，或者可以为通过不同视频采集设备采集的视频数据中抽取的帧图像。

计算机设备对人脸图像集合中的人脸图像中的像素值进行排列生成人脸向量。所有人脸图像对应的人脸向量组成人脸向量集合。假设待聚类的人脸图像集合为{X₁,X₂,X₃,...,X_n}，获取的人脸向量集合为{x₁,x₂,x₃,...,x_n}。

S204，对人脸向量集合进行主成分分析运算，得到特征向量集合。

其中，主成分分析运算是一种降维算法，通过正交变换将高维度的人脸向量集合转换为低维度的特征向量集合。其中特征向量集合中的各个特征向量线性不相关，并且能够反映人脸向量集合的主要特征信息。

计算机设备对人脸向量集合{x₁,x₂,x₃,...,x_n}进行主成分分析运算，得到特征向量集合Y＝{y₁,y₂,…,y_n}，并根据{y₁,y₂,…,y_n}构成的矩阵[y₁,y₂,…,y_n]构成原空间。

计算机设备通过对人脸向量集合进行主成分分析运算可以去除人脸向量集合中的冗余向量，得到的特征向量集合不仅能够保留人脸向量集合中的特征信息，而且具有比人脸向量集合更低的维度，降低了计算的复杂度。

S206，对特征向量集合进行运算，得到距离矩阵和投影矩阵；距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度。

其中，投影矩阵P是计算机设备对特征向量集合进行运算得到的降维矩阵。计算机设备根据投影矩阵构成的线性函数f＝P^T将原空间中的特征向量集合{y₁,y₂,…,y_n}投影到低维度的隐空间，其中投影矩阵构造的矩阵[P^Ty₁,P^Ty₂,…,P^Ty_n]构成隐空间。

S208，计算机设备根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化，直至距离矩阵和投影矩阵满足优化停止条件；优化停止条件是距离矩阵和投影矩阵之间的约束。

其中，先验条件是使距离矩阵和投影矩阵满足：根据投影矩阵将原空间中特征向量降维到隐空间后，使距离矩阵中元素表示的同类别的人脸图像的特征向量之间的相似度大于预设的阈值，并且不同类别的人脸图像的特征向量的相似度小于预设的阈值。

其中，优化停止条件是计算机设备设置的根据距离矩阵和投影矩阵之间的约束终止优化迭代过程的条件。在距离矩阵和投影矩阵之间满足约束关系时，计算机设备停止对距离矩阵和投影矩阵的优化迭代。

S210，基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。

计算机设备在对距离矩阵进行优化后，满足优化停止条件时的距离矩阵表示的人脸特征向量之间的相似度能够满足先验条件。计算机设备基于该距离矩阵，对待聚类的人脸图像集合进行聚类。

在一个实施例中，计算机设备获取待聚类的人脸图像集合对应的人脸向量集合包括：对于待聚类的人脸图像集合中的每个人脸图像，将每列的像素值顺序拼接为人脸向量，获得各人脸图像的人脸向量构成的人脸向量集合；或者，对于待聚类的人脸图像集合中的每个人脸图像，将每行的像素值顺序拼接为人脸向量，获得各人脸图像的人脸向量构成的人脸向量集合。

计算机设备将二维空间中的人脸图像拼接为人脸向量方便在接下来的处理步骤中对人脸向量进行计算。

在一个实施例中，计算机设备对人脸向量集合进行主成分分析运算，得到特征向量集合包括：计算人脸向量集合的协方差矩阵；计算协方差矩阵的特征值；选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵；根据特征矩阵对人脸向量集合进行运算，得到特征向量集合。

在一个实施例中，计算机设备对人脸向量集合进行主成分分析运算，得到特征向量集合包括以下步骤：

(a)根据公式(1)计算人脸向量集合中的人脸向量的平均向量

其中x_i是第i个人脸向量，n是人量向量的总个数。

(b)根据计算得到的平均向量

通过公式(2)计算人脸向量集合的协方差矩阵G。

(c)计算协方差矩阵G的特征值{λ₁,λ₂,…λ_n}和特征向量{u₁,u₂,…,u_n}，其中λ₁≥λ₂≥…≥λ_n。在一个实施例中，选择前面的d个特征值对应的特征向量u₁,u₂,…,u_d构成特征矩阵U＝[u₁,u₂,…,u_d]^T。

(d)根据公式(3)计算人脸向量x_i的特征向量y_i，并得到特征向量集合y＝{y₁,y₂,…,y_n}。

y_i＝Ux_i,i＝1,2,…,n (3)

在一个实施例中，先验条件包括空间紧密先验条件和稀疏表示先验条件。

空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

其中，W为距离矩阵，W_ij为距离矩阵的第i行第j列的元素，P为投影矩阵，y_i为特征向量集合中的第i列向量，y_j为特征向量集合中的第j列向量，Z为中间矩阵，I是单位矩阵，|Z|和|Z^T|分别表示计算Z和Z^T的模，||P^Ty_i-P^Ty_j||_F表示计算P^Ty_i-P^Ty_j的F范数，i为大于或者等于1的正整数，j为大于或者等于1的正整数；

稀疏表示先验条件为：在满足Y＝YZ,diag(Z)＝0的条件下计算||Z||₁；其中，Y为特征向量集合,diag(Z)＝0表示Z的对角线上元素为0，||Z||₁为Z的L₁范数；

根据先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。例如，计算机设备设置λ＝7.5×10^-2，ζ＝5。

在一个实施例中，优化停止条件是优化后的投影矩阵和距离矩阵满足|Φ(W_t,Z_t,P_t)-Φ(W_t+1,Z_t+1,P_t+1)|/Φ(W_t+1,Z_t+1,P_t+1)＜ε。其中，t表示经过t次优化迭代，

其中，ε是预设阈值，计算机设备设置的ε越小，得到的距离矩阵中的元素可以更精确的表示特征向量之间的相似度，但是设置的ε越小，需要进行的优化迭代次数越多，计算复杂度越高。计算机设备可以根据待聚类的人脸图像的类别数或者人脸图像的分辨率设置ε。例如，计算机设备可以设置ε和待聚类的人脸图像的类别线性正相关。例如，计算机设备设置ε和待聚类的人脸图像的分辨率线性负相关。在一个实施例中，计算机设备设置ε＝10^-5。

在一个实施例中，计算机设备根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化包括：基于优化函数对投影矩阵进行优化，得到优化后的投影矩阵；基于优化函数和优化后的投影矩阵对距离矩阵进行优化。

计算机设备根据优化函数进行推导，将对距离矩阵的优化过程分为两个步骤。首先，计算机设备固定优化函数中的中间矩阵Z和距离矩阵W，根据基于空间紧密先验条件推导得到的优化算法对投影矩阵P进行优化。然后根据基于稀疏表示先验条件推导得到的优化算法，根据优化后的投影矩阵P对距离矩阵W进行优化。

在一个实施例中，计算机设备设置中间矩阵Z的初始矩阵为Z₀，距离矩阵W的初始矩阵为W₀，投影矩阵P的初始矩阵为P₀。计算机设备将Z₀的对角线上的元素删除后得到(n-1)×n的子矩阵

设置

为

的第i列，并且将特征向量集合中的第i列特征向量y_i删除后得到剩余的特征向量组成的矩阵

然后，根据公式

计算

其中

表示计算伪逆，由此得到矩阵Z₀除对角线上元素之外的所有元素。最后，计算机设备根据计算得到的

并将Z₀对角线元素置零得到中间矩阵的初始矩阵Z₀。计算机设备根据

得到距离矩阵W的初始矩阵W₀，其中，|Z₀|表示Z₀的所有元素取绝对值。

在得到中间矩阵和距离矩阵的初始矩阵之后，根据基于空间紧密先验条件推导得到的算法计算投影矩阵。

计算机设备首先求解矩阵YL₀Y^T的特征值{λ₀₁,λ₀₂,...,λ_0n}和对应的特征向量{p₀₁,p₀₂,...,p_0n}，其中

其中，L₀＝D₀-W₀，Y是特征向量集合

组成的矩阵，D₀为对角线上元素为

的对角矩阵。W_0,ij为矩阵W₀的第i行第j列元素，表示特征向量集合中的第i个特征向量和第j个特征向量之间的相似度。计算机设备将{p₀₁,p₀₂,...,p_0n}中前l个特征向量组成投影矩阵的初始矩阵P₀＝[p₀₁,p₀₂,…,p_0l]。

在得到投影矩阵的初始矩阵P₀之后，计算机设备根据基于稀疏表示先验条件推导得到的算法计算W₁和Z₁。

计算机设备设置t＝0，其中t为优化迭代的次数，在满足diag(Z_t+1)＝0，也就是使Z_t+1的对角线上元素为0的条件下，求解函数

其中||·||_F表示求F范数，

A∈R^n×n非负对称阵，

其中λ为第一预设变量，ζ为第二预设变量，例如计算机设备设置λ＝7.5×10^-2，ζ＝5。

计算机设备在获取P₀后，利用截断牛顿内点方法、牛顿内点法或者障碍函数法等基于范数的优化问题求解方法，在满足diag(Z_t+1)＝0的条件下，求解函数

得到W₁和Z₁。

然后计算机设备使t＝1并求解矩阵YL_tY^T的特征值{λ_t1,λ_t2,…,λ_tn}和对应的特征向量{P_t1,P_t2,…,P_tn}，λ_t1≤λ_t2≤…≤λ_tn，将前l个特征向量组成投影矩阵P_t＝[P_t1,P_t2,…,P_tl]，得到P₁。其中L_t＝D_t-W_t，D_t为对角阵对角线上元素为

W_t,ij为矩阵W_t第i行第j列元素。

计算机设备根据W₁和Z₁得到P₁，并判断W₀、Z₀、P₀和W₁、Z₁、P₁是否满足优化停止条件|Φ(W₀,Z₀,P₀)-Φ(W₁,Z₁,P₁)|/Φ(W₁,Z₁,P₁)＜ε，如果满足，则使W＝W₁，并基于W对待聚类的人脸图像集合进行聚类。如果不满足，则根据P₁按照上述方法得到W₂和Z₂，并判断W₁、Z₁、P₁和W₂、Z₂、P₂是否满足优化停止条件Φ(W₁,Z₁,P₁)-Φ(W₂,Z₂,P₂)|/Φ(W₂,Z₂,P₂)＜ε，如此循环，直到得到的W_t、Z_t、P_t和W_t+1、Z_t+1、P_t+1满足|Φ(W_t,Z_t,P_t)-Φ(W_t+1,Z_t+1,P_t+1)|/Φ(W_t+1,Z_t+1,P_t+1)＜ε，设置W＝W_t+1并基于距离矩阵W对待聚类的人脸图像集合进行聚类。

计算机设备将优化过程分为两个部分，首先根据基于空间紧密先验条件推导得到的算法对投影矩阵进行优化，然后根据基于稀疏表示先验条件推导得到的算法对距离矩阵进行优化。计算机设备将优化过程分为两个步骤，对投影矩阵和距离矩阵交替进行优化，优化过程中采用基于范数的优化问题求解方法求解优化问题，能够使优化过程快速收敛，提高计算速度。

在一个实施例中，基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类包括：以人脸向量集合中的人脸向量为节点，以距离矩阵中元素为对应节点间的权值，构建人脸向量集合的相似度权重图；对相似度权重图进行分割，得到待聚类的人脸图像集合的聚类结果。

其中，相似度权重图是带权无向图，设置相似度权重图为G(V,E)，其中V为节点集合，V＝{x₁,x₂,…,x_n}，E为节点之间边的集合，各个边对应的权值为W中元素的元素值。W_ij表示第i个人脸向量和第j个人脸向量之间的相似度。

由于相似度权重图中连接同一类别的人脸图像的边对应的权值较大，连接不同类别的人脸图像的边对应的权值较小，所以计算机设备根据相似度权重图中各条边上的权值将相似度权重图分割为多个子图，分割结果即为待聚类的人脸图像集合的聚类结果。

在一个实施例中，计算机设备对相似度权重图进行分割，得到待聚类的人脸图像集合的聚类结果包括：获取相似度权重图的分割向量；基于分割向量将相似度权重图分割为两个子图；当子图不满足分割停止条件时，基于不满足分割停止条件的子图的分割向量，继续对子图进行分割，直至分割后的相似度权重图的所有子图满足分割停止条件；根据停止分割时相似度权重图的分割结果，得到待聚类的人脸图像集合的聚类结果。

其中，分割向量是对相似度权重图进行分割的向量。计算机设备基于分割向量对相似度权重图分割后，使划分在相同子图中的节点之间的边对应的权值大于预设的权值阈值，并且使划分在不同子图中的节点之间的边对应的权值小于预设的权值阈值。

其中，分割停止条件是计算机设备设置的终止对相似度权重图的子图进行分割的条件。例如，分割停止条件是子图中的节点数下降到预设节点数值。或者分割停止条件是同一子图中节点间权值的方差减小到预设方差值。或者分割停止条件是同一子图间的权值差达到预设差值。

在一个实施例中，计算机设备根据归一化分割算法对相似度权重图进行分割，包括如下步骤：

(a)根据广义特征值算法获取分割向量。

计算机设备首先求解满足函数

的λ的集合{λ₁,λ₂...λ_n}，且λ₁≤λ₂≤,...,≤λ_n。其中，λ为矩阵(D-W)相对于矩阵D的特征值，而与λ_i相对应的非零解

为λ_i的特征向量。其中D为对角矩阵，其对角线上元素为

W_ij为W在第i行第j列的元素。计算机设备设置λ的集合{λ₁,λ₂...λ_n}中次小特征值λ₂对应的特征向量

为分割向量。

(b)计算机设备根据分割向量将带权无向图G(V,E)分割成两个子图。

(c)如果子图不满足分割停止条件，则根据子图构造的函数

获取子图的特征向量，并根据子图的特征向量对子图进行分割，直到分割后的所有子图满足分割停止条件。

计算机设备根据归一化分割算法对相似度权重图进行分割，可以避免分割出孤立节点的情况。

在一个实施例中，如图3所示，计算机设备对待聚类人脸图像进行聚类包括以下步骤：

S302，获取人脸向量。

S304，对人脸向量集合进行主成分分析运算，得到特征向量集合，特征向量构造的矩阵构成原空间。

S306，对特征向量集合进行运算，得到距离矩阵的初始矩阵和投影矩阵的初始矩阵。

S308，根据基于空间紧密先验条件推导得到的算法对投影矩阵进行优化，投影矩阵将特征向量投影到隐空间。

S310，根据基于稀疏表示先验条件推导得到的算法对距离矩阵进行优化。

S312，判断是否满足优化停止条件。如果满足满足优化停止条件则执行S314，如果不满足优化停止条件，则返回执行S308。

S314，根据人脸向量和距离矩阵构造相似度权重图。

S316，根据归一化分割算法对相似度权重图进行分割。

S318，输出待聚类人脸图像的聚类结果。

S302至S318的具体内容可以参考上文所述的具体实现过程。

在一个实施例中，计算机设备根据S302至S318的具体算法对耶鲁人脸B数据集进行聚类，耶鲁人脸B数据集包括38个人，每人64幅人脸图像，总共2432幅待聚类人脸图像，构成待聚类的人脸图像集合。对比算法包括：SSC(Sparse Subspace Clustering，稀疏子空间聚类)算法、LRR(Low-Rank Representation，低秩表示)算法、LSR1(Least SquaresRegression，最小二乘递归1)算法、LSR2(Least Squares Regression，最小二乘递归2)算法和LPP(Locality Preserving Projection，空间紧密先验)算法。计算机设备根据公式(4)计算聚类误差：

计算机设备首先将人脸图像大小变为32×32，将人脸图像类别数设为

将主成分分析得到的特征向量个数设为d＝c×6，设置ε＝10^-5，λ＝7.5×10^-2，ζ＝5。投影矩阵P_t的列向量个数l设置与类别数c有关，设置l＝{5c,4c,3c,2c}，t为迭代次数。

计算机设备对SSC算法、LRR算法、LSR1算法、LSR2算法和LPP算法中参数的设置如表1所示。计算机设备根据S302至S318的算法对耶鲁人脸B数据集进行聚类时，在投影矩阵P_t的列向量个数l取不同数值时的聚类误差如表2所示。当c分别为2、3、5、8、10时，计算机设备根据不同人脸聚类算法计算得到的聚类误差如表3所示。计算机设备根据S302至S318的算法，在投影矩阵P_t的列向量个数l＝{5c,4c,3c,2c}，c分别为2、3、5、8、10时，计算得到的函数Φ(W,Z,P)的数值与迭代次数t的关系分别如图4a、4b、4c、4d、4e所示。

表1

表2

c	l＝5c(％)	l＝4c(％)	l＝3c(％)	l＝2c(％)
					2	0.78	0.78	0.78	0
3	1.04	0.52	1.56	1.56
					5	1.56	1.88	2.19	2.19
8	1.56	1.17	3.32	3.91
					10	2.81	1.56	11.88	16.41

表3

应该理解的是，虽然图1-3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-3中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种人脸图像聚类装置，包括：获取模块502、主成分分析模块504、运算模块506、迭代优化模块508和聚类模块510，其中：

获取模块502，用于获取待聚类的人脸图像集合对应的人脸向量集合；

主成分分析模块504，用于对人脸向量集合进行主成分分析运算，得到特征向量集合；

运算模块506，用于对特征向量集合进行运算，得到距离矩阵和投影矩阵；距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度；

迭代优化模块508，用于根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化，直至距离矩阵和投影矩阵满足优化停止条件；优化停止条件是距离矩阵和投影矩阵之间的约束；

聚类模块510，用于基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。

在一个实施例中，获取模块502还用于：

对于待聚类的人脸图像集合中的每个人脸图像，将每列的像素值顺序拼接为人脸向量，获得各人脸图像的人脸向量构成的人脸向量集合；或者，

对于待聚类的人脸图像集合中的每个人脸图像，将每行的像素值顺序拼接为人脸向量，获得各人脸图像的人脸向量构成的人脸向量集合。

在一个实施例中，主成分分析模块504还用于：

计算人脸向量集合的协方差矩阵；

计算协方差矩阵的特征值；

选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵；

根据特征矩阵对人脸向量集合进行运算，得到特征向量集合。

在一个实施例中，先验条件包括空间紧密先验条件和稀疏表示先验条件；

空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

根据先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。

在一个实施例中，迭代优化模块508还用于：

基于优化函数对投影矩阵进行优化，得到优化后的投影矩阵；

基于优化函数和优化后的投影矩阵对距离矩阵进行优化。

在一个实施例中，聚类模块510还包括：

构建子模块5102，用于以人脸向量集合中的人脸向量为节点，以距离矩阵中元素为对应节点间的权值，构建人脸向量集合的相似度权重图；

分割子模块5104，用于对相似度权重图进行分割，得到待聚类的人脸图像集合的聚类结果。

在一个实施例中，分割子模块5104还用于：

获取相似度权重图的分割向量；

基于分割向量将相似度权重图分割为两个子图；

当子图不满足分割停止条件时，基于不满足分割停止条件的子图的分割向量，继续对子图进行分割，直至分割后的相似度权重图的所有子图满足分割停止条件；

根据停止分割时相似度权重图的分割结果，得到待聚类的人脸图像集合的聚类结果。

关于人脸图像聚类装置的具体限定可以参见上文中对于人脸图像聚类方法的限定，在此不再赘述。上述人脸图像聚类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储人脸图像聚类数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种人脸图像聚类方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种人脸图像聚类方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图7、图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

获取待聚类的人脸图像集合对应的人脸向量集合；

对人脸向量集合进行主成分分析运算，得到特征向量集合；

对特征向量集合进行运算，得到距离矩阵和投影矩阵；距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度；

根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化，直至距离矩阵和投影矩阵满足优化停止条件；优化停止条件是距离矩阵和投影矩阵之间的约束；

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

计算人脸向量集合的协方差矩阵；

计算协方差矩阵的特征值；

在一个实施例中，处理器执行计算机程序时还实现以下步骤：先验条件包括空间紧密先验条件和稀疏表示先验条件；空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

根据先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。

基于优化函数和优化后的投影矩阵对距离矩阵进行优化。

以人脸向量集合中的人脸向量为节点，以距离矩阵中元素为对应节点间的权值，构建人脸向量集合的相似度权重图；

对相似度权重图进行分割，得到待聚类的人脸图像集合的聚类结果。

获取相似度权重图的分割向量；

基于分割向量将相似度权重图分割为两个子图；

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取待聚类的人脸图像集合对应的人脸向量集合；对人脸向量集合进行主成分分析运算，得到特征向量集合；对特征向量集合进行运算，得到距离矩阵和投影矩阵；距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度；根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化，直至距离矩阵和投影矩阵满足优化停止条件；优化停止条件是距离矩阵和投影矩阵之间的约束；基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对于待聚类的人脸图像集合中的每个人脸图像，将每列的像素值顺序拼接为人脸向量，得各人脸图像的人脸向量构成的人脸向量集合；或者，对于待聚类的人脸图像集合中的每个人脸图像，将每行的像素值顺序拼接为人脸向量，获得各人脸图像的人脸向量构成的人脸向量集合。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：计算人脸向量集合的协方差矩阵；计算协方差矩阵的特征值；选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵；根据特征矩阵对人脸向量集合进行运算，得到特征向量集合。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：先验条件包括空间紧密先验条件和稀疏表示先验条件；空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

其中，W为距离矩阵，W_ij为距离矩阵的第i行第j列的元素，P为投影矩阵，y_i为特征向量集合中的第i列向量，y_j为特征向量集合中的第j列向量，Z为中间矩阵，I是单位矩阵，|Z|和|Z^T|分别表示计算Z和Z^T的模，||P^Ty_i-P^Ty_j||_F表示计算P^Ty_i-P^Ty_j的F范数，i为大于或者等于1的正整数，j为大于或者等于1的正整数；稀疏表示先验条件为：在满足Y＝YZ,diag(Z)＝0的条件下计算||Z||₁；其中，Y为特征向量集合,diag(Z)＝0表示Z的对角线上元素为0，||Z||₁为Z的L₁范数；根据先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：基于优化函数对投影矩阵进行优化，得到优化后的投影矩阵；基于优化函数和优化后的投影矩阵对距离矩阵进行优化。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：以人脸向量集合中的人脸向量为节点，以距离矩阵中元素为对应节点间的权值，构建人脸向量集合的相似度权重图；对相似度权重图进行分割，得到待聚类的人脸图像集合的聚类结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取相似度权重图的分割向量；基于分割向量将相似度权重图分割为两个子图；当子图不满足分割停止条件时，基于不满足分割停止条件的子图的分割向量，继续对子图进行分割，直至分割后的相似度权重图的所有子图满足分割停止条件；根据停止分割时相似度权重图的分割结果，得到待聚类的人脸图像集合的聚类结果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种人脸图像聚类方法，其特征在于，所述方法包括：

获取待聚类的人脸图像集合对应的人脸向量集合；

2.根据权利要求1所述的方法，其特征在于，所述获取待聚类的人脸图像集合对应的人脸向量集合包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述人脸向量集合进行主成分分析运算，得到特征向量集合包括：

计算所述人脸向量集合的协方差矩阵；

计算所述协方差矩阵的特征值；

4.根据权利要求1所述的方法，其特征在于，所述先验条件包括空间紧密先验条件和稀疏表示先验条件；

所述空间紧密先验条件为：在满足

P^TP＝I的条件下计算函数

根据所述先验条件构造的优化函数为：在diag(Z)＝0,

P^TP＝I的条件下获取满足函数

的W,Z,P；其中λ为第一预设变量，ζ为第二预设变量。

5.根据权利要求4所述的方法，其特征在于，所述根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化包括：

6.根据权利要求1所述的方法，其特征在于，所述基于满足优化停止条件时的距离矩阵，对待聚类的人脸图像集合进行聚类包括：

7.根据权利要求6所述的方法，其特征在于，所述对所述相似度权重图进行分割，得到所述待聚类的人脸图像集合的聚类结果包括：

获取所述相似度权重图的分割向量；

基于所述分割向量将所述相似度权重图分割为两个子图；

8.一种人脸图像聚类装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。