CN106909944B

CN106909944B - 一种人脸图片聚类的方法

Info

Publication number: CN106909944B
Application number: CN201710117961.4A
Authority: CN
Inventors: 郭军; 赵晓伟; 许鹏飞; 袁璇; 陈晓江; 肖云
Original assignee: Northwestern University
Current assignee: Northwestern University
Priority date: 2017-03-01
Filing date: 2017-03-01
Publication date: 2020-05-26
Anticipated expiration: 2037-03-01
Also published as: CN106909944A

Abstract

本发明属于图片处理技术，具体涉及一种人脸图片聚类的方法。一种人脸图片聚类的方法，包括以下步骤:(1)构建聚类目标函数；(2)对应步骤(1)中的目标函数，准备人脸图片的二维矩阵数据集X{x₁,x₂,...,x_N}、行投影矩阵U和列投影矩阵V；(3)在步骤(1)和步骤(2)的基础上求解目标函数；(4)利用最终得到的相似性矩阵P进行聚类；(5)输出聚类结果。

Description

一种人脸图片聚类的方法

技术领域

本发明属于图片处理技术，具体涉及一种人脸图片聚类的方法。

背景技术

对海量图片进行聚类，根据聚类结果对同一类的图片进行相应的处理，是图片检索引擎向用户返回准确的检索结果的前提。

在无监督的情况下，降维技术一般和聚类技术相结合对图片进行处理，降维主要是为了去除图片中的噪音数据和不相关特征，聚类技术的任务是在降维的基础上把特征相近的图片聚集到同一个类里面，因此降维是一个关键的步骤。

传统的非监督型维度下降方法，例如局部保持投影法，主成分分析法等把搜集到的图片处理成了一个向量，严重破坏了图片数据的局部结构，导致降维之后的图片数据被应用到聚类算法后得到的聚类结果很差。而且，大多数的二维非监督型维度下降方法只是在一维非监督型维度下降方法的基础上把数据从一维变成了二维，核心的思想没有变，聚类效果也不好。

发明内容

发明目的：本发明针对上述现有技术存在的问题做出改进，即本发明公开了一种人脸图片聚类的方法。

技术方案：一种人脸图片聚类的方法，包括以下步骤:

(1)构建聚类目标函数，其表达式为：

其中:

X_i表示人脸数据集的第i个样本；

X_j表示人脸数据集的第j个样本；

N表示人脸数据集的总的样本个数；

表示矩阵A的F阶范数的平方，

表示矩阵A的2阶范数的平方；

U表示行投影矩阵；

V表示列投影矩阵；

U^T表示矩阵U的转置矩阵；

P表示相似性矩阵；

I表示元素全是1的列向量；

F表示光谱聚类矩阵；

P_ij表示矩阵P的第i行第j个元素；

γ表示一个规范化参数，用来避免出现平凡解；

λ_∞表示一个足够大的数字用来保证最后降维之后的图片能被聚成c个类，具体可以先赋初值为10^3,在目标函数收敛之前，目标函数的每次迭代求解都需要更改λ_∞的值，当某一次目标函数求解结束之后，如果聚成的类的个数超过了c，那么λ_∞就除以2，如果聚成的类的个数小于c，那么λ_∞就要乘以2，直到目标函数收敛，λ_∞的值将不再发生变化；

f_i表示光谱聚类矩阵F的第i列；

f_j表示光谱聚类矩阵F的第j列；

P_i ^T1中的1表示一个元素全是1的列向量；

P_i ^T1＝1表示相似性矩阵P的第i列的所有元素的和等于1；

0≤P_i≤1表示向量P_i的所有元素都在[0,1]之间；

V^T表示列投影矩阵V的转置；

P_i表示相似性矩阵P的第i列；

F^T表示矩阵F的转置；

(2)对应步骤(1)中的目标函数，准备人脸图片的二维矩阵数据集X{x₁,x₂,...,x_N}、行投影矩阵U和列投影矩阵V，在相似性矩阵P的构造中需要设定邻接结点的个数，这里我们用字母k来代替邻接结点的个数，k的值设置为5，聚类的个数需要提前设定，这里我们用字母c表示要聚成的类的个数，c的值需要根据数据集来确定个数，行投影矩阵U和列投影矩阵V分别需要提前设定一个维度，这里我们分别用u代表行投影矩阵的维度，v代表列投影矩阵的维度，u和v的值分别设置为c-1；

(3)在步骤(1)和步骤(2)的基础上求解目标函数；

(4)利用最终得到的相似性矩阵P进行聚类；

(5)输出聚类结果。

进一步地，步骤(3)包括以下步骤：

(31)利用公式

给相似性矩阵P赋初值，其中：

P_i表示矩阵P的第i列；

γ表示一个规范化的参数，其值可以通过对公式(2)的求解得到；

d_i表示一个由N个元素组成的列向量，其中第j个元素的值可以通过

得到；

(32)在相似性矩阵P固定的基础上，求解拉普拉斯矩阵L，

其中：

D∈R^N×N是一个对角矩阵，而且第i个对角元素为∑_j(P_ij+P_ji)/2；

P表示相似性矩阵；

P^T表示矩阵P的转置；

(33)由拉普拉斯矩阵L得到光谱聚类矩阵F,F的列是由拉普拉斯矩阵L的前c个最小的特征值对应的特征向量组成；

(34)在固定相似性矩阵P和光谱聚类矩阵F的基础上，如果列投影矩阵V是固定的，目标函数变为：

如果行投影矩阵U是固定的，目标函数变为：

其中：

V^T表示行投影矩阵V的转置；

V表示行投影矩阵；

(35)通过求解公式(3)和公式(4)得到行投影矩阵U和列投影矩阵V；

(36)在行投影矩阵U、列投影矩阵V和光谱聚类矩阵F固定的基础上，目标函数变为：

其中：

d_i∈R^N×1是一个向量，它的第j个元素是

其中：

通过求解公式(7)更新相似性矩阵P；

(37)在固定行投影矩阵U、列投影矩阵V和相似性矩阵P的基础上，按照步骤(33)更新光谱聚类矩阵F；

(38)不断的迭代步骤(32)～(37),更新相似性矩阵P、光谱聚类矩阵F、行投影矩阵U和列投影矩阵V直至收敛，这里的收敛条件是最后得到的聚类个数是c，而且目标函数的值不再变化。

有益效果：本发明公开的一种人脸图片聚类的方法具有以下有益效果：

1、可以对输入的不同人的人脸图片实现很好的聚类效果，例如，我们输入不同人的人脸图片，这些图片可以是在不同的光照下，不同的穿戴，或者戴帽子，戴眼镜等等情况下拍照得到，通过我们的算法，可以高效的把属于同一个人的人脸图片聚到一起；

2、本聚类结束之后，聚得的类的个数恰好是数据集里人的类的个数。

附图说明

图1为本发明公开的一种人脸图片聚类的流程图。

具体实施方式：

下面对本发明的具体实施方式详细说明。

如图1所示，一种人脸图片聚类的方法，包括以下步骤:

(1)构建聚类目标函数，其表达式为：

其中:

X_i表示人脸数据集的第i个样本；

X_j表示人脸数据集的第j个样本；

N表示人脸数据集的总的样本个数；

表示矩阵A的F阶范数的平方，

表示矩阵A的2阶范数的平方；

U表示行投影矩阵；

V表示列投影矩阵；

U^T表示矩阵U的转置矩阵；

P表示相似性矩阵；

I表示元素全是1的列向量；

F表示光谱聚类矩阵；

P_ij表示矩阵P的第i行第j个元素；

γ表示一个规范化参数，用来避免出现平凡解；

f_i表示光谱聚类矩阵F的第i列；

f_j表示光谱聚类矩阵F的第j列；

P_i ^T1中的1表示一个元素全是1的列向量；

P_i ^T1＝1表示相似性矩阵P的第i列的所有元素的和等于1；

0≤P_i≤1表示向量P_i的所有元素都在[0,1]之间；

V^T表示列投影矩阵V的转置；

P_i表示相似性矩阵P的第i列；

F^T表示矩阵F的转置；

N表示样本个数

(2)对应步骤(1)中的目标函数，准备人脸图片的二维矩阵数据集X{x₁,x₂,...,x_N}、行投影矩阵U和列投影矩阵V，在相似性矩阵P的构造中需要设定邻接结点的个数，这里我们用字母k来代替邻接结点的个数，k的值设置为5，聚类的个数需要提前设定，这里我们用字母c表示要聚成的类的个数，c的值需要根据数据集来确定个数(如果数据集里面一共有10类图片，那么c的值就等于10)，行投影矩阵U和列投影矩阵V分别需要提前设定一个维度，这里我们分别用u代表行投影矩阵的维度，v代表列投影矩阵的维度，u和v的值分别设置为c-1；

(3)在步骤(1)和步骤(2)的基础上求解目标函数，

(4)利用最终得到的相似性矩阵P进行聚类；

(5)输出聚类结果。

进一步地，步骤(3)包括以下步骤：

(31)利用公式

给相似性矩阵P赋初值，其中：

P_i表示矩阵P的第i列；

得到；

(32)在相似性矩阵P固定的基础上，求解拉普拉斯矩阵L，

其中：

P表示相似性矩阵；

P^T表示矩阵P的转置；

如果行投影矩阵U是固定的，目标函数变为：

其中：

V^T表示行投影矩阵V的转置；

V表示行投影矩阵；

其中：

d_i∈R^N×1是一个向量，它的第j个元素是

其中：

通过求解公式(7)更新相似性矩阵P；

(38)不断的迭代步骤(32)～(37),更新相似性矩阵P、光谱聚类矩阵F、行投影矩阵U和列投影矩阵V直至收敛，这里的收敛条件是最后得到的聚类个数是c，而且目标函数的值不再变化；

上面对本发明的实施方式做了详细说明。但是本发明并不限于上述实施方式，在所属技术领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种人脸图片聚类的方法，其特征在于，包括以下步骤:

(1)构建聚类目标函数，其表达式为：

s.t.U^TU＝I,V^TV＝I,P_i ^T1＝1,0≤P_i≤1,F^TF＝I；

其中:

X_i表示人脸数据集的第i个样本；

X_j表示人脸数据集的第j个样本；

N表示人脸数据集的总的样本个数；

表示矩阵A的F阶范数的平方，

表示矩阵A的2阶范数的平方；

U表示行投影矩阵；

V表示列投影矩阵；

U^T表示矩阵U的转置矩阵；

P表示相似性矩阵；

I表示元素全是1的列向量；

F表示光谱聚类矩阵；

P_ij表示矩阵P的第i行第j个元素；

γ表示一个规范化参数，用来避免出现平凡解；

λ_∞表示一个足够大的数字用来保证最后降维之后的图片能被聚成c个类，具体先赋初值为10^3,在目标函数收敛之前，目标函数的每次迭代求解都需要更改λ_∞的值，当某一次目标函数求解结束之后，如果聚成的类的个数超过了c，那么λ_∞就除以2，如果聚成的类的个数小于c，那么λ_∞就要乘以2，直到目标函数收敛，λ_∞的值将不再发生变化；

f_i表示光谱聚类矩阵F的第i列；

f_j表示光谱聚类矩阵F的第j列；

P_i ^T I中的I表示一个元素全是1的列向量；

P_i ^T1＝1表示相似性矩阵P的第i列的所有元素的和等于1；

0≤P_i≤1表示向量P_i的所有元素都在[0,1]之间；

V^T表示列投影矩阵V的转置；

P_i表示相似性矩阵P的第i列；

F^T表示矩阵F的转置；

(2)对应步骤(1)中的目标函数，准备人脸图片的二维矩阵数据集X{x₁,x₂,...,x_N}、行投影矩阵U和列投影矩阵V；

(3)在步骤(1)和步骤(2)的基础上求解目标函数；

(4)利用最终得到的相似性矩阵P进行聚类；

(5)输出聚类结果；