CN106909944B - 一种人脸图片聚类的方法 - Google Patents

一种人脸图片聚类的方法 Download PDF

Info

Publication number
CN106909944B
CN106909944B CN201710117961.4A CN201710117961A CN106909944B CN 106909944 B CN106909944 B CN 106909944B CN 201710117961 A CN201710117961 A CN 201710117961A CN 106909944 B CN106909944 B CN 106909944B
Authority
CN
China
Prior art keywords
matrix
column
clustering
objective function
projection matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710117961.4A
Other languages
English (en)
Other versions
CN106909944A (zh
Inventor
郭军
赵晓伟
许鹏飞
袁璇
陈晓江
肖云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern University
Original Assignee
Northwestern University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern University filed Critical Northwestern University
Priority to CN201710117961.4A priority Critical patent/CN106909944B/zh
Publication of CN106909944A publication Critical patent/CN106909944A/zh
Application granted granted Critical
Publication of CN106909944B publication Critical patent/CN106909944B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于图片处理技术,具体涉及一种人脸图片聚类的方法。一种人脸图片聚类的方法,包括以下步骤:(1)构建聚类目标函数;(2)对应步骤(1)中的目标函数,准备人脸图片的二维矩阵数据集X{x1,x2,...,xN}、行投影矩阵U和列投影矩阵V;(3)在步骤(1)和步骤(2)的基础上求解目标函数;(4)利用最终得到的相似性矩阵P进行聚类;(5)输出聚类结果。

Description

一种人脸图片聚类的方法
技术领域
本发明属于图片处理技术,具体涉及一种人脸图片聚类的方法。
背景技术
对海量图片进行聚类,根据聚类结果对同一类的图片进行相应的处理,是图片检索引擎向用户返回准确的检索结果的前提。
在无监督的情况下,降维技术一般和聚类技术相结合对图片进行处理,降维主要是为了去除图片中的噪音数据和不相关特征,聚类技术的任务是在降维的基础上把特征相近的图片聚集到同一个类里面,因此降维是一个关键的步骤。
传统的非监督型维度下降方法,例如局部保持投影法,主成分分析法等把搜集到的图片处理成了一个向量,严重破坏了图片数据的局部结构,导致降维之后的图片数据被应用到聚类算法后得到的聚类结果很差。而且,大多数的二维非监督型维度下降方法只是在一维非监督型维度下降方法的基础上把数据从一维变成了二维,核心的思想没有变,聚类效果也不好。
发明内容
发明目的:本发明针对上述现有技术存在的问题做出改进,即本发明公开了一种人脸图片聚类的方法。
技术方案:一种人脸图片聚类的方法,包括以下步骤:
(1)构建聚类目标函数,其表达式为:
Figure BDA0001236159360000021
Figure BDA0001236159360000022
其中:
Xi表示人脸数据集的第i个样本;
Xj表示人脸数据集的第j个样本;
N表示人脸数据集的总的样本个数;
Figure BDA0001236159360000023
表示矩阵A的F阶范数的平方,
Figure BDA0001236159360000024
表示矩阵A的2阶范数的平方;
U表示行投影矩阵;
V表示列投影矩阵;
UT表示矩阵U的转置矩阵;
P表示相似性矩阵;
I表示元素全是1的列向量;
F表示光谱聚类矩阵;
Pij表示矩阵P的第i行第j个元素;
γ表示一个规范化参数,用来避免出现平凡解;
λ表示一个足够大的数字用来保证最后降维之后的图片能被聚成c个类,具体可以先赋初值为10^3,在目标函数收敛之前,目标函数的每次迭代求解都需要更改λ的值,当某一次目标函数求解结束之后,如果聚成的类的个数超过了c,那么λ就除以2,如果聚成的类的个数小于c,那么λ就要乘以2,直到目标函数收敛,λ的值将不再发生变化;
fi表示光谱聚类矩阵F的第i列;
fj表示光谱聚类矩阵F的第j列;
Pi T1中的1表示一个元素全是1的列向量;
Pi T1=1表示相似性矩阵P的第i列的所有元素的和等于1;
0≤Pi≤1表示向量Pi的所有元素都在[0,1]之间;
VT表示列投影矩阵V的转置;
Pi表示相似性矩阵P的第i列;
FT表示矩阵F的转置;
(2)对应步骤(1)中的目标函数,准备人脸图片的二维矩阵数据集X{x1,x2,...,xN}、行投影矩阵U和列投影矩阵V,在相似性矩阵P的构造中需要设定邻接结点的个数,这里我们用字母k来代替邻接结点的个数,k的值设置为5,聚类的个数需要提前设定,这里我们用字母c表示要聚成的类的个数,c的值需要根据数据集来确定个数,行投影矩阵U和列投影矩阵V分别需要提前设定一个维度,这里我们分别用u代表行投影矩阵的维度,v代表列投影矩阵的维度,u和v的值分别设置为c-1;
(3)在步骤(1)和步骤(2)的基础上求解目标函数;
(4)利用最终得到的相似性矩阵P进行聚类;
(5)输出聚类结果。
进一步地,步骤(3)包括以下步骤:
(31)利用公式
Figure BDA0001236159360000041
给相似性矩阵P赋初值,其中:
Pi表示矩阵P的第i列;
γ表示一个规范化的参数,其值可以通过对公式(2)的求解得到;
di表示一个由N个元素组成的列向量,其中第j个元素的值可以通过
Figure BDA0001236159360000042
得到;
(32)在相似性矩阵P固定的基础上,求解拉普拉斯矩阵L,
Figure BDA0001236159360000043
其中:
D∈RN×N是一个对角矩阵,而且第i个对角元素为∑j(Pij+Pji)/2;
P表示相似性矩阵;
PT表示矩阵P的转置;
(33)由拉普拉斯矩阵L得到光谱聚类矩阵F,F的列是由拉普拉斯矩阵L的前c个最小的特征值对应的特征向量组成;
(34)在固定相似性矩阵P和光谱聚类矩阵F的基础上,如果列投影矩阵V是固定的,目标函数变为:
Figure BDA0001236159360000044
如果行投影矩阵U是固定的,目标函数变为:
Figure BDA0001236159360000045
其中:
Figure BDA0001236159360000046
Figure BDA0001236159360000051
VT表示行投影矩阵V的转置;
V表示行投影矩阵;
(35)通过求解公式(3)和公式(4)得到行投影矩阵U和列投影矩阵V;
(36)在行投影矩阵U、列投影矩阵V和光谱聚类矩阵F固定的基础上,目标函数变为:
Figure BDA0001236159360000052
其中:
di∈RN×1是一个向量,它的第j个元素是
Figure BDA0001236159360000053
其中:
Figure BDA0001236159360000054
通过求解公式(7)更新相似性矩阵P;
(37)在固定行投影矩阵U、列投影矩阵V和相似性矩阵P的基础上,按照步骤(33)更新光谱聚类矩阵F;
(38)不断的迭代步骤(32)~(37),更新相似性矩阵P、光谱聚类矩阵F、行投影矩阵U和列投影矩阵V直至收敛,这里的收敛条件是最后得到的聚类个数是c,而且目标函数的值不再变化。
有益效果:本发明公开的一种人脸图片聚类的方法具有以下有益效果:
1、可以对输入的不同人的人脸图片实现很好的聚类效果,例如,我们输入不同人的人脸图片,这些图片可以是在不同的光照下,不同的穿戴,或者戴帽子,戴眼镜等等情况下拍照得到,通过我们的算法,可以高效的把属于同一个人的人脸图片聚到一起;
2、本聚类结束之后,聚得的类的个数恰好是数据集里人的类的个数。
附图说明
图1为本发明公开的一种人脸图片聚类的流程图。
具体实施方式:
下面对本发明的具体实施方式详细说明。
如图1所示,一种人脸图片聚类的方法,包括以下步骤:
(1)构建聚类目标函数,其表达式为:
Figure BDA0001236159360000061
Figure BDA0001236159360000062
其中:
Xi表示人脸数据集的第i个样本;
Xj表示人脸数据集的第j个样本;
N表示人脸数据集的总的样本个数;
Figure BDA0001236159360000063
表示矩阵A的F阶范数的平方,
Figure BDA0001236159360000064
表示矩阵A的2阶范数的平方;
U表示行投影矩阵;
V表示列投影矩阵;
UT表示矩阵U的转置矩阵;
P表示相似性矩阵;
I表示元素全是1的列向量;
F表示光谱聚类矩阵;
Pij表示矩阵P的第i行第j个元素;
γ表示一个规范化参数,用来避免出现平凡解;
λ表示一个足够大的数字用来保证最后降维之后的图片能被聚成c个类,具体可以先赋初值为10^3,在目标函数收敛之前,目标函数的每次迭代求解都需要更改λ的值,当某一次目标函数求解结束之后,如果聚成的类的个数超过了c,那么λ就除以2,如果聚成的类的个数小于c,那么λ就要乘以2,直到目标函数收敛,λ的值将不再发生变化;
fi表示光谱聚类矩阵F的第i列;
fj表示光谱聚类矩阵F的第j列;
Pi T1中的1表示一个元素全是1的列向量;
Pi T1=1表示相似性矩阵P的第i列的所有元素的和等于1;
0≤Pi≤1表示向量Pi的所有元素都在[0,1]之间;
VT表示列投影矩阵V的转置;
Pi表示相似性矩阵P的第i列;
FT表示矩阵F的转置;
N表示样本个数
(2)对应步骤(1)中的目标函数,准备人脸图片的二维矩阵数据集X{x1,x2,...,xN}、行投影矩阵U和列投影矩阵V,在相似性矩阵P的构造中需要设定邻接结点的个数,这里我们用字母k来代替邻接结点的个数,k的值设置为5,聚类的个数需要提前设定,这里我们用字母c表示要聚成的类的个数,c的值需要根据数据集来确定个数(如果数据集里面一共有10类图片,那么c的值就等于10),行投影矩阵U和列投影矩阵V分别需要提前设定一个维度,这里我们分别用u代表行投影矩阵的维度,v代表列投影矩阵的维度,u和v的值分别设置为c-1;
(3)在步骤(1)和步骤(2)的基础上求解目标函数,
(4)利用最终得到的相似性矩阵P进行聚类;
(5)输出聚类结果。
进一步地,步骤(3)包括以下步骤:
(31)利用公式
Figure BDA0001236159360000081
给相似性矩阵P赋初值,其中:
Pi表示矩阵P的第i列;
γ表示一个规范化的参数,其值可以通过对公式(2)的求解得到;
di表示一个由N个元素组成的列向量,其中第j个元素的值可以通过
Figure BDA0001236159360000082
得到;
(32)在相似性矩阵P固定的基础上,求解拉普拉斯矩阵L,
Figure BDA0001236159360000083
其中:
D∈RN×N是一个对角矩阵,而且第i个对角元素为∑j(Pij+Pji)/2;
P表示相似性矩阵;
PT表示矩阵P的转置;
(33)由拉普拉斯矩阵L得到光谱聚类矩阵F,F的列是由拉普拉斯矩阵L的前c个最小的特征值对应的特征向量组成;
(34)在固定相似性矩阵P和光谱聚类矩阵F的基础上,如果列投影矩阵V是固定的,目标函数变为:
Figure BDA0001236159360000091
如果行投影矩阵U是固定的,目标函数变为:
Figure BDA0001236159360000092
其中:
Figure BDA0001236159360000093
Figure BDA0001236159360000094
VT表示行投影矩阵V的转置;
V表示行投影矩阵;
(35)通过求解公式(3)和公式(4)得到行投影矩阵U和列投影矩阵V;
(36)在行投影矩阵U、列投影矩阵V和光谱聚类矩阵F固定的基础上,目标函数变为:
Figure BDA0001236159360000095
其中:
di∈RN×1是一个向量,它的第j个元素是
Figure BDA0001236159360000096
其中:
Figure BDA0001236159360000097
通过求解公式(7)更新相似性矩阵P;
(37)在固定行投影矩阵U、列投影矩阵V和相似性矩阵P的基础上,按照步骤(33)更新光谱聚类矩阵F;
(38)不断的迭代步骤(32)~(37),更新相似性矩阵P、光谱聚类矩阵F、行投影矩阵U和列投影矩阵V直至收敛,这里的收敛条件是最后得到的聚类个数是c,而且目标函数的值不再变化;
上面对本发明的实施方式做了详细说明。但是本发明并不限于上述实施方式,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (1)

1.一种人脸图片聚类的方法,其特征在于,包括以下步骤:
(1)构建聚类目标函数,其表达式为:
Figure FDA0002423768490000011
s.t.UTU=I,VTV=I,Pi T1=1,0≤Pi≤1,FTF=I;
其中:
Xi表示人脸数据集的第i个样本;
Xj表示人脸数据集的第j个样本;
N表示人脸数据集的总的样本个数;
Figure FDA0002423768490000012
表示矩阵A的F阶范数的平方,
Figure FDA0002423768490000013
表示矩阵A的2阶范数的平方;
U表示行投影矩阵;
V表示列投影矩阵;
UT表示矩阵U的转置矩阵;
P表示相似性矩阵;
I表示元素全是1的列向量;
F表示光谱聚类矩阵;
Pij表示矩阵P的第i行第j个元素;
γ表示一个规范化参数,用来避免出现平凡解;
λ表示一个足够大的数字用来保证最后降维之后的图片能被聚成c个类,具体先赋初值为10^3,在目标函数收敛之前,目标函数的每次迭代求解都需要更改λ的值,当某一次目标函数求解结束之后,如果聚成的类的个数超过了c,那么λ就除以2,如果聚成的类的个数小于c,那么λ就要乘以2,直到目标函数收敛,λ的值将不再发生变化;
fi表示光谱聚类矩阵F的第i列;
fj表示光谱聚类矩阵F的第j列;
Pi T I中的I表示一个元素全是1的列向量;
Pi T1=1表示相似性矩阵P的第i列的所有元素的和等于1;
0≤Pi≤1表示向量Pi的所有元素都在[0,1]之间;
VT表示列投影矩阵V的转置;
Pi表示相似性矩阵P的第i列;
FT表示矩阵F的转置;
(2)对应步骤(1)中的目标函数,准备人脸图片的二维矩阵数据集X{x1,x2,...,xN}、行投影矩阵U和列投影矩阵V;
(3)在步骤(1)和步骤(2)的基础上求解目标函数;
(4)利用最终得到的相似性矩阵P进行聚类;
(5)输出聚类结果;
所述一种人脸图片聚类的方法,其特征在于,其中,步骤(3)包括以下步骤:
(31)利用公式
Figure FDA0002423768490000021
给相似性矩阵P赋初值,其中:
Pi表示矩阵P的第i列;
γ表示一个规范化的参数,其值通过对公式(2)的求解得到;
di表示一个由N个元素组成的列向量,其中第j个元素的值通过
Figure FDA0002423768490000031
得到;
(32)在相似性矩阵P固定的基础上,求解拉普拉斯矩阵L,
Figure FDA0002423768490000032
其中:
D∈RN×N是一个对角矩阵,而且第i个对角元素为∑j(Pij+Pji)/2;
P表示相似性矩阵;
PT表示矩阵P的转置;
(33)由拉普拉斯矩阵L得到光谱聚类矩阵F,F的列是由拉普拉斯矩阵L的前c个最小的特征值对应的特征向量组成;
(34)在固定相似性矩阵P和光谱聚类矩阵F的基础上,如果列投影矩阵V是固定的,目标函数变为:
Figure FDA0002423768490000033
如果行投影矩阵U是固定的,目标函数变为:
Figure FDA0002423768490000034
其中:
Figure FDA0002423768490000035
Figure FDA0002423768490000036
VT表示列投影矩阵V的转置;
V表示列投影矩阵;
(35)通过求解公式(3)和公式(4)得到行投影矩阵U和列投影矩阵V;
(36)在行投影矩阵U、列投影矩阵V和光谱聚类矩阵F固定的基础上,目标函数变为:
Figure FDA0002423768490000041
其中:
di∈RN×1是一个向量,它的第j个元素是
Figure FDA0002423768490000042
其中:
Figure FDA0002423768490000043
通过求解公式(7)更新相似性矩阵P;
(37)在固定行投影矩阵U、列投影矩阵V和相似性矩阵P的基础上,按照步骤(33)更新光谱聚类矩阵F;
(38)不断的迭代步骤(32)~(37),更新相似性矩阵P、光谱聚类矩阵F、行投影矩阵U和列投影矩阵V直至收敛,这里的收敛条件是最后得到的聚类个数是c,而且目标函数的值不再变化。
CN201710117961.4A 2017-03-01 2017-03-01 一种人脸图片聚类的方法 Expired - Fee Related CN106909944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710117961.4A CN106909944B (zh) 2017-03-01 2017-03-01 一种人脸图片聚类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710117961.4A CN106909944B (zh) 2017-03-01 2017-03-01 一种人脸图片聚类的方法

Publications (2)

Publication Number Publication Date
CN106909944A CN106909944A (zh) 2017-06-30
CN106909944B true CN106909944B (zh) 2020-05-26

Family

ID=59186218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710117961.4A Expired - Fee Related CN106909944B (zh) 2017-03-01 2017-03-01 一种人脸图片聚类的方法

Country Status (1)

Country Link
CN (1) CN106909944B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447098B (zh) * 2018-08-27 2022-03-18 西北大学 一种基于深度语义嵌入的图像聚类算法
CN111985336A (zh) * 2020-07-22 2020-11-24 深圳供电局有限公司 人脸图像聚类方法、装置、计算机设备和存储介质
CN111881190B (zh) * 2020-08-05 2021-10-08 厦门南讯股份有限公司 基于客户画像的关键数据挖掘系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956515A (zh) * 2016-04-20 2016-09-21 西安电子科技大学 基于极成像的立体-高光谱人脸识别方法
CN106228027A (zh) * 2016-08-26 2016-12-14 西北大学 一种多视角数据的半监督特征选择方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956515A (zh) * 2016-04-20 2016-09-21 西安电子科技大学 基于极成像的立体-高光谱人脸识别方法
CN106228027A (zh) * 2016-08-26 2016-12-14 西北大学 一种多视角数据的半监督特征选择方法

Also Published As

Publication number Publication date
CN106909944A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
Le et al. Fingerprint enhancement based on tensor of wavelet subbands for classification
Krisshna et al. Face recognition using transform domain feature extraction and PSO-based feature selection
Tang et al. Weighted group sparse representation for undersampled face recognition
CN110659665B (zh) 一种异维特征的模型构建方法及图像识别方法、装置
Basak et al. Weather data mining using independent component analysis
CN107292225B (zh) 一种人脸识别方法
CN112115881B (zh) 基于鲁棒鉴别特征学习的图像特征提取方法
CN106909944B (zh) 一种人脸图片聚类的方法
CN108664911A (zh) 一种基于图像稀疏表示的鲁棒人脸识别方法
Siwek et al. Autoencoder versus PCA in face recognition
Wang et al. Regularized filters for L1-norm-based common spatial patterns
Shinde et al. Analysis of fingerprint image for gender classification or identification: Using wavelet transform and singular value decomposition
Dong et al. Feature extraction through contourlet subband clustering for texture classification
CN109063555B (zh) 基于低秩分解和稀疏表示残差对比的多姿态人脸识别方法
CN110991554B (zh) 一种基于改进pca的深度网络图像分类方法
CN110826534B (zh) 一种基于局部主成分分析的人脸关键点检测方法及系统
CN106803105B (zh) 一种基于稀疏表示字典学习的图像分类方法
Spurek et al. ICA based on asymmetry
Lu et al. Compressed signal processing on Nyquist-sampled signals
CN108898153B (zh) 基于l21范式距离度量的特征选择方法
CN108388869B (zh) 一种基于多重流形的手写数据分类方法及系统
CN113627237A (zh) 基于局部最大对齐的后期融合人脸图像聚类方法及系统
CN110287973B (zh) 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法
Yao A compressed deep convolutional neural networks for face recognition
CN116919422A (zh) 基于图卷积的多特征情感脑电识别模型建立方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200526

Termination date: 20210301

CF01 Termination of patent right due to non-payment of annual fee