CN111985336A - 人脸图像聚类方法、装置、计算机设备和存储介质 - Google Patents

人脸图像聚类方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111985336A
CN111985336A CN202010708111.3A CN202010708111A CN111985336A CN 111985336 A CN111985336 A CN 111985336A CN 202010708111 A CN202010708111 A CN 202010708111A CN 111985336 A CN111985336 A CN 111985336A
Authority
CN
China
Prior art keywords
matrix
face
face image
vector set
distance matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010708111.3A
Other languages
English (en)
Inventor
李喆
陈子涵
王东骥
赵世祥
胡佳新
宋书生
吴中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN202010708111.3A priority Critical patent/CN111985336A/zh
Publication of CN111985336A publication Critical patent/CN111985336A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种人脸图像聚类方法、装置、计算机设备和存储介质。方法包括:获取待聚类的人脸图像集合对应的人脸向量集合;对所述人脸向量集合进行主成分分析运算,得到特征向量集合;对所述特征向量集合进行运算,得到距离矩阵和投影矩阵;所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度;根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化,直至所述距离矩阵和所述投影矩阵满足优化停止条件;所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束;基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。采用本方法能够提高人脸图像聚类准确性。

Description

人脸图像聚类方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种人脸图像聚类方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,人脸图像聚类技术在司法鉴定、住宅监控和人脸检索等领域中有广泛的应用。人脸图像聚类技术是将未标注的人脸数据集中的人脸图像划分为不同的类别。现有的人脸图像聚类方法对人脸图像分类的错误率较高,聚类误差较大。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高人脸图像聚类准确性的人脸图像聚类方法、装置、计算机设备和存储介质。
一种人脸图像聚类方法,所述方法包括:
获取待聚类的人脸图像集合对应的人脸向量集合;
对所述人脸向量集合进行主成分分析运算,得到特征向量集合;
对所述特征向量集合进行运算,得到距离矩阵和投影矩阵;所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度;
根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化,直至所述距离矩阵和所述投影矩阵满足优化停止条件;所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束;
基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
在一个实施例中,所述获取待聚类的人脸图像集合对应的人脸向量集合包括:
对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,获得各所述人脸图像的人脸向量构成的人脸向量集合;或者,
对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各所述人脸图像的人脸向量构成的人脸向量集合。
在一个实施例中,所述对所述人脸向量集合进行主成分分析运算,得到特征向量集合包括:
计算所述人脸向量集合的协方差矩阵;
计算所述协方差矩阵的特征值;
选取一部分的特征值对应的特征向量组成所述协方差矩阵的特征矩阵;
根据所述特征矩阵对所述人脸向量集合进行运算,得到所述特征向量集合。
在一个实施例中,所述先验条件包括空间紧密先验条件和稀疏表示先验条件;
所述空间紧密先验条件为:在满足
Figure BDA0002595446710000021
PTP=I的条件下计算函数
Figure BDA0002595446710000022
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为所述特征向量集合中的第i列向量,yj为所述特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;
所述稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为所述特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;
根据所述先验条件构造的优化函数为:在diag(Z)=0,
Figure BDA0002595446710000023
PTP=I的条件下获取满足函数
Figure BDA0002595446710000024
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。
在一个实施例中,所述根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化包括:
基于所述优化函数对所述投影矩阵进行优化,得到优化后的投影矩阵;
基于所述优化函数和所述优化后的投影矩阵对所述距离矩阵进行优化。
在一个实施例中,所述基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类包括:
以所述人脸向量集合中的人脸向量为节点,以所述距离矩阵中元素为对应节点间的权值,构建所述人脸向量集合的相似度权重图;
对所述相似度权重图进行分割,得到所述待聚类的人脸图像集合的聚类结果。
在一个实施例中,所述对所述相似度权重图进行分割,得到所述待聚类的人脸图像集合的聚类结果包括:
获取所述相似度权重图的分割向量;
基于所述分割向量将所述相似度权重图分割为两个子图;
当所述子图不满足分割停止条件时,基于不满足分割停止条件的所述子图的分割向量,继续对所述子图进行分割,直至分割后的所述相似度权重图的所有子图满足分割停止条件;
根据停止分割时所述相似度权重图的分割结果,得到所述待聚类的人脸图像集合的聚类结果。
一种人脸图像聚类装置,所述装置包括:
获取模块,用于获取待聚类的人脸图像集合对应的人脸向量集合;
主成分分析模块,用于对所述人脸向量集合进行主成分分析运算,得到特征向量集合;
运算模块,用于对所述特征向量集合进行运算,得到距离矩阵和投影矩阵;所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度;
迭代优化模块,用于根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化,直至所述距离矩阵和所述投影矩阵满足优化停止条件;所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束;
聚类模块,用于基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
在一个实施例中,所述获取模块还用于:
对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,获得各所述人脸图像的人脸向量构成的人脸向量集合;或者,
对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各所述人脸图像的人脸向量构成的人脸向量集合。
在一个实施例中,所述主成分分析模块还用于:
计算所述人脸向量集合的协方差矩阵;
计算所述协方差矩阵的特征值;
选取一部分的特征值对应的特征向量组成所述协方差矩阵的特征矩阵;
根据所述特征矩阵对所述人脸向量集合进行运算,得到所述特征向量集合。
在一个实施例中,所述先验条件包括空间紧密先验条件和稀疏表示先验条件;
所述空间紧密先验条件为:在满足
Figure BDA0002595446710000041
PTP=I的条件下计算函数
Figure BDA0002595446710000042
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为所述特征向量集合中的第i列向量,yj为所述特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;
所述稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为所述特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;
根据所述先验条件构造的优化函数为:在diag(Z)=0,
Figure BDA0002595446710000043
PTP=I的条件下获取满足函数
Figure BDA0002595446710000044
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。
在一个实施例中,所述迭代优化模块还用于:
基于所述优化函数对所述投影矩阵进行优化,得到优化后的投影矩阵;
基于所述优化函数和所述优化后的投影矩阵对所述距离矩阵进行优化。
在一个实施例中,所述聚类模块还包括:
构建子模块,用于以所述人脸向量集合中的人脸向量为节点,以所述距离矩阵中元素为对应节点间的权值,构建所述人脸向量集合的相似度权重图;
分割子模块,用于对所述相似度权重图进行分割,得到所述待聚类的人脸图像集合的聚类结果。
在一个实施例中,所述分割子模块还用于:
获取所述相似度权重图的分割向量;
基于所述分割向量将所述相似度权重图分割为两个子图;
当所述子图不满足分割停止条件时,基于不满足分割停止条件的所述子图的分割向量,继续对所述子图进行分割,直至分割后的所述相似度权重图的所有子图满足分割停止条件;
根据停止分割时所述相似度权重图的分割结果,得到所述待聚类的人脸图像集合的聚类结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述人脸图像聚类方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述人脸图像聚类方法的步骤。
上述实施例中,计算机设备通过对待聚类的人脸图像集合对应的人脸向量集合进行主成分分析运算,得到特征向量集合。并根据特征向量集合获取距离矩阵,距离矩阵中元素为特征向量集合中对应的特征向量之间的相似度。然后计算机设备根据基于先验条件构造的优化函数对距离矩阵进行优化。由于根据先验条件优化后的距离矩阵中元素的元素值能够更精确的表示特征向量之间的相似度,所以基于优化后的距离矩阵对待聚类的人脸图像集合进行聚类的聚类结果更加准确。
附图说明
图1为一个实施例中人脸图像聚类方法的应用环境图;
图2为一个实施例中人脸图像聚类方法的流程示意图;
图3为另一个实施例中人脸图像聚类方法的流程示意图;
图4a为当人脸图像类别数c=2时,投影矩阵Pt的列向量个数l分别取5c、4c、3c、2c时,函数Φ的数值与迭代次数t之间的关系示意图;
图4b为当人脸图像类别数c=3时,投影矩阵Pt的列向量个数l分别取5c、4c、3c、2c时,函数Φ的数值与迭代次数t之间的关系示意图;
图4c为当人脸图像类别数c=5时,投影矩阵Pt的列向量个数l分别取5c、4c、3c、2c时,函数Φ的数值与迭代次数t之间的关系示意图;
图4d为当人脸图像类别数c=8时,投影矩阵Pt的列向量个数l分别取5c、4c、3c、2c时,函数Φ的数值与迭代次数t之间的关系示意图;
图4e为当人脸图像类别数c=10时,投影矩阵Pt的列向量个数l分别取5c、4c、3c、2c时,函数Φ的数值与迭代次数t之间的关系示意图;
图5为一个实施例中人脸图像聚类装置的结构框图;
图6为另一个实施例中人脸图像聚类装置的结构框图;
图7为一个实施例中计算机设备的内部结构图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的人脸图像聚类方法,可以应用于如图1所示的应用环境中。其中,计算机设备102基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。其中,计算机设备102可以是终端,也可以是服务器。终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种人脸图像聚类方法,以该方法应用于图1中的计算机设备为例进行说明,包括以下步骤:
S202,获取待聚类的人脸图像集合对应的人脸向量集合。
人脸图像聚类是将未作标记的人脸图像划分为不同的类别,例如老人、年轻人、中年人、小孩、男人、女人等。
其中,待聚类的人脸图像集合是所有待聚类的人脸图像组成的集合。待聚类的人脸图像可以为通过不同图像采集设备采集的图像,或者可以为通过不同视频采集设备采集的视频数据中抽取的帧图像。
计算机设备对人脸图像集合中的人脸图像中的像素值进行排列生成人脸向量。所有人脸图像对应的人脸向量组成人脸向量集合。假设待聚类的人脸图像集合为{X1,X2,X3,...,Xn},获取的人脸向量集合为{x1,x2,x3,...,xn}。
S204,对人脸向量集合进行主成分分析运算,得到特征向量集合。
其中,主成分分析运算是一种降维算法,通过正交变换将高维度的人脸向量集合转换为低维度的特征向量集合。其中特征向量集合中的各个特征向量线性不相关,并且能够反映人脸向量集合的主要特征信息。
计算机设备对人脸向量集合{x1,x2,x3,...,xn}进行主成分分析运算,得到特征向量集合Y={y1,y2,…,yn},并根据{y1,y2,…,yn}构成的矩阵[y1,y2,…,yn]构成原空间。
计算机设备通过对人脸向量集合进行主成分分析运算可以去除人脸向量集合中的冗余向量,得到的特征向量集合不仅能够保留人脸向量集合中的特征信息,而且具有比人脸向量集合更低的维度,降低了计算的复杂度。
S206,对特征向量集合进行运算,得到距离矩阵和投影矩阵;距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度。
其中,投影矩阵P是计算机设备对特征向量集合进行运算得到的降维矩阵。计算机设备根据投影矩阵构成的线性函数f=PT将原空间中的特征向量集合{y1,y2,…,yn}投影到低维度的隐空间,其中投影矩阵构造的矩阵[PTy1,PTy2,…,PTyn]构成隐空间。
S208,计算机设备根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化,直至距离矩阵和投影矩阵满足优化停止条件;优化停止条件是距离矩阵和投影矩阵之间的约束。
其中,先验条件是使距离矩阵和投影矩阵满足:根据投影矩阵将原空间中特征向量降维到隐空间后,使距离矩阵中元素表示的同类别的人脸图像的特征向量之间的相似度大于预设的阈值,并且不同类别的人脸图像的特征向量的相似度小于预设的阈值。
其中,优化停止条件是计算机设备设置的根据距离矩阵和投影矩阵之间的约束终止优化迭代过程的条件。在距离矩阵和投影矩阵之间满足约束关系时,计算机设备停止对距离矩阵和投影矩阵的优化迭代。
S210,基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
计算机设备在对距离矩阵进行优化后,满足优化停止条件时的距离矩阵表示的人脸特征向量之间的相似度能够满足先验条件。计算机设备基于该距离矩阵,对待聚类的人脸图像集合进行聚类。
上述实施例中,计算机设备通过对待聚类的人脸图像集合对应的人脸向量集合进行主成分分析运算,得到特征向量集合。并根据特征向量集合获取距离矩阵,距离矩阵中元素为特征向量集合中对应的特征向量之间的相似度。然后计算机设备根据基于先验条件构造的优化函数对距离矩阵进行优化。由于根据先验条件优化后的距离矩阵中元素的元素值能够更精确的表示特征向量之间的相似度,所以基于优化后的距离矩阵对待聚类的人脸图像集合进行聚类的聚类结果更加准确。
在一个实施例中,计算机设备获取待聚类的人脸图像集合对应的人脸向量集合包括:对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合;或者,对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合。
计算机设备将二维空间中的人脸图像拼接为人脸向量方便在接下来的处理步骤中对人脸向量进行计算。
在一个实施例中,计算机设备对人脸向量集合进行主成分分析运算,得到特征向量集合包括:计算人脸向量集合的协方差矩阵;计算协方差矩阵的特征值;选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵;根据特征矩阵对人脸向量集合进行运算,得到特征向量集合。
在一个实施例中,计算机设备对人脸向量集合进行主成分分析运算,得到特征向量集合包括以下步骤:
(a)根据公式(1)计算人脸向量集合中的人脸向量的平均向量
Figure BDA0002595446710000091
其中xi是第i个人脸向量,n是人量向量的总个数。
Figure BDA0002595446710000092
(b)根据计算得到的平均向量
Figure BDA0002595446710000093
通过公式(2)计算人脸向量集合的协方差矩阵G。
Figure BDA0002595446710000094
(c)计算协方差矩阵G的特征值{λ12,…λn}和特征向量{u1,u2,…,un},其中λ1≥λ2≥…≥λn。在一个实施例中,选择前面的d个特征值对应的特征向量u1,u2,…,ud构成特征矩阵U=[u1,u2,…,ud]T
(d)根据公式(3)计算人脸向量xi的特征向量yi,并得到特征向量集合y={y1,y2,…,yn}。
yi=Uxi,i=1,2,…,n (3)
在一个实施例中,先验条件包括空间紧密先验条件和稀疏表示先验条件。
空间紧密先验条件为:在满足
Figure BDA0002595446710000101
PTP=I的条件下计算函数
Figure BDA0002595446710000102
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为特征向量集合中的第i列向量,yj为特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;
稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;
根据先验条件构造的优化函数为:在diag(Z)=0,
Figure BDA0002595446710000103
PTP=I的条件下获取满足函数
Figure BDA0002595446710000104
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。例如,计算机设备设置λ=7.5×10-2,ζ=5。
在一个实施例中,优化停止条件是优化后的投影矩阵和距离矩阵满足|Φ(Wt,Zt,Pt)-Φ(Wt+1,Zt+1,Pt+1)|/Φ(Wt+1,Zt+1,Pt+1)<ε。其中,t表示经过t次优化迭代,
Figure BDA0002595446710000105
其中,ε是预设阈值,计算机设备设置的ε越小,得到的距离矩阵中的元素可以更精确的表示特征向量之间的相似度,但是设置的ε越小,需要进行的优化迭代次数越多,计算复杂度越高。计算机设备可以根据待聚类的人脸图像的类别数或者人脸图像的分辨率设置ε。例如,计算机设备可以设置ε和待聚类的人脸图像的类别线性正相关。例如,计算机设备设置ε和待聚类的人脸图像的分辨率线性负相关。在一个实施例中,计算机设备设置ε=10-5
在一个实施例中,计算机设备根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化包括:基于优化函数对投影矩阵进行优化,得到优化后的投影矩阵;基于优化函数和优化后的投影矩阵对距离矩阵进行优化。
计算机设备根据优化函数进行推导,将对距离矩阵的优化过程分为两个步骤。首先,计算机设备固定优化函数中的中间矩阵Z和距离矩阵W,根据基于空间紧密先验条件推导得到的优化算法对投影矩阵P进行优化。然后根据基于稀疏表示先验条件推导得到的优化算法,根据优化后的投影矩阵P对距离矩阵W进行优化。
在一个实施例中,计算机设备设置中间矩阵Z的初始矩阵为Z0,距离矩阵W的初始矩阵为W0,投影矩阵P的初始矩阵为P0。计算机设备将Z0的对角线上的元素删除后得到(n-1)×n的子矩阵
Figure BDA0002595446710000111
设置
Figure BDA0002595446710000112
Figure BDA0002595446710000113
的第i列,并且将特征向量集合中的第i列特征向量yi删除后得到剩余的特征向量组成的矩阵
Figure BDA0002595446710000114
然后,根据公式
Figure BDA0002595446710000115
计算
Figure BDA0002595446710000116
其中
Figure BDA0002595446710000117
表示计算伪逆,由此得到矩阵Z0除对角线上元素之外的所有元素。最后,计算机设备根据计算得到的
Figure BDA0002595446710000118
并将Z0对角线元素置零得到中间矩阵的初始矩阵Z0。计算机设备根据
Figure BDA0002595446710000119
得到距离矩阵W的初始矩阵W0,其中,|Z0|表示Z0的所有元素取绝对值。
在得到中间矩阵和距离矩阵的初始矩阵之后,根据基于空间紧密先验条件推导得到的算法计算投影矩阵。
计算机设备首先求解矩阵YL0YT的特征值{λ0102,...,λ0n}和对应的特征向量{p01,p02,...,p0n},其中
Figure BDA00025954467100001110
其中,L0=D0-W0,Y是特征向量集合
Figure BDA00025954467100001111
组成的矩阵,D0为对角线上元素为
Figure BDA00025954467100001112
的对角矩阵。W0,ij为矩阵W0的第i行第j列元素,表示特征向量集合中的第i个特征向量和第j个特征向量之间的相似度。计算机设备将{p01,p02,...,p0n}中前l个特征向量组成投影矩阵的初始矩阵P0=[p01,p02,…,p0l]。
在得到投影矩阵的初始矩阵P0之后,计算机设备根据基于稀疏表示先验条件推导得到的算法计算W1和Z1
计算机设备设置t=0,其中t为优化迭代的次数,在满足diag(Zt+1)=0,也就是使Zt+1的对角线上元素为0的条件下,求解函数
Figure BDA0002595446710000121
其中||·||F表示求F范数,
Figure BDA0002595446710000122
A∈Rn×n非负对称阵,
Figure BDA0002595446710000123
其中λ为第一预设变量,ζ为第二预设变量,例如计算机设备设置λ=7.5×10-2,ζ=5。
计算机设备在获取P0后,利用截断牛顿内点方法、牛顿内点法或者障碍函数法等基于范数的优化问题求解方法,在满足diag(Zt+1)=0的条件下,求解函数
Figure BDA0002595446710000124
得到W1和Z1
然后计算机设备使t=1并求解矩阵YLtYT的特征值{λt1t2,…,λtn}和对应的特征向量{Pt1,Pt2,…,Ptn},λt1≤λt2≤…≤λtn,将前l个特征向量组成投影矩阵Pt=[Pt1,Pt2,…,Ptl],得到P1。其中Lt=Dt-Wt,Dt为对角阵对角线上元素为
Figure BDA0002595446710000125
Wt,ij为矩阵Wt第i行第j列元素。
计算机设备根据W1和Z1得到P1,并判断W0、Z0、P0和W1、Z1、P1是否满足优化停止条件|Φ(W0,Z0,P0)-Φ(W1,Z1,P1)|/Φ(W1,Z1,P1)<ε,如果满足,则使W=W1,并基于W对待聚类的人脸图像集合进行聚类。如果不满足,则根据P1按照上述方法得到W2和Z2,并判断W1、Z1、P1和W2、Z2、P2是否满足优化停止条件Φ(W1,Z1,P1)-Φ(W2,Z2,P2)|/Φ(W2,Z2,P2)<ε,如此循环,直到得到的Wt、Zt、Pt和Wt+1、Zt+1、Pt+1满足|Φ(Wt,Zt,Pt)-Φ(Wt+1,Zt+1,Pt+1)|/Φ(Wt+1,Zt+1,Pt+1)<ε,设置W=Wt+1并基于距离矩阵W对待聚类的人脸图像集合进行聚类。
计算机设备将优化过程分为两个部分,首先根据基于空间紧密先验条件推导得到的算法对投影矩阵进行优化,然后根据基于稀疏表示先验条件推导得到的算法对距离矩阵进行优化。计算机设备将优化过程分为两个步骤,对投影矩阵和距离矩阵交替进行优化,优化过程中采用基于范数的优化问题求解方法求解优化问题,能够使优化过程快速收敛,提高计算速度。
在一个实施例中,基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类包括:以人脸向量集合中的人脸向量为节点,以距离矩阵中元素为对应节点间的权值,构建人脸向量集合的相似度权重图;对相似度权重图进行分割,得到待聚类的人脸图像集合的聚类结果。
其中,相似度权重图是带权无向图,设置相似度权重图为G(V,E),其中V为节点集合,V={x1,x2,…,xn},E为节点之间边的集合,各个边对应的权值为W中元素的元素值。Wij表示第i个人脸向量和第j个人脸向量之间的相似度。
由于相似度权重图中连接同一类别的人脸图像的边对应的权值较大,连接不同类别的人脸图像的边对应的权值较小,所以计算机设备根据相似度权重图中各条边上的权值将相似度权重图分割为多个子图,分割结果即为待聚类的人脸图像集合的聚类结果。
在一个实施例中,计算机设备对相似度权重图进行分割,得到待聚类的人脸图像集合的聚类结果包括:获取相似度权重图的分割向量;基于分割向量将相似度权重图分割为两个子图;当子图不满足分割停止条件时,基于不满足分割停止条件的子图的分割向量,继续对子图进行分割,直至分割后的相似度权重图的所有子图满足分割停止条件;根据停止分割时相似度权重图的分割结果,得到待聚类的人脸图像集合的聚类结果。
其中,分割向量是对相似度权重图进行分割的向量。计算机设备基于分割向量对相似度权重图分割后,使划分在相同子图中的节点之间的边对应的权值大于预设的权值阈值,并且使划分在不同子图中的节点之间的边对应的权值小于预设的权值阈值。
其中,分割停止条件是计算机设备设置的终止对相似度权重图的子图进行分割的条件。例如,分割停止条件是子图中的节点数下降到预设节点数值。或者分割停止条件是同一子图中节点间权值的方差减小到预设方差值。或者分割停止条件是同一子图间的权值差达到预设差值。
在一个实施例中,计算机设备根据归一化分割算法对相似度权重图进行分割,包括如下步骤:
(a)根据广义特征值算法获取分割向量。
计算机设备首先求解满足函数
Figure BDA0002595446710000141
的λ的集合{λ12...λn},且λ1≤λ2≤,...,≤λn。其中,λ为矩阵(D-W)相对于矩阵D的特征值,而与λi相对应的非零解
Figure BDA0002595446710000142
为λi的特征向量。其中D为对角矩阵,其对角线上元素为
Figure BDA0002595446710000143
Wij为W在第i行第j列的元素。计算机设备设置λ的集合{λ12...λn}中次小特征值λ2对应的特征向量
Figure BDA0002595446710000144
为分割向量。
(b)计算机设备根据分割向量将带权无向图G(V,E)分割成两个子图。
(c)如果子图不满足分割停止条件,则根据子图构造的函数
Figure BDA0002595446710000145
获取子图的特征向量,并根据子图的特征向量对子图进行分割,直到分割后的所有子图满足分割停止条件。
计算机设备根据归一化分割算法对相似度权重图进行分割,可以避免分割出孤立节点的情况。
在一个实施例中,如图3所示,计算机设备对待聚类人脸图像进行聚类包括以下步骤:
S302,获取人脸向量。
S304,对人脸向量集合进行主成分分析运算,得到特征向量集合,特征向量构造的矩阵构成原空间。
S306,对特征向量集合进行运算,得到距离矩阵的初始矩阵和投影矩阵的初始矩阵。
S308,根据基于空间紧密先验条件推导得到的算法对投影矩阵进行优化,投影矩阵将特征向量投影到隐空间。
S310,根据基于稀疏表示先验条件推导得到的算法对距离矩阵进行优化。
S312,判断是否满足优化停止条件。如果满足满足优化停止条件则执行S314,如果不满足优化停止条件,则返回执行S308。
S314,根据人脸向量和距离矩阵构造相似度权重图。
S316,根据归一化分割算法对相似度权重图进行分割。
S318,输出待聚类人脸图像的聚类结果。
S302至S318的具体内容可以参考上文所述的具体实现过程。
在一个实施例中,计算机设备根据S302至S318的具体算法对耶鲁人脸B数据集进行聚类,耶鲁人脸B数据集包括38个人,每人64幅人脸图像,总共2432幅待聚类人脸图像,构成待聚类的人脸图像集合。对比算法包括:SSC(Sparse Subspace Clustering,稀疏子空间聚类)算法、LRR(Low-Rank Representation,低秩表示)算法、LSR1(Least SquaresRegression,最小二乘递归1)算法、LSR2(Least Squares Regression,最小二乘递归2)算法和LPP(Locality Preserving Projection,空间紧密先验)算法。计算机设备根据公式(4)计算聚类误差:
Figure BDA0002595446710000151
计算机设备首先将人脸图像大小变为32×32,将人脸图像类别数设为
Figure BDA0002595446710000152
将主成分分析得到的特征向量个数设为d=c×6,设置ε=10-5,λ=7.5×10-2,ζ=5。投影矩阵Pt的列向量个数l设置与类别数c有关,设置l={5c,4c,3c,2c},t为迭代次数。
计算机设备对SSC算法、LRR算法、LSR1算法、LSR2算法和LPP算法中参数的设置如表1所示。计算机设备根据S302至S318的算法对耶鲁人脸B数据集进行聚类时,在投影矩阵Pt的列向量个数l取不同数值时的聚类误差如表2所示。当c分别为2、3、5、8、10时,计算机设备根据不同人脸聚类算法计算得到的聚类误差如表3所示。计算机设备根据S302至S318的算法,在投影矩阵Pt的列向量个数l={5c,4c,3c,2c},c分别为2、3、5、8、10时,计算得到的函数Φ(W,Z,P)的数值与迭代次数t的关系分别如图4a、4b、4c、4d、4e所示。
表1
Figure BDA0002595446710000153
表2
c l=5c(%) l=4c(%) l=3c(%) l=2c(%)
2 0.78 0.78 0.78 0
3 1.04 0.52 1.56 1.56
5 1.56 1.88 2.19 2.19
8 1.56 1.17 3.32 3.91
10 2.81 1.56 11.88 16.41
表3
Figure BDA0002595446710000161
应该理解的是,虽然图1-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种人脸图像聚类装置,包括:获取模块502、主成分分析模块504、运算模块506、迭代优化模块508和聚类模块510,其中:
获取模块502,用于获取待聚类的人脸图像集合对应的人脸向量集合;
主成分分析模块504,用于对人脸向量集合进行主成分分析运算,得到特征向量集合;
运算模块506,用于对特征向量集合进行运算,得到距离矩阵和投影矩阵;距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度;
迭代优化模块508,用于根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化,直至距离矩阵和投影矩阵满足优化停止条件;优化停止条件是距离矩阵和投影矩阵之间的约束;
聚类模块510,用于基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
在一个实施例中,获取模块502还用于:
对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合;或者,
对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合。
在一个实施例中,主成分分析模块504还用于:
计算人脸向量集合的协方差矩阵;
计算协方差矩阵的特征值;
选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵;
根据特征矩阵对人脸向量集合进行运算,得到特征向量集合。
在一个实施例中,先验条件包括空间紧密先验条件和稀疏表示先验条件;
空间紧密先验条件为:在满足
Figure BDA0002595446710000171
PTP=I的条件下计算函数
Figure BDA0002595446710000172
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为特征向量集合中的第i列向量,yj为特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;
稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;
根据先验条件构造的优化函数为:在diag(Z)=0,
Figure BDA0002595446710000173
PTP=I的条件下获取满足函数
Figure BDA0002595446710000174
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。
在一个实施例中,迭代优化模块508还用于:
基于优化函数对投影矩阵进行优化,得到优化后的投影矩阵;
基于优化函数和优化后的投影矩阵对距离矩阵进行优化。
在一个实施例中,聚类模块510还包括:
构建子模块5102,用于以人脸向量集合中的人脸向量为节点,以距离矩阵中元素为对应节点间的权值,构建人脸向量集合的相似度权重图;
分割子模块5104,用于对相似度权重图进行分割,得到待聚类的人脸图像集合的聚类结果。
在一个实施例中,分割子模块5104还用于:
获取相似度权重图的分割向量;
基于分割向量将相似度权重图分割为两个子图;
当子图不满足分割停止条件时,基于不满足分割停止条件的子图的分割向量,继续对子图进行分割,直至分割后的相似度权重图的所有子图满足分割停止条件;
根据停止分割时相似度权重图的分割结果,得到待聚类的人脸图像集合的聚类结果。
关于人脸图像聚类装置的具体限定可以参见上文中对于人脸图像聚类方法的限定,在此不再赘述。上述人脸图像聚类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储人脸图像聚类数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种人脸图像聚类方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种人脸图像聚类方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7、图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待聚类的人脸图像集合对应的人脸向量集合;
对人脸向量集合进行主成分分析运算,得到特征向量集合;
对特征向量集合进行运算,得到距离矩阵和投影矩阵;距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度;
根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化,直至距离矩阵和投影矩阵满足优化停止条件;优化停止条件是距离矩阵和投影矩阵之间的约束;
基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合;或者,
对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
计算人脸向量集合的协方差矩阵;
计算协方差矩阵的特征值;
选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵;
根据特征矩阵对人脸向量集合进行运算,得到特征向量集合。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:先验条件包括空间紧密先验条件和稀疏表示先验条件;空间紧密先验条件为:在满足
Figure BDA0002595446710000201
PTP=I的条件下计算函数
Figure BDA0002595446710000202
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为特征向量集合中的第i列向量,yj为特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;
稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;
根据先验条件构造的优化函数为:在diag(Z)=0,
Figure BDA0002595446710000203
PTP=I的条件下获取满足函数
Figure BDA0002595446710000204
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于优化函数对投影矩阵进行优化,得到优化后的投影矩阵;
基于优化函数和优化后的投影矩阵对距离矩阵进行优化。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
以人脸向量集合中的人脸向量为节点,以距离矩阵中元素为对应节点间的权值,构建人脸向量集合的相似度权重图;
对相似度权重图进行分割,得到待聚类的人脸图像集合的聚类结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取相似度权重图的分割向量;
基于分割向量将相似度权重图分割为两个子图;
当子图不满足分割停止条件时,基于不满足分割停止条件的子图的分割向量,继续对子图进行分割,直至分割后的相似度权重图的所有子图满足分割停止条件;
根据停止分割时相似度权重图的分割结果,得到待聚类的人脸图像集合的聚类结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待聚类的人脸图像集合对应的人脸向量集合;对人脸向量集合进行主成分分析运算,得到特征向量集合;对特征向量集合进行运算,得到距离矩阵和投影矩阵;距离矩阵中的元素为特征向量集合中对应的特征向量之间的相似度;根据基于先验条件构造的优化函数对投影矩阵和距离矩阵进行迭代优化,直至距离矩阵和投影矩阵满足优化停止条件;优化停止条件是距离矩阵和投影矩阵之间的约束;基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,得各人脸图像的人脸向量构成的人脸向量集合;或者,对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各人脸图像的人脸向量构成的人脸向量集合。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算人脸向量集合的协方差矩阵;计算协方差矩阵的特征值;选取一部分的特征值对应的特征向量组成协方差矩阵的特征矩阵;根据特征矩阵对人脸向量集合进行运算,得到特征向量集合。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:先验条件包括空间紧密先验条件和稀疏表示先验条件;空间紧密先验条件为:在满足
Figure BDA0002595446710000221
PTP=I的条件下计算函数
Figure BDA0002595446710000222
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为特征向量集合中的第i列向量,yj为特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;根据先验条件构造的优化函数为:在diag(Z)=0,
Figure BDA0002595446710000223
PTP=I的条件下获取满足函数
Figure BDA0002595446710000224
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:基于优化函数对投影矩阵进行优化,得到优化后的投影矩阵;基于优化函数和优化后的投影矩阵对距离矩阵进行优化。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:以人脸向量集合中的人脸向量为节点,以距离矩阵中元素为对应节点间的权值,构建人脸向量集合的相似度权重图;对相似度权重图进行分割,得到待聚类的人脸图像集合的聚类结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取相似度权重图的分割向量;基于分割向量将相似度权重图分割为两个子图;当子图不满足分割停止条件时,基于不满足分割停止条件的子图的分割向量,继续对子图进行分割,直至分割后的相似度权重图的所有子图满足分割停止条件;根据停止分割时相似度权重图的分割结果,得到待聚类的人脸图像集合的聚类结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种人脸图像聚类方法,其特征在于,所述方法包括:
获取待聚类的人脸图像集合对应的人脸向量集合;
对所述人脸向量集合进行主成分分析运算,得到特征向量集合;
对所述特征向量集合进行运算,得到距离矩阵和投影矩阵;所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度;
根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化,直至所述距离矩阵和所述投影矩阵满足优化停止条件;所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束;
基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
2.根据权利要求1所述的方法,其特征在于,所述获取待聚类的人脸图像集合对应的人脸向量集合包括:
对于待聚类的人脸图像集合中的每个人脸图像,将每列的像素值顺序拼接为人脸向量,获得各所述人脸图像的人脸向量构成的人脸向量集合;或者,
对于待聚类的人脸图像集合中的每个人脸图像,将每行的像素值顺序拼接为人脸向量,获得各所述人脸图像的人脸向量构成的人脸向量集合。
3.根据权利要求1所述的方法,其特征在于,所述对所述人脸向量集合进行主成分分析运算,得到特征向量集合包括:
计算所述人脸向量集合的协方差矩阵;
计算所述协方差矩阵的特征值;
选取一部分的特征值对应的特征向量组成所述协方差矩阵的特征矩阵;
根据所述特征矩阵对所述人脸向量集合进行运算,得到所述特征向量集合。
4.根据权利要求1所述的方法,其特征在于,所述先验条件包括空间紧密先验条件和稀疏表示先验条件;
所述空间紧密先验条件为:在满足
Figure FDA0002595446700000011
PTP=I的条件下计算函数
Figure FDA0002595446700000012
其中,W为距离矩阵,Wij为距离矩阵的第i行第j列的元素,P为投影矩阵,yi为所述特征向量集合中的第i列向量,yj为所述特征向量集合中的第j列向量,Z为中间矩阵,I是单位矩阵,|Z|和|ZT|分别表示计算Z和ZT的模,||PTyi-PTyj||F表示计算PTyi-PTyj的F范数,i为大于或者等于1的正整数,j为大于或者等于1的正整数;
所述稀疏表示先验条件为:在满足Y=YZ,diag(Z)=0的条件下计算||Z||1;其中,Y为所述特征向量集合,diag(Z)=0表示Z的对角线上元素为0,||Z||1为Z的L1范数;
根据所述先验条件构造的优化函数为:在diag(Z)=0,
Figure FDA0002595446700000021
PTP=I的条件下获取满足函数
Figure FDA0002595446700000022
的W,Z,P;其中λ为第一预设变量,ζ为第二预设变量。
5.根据权利要求4所述的方法,其特征在于,所述根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化包括:
基于所述优化函数对所述投影矩阵进行优化,得到优化后的投影矩阵;
基于所述优化函数和所述优化后的投影矩阵对所述距离矩阵进行优化。
6.根据权利要求1所述的方法,其特征在于,所述基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类包括:
以所述人脸向量集合中的人脸向量为节点,以所述距离矩阵中元素为对应节点间的权值,构建所述人脸向量集合的相似度权重图;
对所述相似度权重图进行分割,得到所述待聚类的人脸图像集合的聚类结果。
7.根据权利要求6所述的方法,其特征在于,所述对所述相似度权重图进行分割,得到所述待聚类的人脸图像集合的聚类结果包括:
获取所述相似度权重图的分割向量;
基于所述分割向量将所述相似度权重图分割为两个子图;
当所述子图不满足分割停止条件时,基于不满足分割停止条件的所述子图的分割向量,继续对所述子图进行分割,直至分割后的所述相似度权重图的所有子图满足分割停止条件;
根据停止分割时所述相似度权重图的分割结果,得到所述待聚类的人脸图像集合的聚类结果。
8.一种人脸图像聚类装置,其特征在于,所述装置包括:
获取模块,用于获取待聚类的人脸图像集合对应的人脸向量集合;
主成分分析模块,用于对所述人脸向量集合进行主成分分析运算,得到特征向量集合;
运算模块,用于对所述特征向量集合进行运算,得到距离矩阵和投影矩阵;所述距离矩阵中的元素为所述特征向量集合中对应的特征向量之间的相似度;
迭代优化模块,用于根据基于先验条件构造的优化函数对所述投影矩阵和所述距离矩阵进行迭代优化,直至所述距离矩阵和所述投影矩阵满足优化停止条件;所述优化停止条件是所述距离矩阵和所述投影矩阵之间的约束;
聚类模块,用于基于满足优化停止条件时的距离矩阵,对待聚类的人脸图像集合进行聚类。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010708111.3A 2020-07-22 2020-07-22 人脸图像聚类方法、装置、计算机设备和存储介质 Pending CN111985336A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010708111.3A CN111985336A (zh) 2020-07-22 2020-07-22 人脸图像聚类方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010708111.3A CN111985336A (zh) 2020-07-22 2020-07-22 人脸图像聚类方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN111985336A true CN111985336A (zh) 2020-11-24

Family

ID=73438379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010708111.3A Pending CN111985336A (zh) 2020-07-22 2020-07-22 人脸图像聚类方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111985336A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528078A (zh) * 2020-12-16 2021-03-19 杭州海康威视数字技术股份有限公司 一种图像归档方法、装置及设备
CN112766299A (zh) * 2020-12-09 2021-05-07 江苏师范大学 一种人脸图像的迭代式双向连接聚类算法
CN112883875A (zh) * 2021-02-22 2021-06-01 北京三快在线科技有限公司 图像聚类方法、装置、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573710A (zh) * 2014-12-25 2015-04-29 北京交通大学 一种基于潜在空间平滑自表征的子空间聚类方法
CN106909944A (zh) * 2017-03-01 2017-06-30 西北大学 一种人脸图片聚类的方法
CN109635647A (zh) * 2018-11-05 2019-04-16 南京航空航天大学 一种基于约束条件下的多图片多人脸的聚类方法
CN111291678A (zh) * 2020-02-06 2020-06-16 北京爱笔科技有限公司 一种基于多特征融合的人脸图像聚类方法及装置
CN111401413A (zh) * 2020-02-29 2020-07-10 同济大学 一种基于优化理论的带规模约束的并行聚类方法
CN111401429A (zh) * 2020-03-12 2020-07-10 安徽理工大学 基于聚类自适应典型相关分析的多视角图像聚类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573710A (zh) * 2014-12-25 2015-04-29 北京交通大学 一种基于潜在空间平滑自表征的子空间聚类方法
CN106909944A (zh) * 2017-03-01 2017-06-30 西北大学 一种人脸图片聚类的方法
CN109635647A (zh) * 2018-11-05 2019-04-16 南京航空航天大学 一种基于约束条件下的多图片多人脸的聚类方法
CN111291678A (zh) * 2020-02-06 2020-06-16 北京爱笔科技有限公司 一种基于多特征融合的人脸图像聚类方法及装置
CN111401413A (zh) * 2020-02-29 2020-07-10 同济大学 一种基于优化理论的带规模约束的并行聚类方法
CN111401429A (zh) * 2020-03-12 2020-07-10 安徽理工大学 基于聚类自适应典型相关分析的多视角图像聚类方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766299A (zh) * 2020-12-09 2021-05-07 江苏师范大学 一种人脸图像的迭代式双向连接聚类算法
CN112766299B (zh) * 2020-12-09 2024-01-09 江苏师范大学 一种人脸图像的迭代式双向连接聚类算法
CN112528078A (zh) * 2020-12-16 2021-03-19 杭州海康威视数字技术股份有限公司 一种图像归档方法、装置及设备
CN112528078B (zh) * 2020-12-16 2023-04-25 杭州海康威视数字技术股份有限公司 一种图像归档方法、装置及设备
CN112883875A (zh) * 2021-02-22 2021-06-01 北京三快在线科技有限公司 图像聚类方法、装置、服务器及存储介质
CN112883875B (zh) * 2021-02-22 2022-09-16 北京三快在线科技有限公司 图像聚类方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
Cai et al. A singular value thresholding algorithm for matrix completion
CN107657015B (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
Baker et al. Low-rank incremental methods for computing dominant singular subspaces
Damle et al. Simple, direct and efficient multi-way spectral clustering
CN111985336A (zh) 人脸图像聚类方法、装置、计算机设备和存储介质
Ding et al. 2-dimensional singular value decomposition for 2d maps and images
Liu et al. Generalized higher order orthogonal iteration for tensor learning and decomposition
US20210012153A1 (en) Image processing method and apparatus, electronic device, and storage medium
US20150293884A1 (en) Method to compute the barycenter of a set of histograms
Takeuchi et al. Nonparametric conditional density estimation using piecewise-linear solution path of kernel quantile regression
CN106803054B (zh) 人脸模型矩阵训练方法和装置
Pumir et al. The generalized orthogonal Procrustes problem in the high noise regime
CN111062324A (zh) 人脸检测方法、装置、计算机设备和存储介质
CN112417169A (zh) 知识图谱的实体对齐方法、装置、计算机设备和存储介质
US20220070266A1 (en) Systems and methods for estimating typed graphlets in large data
Shi et al. Robust generalized low rank approximations of matrices
Li et al. Simultaneous clustering and model selection: Algorithm, theory and applications
CN112200147A (zh) 一种人脸识别方法、装置、计算机设备以及可存储介质
CN110472588B (zh) 锚点框确定方法、装置、计算机设备和存储介质
Salhov et al. Approximately-isometric diffusion maps
CN109086386B (zh) 数据处理方法、装置、计算机设备和存储介质
CN108388869B (zh) 一种基于多重流形的手写数据分类方法及系统
Qian et al. Error bound and exact penalty method for optimization problems with nonnegative orthogonal constraint
CN113420421A (zh) 移动边缘计算中基于时序正则化张量分解的QoS预测方法
CN114638823B (zh) 基于注意力机制序列模型的全切片图像分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination