CN111046745B - 基于软块对角的多视聚类方法 - Google Patents

基于软块对角的多视聚类方法 Download PDF

Info

Publication number
CN111046745B
CN111046745B CN201911152319.5A CN201911152319A CN111046745B CN 111046745 B CN111046745 B CN 111046745B CN 201911152319 A CN201911152319 A CN 201911152319A CN 111046745 B CN111046745 B CN 111046745B
Authority
CN
China
Prior art keywords
view
clustering
incomplete
data
block diagonal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911152319.5A
Other languages
English (en)
Other versions
CN111046745A (zh
Inventor
王博岳
罗萃萃
胡永利
魏运
孙艳丰
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201911152319.5A priority Critical patent/CN111046745B/zh
Publication of CN111046745A publication Critical patent/CN111046745A/zh
Application granted granted Critical
Publication of CN111046745B publication Critical patent/CN111046745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于软块对角的多视聚类方法,涉及模式识别和机器学习等领域,尤其是面向人脸图像的不完整多视角数据的聚类任务。该方法在基于多视角数据自表示的模型上引入软块对角正则化,对学习到的多图进行融合,最终把得到的软块对角相似度矩阵执行NCut操作。相比于传统的硬块对角正则化,软块对角正则化对噪声和异常值更加鲁棒。完成了不完整多视聚类任务,提高了识别正确率。

Description

基于软块对角的多视聚类方法
技术领域
本发明涉及模式识别和机器学习等领域,尤其是面向人脸图像的不完整多视角数据的聚类任务。
背景技术
多视角数据聚类是当前数据挖掘领域的研究热点之一,在机器学习,模式识别和计算机视觉等方面都有着广泛的应用。相比于单视角图像视频数据,多视角数据可以看作对同一对象不同视角的采样,这种多视角采样提供了更全面的对象或场景的信息,有益于解决聚类应用中常用的光照和遮挡等问题。而如何获取多视视频数据的类别等语义信息,是多视视频大数据高效组织和有效利用的关键问题,这一问题的解决依赖于聚类分析中的无监督聚类方法的突破。
在聚类任务中,为了对具有K个类别的数据进行聚类,理想的相似矩阵应该具有精确的K个对角块,其中来自相同块的数据自然地被视为一个类别,这种块对角正则化策略通常被嵌入到谱聚类算法中以提高聚类性能,但仍存在若干缺点。一方面,它们被设计用于多个图的数据,而不是原始的多视角数据或特征。另一方面,这使得块对角矩阵具有恰好具有K个连通分量,其中K是类别的数量,忽略了噪声和异常值的重要性。
传统的多视聚类方法假设所有样本的各视信息都是完整的,但实际情况下某些视角数据有可能缺失,例如由于某视角拍摄设备故障或者线路传输故障造成某视角数据丢失,产生不完整多视数据,并且每个样本的缺失是视角的数量是随机的,这为多视聚类算法带来了困难。
发明内容
为解决传统方法聚类多视角数据出现的问题,本发明公开了一种基于软块对角策略的多视聚类方法,同时面向完整及不完整的多视角数据。该方法在基于多视角数据自表示的模型上引入软块对角正则化,对学习到的多图进行融合,最终把得到的软块对角相似度矩阵执行NCut操作。相比于传统的硬块对角正则化,软块对角正则化对噪声和异常值更加鲁棒。为了处理不完整的多视角数据,使用多个指示矩阵来标记每个视角中缺失样本的位置,从而完成不完整多视聚类任务。
基于软块对角正则化的多视聚类方法,适用于完整和不完整的多视角数据,包括以下步骤:
首先使用四个经典的人脸数据库(ORL,Yale,Extended YaleB和CMU-PIE)来构建输入样本点:a)将所有图片尺度归一化后提取LBP,Gist和Gabor特征作为完整多视数据样本的三个视角输入。b)对于完整的数据集,先随机从每个视角中删除0.1-0.4的样本再提取LBP,Gist和Gabor特征作为不完整多视数据样本的三个视角输入。
接下来利用提出的多视聚类方法MVC-SBD和IMVC-SBD分别对完整和不完整的多视输入数据进行处理:
·MVC-SBD:
s.t.diag(BM)=0,BM≥0,BM=BM T
·IMVC-SBD:
s.t.diag(BIM)=0,BIM≥0,BIM=BIM T
其中Xv和Yv分别表示完整的和不完整的多视聚类模型的第v个视角输入,具体地,视角数目v取3,X1,X2和X3(Y1,Y2和Y3)分别表示提取的LBP,Gist和Gabor特征;ZM和ZIM分别表示Xv和Yv的自表示矩阵;BM和BIM为相似度矩阵;约束‖BM≈K和‖BIM≈K表示软块对角正则化,即矩阵BM和BIM的对角块数目近似于数据样本的类别数K。相比于传统的块对角约束(严格要求相似度矩阵具有K个对角块)软块对角正则化约束的使用保证了本方法模型对噪声和异常值的鲁棒性。权衡因子λ1λ2λ3取值范围为{10-4,10-3,10-2,10-1,100,101,102,103}。diag(·)提取矩阵的对角元素。
最后对该模型进行优化求解得到的软块对角相似度矩阵BM和BIM执行谱聚类Ncut操作,得到聚类结果。我们选择了ACC和NMI作为标准测量值,指标的较高值会反映出更好的性能。
有益效果
本发明解决了传统多视聚类方法假设所有样本的各视信息都是完整的,而实际情况下某些视角数据存在缺失,产生不完整多视数据的问题,完成了不完整多视聚类任务,提高了识别正确率。
附图说明
图1、本发明方法流程图
图2、数据库部分样本示例
具体实施方式
人脸图像集聚类-面部聚类是模式识别领域的一个基本问题。在一个图像集上聚类,即一个人的多个面部图像,可以减轻使用单个人脸图像的缺点,例如有限的视图,噪声和坏的聚类结果。在这个实验中,我们使用四个常用的经典人脸数据库,包括ORL,Yale,Extended YaleB和CMU-PIE,来构建面部图像集数据。
图2是数据集中的一些样本图像,由上至下依次为ORL,Yale,Extended YaleB,CMU-PIE。这些数据集均为完整数据集(未缺失),直接提取特征可作为完整多视数据聚类方法模型的输入;先随机从每个视角中删除0.1-0.4的样本再提取特征则可作为不完整多视数据聚类方法模型的输入。
为了验证所提方法聚类效果的优越性,将本发明MVC-SBD与SwMC,MLAN,DiMSC,LMSC,MCGC,MVGL几种面向完整数据的多视聚类方法进行比较,将本发明的IMVC-SBD与IMC-GRMF,UEAF,OPIMC几种面向不完整数据的多视聚类方法进行比较。
表1显示了在不同数据集上,MVC-SBD与其他多视聚类方法的实验效果。显然,在大多数情况下,我们提出的方法性能明显优于许多现有的最先进的方法,而其他比较方法仅在部分数据集中获得满意的实验结果,如ORL数据集中的DiMSC,CMU-PIE数据集中的SwMC和LMSC。由于噪声、光照、姿态等因素的影响,在Extended YaleB和CMU-PIE数据库数据量更大、数据样本更复杂的情况下,聚类性能变得更具挑战性。然而,从目前的结果可以看出,我们的MVC-SBD仍然优于其他方法。它清楚地说明了我们提出的多视聚类统一框架对于噪声和离群点的鲁棒性。与基于自表示的方法DiMSC和LMSC相比,我们提出的MVC-SBD在两个评估指标方面均实现了较高的性能,这是因为我们将软块对角正则化约束引入了自表示模型中。谱聚类算法中,理想的相似度矩阵应该具有块对角结构。尽管对比方法MLAN,SwMC,MCGC和MVGL中使用的拉普拉斯秩约束也是经典的块对角约束,但它严格要求所学习的相似性矩阵恰好包含K个对角块,由于存在噪声和离群值,这种约束对实际数据过于严格。而本方法使用的软块对角正则化放宽了该约束条件,并获得了更好的实验结果。
表2列出了不同数据库中比较方法的不完全多视聚类结果。可以看出,对于不同的不完全多视数据聚类任务,当不完全率在0.1-0.4之间变化时,我们所提出的IMVC-SBD方法总能获得最佳的性能。另外,与我们的IMVC-SBD相比,其他三种方法的实验性能较差,这表明基于谱聚类的方法比基于矩阵分解的方法能够捕获更多不完整多视数据的互补信息。可以看出,随着不完全度的增加,我们的方法IMVC-SBD的ACC和NMI值约下降了20%,这表明采用软块对角正则化策略学习一个判别表示矩阵对于不完整多视聚类是至关重要的。
无论是完整还是不完整多视数据,我们提出的方法都比其他比较方法实现了更高的聚类精度和识别能力,这预示着未来在实际应用中的良好前景。
表1:完整多视数据聚类方法效果对比
表2:不完整多视聚类方法效果对比

Claims (1)

1.基于软块对角的多视聚类方法,适用于完整以及不完整的多视数据,其特征在于包括以下步骤:
(1)将样本数为N,类别数为K的图像数据集,提取LBP,Gabor,及Gist特征,作为完整数据多视聚类模型的三个视角输入:X1,X2及X3;对于不完整多视聚类,先随机从每个视角中删除0.1-0.4的样本,再提取LBP,Gabor及Gist特征,作为不完整数据多视聚类模型的三个视角输入:Y1,Y2及Y3
(2)通过基于软块对角策略的多视聚类方法MVC-SBD和IMVC-SBD分别对完整和不完整的多视输入数据进行处理,其中所述的多视聚类学习方法模型如下:
●MVC-SBD:
s.t.diag(BM)=0,BM≥0,BM=BM T
●IMVC-SBD:
s.t.diag(BIM)=0,BIM≥0,BIM=BIM T
其中Xv和Yv分别表示完整的和不完整的多视聚类模型的第v个视角输入,具体地,视角数目v取3,X1,X2和X3分别表示完整的多视聚类模型提取的LBP,Gist和Gabor特征,Y1,Y2和Y3分别表示不完整的多视聚类模型提取的LBP,Gist和Gabor特征;ZM v和ZIM v分别表示Xv和Yv的自表示矩阵;BM和BIM为相似度矩阵;约束||BM||≈K和||BiM||≈K表示软块对角正则化,即矩阵BM和BIM的对角块数目近似于数据样本的类别数K;λ1、λ2、λ3取值范围均为{10-4,10-3,10-2,10-1,100,101,102,103},diag(·)提取矩阵的对角元素;
(3)根据优化求解得到的软块对角相似度矩阵BM和BIM,分别对其进行谱聚类Ncut操作,得到两种模型的多视聚类结果。
CN201911152319.5A 2019-11-20 2019-11-20 基于软块对角的多视聚类方法 Active CN111046745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911152319.5A CN111046745B (zh) 2019-11-20 2019-11-20 基于软块对角的多视聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911152319.5A CN111046745B (zh) 2019-11-20 2019-11-20 基于软块对角的多视聚类方法

Publications (2)

Publication Number Publication Date
CN111046745A CN111046745A (zh) 2020-04-21
CN111046745B true CN111046745B (zh) 2023-08-04

Family

ID=70233083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911152319.5A Active CN111046745B (zh) 2019-11-20 2019-11-20 基于软块对角的多视聚类方法

Country Status (1)

Country Link
CN (1) CN111046745B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307980A (zh) * 2020-10-28 2021-02-02 北京工业大学 一种基于不完整多视聚类的图像识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400143A (zh) * 2013-07-12 2013-11-20 中国科学院自动化研究所 一种基于多视角的数据子空间聚类方法
CN103559426A (zh) * 2013-11-06 2014-02-05 北京工业大学 一种针对多视图数据融合的蛋白质功能模块挖掘方法
CN106971197A (zh) * 2017-03-02 2017-07-21 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN107784318A (zh) * 2017-09-12 2018-03-09 天津大学 一种应用于多视角聚类的鲁棒性相似图表示的学习方法
CN108171279A (zh) * 2018-01-28 2018-06-15 北京工业大学 一种多视角视频自适应乘积Grassmann流形子空间聚类方法
CN109063757A (zh) * 2018-07-20 2018-12-21 西安电子科技大学 基于块对角表示和视图多样性的多视图子空间聚类方法
CN109784374A (zh) * 2018-12-21 2019-05-21 西北工业大学 基于自适应邻近点的多视角聚类方法
CN110135499A (zh) * 2019-05-16 2019-08-16 北京工业大学 基于流形空间自适应邻域图学习的聚类方法
CN110135520A (zh) * 2019-05-27 2019-08-16 哈尔滨工业大学(深圳) 基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400143A (zh) * 2013-07-12 2013-11-20 中国科学院自动化研究所 一种基于多视角的数据子空间聚类方法
CN103559426A (zh) * 2013-11-06 2014-02-05 北京工业大学 一种针对多视图数据融合的蛋白质功能模块挖掘方法
CN106971197A (zh) * 2017-03-02 2017-07-21 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN107784318A (zh) * 2017-09-12 2018-03-09 天津大学 一种应用于多视角聚类的鲁棒性相似图表示的学习方法
CN108171279A (zh) * 2018-01-28 2018-06-15 北京工业大学 一种多视角视频自适应乘积Grassmann流形子空间聚类方法
CN109063757A (zh) * 2018-07-20 2018-12-21 西安电子科技大学 基于块对角表示和视图多样性的多视图子空间聚类方法
CN109784374A (zh) * 2018-12-21 2019-05-21 西北工业大学 基于自适应邻近点的多视角聚类方法
CN110135499A (zh) * 2019-05-16 2019-08-16 北京工业大学 基于流形空间自适应邻域图学习的聚类方法
CN110135520A (zh) * 2019-05-27 2019-08-16 哈尔滨工业大学(深圳) 基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Canyi Lu等.Subspace Clustering by Block Diagonal Representation.《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》.2018,第1-15页. *

Also Published As

Publication number Publication date
CN111046745A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
CN112308158B (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN104268593B (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN109903236B (zh) 基于vae-gan与相似块搜索的人脸图像修复方法及装置
CN108319938A (zh) 用于高性能人脸识别系统的高质量训练数据准备系统
CN109711461B (zh) 基于主成分分析的迁移学习图片分类方法及其装置
CN103942571B (zh) 一种基于遗传规划算法的图形图像分类方法
CN111738143A (zh) 一种基于期望最大化的行人重识别方法
Bui et al. Scalable sketch-based image retrieval using color gradient features
CN109299664B (zh) 一种行人重识别的重排序方法
CN102592148A (zh) 基于非负矩阵分解和多种距离函数的人脸识别方法
CN113239131B (zh) 基于元学习的少样本知识图谱补全方法
CN111652273B (zh) 一种基于深度学习的rgb-d图像分类方法
CN105469080B (zh) 一种人脸表情识别方法
WO2021012793A1 (zh) 基于大数据分析的律师推荐方法及相关设备
CN111325237B (zh) 一种基于注意力交互机制的图像识别方法
JPH09134432A (ja) パターン認識方法
CN106845516A (zh) 一种基于多样本联合表示的足迹图像识别方法
CN110674685A (zh) 一种基于边缘信息增强的人体解析分割模型及方法
CN112784921A (zh) 任务注意力引导的小样本图像互补学习分类算法
CN111046745B (zh) 基于软块对角的多视聚类方法
Jia et al. 2DPCANet: dayside aurora classification based on deep learning
CN106951501B (zh) 一种基于多图匹配的三维模型检索方法
CN110674334B (zh) 基于一致性区域深度学习特征的近重复图像检索方法
CN111401434A (zh) 一种基于无监督特征学习的图像分类方法
CN115100694A (zh) 一种基于自监督神经网络的指纹快速检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant