CN109325515B - 基于局部学习正则化的深度矩阵分解方法及图像聚类方法 - Google Patents

基于局部学习正则化的深度矩阵分解方法及图像聚类方法 Download PDF

Info

Publication number
CN109325515B
CN109325515B CN201810905948.XA CN201810905948A CN109325515B CN 109325515 B CN109325515 B CN 109325515B CN 201810905948 A CN201810905948 A CN 201810905948A CN 109325515 B CN109325515 B CN 109325515B
Authority
CN
China
Prior art keywords
matrix
data
decomposition
image clustering
objective function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810905948.XA
Other languages
English (en)
Other versions
CN109325515A (zh
Inventor
舒振球
孙燕武
陆翼
范洪辉
李仁璞
张�杰
汤嘉立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University of Technology
Original Assignee
Jiangsu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University of Technology filed Critical Jiangsu University of Technology
Priority to CN201810905948.XA priority Critical patent/CN109325515B/zh
Publication of CN109325515A publication Critical patent/CN109325515A/zh
Application granted granted Critical
Publication of CN109325515B publication Critical patent/CN109325515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2133Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on naturality criteria, e.g. with non-negative factorisation or negative correlation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于局部学习正则化的深度矩阵分解方法及图像聚类方法,其中,在深度矩阵分解方法中包括:S10根据待聚类图片获取数据矩阵Y;S20基于数据矩阵Y构建目标函数:S30根据目标函数C**,使用迭代加权的方法,输出基矩阵Ni和系数矩阵Mi,完成对数据矩阵Y的分解。与传统的严格意义上的绝对非负矩阵分解相比,不仅通过深度半非负矩阵分解精准高效地完成了数据的分类,同时将部分属性信息进行合并,实现了对各个区域的预测代价最小化。

Description

基于局部学习正则化的深度矩阵分解方法及图像聚类方法
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于局部学习正则化的深度矩阵分解方法及图像聚类方法。
背景技术
在很多情况下,为了处理数据的分类和聚类问题,我们常常面临着处理高维数据的难题。这类问题的常规解决方法是将高维数据低维化,即建立某种数据表示方法,用低维数据近似表示高维数据。常用的数据表示方法主要分为两类:一类是线性表示方法,另一类是非线性表示方法。对于线性表示方法来说,只要求采样数据所在的低维流形是线性即可,具有使用简单的特点,但在对原始数据进行线性分解时,常常会忽略甚至丢失各种模型的潜在的属性之间的可能存在的非线性关系,进而无法处理新的样本。对于非线性表示方法来说,其通过引入不同层之间的非线性函数,可以从初始输入空间中对模型的潜在属性进行较高精度和更高准确度地提取特征,并同时保证数据的几何流形结构,从而确保忠于原始数据集,保证较多的有效信息和特征的同时,增加了数据的使用效率。
近来,稀疏编码(SC)渐渐地在图像处理、目标分类、语言信号等领域普及,其原理是将少量的训练样本表示测试样本,从而达到将表达系数稀疏化的目的。一种常用的稀疏编码的方法是非负矩阵分解,通过将绝对的非负矩阵分解成两个绝对非负矩阵的乘积的形式。但是严格意义上的非负矩阵很难满足数据的多属性性质所要求的层次结构,在实际应用中局限性较大。
发明内容
针对上述问题,本发明提供了一种基于局部学习正则化的深度矩阵分解方法及图像聚类方法,有效解决现有非负矩阵难以满足数据的多属性性质所要求的层次结构的技术问题。
本发明提供的技术方案如下:
一种基于局部学习正则化的深度矩阵分解方法,包括:
S10根据待聚类图片获取数据矩阵Y;
S20基于所述数据矩阵Y构建目标函数:
Figure GDA0003118674500000021
其中,Y=[y1,y2,…,yN],其中,Yj=yj,j=1,2,…,N,j表示对数据矩阵Y观测的次数,N表示对数据矩阵Y观测的总次数;m为数据矩阵Y的维度;
Figure GDA0003118674500000022
表示不限制内部正负的基矩阵,其中,i=1,2,…,m,对应重建的层数;Mm表示第m层基矩阵
Figure GDA0003118674500000023
对应的系数;D=(Q-E)(Q-E),Q表示数据矩阵Y对应图片的最邻近图,且Q=(V,E),V=Y,E是一个X×X子集;
S30根据目标函数C**,使用迭代加权的方法,输出基矩阵Ni和系数矩阵Mi,完成对数据矩阵Y的分解。
进一步优选地,在步骤S30中包括,目标函数C**对基矩阵Ni求偏导,得到基矩阵Ni的更新迭代式:
Figure GDA0003118674500000024
其中,ψ=N1...Ni-1
Figure GDA0003118674500000025
代表Moore-Penrose伪逆,
Figure GDA0003118674500000026
代表对第i层的重建。
进一步优选地,在步骤S30中还包括,根据数据矩阵Y中m层的数据分解过程,得到系数矩阵Mi的更新迭代式:
Figure GDA0003118674500000027
其中,[M]pos表示矩阵中所有负元素都被0替换,[M]neg表示矩阵中所有正元素都被0替换。
本发明还提供了一种图像聚类方法,包括:
S1从图像库中提取出m个图像,并构造Q个最邻近图;
S2采用如权利要求1-3任意一项所述的深度矩阵分解方法得到系数矩阵Mi
S3利用k-means算法对系数矩阵Mi进行分析,完成图像聚类。
本发明提供的基于局部学习正则化的深度矩阵分解方法及图像聚类方法,与传统的严格意义上的绝对非负矩阵分解相比,不仅通过深度半非负矩阵分解精准高效地完成了数据的分类,同时将部分属性信息进行合并,实现了对各个区域的预测代价最小化;此外,该深度矩阵分解方法不仅可以保持原始数据的流形结构和鉴别结构,而且还能够高效地利用数据集,提取更为潜在的数据属性和特征。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技术特征、优点及其实现方式予以进一步说明。
图1为本发明中基于局部学习正则化的深度矩阵分解方法流程示意图;
图2为本发明中图像聚类方法流程示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
对于深度半非负矩阵分解(Deep Semi-NMF)来说,是将给定的不限制内部元素正负的原始数据集矩阵Y±分解成(m+1)个因子,使这(m+1)个因子的乘积尽可能与原始数据集矩阵Y±近似相等。在系数矩阵非负的限制下,深半非负矩阵正则化尽可能保持信息不变,将高维的随机模式简化为低维的随机模式,简化的基础是估计出数据中的本质结构Y±。因此,从维数简约的角度,由于基矩阵N±和系数矩阵M±同时由原始数据矩阵确定,系数矩阵M±并非是原始数据矩阵Y±在基矩阵N±上的投影,故深度半非负矩阵分解的根本方法是非线性的维数约简。对一个m维的随机变量Y,进行N次观测,分别将这些观测记为Yj,j=1,2,…,N,令Y=[y1,y2,...yn],其中,Yj=yj,j=1,2,…,N,求出m个不限制内部元素正负的基矩阵N±=[n1,n2,…,nN]和非负系数矩阵M±=[e1,e2,...eN],使得满足式(1):
Figure GDA0003118674500000031
为了减少模式全部重建的错误,建立了如式(2)的损失函数,即目标函数Cdeep
Figure GDA0003118674500000032
其中,||·||F表示弗罗贝尼乌斯范数。以此,对于深度半非负矩阵的分解,转化为目标函数Cdeep的最小化问题。
由于其中包括m层结构,具体的分解过程如式(3):
Figure GDA0003118674500000041
对式(3)进行变形得到式(4):
Figure GDA0003118674500000042
通过式(4)进一步限制这些隐含的表示
Figure GDA0003118674500000043
也是非负的,且任意一层的表示层都适合一个聚类解释。
虽然其是稀疏编码常用的分解方法,但是严格意义上的非负矩阵很难满足数据的多属性性质所要求的层次结构,在实际应用中局限性较大。因此,本申请中提出了一种基于局部学习正则化的深度矩阵分解方法,不仅可以精准高效地完成了数据的分类,同时可以将部分属性信息进行合并,实现对各个区域的预测代价最小化。如图1所示,在该分解方法中包括:
S10根据待聚类图片获取数据矩阵Y。
S20基于数据矩阵Y构建由深半非负矩阵正则化的目标损失函数和局部学习正则化的预测损失函数两部分构成的目标函数:
Figure GDA0003118674500000044
其中,Y=[y1,y2,…,yN],其中,Yj=yj,j=1,2,…,N,j表示对数据矩阵Y观测的次数,N表示对数据矩阵Y观测的总次数;m为数据矩阵Y的维度;
Figure GDA0003118674500000045
表示不限制内部正负的基矩阵,其中,i=1,2,…,m,对应重建的层数;Mm表示第m层基矩阵
Figure GDA0003118674500000046
对应的系数;D=(Q-E)(Q-E),Q表示数据矩阵Y对应图片的最邻近图,且Q=(V,E),V=Y,E是一个X×X子集。
在该步骤中,假定
Figure GDA0003118674500000051
以下对其由来进行说明:
对于任意一个数据点Yi,使用T(Yi)表示它周围的点。通过建立预测函数
Figure GDA0003118674500000052
来预测
Figure GDA0003118674500000053
的类标签,其中,l代表第l簇,i代表在yi的临近点内进行训练,将式(6)表示的预测函数最小化:
Figure GDA0003118674500000054
其中,
Figure GDA0003118674500000055
P是正定核函数,
Figure GDA0003118674500000056
是膨胀系数,其中,
Figure GDA0003118674500000057
是Yi的邻域上定义的核矩阵,
Figure GDA0003118674500000058
是指向量[p(yi,yj)]T,yj∈T(yi)。
通过局部学习正则化技术,可以用监督式学习的办法解决无监督式问题。因此,局部学习正则化方法的目标函数如(6)式所示,默认ω1=...=ωn=ω,n1=n2=...=nn=b,根据Representor Theorem定理可得式(7):
Figure GDA0003118674500000059
将式(7)代入式(6),可得到函数的变形式(8):
Figure GDA00031186745000000510
限定
Figure GDA00031186745000000511
得到式(9):
Figure GDA00031186745000000512
其中,矩阵E代表单位矩阵,且满足:
Figure GDA00031186745000000513
将(9)式代入(6)式中得到式(10):
Figure GDA00031186745000000514
其中,
Figure GDA00031186745000000515
将所有的预测组合在一起并将预测错误最小化:
Figure GDA00031186745000000516
之后引入最近邻图,对于任意的特征向量yj∈Y,若其近邻图T(yi)在Y中首次被发现,则可将Y作为其中的一个最近邻图。以此这里根据用户特定的度量,从数据集Y,Y={Y1,...,Yn},Yi∈Rd,构造的最近邻图Q(一个节点连接到C个最近邻居)是一个有向图,其中Q=(V,E)是一个有向图,其中V=X,E是一个X×X子集,并且(xi,xj)∈E,则Nk(xi,Q)在图形Q上是xi的C个近邻。构造图Q,Q∈Rn×n,当yj∈T(yi)时,Qij=γij;否则,Qij=0。将(10)式代入(11)式,令D=(Q-E)(Q-E)(E是单位矩阵),得到预测代价函数式(12):
Figure GDA0003118674500000061
其中,el是矩阵M的第l行。
S30根据目标函数C**,使用迭代加权的方法,输出基矩阵Ni和系数矩阵Mi,完成对数据矩阵Y的分解。
具体,在该步骤中,对C**求偏导时,考虑到(13)式中的第二项
Figure GDA0003118674500000062
对Ni的偏导数为常数0,所以只需通过利用等式
Figure GDA0003118674500000063
便可以得到基矩阵的Ni更新迭代规则:
Figure GDA0003118674500000064
其中,ψ=N1...Ni-1
Figure GDA0003118674500000065
代表Moore-Penrose伪逆,
Figure GDA0003118674500000066
代表对第i层的重建。
根据数据矩阵Y中m层的数据分解过程(与式(4)同理),得到系数矩阵Mi的更新迭代式:
Figure GDA0003118674500000067
其中,[M]pos表示矩阵中所有负元素都被0替换,[M]neg表示矩阵中所有正元素都被0替换,可以通过式(15)实现:
Figure GDA0003118674500000071
Tψ]neg和[ψTψ]neg也可以通过相同的方式加以实现。
基于基矩阵Ni和系数矩阵Mi的迭代式,循环迭代m次得到更新的基矩阵和系数矩阵。
本发明还提供了一种图像聚类方法,如图2所示,在该图像聚类方法中包括:S1从图像库中提取出m个图像,并构造Q个最邻近图;S2采用上述深度矩阵分解方法得到系数矩阵Mi;S3利用k-means算法对系数矩阵Mi进行分析,完成图像聚类。具体,该图像聚类方法除了可以应用于正常的图片聚类之外,可以应用于人脸图像聚类等。
应当说明的是,上述实施例均可根据需要自由组合。以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通相关人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种图像聚类方法,其特征在于,所述图像聚类方法中包括:
S1从图像库中提取出m个图像,并构造Q个最邻近图;
S2采用深度矩阵分解方法得到系数矩阵Mi
S3利用k-means算法对系数矩阵Mi进行分析,完成图像聚类;
深度矩阵分解方法中包括:
S10根据待聚类图片获取数据矩阵Y;
S20基于所述数据矩阵Y构建目标函数:
Figure FDA0003118674490000011
其中,Y=[y1,y2,…,yN],其中,Yj=yj,j=1,2,…,N,j表示对数据矩阵Y观测的次数,N表示对数据矩阵Y观测的总次数;m为数据矩阵Y的维度;Nm表示第m层基矩阵,其中,m是重建的层数;Mm表示第m层基矩阵
Figure FDA0003118674490000012
对应的系数矩阵;Mm表示第m层基矩阵
Figure FDA0003118674490000013
对应的系数矩阵,D=(Q-E)(Q-E),Q表示数据矩阵Y对应图片的最邻近图,且Q=(V,E),V=Y,E是一个X×X子集;
S30根据目标函数C**,使用迭代加权的方法,输出基矩阵Ni和系数矩阵Mi,完成对数据矩阵Y的分解;
在步骤S30中包括,目标函数C**对基矩阵Ni求偏导,得到基矩阵Ni的更新迭代式:
Figure FDA0003118674490000014
其中,ψ=N1...Ni-1
Figure FDA0003118674490000015
代表Moore-Penrose伪逆,
Figure FDA0003118674490000016
代表对第i层的重建;
在步骤S30中还包括,根据数据矩阵Y中m层的数据分解过程,得到系数矩阵Mi的更新迭代式:
Figure FDA0003118674490000017
其中,[M]pos表示矩阵中所有负元素都被0替换,[M]neg表示矩阵中所有正元素都被0替换。
CN201810905948.XA 2018-08-10 2018-08-10 基于局部学习正则化的深度矩阵分解方法及图像聚类方法 Active CN109325515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810905948.XA CN109325515B (zh) 2018-08-10 2018-08-10 基于局部学习正则化的深度矩阵分解方法及图像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810905948.XA CN109325515B (zh) 2018-08-10 2018-08-10 基于局部学习正则化的深度矩阵分解方法及图像聚类方法

Publications (2)

Publication Number Publication Date
CN109325515A CN109325515A (zh) 2019-02-12
CN109325515B true CN109325515B (zh) 2021-09-28

Family

ID=65264149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810905948.XA Active CN109325515B (zh) 2018-08-10 2018-08-10 基于局部学习正则化的深度矩阵分解方法及图像聚类方法

Country Status (1)

Country Link
CN (1) CN109325515B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215082A (zh) * 2020-09-17 2021-01-12 广东技术师范大学 一种植物叶片图像识别方法
US11527074B1 (en) 2021-11-24 2022-12-13 Continental Automotive Technologies GmbH Systems and methods for deep multi-task learning for embedded machine vision applications

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006134011A1 (de) * 2005-06-17 2006-12-21 Siemens Aktiengesellschaft Verfahren zur rechnergestützten verarbeitung von digitalen daten
CN107292341A (zh) * 2017-06-20 2017-10-24 西安电子科技大学 基于成对协同正则化和nmf的自适应多视图聚类方法
CN107609596A (zh) * 2017-09-22 2018-01-19 江苏理工学院 无参数自动加权多图正则化非负矩阵分解及图像聚类方法
CN107894967A (zh) * 2017-11-27 2018-04-10 江苏理工学院 一种基于局部与全局正则化稀疏编码方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006134011A1 (de) * 2005-06-17 2006-12-21 Siemens Aktiengesellschaft Verfahren zur rechnergestützten verarbeitung von digitalen daten
CN107292341A (zh) * 2017-06-20 2017-10-24 西安电子科技大学 基于成对协同正则化和nmf的自适应多视图聚类方法
CN107609596A (zh) * 2017-09-22 2018-01-19 江苏理工学院 无参数自动加权多图正则化非负矩阵分解及图像聚类方法
CN107894967A (zh) * 2017-11-27 2018-04-10 江苏理工学院 一种基于局部与全局正则化稀疏编码方法

Also Published As

Publication number Publication date
CN109325515A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
US11645835B2 (en) Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
US11221990B2 (en) Ultra-high compression of images based on deep learning
Drenkow et al. A systematic review of robustness in deep learning for computer vision: Mind the gap?
Sorzano et al. A survey of dimensionality reduction techniques
Yang et al. A sparse singular value decomposition method for high-dimensional data
CN106097278B (zh) 一种多维信号的稀疏模型、重建方法和字典训练方法
CN107480636B (zh) 基于核非负矩阵分解的人脸识别方法、系统及存储介质
Liu et al. MLSLR: Multilabel learning via sparse logistic regression
CN109657611B (zh) 一种用于人脸识别的自适应图正则化非负矩阵分解方法
CN111324791B (zh) 一种多视数据子空间聚类方法
CN113420421B (zh) 移动边缘计算中基于时序正则化张量分解的QoS预测方法
CN109325515B (zh) 基于局部学习正则化的深度矩阵分解方法及图像聚类方法
CN108764351B (zh) 一种基于测地距离的黎曼流形保持核学习方法及装置
CN108121962B (zh) 基于非负自适应特征提取的人脸识别方法、装置及设备
Yang et al. Joint learning of unsupervised dimensionality reduction and gaussian mixture model
CN109558882B (zh) 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置
CN110097499B (zh) 基于谱混合核高斯过程回归的单帧图像超分辨率重建方法
CN109614581B (zh) 基于对偶局部学习的非负矩阵分解聚类方法
CN116958613A (zh) 深度多视图聚类方法、装置、电子设备及可读存储介质
CN108009570A (zh) 一种基于核正负标签传播的数据分类方法及系统
CN108009586B (zh) 封顶概念分解方法及图像聚类方法
CN116383441A (zh) 社群检测方法、装置、计算机设备和存储介质
Rad et al. A multi-view-group non-negative matrix factorization approach for automatic image annotation
Konstantinidis et al. Kernel learning with tensor networks
Cheng et al. Locality constrained-ℓp sparse subspace clustering for image clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant