CN102722578A - 一种基于拉普拉斯正则化无监督的聚类特征选取方法 - Google Patents

一种基于拉普拉斯正则化无监督的聚类特征选取方法 Download PDF

Info

Publication number
CN102722578A
CN102722578A CN2012101825144A CN201210182514A CN102722578A CN 102722578 A CN102722578 A CN 102722578A CN 2012101825144 A CN2012101825144 A CN 2012101825144A CN 201210182514 A CN201210182514 A CN 201210182514A CN 102722578 A CN102722578 A CN 102722578A
Authority
CN
China
Prior art keywords
matrix
characteristic set
characteristic
sample characteristics
variance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101825144A
Other languages
English (en)
Other versions
CN102722578B (zh
Inventor
何晓飞
姚冠红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201210182514.4A priority Critical patent/CN102722578B/zh
Publication of CN102722578A publication Critical patent/CN102722578A/zh
Application granted granted Critical
Publication of CN102722578B publication Critical patent/CN102722578B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括:(1)构建样本特征矩阵;(2)计算拉普拉斯矩阵;(3)对样本特征矩阵进行特征提取。本发明通过直接度量后续学习预测结果的方差来选择特征,能直接提高后续学习预测效果;同时在特征提取过程中考虑选取的特征点对于学习问题的预测值的影响,故能有效提高后续的学习效率;另外本发明数据的建模是基于数据的流形几何的拉普拉斯方法,该方法能有效的反映数据在空间中的分布信息,从而能够找出信息量最大的维度。

Description

一种基于拉普拉斯正则化无监督的聚类特征选取方法
技术领域
本发明属于数据处理技术领域,具体涉及一种基于拉普拉斯正则化无监督的聚类特征选取方法。
背景技术
聚类是机器学习和数据挖掘中一种常见的多元统计分析方法,它讨论的对象是大量的样品,要求能按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即在没有先验知识的情况下进行的。目前,作为一种有效地数据分析手段,聚类方法被广泛应用于各大领域:在商业上,聚类分析被用来发现不同的客户群,并且通过购买模式刻画不同的客户群的特征;在生物上,聚类分析被用来动植物分类和基因进行分类,获取对种群固有结构的认识;在地理上,聚类能够帮助在地球中被观察的数据库上趋于的相似性;在保险行业上,聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组,同时根据住宅类型,价值,地理位置来鉴定一个城市的房产分组;在互联网应用中,聚类分析被用来对网络中的文档进行归类,对虚拟社区中的用户进行分组。
常见的聚类分析方法主要包括如下几种:
(1)分裂法,又称划分方法,首先创建K个划分,K为要创建的划分的个数;然后利用一个循环定位的技术通过将对象从一个划分移到另一个划分来改善划分质量。典型的划分方法有:K均值聚类算法(Kmeans)、K中心聚类算法(Kmedoids)和聚类大应用程序算法(CLARA,Clustering LARge Application)等。
(2)层次法,通过创建一个层次以分解给定的数据集。该方法可以分为自上而下(分解)和自下而上(合并)两种操作方式。为弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。典型的层次方法有:基于平衡迭代降低的层次聚类算法(BIRCH,Balanced Iterative Reducing andClustering using Hierarchies)、基于表达的聚类算法(CURE,Clustering UsingREprisentatives)和基于动态模型的层次聚类算法(CHEMALOEN)等。
(3)基于密度的方法,根据密度完成对象的聚类。它根据对象周围的密度不断增长聚类。典型的基于密度的方法有:基于密度的聚类算法(DBSCAN,Densit-based Spatial Clustering of Application with Noise)和基于对象排序识别聚类结构的聚类算法(OPTICS,Ordering Points To Identify the Clustering Structure)。
(4)基于网格的方法,首先将对象空间划分为有限个单元以构成网格结构,然后利用网格结构完成聚类。
(5)基于模型的方法,它假设每个聚类的模型并发现适合相应模型的数据。
这些传统的聚类方法已经比较成功的解决了低维数据的聚类问题,但随着信息技术的迅速发展,数据采集能力的提高导致各领域数据的维度呈指数级增长,由于实际应用中数据的复杂性,在处理许多高维数据时传统的聚类方法经常失效。因为传统聚类方法对高维数据集中进行聚类时,主要遇到两个问题:(1)高维数据集中存在大量无关的属性使得在所有维中存在簇的可能性几乎为零,大大增加了运算的复杂度;(2)高维带来的维度灾难使得某些聚类算法的实用性几乎为零,在图像,识别,信息检索等众多领域,严重影响学习的效率和效果。
针对以上两个问题,研究者提出了特征选择和特征提取两种聚类预处理方法。特征提取是将原有的特征进行转换和组合,产生新的有效的特征。而特征选择是从原来大量的特征中挑选出包含最多信息的特征。这两项技术是成功的数据应用学习的重要组成部分。根据是否利用标记数据进行训练,特征选择可以分成监督式特征学习和非监督式特征学习。典型的监督式特征学习包括费舍尔分值法(Fish score),蓬松相关系数法(Person correlation coefficients)等。这些方法能很有效的进行特征选择。然而,在实际应用中,由于对数据进行标记需要昂贵的人力成本,并且有时候,带标记的数据难以取得,因此监督式学习就难以在一些应用中发挥作用。
故为了解决维数灾难和消除数据中对于学习来说不必要的冗余信息,常采用非监督式特征选择对数据进行预处理。目前主要的非监督式方法有:
拉普拉斯分值法(Laplacian Score):利用数据的原始流形空间信息,挑选出最符合数据几何分布规律的特征点。它从最本质的原理出发,充分利用了数据的分布特性,揭示事物的本质,简化复杂的问题。
Q-alpha法:通过优化最小二乘法标准函数通过估计所选维度数据点的聚类性来挑选特征。
方差法(Variance):选取方差变化最大的特征为所需特征。
拉普拉斯分值作为经典的特征选择的谱方法,目前已经广泛应用于各种应用,该方法可以有效地找出数据的主要特征,但是不能有效地提取出数据的类别特征;Q-alpha作为一种特征选择方法,在基因的选择上有很好的效果,但是不适合其他应用(比如图形图像的处理);方差特征选择法是最简单的一种特征选择方法之一,但是它仅仅选择变化最大的特征作为包含信息量最大的特征,这样的选择方式容易被噪音数据所干扰。
发明内容
针对现有技术所存在的上述技术缺陷,本发明提供了一种基于拉普拉斯正则化无监督的聚类特征选取方法,能够改善后续学习及聚类分析的效果,提高学习及聚类分析的判别能力。
一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括如下步骤:
(1)获取样本数据集合,进而构建样本数据集合的样本特征矩阵;
所述的样本特征矩阵为n×m维矩阵,n为特征个数,m为样本个数,且m和n均为大于1的自然数;
(2)根据所述的样本特征矩阵,计算出其对应的拉普拉斯矩阵;
(3)根据所述的拉普拉斯矩阵,利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合,k为预期给定的特征提取个数。
所述的步骤(3)中,利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合的具体过程如下:
a.取样本特征矩阵中的任一行特征集合作为特征过渡矩阵Y1
b.根据以下方程组计算特征过渡矩阵Y1对应的方差z1
z1=max{g11,g12,g13…g1m}
g1j=(y1j)TH-1Y1(Y1)TH-1y1j
H - 1 = 1 β I - 1 β Y 1 ( Q 1 ) - 1 ( Y 1 ) T
Q1=M+(Y1)TY1
M=β(I+αL)-1
其中:y1j为Y1的第j列特征向量,j为自然数,且1≤j≤m,L为样本特征矩阵对应的拉普拉斯矩阵,I为单位矩阵,α和β均为给定的运算系数;
c.根据步骤a和b,遍历样本特征矩阵中的每一行特征集合,得到n个方差,从样本特征矩阵中提取出最小方差所对应的一行特征集合,并令该行特征集合为S1,以完成第一次特征提取;
d.依次完成k次特征提取后从样本特征矩阵中提取得到k行特征集合;
其中,关于第i次特征提取的过程为:构建一i×m维矩阵,令S1~Si-1为该矩阵的前i-1行特征集合,取样本特征矩阵中除S1~Si-1外的任一行特征集合为该矩阵的第i行特征集合,并使该矩阵作为特征过渡矩阵Yi,i为自然数,且2≤i≤k;根据以下方程组计算特征过渡矩阵Yi对应的方差zi
zi=max{gi1,gi2,gi3…gim}
gij=(yij)TH-1Yi(Yi)TH-1yij
H - 1 = 1 β I - 1 β Y i ( Q i ) - 1 ( Y i ) T
Qi=M+(Yi)TYi
M=β(I+αL)-1
其中:yij为Yi的第j列特征向量;
依此,遍历样本特征矩阵中除S1~Si-1外的每一行特征集合,得到n-i+1个方差,从样本特征矩阵中提取出最小方差所对应的一行特征集合,并令该行特征集合为Si
优选地,第i次特征提取过程中,根据以下方程组计算特征过渡矩阵Yi对应的方差zi
zi=max{gi1,gi2,gi3…gim}
gij=(yij)TH-1Yi(Yi)TH-1yij
H - 1 = 1 β I - 1 β Y i ( Q i ) - 1 ( Y i ) T
( Q i ) - 1 = [ M + ( Y i ) T Y i ] - 1 = ( Q i - 1 ) - 1 - ( Q i - 1 ) - 1 x i ( x i ) T ( Q i - 1 ) - 1 1 + ( x i ) T ( Q i - 1 ) - 1 x i
其中:xi为Yi的第i行特征集合。
采用该优选技术方案能够大幅减少相应运算量,有效提升特征提取过程的速率。
本发明的有益技术效果为:
(1)促进后续学习分析的有效性:相比其他特征选择方法,本发明方法通过直接度量后续学习预测结果的方差来选择特征,由此方法选择出的特征能直接提高后续学习预测效果。
(2)可解释性:因为本发明方法选取特征点的过程是直接考虑选取的特征点对于学习问题的预测值的影响,所以比其他方法更能直接的提高后续的学习效率。
(3)良好的数据建模:本发明方法数据的建模是基于数据的流形几何的拉普拉斯方法,该方法相比于一般模型,能有效的反映数据在空间中的分布信息;基于此方法的特征选择方法能够找出信息量最大的维度。
附图说明
图1为本发明特征提取方法的步骤流程示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的聚类方法进行详细说明。
如图1所示,一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括如下步骤:
(1)构建样本特征矩阵。
本实施方式以ORL人脸数据集为例,该数据集合的统计信息如表1所示。
表1
  数据集   人脸图像帧数   人脸类别数   图像特征个数
  ORL   1400   20   1024
其中,ORL人脸数据集中有1400帧人脸图像,1400帧人脸图像由20个不同相貌的人的人脸图像组成(每个人各70帧人脸图像)。
选取ORL人脸数据集中五类人脸图像作为原始的高维数据集合,并构建对应的样本特征矩阵X,X为n×m维矩阵,m为样本个数(即图像帧数),n为样本的特征个数,样本特征矩阵中的元素值为样本各特征的特征值;m=5×70=350,n=1024。
(2)计算拉普拉斯矩阵。
根据样本特征矩阵X,计算出其对应的拉普拉斯矩阵L;
求解拉普拉斯矩阵L的具体过程如下:
a.构造邻接图:将n个数据点构造成邻接图G。定义度量点之间关联性的函数,根据定义,如果xi和xj关联度高(也可以认为是点与点在流形上的相近程度),则在图G上的点i和点j就有边相连。
一般采用两种函数用来计算点之间的相关性:
1.∈-邻接计算法,[∈∈R]。如果||xi-xj||2<∈,则图G上的点i和点j之间有边相连。
2.K近邻法,[k∈N]。如果xi在xj的k个最近邻中或者xj在xi的k个最近邻中,则图G上的i和j之间有边相连。(本实施方式采用K近邻法)
b.赋权重:构造m×m的矩阵W,Wij表示图G上点i和点j之间边的权重值,如果i和j之间没有边相连,则权重为0。Wij的计算方法也有两种:
1.高斯核,如果点i和点j是相连的。则权重
Figure BDA00001711369000061
2.二值法,如果点i和点j相连,则权重Wij=1。
L=D-W,其中D矩阵为对角矩阵,对角上的每个元素Dii=∑j Wij
(3)对样本特征矩阵进行特征提取。
a.取样本特征矩阵X中的任一行特征集合作为特征过渡矩阵Y1
b.根据以下方程组计算特征过渡矩阵Y1对应的方差z1
z1=max{g11,g12,g13…g1m}
g1j=(y1j)TH-1Y1(Y1)TH-1y1j
H - 1 = 1 β I - 1 β Y 1 ( Q 1 ) - 1 ( Y 1 ) T
Q1=M+(Y1)TY1
M=β(I+αL)-1
其中:y1j为Y1的第j列特征向量,j为自然数,且1≤j≤m,L为样本特征矩阵X对应的拉普拉斯矩阵,I为单位矩阵,α和β均为运算系数;本实施方式中,α=β=0.001。
c.根据步骤a和b,遍历样本特征矩阵X中的每一行特征集合,得到n个方差,从样本特征矩阵X中提取出最小方差所对应的一行特征集合,并令该行特征集合为S1,以完成第一次特征提取;
d.依次完成k次特征提取后从样本特征矩阵X中提取得到k行特征集合;
其中,关于第i次特征提取的过程为:构建一i×m维矩阵,令S1~Si-1为该矩阵的前i-1行特征集合,取样本特征矩阵X中除S1~Si-1外的任一行特征集合为该矩阵的第i行特征集合,并使该矩阵作为特征过渡矩阵Yi,i为自然数,且2≤i≤k,k为预期的特征提取个数,本实施方式k=20;根据以下方程组计算特征过渡矩阵Yi对应的方差zi
zi=max{gi1,gi2,gi3…gim}
gij=(yij)TH-1Yi(Yi)TH-1yij
H - 1 = 1 β I - 1 β Y i ( Q i ) - 1 ( Y i ) T
( Q i ) - 1 = [ M + ( Y i ) T Y i ] - 1 = ( Q i - 1 ) - 1 - ( Q i - 1 ) - 1 x i ( x i ) T ( Q i - 1 ) - 1 1 + ( x i ) T ( Q i - 1 ) - 1 x i
其中:yij为Yi的第j列特征向量,xi为Yi的第i行特征集合。
依此,遍历样本特征矩阵X中除S1~Si-1外的每一行特征集合,得到n-i+1个方差,从样本特征矩阵X中提取出最小方差所对应的一行特征集合,并令该行特征集合为Si
最后对提取得到的k行特征集合构成的数据矩阵进行K均值聚类。
以下依次使聚类个数p=10,15,通过分析精确度(accuracy,简写为AC)和标准化互信息(normalized mutual information,简写为NMI)两个指标来比较通过Laplacian Score、Q-alpha、Variance和本实施方式四种特征提取方法预处理后的聚类效果;最终的指标数据结果如表2所示。
精确度是用来计量正确标记的数据的百分比:
Figure BDA00001711369000081
标准化互信息是用来度量两个集合之间的相关性的信息度量,给定两个集合C和C′:
MI ( C , C ′ ) = Σ c i ∈ C , c j ′ ∈ C ′ p ( c i , c j ′ ) · log p ( c i , c j ′ ) p ( c i ) · p ( c j ′ )
NMI ( C , C ′ ) = MI ( C , C ′ ) max ( H ( C ) , H ( C ′ ) )
其中:p(ci),p(c′j)表示从数据集中任意选取某一数据,分别属于ci,c′j的概率,p(ci,c′j)则表示同时属于两类的概率;H(C)和H(C′)分别表示C和C′的熵。
表2
Figure BDA00001711369000084
由表2可见,本实施方式相比现有技术的三种特征提取方法,聚类的效果和判别能力能够得到明显的改善和提高。

Claims (3)

1.一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括如下步骤:
(1)获取样本数据集合,进而构建样本数据集合的样本特征矩阵;
所述的样本特征矩阵为n×m维矩阵,n为特征个数,m为样本个数,且m和n均为大于1的自然数;
(2)根据所述的样本特征矩阵,计算出其对应的拉普拉斯矩阵;
(3)根据所述的拉普拉斯矩阵,利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合,k为预期给定的特征提取个数。
2.根据权利要求1所述的基于拉普拉斯正则化无监督的聚类特征选取方法,其特征在于:所述的步骤(3)中,利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合的具体过程如下:
a.取样本特征矩阵中的任一行特征集合作为特征过渡矩阵Y1
b.根据以下方程组计算特征过渡矩阵Y1对应的方差z1
z1=max{g11,g12,g13…g1m}
g1j=(y1j)TH-1Y1(Y1)TH-1y1j
H - 1 = 1 β I - 1 β Y 1 ( Q 1 ) - 1 ( Y 1 ) T
Q1=M+(Y1)TY1
M=β(I+αL)-1
其中:y1j为Y1的第j列特征向量,j为自然数,且1≤j≤m,L为样本特征矩阵对应的拉普拉斯矩阵,I为单位矩阵,α和β均为给定的运算系数;
c.根据步骤a和b,遍历样本特征矩阵中的每一行特征集合,得到n个方差,从样本特征矩阵中提取出最小方差所对应的一行特征集合,并令该行特征集合为S1,以完成第一次特征提取;
d.依次完成k次特征提取后从样本特征矩阵中提取得到k行特征集合;
其中,关于第i次特征提取的过程为:构建一i×m维矩阵,令S1~Si-1为该矩阵的前i-1行特征集合,取样本特征矩阵中除S1~Si-1外的任一行特征集合为该矩阵的第i行特征集合,并使该矩阵作为特征过渡矩阵Yi,i为自然数,且2≤i≤k;根据以下方程组计算特征过渡矩阵Yi对应的方差zi
zi=max{gi1,gi2,gi3…gim}
gij=(yij)TH-1Yi(Yi)TH-1yij
H - 1 = 1 β I - 1 β Y i ( Q i ) - 1 ( Y i ) T
Qi=M+(Yi)TYi
M=β(I+αL)-1
其中:yij为Yi的第j列特征向量;
依此,遍历样本特征矩阵中除S1~Si-1外的每一行特征集合,得到n-i+1个方差,从样本特征矩阵中提取出最小方差所对应的一行特征集合,并令该行特征集合为Si
3.根据权利要求2所述的基于拉普拉斯正则化无监督的聚类特征选取方法,其特征在于:第i次特征提取过程中,根据以下方程组计算特征过渡矩阵Yi对应的方差zi
zi=max{gi1,gi2,gi3…gim}
gij=(yij)TH-1Yi(Yi)TH-1yij
H - 1 = 1 β I - 1 β Y i ( Q i ) - 1 ( Y i ) T
( Q i ) - 1 = [ M + ( Y i ) T Y i ] - 1 = ( Q i - 1 ) - 1 - ( Q i - 1 ) - 1 x i ( x i ) T ( Q i - 1 ) - 1 1 + ( x i ) T ( Q i - 1 ) - 1 x i
其中:xi为Yi的第i行特征集合。
CN201210182514.4A 2012-05-31 2012-05-31 一种基于拉普拉斯正则化无监督的聚类特征选取方法 Expired - Fee Related CN102722578B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210182514.4A CN102722578B (zh) 2012-05-31 2012-05-31 一种基于拉普拉斯正则化无监督的聚类特征选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210182514.4A CN102722578B (zh) 2012-05-31 2012-05-31 一种基于拉普拉斯正则化无监督的聚类特征选取方法

Publications (2)

Publication Number Publication Date
CN102722578A true CN102722578A (zh) 2012-10-10
CN102722578B CN102722578B (zh) 2014-07-02

Family

ID=46948339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210182514.4A Expired - Fee Related CN102722578B (zh) 2012-05-31 2012-05-31 一种基于拉普拉斯正则化无监督的聚类特征选取方法

Country Status (1)

Country Link
CN (1) CN102722578B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982346A (zh) * 2012-11-30 2013-03-20 湖州师范学院 一种最小最大局部结构信息的特征选择方法
CN103093239A (zh) * 2013-01-18 2013-05-08 上海交通大学 一种融合了点对和邻域信息的建图方法
CN103942568A (zh) * 2014-04-22 2014-07-23 浙江大学 一种基于无监督特征选择的分类方法
CN107203787A (zh) * 2017-06-14 2017-09-26 江西师范大学 一种无监督正则化矩阵分解特征选择方法
CN108363724A (zh) * 2018-01-04 2018-08-03 浙江大学 一种利用图像正则化及数据重建解决特征提取任务的方法
CN109976308A (zh) * 2019-03-29 2019-07-05 南昌航空大学 一种基于拉普拉斯分值与ap聚类的故障特征的提取方法
CN117936079A (zh) * 2024-03-21 2024-04-26 中国人民解放军总医院第三医学中心 基于流形学习的糖尿病视网膜病变识别方法、介质及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952929A (zh) * 2005-10-20 2007-04-25 关涛 面向领域基于样本的互联网结构化数据抽取方法及其系统
EP1916624A1 (en) * 2006-10-25 2008-04-30 Agfa HealthCare NV Method for segmenting a digital medical image.
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法
CN101840516A (zh) * 2010-04-27 2010-09-22 上海交通大学 基于稀疏分数的特征选择方法
CN101968852A (zh) * 2010-09-09 2011-02-09 西安电子科技大学 基于熵排序的半监督谱聚类确定聚类数的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952929A (zh) * 2005-10-20 2007-04-25 关涛 面向领域基于样本的互联网结构化数据抽取方法及其系统
EP1916624A1 (en) * 2006-10-25 2008-04-30 Agfa HealthCare NV Method for segmenting a digital medical image.
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法
CN101840516A (zh) * 2010-04-27 2010-09-22 上海交通大学 基于稀疏分数的特征选择方法
CN101968852A (zh) * 2010-09-09 2011-02-09 西安电子科技大学 基于熵排序的半监督谱聚类确定聚类数的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HE XIAOFEI等: "A Variance Minimization Criterion to Feature Selection Using Laplacian Regularization", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982346A (zh) * 2012-11-30 2013-03-20 湖州师范学院 一种最小最大局部结构信息的特征选择方法
CN102982346B (zh) * 2012-11-30 2015-10-28 湖州师范学院 一种最小最大局部结构信息的特征选择方法
CN103093239A (zh) * 2013-01-18 2013-05-08 上海交通大学 一种融合了点对和邻域信息的建图方法
CN103093239B (zh) * 2013-01-18 2016-04-13 上海交通大学 一种融合了点对和邻域信息的建图方法
CN103942568A (zh) * 2014-04-22 2014-07-23 浙江大学 一种基于无监督特征选择的分类方法
CN103942568B (zh) * 2014-04-22 2017-04-05 浙江大学 一种基于无监督特征选择的分类方法
CN107203787A (zh) * 2017-06-14 2017-09-26 江西师范大学 一种无监督正则化矩阵分解特征选择方法
CN107203787B (zh) * 2017-06-14 2021-01-08 江西师范大学 一种无监督正则化矩阵分解特征选择方法
CN108363724A (zh) * 2018-01-04 2018-08-03 浙江大学 一种利用图像正则化及数据重建解决特征提取任务的方法
CN109976308A (zh) * 2019-03-29 2019-07-05 南昌航空大学 一种基于拉普拉斯分值与ap聚类的故障特征的提取方法
CN117936079A (zh) * 2024-03-21 2024-04-26 中国人民解放军总医院第三医学中心 基于流形学习的糖尿病视网膜病变识别方法、介质及系统

Also Published As

Publication number Publication date
CN102722578B (zh) 2014-07-02

Similar Documents

Publication Publication Date Title
CN102722578B (zh) 一种基于拉普拉斯正则化无监督的聚类特征选取方法
Weinmann et al. Contextual classification of point cloud data by exploiting individual 3D neigbourhoods
Shao et al. Multiple incomplete views clustering via weighted nonnegative matrix factorization with regularization
Gonçalves et al. An unsupervised method of classifying remotely sensed images using Kohonen self‐organizing maps and agglomerative hierarchical clustering methods
Chen et al. Research on location fusion of spatial geological disaster based on fuzzy SVM
CN102411610A (zh) 一种用于高维数据聚类的半监督降维方法
CN104731962A (zh) 一种社交网络中基于相似社团的好友推荐方法及系统
CN102495876A (zh) 一种基于非负局部坐标分解的聚类方法
Martínez-Ballesteros et al. Selecting the best measures to discover quantitative association rules
Bu An efficient fuzzy c-means approach based on canonical polyadic decomposition for clustering big data in IoT
Ding et al. A multiway p-spectral clustering algorithm
Li et al. A novel unsupervised Levy flight particle swarm optimization (ULPSO) method for multispectral remote-sensing image classification
CN108389113B (zh) 一种协同过滤推荐方法和系统
Sevastyanov et al. On methods for improving the accuracy of multi-class classification on imbalanced data.
CN107729377A (zh) 基于数据挖掘的顾客分类方法与系统
Krasnoshchekov et al. Order-k α-hulls and α-shapes
CN109583712B (zh) 一种数据指标分析方法及装置、存储介质
Calò et al. A hierarchical modeling approach for clustering probability density functions
CN113850811B (zh) 基于多尺度聚类和掩码打分的三维点云实例分割方法
CN107657276B (zh) 一种基于寻找语义类簇的弱监督语义分割方法
CN102779162B (zh) 一种带局域限制的矩阵概念分解方法
CN110020918B (zh) 一种推荐信息生成方法和系统
CN115392474B (zh) 一种基于迭代优化的局部感知图表示学习方法
Giang et al. Adaptive Spatial Complex Fuzzy Inference Systems With Complex Fuzzy Measures
Özkan et al. Comparing feature extraction techniques for urban land‐use classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140702

Termination date: 20180531

CF01 Termination of patent right due to non-payment of annual fee