CN102968639A - 基于局部线性回归的半监督图像聚类子空间学习算法 - Google Patents

基于局部线性回归的半监督图像聚类子空间学习算法 Download PDF

Info

Publication number
CN102968639A
CN102968639A CN2012103701790A CN201210370179A CN102968639A CN 102968639 A CN102968639 A CN 102968639A CN 2012103701790 A CN2012103701790 A CN 2012103701790A CN 201210370179 A CN201210370179 A CN 201210370179A CN 102968639 A CN102968639 A CN 102968639A
Authority
CN
China
Prior art keywords
formula
matrix
image
clustering
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103701790A
Other languages
English (en)
Inventor
张鸿
汪萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Science and Engineering WUSE
Original Assignee
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Science and Engineering WUSE filed Critical Wuhan University of Science and Engineering WUSE
Priority to CN2012103701790A priority Critical patent/CN102968639A/zh
Publication of CN102968639A publication Critical patent/CN102968639A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于局部线性回归的半监督图像聚类子空间学习算法。首先采用局部线性回归模型预测训练样本在聚类子空间中的坐标,得到预测值与真实值之间的局部预测误差,进而得到总预测误差最小化的目标函数;然后根据类间离散度最大化和类内离散度最小化两个约束条件,利用标记样本和未标记样本计算类间离散度矩阵和总离散度矩阵;最后,将类间离散度矩阵和总离散度矩阵融入到总预测误差最小化的目标函数中,得到求解聚类子空间的目标函数,通过广义特征根进行函数求解,得到最优的聚类子空间。本发明充分利用了标记样本、未标记样本,以及训练数据集中的局部近邻关系,得到了较好的聚类结果。

Description

基于局部线性回归的半监督图像聚类子空间学习算法
技术领域
本发明属于半监督图像聚类子空间学习算法技术领域。特别是涉及一种基于局部线性回归的半监督图像聚类子空间学习算法。
背景技术
随着数字相机的普及和信息技术的发展,出现了越来越多的大规模的图像数据库,其中相当比例的图像是未标注、未分类的。一图胜千言,图像数据所表达的语义信息较为丰富,因此,人工标注和分类工作不仅费时费力、成本较高,而且难以做到标准统一和结果客观。这就使得对图像数据库的高效管理和有效利用十分重要且困难重重。
图像聚类算法可从底层特征中挖掘出潜在的高层语义关系,从而自动、高效地对图像数据集进行聚类是实现图像数据库有效管理的重要途径。同时,图像数据具有颜色、纹理、形状等多种底层视觉特征,而底层特征和高层语义之间的语义鸿沟问题,又使得对图像数据聚类的研究极具挑战性。
近年来,大量研究探讨了如何在图像聚类过程中缩小语义鸿沟,提出了子空间学习、谱分析方法、流形学习、张量模型等诸多较为有效的方法。这些方法通过机器学习、统计分析等相关理论和原理,对训练样本进行学习,从高维特征中挖掘出图像语义的有效表达,以提高图像聚类的效率。根据训练过程中对标记样本和未标记样本的使用,上述方法可归纳为监督式、无监督式和半监督式学习三种类型。
监督式学习要求所有的训练数据都是已标记样本,如:Fisher人脸方法在线性鉴别分析(Linear Discriminant Analysis,LDA)的基础上,对标记样本进行学习得到Fisher人脸子空间,并用于人脸图像的聚类,其结果超越了传统的“特征人脸”方法。
监督式学习方法完全依赖于标记样本,且需要有充足的标记样本才能取得较好的学习效果。而目前庞大的图像数据库中大多是未标记的数据,获得大量标记样本较为困难。因此,无监督学习被广泛使用,如:主成分分析(PrincipalComponent Analysis)方法、局部保持映射(Locality Preserving Projection)和局部线性嵌入(Locally Linear Embedding)等方法。
然而,无监督学习完全以未标记样本为学习对象,在准确率方面难以与监督式学习媲美,但监督式学习要取得理想的效果,又需要有充足的标记样本。因此,半监督学习迅速成为机器学习领域的研究热点,例如:半监督鉴别分析算法(Semi-supervised Discriminant Analysis,SDA)利用标记样本和未标记样本,计算最优离散度的聚类子空间,取得了较好的学习性能。
现有研究大都或多或少地存在一些缺陷和不足,尤其体现在如何挖掘训练数据集的几何近邻关系,分析类内和类间离散度,求解聚类子空间的最优解,从而取得较好的聚类性能。
发明内容
本发明旨在克服现有技术缺陷,目的在于提供一种基于局部线性回归的半监督图像聚类子空间学习算法,该方法在满足聚类约束条件的情况下,挖掘图像训练数据集的局部近邻关系,得到最优坐标矩阵,取得较好的聚类性能。
为实现上述目的,本发明采用的技术方案是:
第一步、特征向量x的预测误差
(1)构建训练数据集,包括标记样本和未标记样本;
(2)对训练数据集中的每幅图像,提取底层的颜色、纹理和形状特征,构成特征向量x;
(3)采用局部线性回归方法,预测特征向量x在聚类子空间中的坐标,得到预测值
z=ψTx+ξ(1)
式(1)中:ψ表示回归矩阵;
ξ表示偏向;
T表示转置运算。
(4)设特征向量x在聚类子空间中的坐标最佳取值为y,则预测值z与最佳取值y之间的差为特征向量x的预测误差
q=||z-y||2=||ψTx+ξ-y||2(2)
式(2)中:||||2表示二范式。
第二步、基于近邻关系的局部预测误差之和
(1)根据欧氏距离,从训练数据集中找到与特征向量x相邻的图像5~8幅;
(2)采用第一步中第(3)和第(4)分步所述方法,得到特征向量x相邻的图像中每幅图像的预测误差q,然后对特征向量x相邻的图像中每幅图像的预测误差q进行累加,得到基于近邻关系的局部预测误差之和σ。
第三步、基于总预测误差的优化函数
(1)在整个训练数据集的范围内,对基于近邻关系的局部预测误差之和σ进行累加,得到全局范围内的总预测误差,将总预测误差最小化,得到总预测误差的优化函数
min Σ i = 1 n ( | | ψ T x + ξ - y | | 2 + α | | ψ | | 2 ) - - - ( 3 )
式(3)中:min表示最小化函数;
表示从数据集中第1幅图像到第n幅图像进行累加;
n表示训练数据集中图像的总个数;
ξ表示偏向;
α为权重参数(0<α<1);
ψ表示回归矩阵;
T表示转置运算;
x表示特征向量;
y表示特征向量x在聚类子空间中的坐标的最佳取值;
α||ψ||2是加入的正则项,以避免出现过学习现象。
(2)对式(3)中的参数ψ和参数ξ求导,根据矩阵运算规则,式(3)的总预测误差的优化函数变形为
mintr(YLYT)(4)
式(4)中:tr表示矩阵的迹运算;
min表示最小化函数;
Y表示由所有图像样本在聚类子空间中坐标的最佳取值构成的最优坐标矩阵,即为待求解的聚类子空间;
T表示转置运算;
L为相关性矩阵,记录了图像样本之间的相邻关系。
第四步、聚类约束条件
(1)在聚类过程中,除了需要满足式(4)之外,还增加两个聚类约束条件,分别是训练数据集的类内离散度最小和训练数据集的类间离散度最大。
(2)训练数据集中标记样本的类间离散度
b = &Sigma; i = 1 c maa T - - - ( 5 )
式(5)中:c为正整数,表示训练数据集中标记样本的语义类别数;
i为正整数;
a表示每个语义类别的特征均值;
m表示语义类别中标记样本的个数;
T表示转置运算。
(3)将式(5)扩展到整个训练数据集,包括标记样本和未标记样本,根据矩阵运算规则,得到训练数据集的类间离散度
B=XLXT    (6)
式(6)中:X表示图像视觉特征矩阵;
L为式(4)中的相关性矩阵;
T表示转置运算。
(4)训练数据集的类内离散度
W=XXT    (7)
式(7)中:X表示图像视觉特征矩阵;
T表示转置运算。
第五步、总目标函数的定义和求解
(1)根据式(4)、式(6)和式(7)得到总目标函数
max D tr [ D T BD ( D T WD + &lambda;D T XL X T D ) - 1 ] - - - ( 8 )
式(8)中:D表示聚类子空间的映射矩阵;
W表示类内离散度;
B表示类间离散度;
-1表示矩阵的逆运算;
λ表示权重参数;
T表示转置运算;
L为式(4)中的相关性矩阵;
X表示图像视觉特征矩阵;
tr表示矩阵的迹运算。
(2)用广义特征根方法求解式(8),得到2c个非零特征根,取其中c个最大的非零特征根,得出相应的c个非零特征向量d1,d2,...dc,聚类子空间的映射矩阵D的最优解为[d1,d2,...dc]。
(3)根据映射矩阵D的最优解[d1,d2,...dc],求解最优坐标矩阵
Y=DTX    (9)
式(9)中:T表示转置运算;
X表示图像视觉特征矩阵。
(4)根据最优坐标矩阵Y,找到图像样本在聚类子空间中对应的坐标,采用Kmeans聚类算法,得到图像聚类结果。
由于采用上述技术方案,本发明与现有技术相比具有如下积极效果:
本发明采用局部线性回归方法,预测训练数据集中每幅图像的特征向量x在聚类子空间中的坐标,得到预测值z;进而建立了基于局部近邻关系的局部预测误差之和σ和总预测误差的优化函数。因此,既挖掘了训练数据集中的空间几何关系,又通过最小化总预测误差使得聚类子空间尽可能地保持了原有的近邻关系,提高了聚类质量;此外,还引入了两个聚类约束条件,使总目标函数的定义既在满足聚类约束条件的情况下,又使得总预测误差最小;从而从多个角度优化了聚类性能,取得的聚类效果也较好。
附图说明
图1为本发明的一种学习算法示意框图;
图2为图1所述方法对六种类别图像的聚类结果。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述,并非对其保护范围的限制。
实施例1
一种基于局部线性回归的半监督图像聚类子空间学习算法,如图1所示,其具体步骤如下:
第一步、特征向量x的预测误差
(1)构建训练数据集,包括标记样本和未标记样本;
(2)对训练数据集中的每幅图像,提取底层的颜色、纹理和形状特征,具体包括HSV颜色直方图、颜色聚合矢量和Tamura方向度,构成特征向量x。
(3)采用局部线性回归方法,预测特征向量x在聚类子空间中的坐标,得到预测值
z=ψTx+ξ(1)
式(1)中:ψ表示回归矩阵;
ξ表示偏向;
T表示转置运算。
(4)设特征向量x在聚类子空间中的坐标最佳取值为y,则预测值z与最佳取值y之间的差为特征向量x的预测误差
 q=||z-y||2=||ψTx+ξ-y||2(2)
式(2)中:||||2表示二范式。
第二步、基于近邻关系的局部预测误差之和
(1)根据欧氏距离,从训练数据集中找到与特征向量x相邻的图像5~8幅。
(2)采用第一步中第(3)和第(4)分步所述方法,得到特征向量x相邻的图像中每幅图像的预测误差q,然后对特征向量x相邻的图像中每幅图像的预测误差q进行累加,得到基于近邻关系的局部预测误差之和σ。
第三步、基于总预测误差的优化函数
(1)在整个训练数据集的范围内,对基于近邻关系的局部预测误差之和σ进行累加,得到全局范围内的总预测误差,将总预测误差最小化,得到总预测误差的优化函数
min &Sigma; i = 1 n ( | | &psi; T x + &xi; - y | | 2 + &alpha; | | &psi; | | 2 ) - - - ( 3 )
式(3)中:min表示最小化函数;
表示从数据集中第1幅图像到第n幅图像进行累加;
n表示本实施例的训练数据集中图像的总个数;
ξ表示偏向;
α为权重参数(0<α<1);
ψ表示回归矩阵;
T表示转置运算;
x表示特征向量;
y表示特征向量x在聚类子空间中的坐标的最佳取值;
α||ψ||2是加入的正则项,以避免出现过学习现象。
(2)对式(3)中的参数ψ和参数ξ求导,根据矩阵运算规则,式(3)的总预测误差的优化函数变形为
mintr(YLYT)(4)
式(4)中:tr表示矩阵的迹运算;
min表示最小化函数;
Y表示由所有图像样本在聚类子空间中坐标的最佳取值构成的最优坐标矩阵,即为待求解的聚类子空间;
T表示转置运算;
L为相关性矩阵,记录了图像样本之间的相邻关系。
第四步、聚类约束条件
(1)在聚类过程中,除了需要满足式(4)之外,还增加两个聚类约束条件,分别是训练数据集的类内离散度最小和训练数据集的类间离散度最大。
(2)训练数据集中标记样本的类间离散度
b = &Sigma; i = 1 c maa T - - - ( 5 )
式(5)中:c为正整数,表示训练数据集中标记样本的语义类别数;
i为正整数;
a表示每个语义类别的特征均值;
m表示语义类别中标记样本的个数;
T表示转置运算。
(3)将式(5)扩展到整个训练数据集,包括标记样本和未标记样本,根据矩阵运算规则,得到训练数据集的类间离散度
B=XLXT    (6)
式(6)中:X表示图像视觉特征矩阵;
L为式(4)中的相关性矩阵;
T表示转置运算。
(4)训练数据集的类内离散度
W=XXT    (7)
式(7)中:X表示图像视觉特征矩阵;
T表示转置运算。
第五步、总目标函数的定义和求解
(1)根据式(4)、式(6)和式(7)得到总目标函数
max D tr [ D T BD ( D T WD + &lambda;D T XL X T D ) - 1 ] - - - ( 8 )
式(8)中:D表示聚类子空间的映射矩阵;
W表示类内离散度;
B表示类间离散度;
-1表示矩阵的逆运算;
λ表示权重参数;
T表示转置运算;
L为式(4)中的相关性矩阵;
X表示图像视觉特征矩阵;
tr表示矩阵的迹运算。
(2)用广义特征根方法求解式(8),得到2c个非零特征根,取其中c个最大的非零特征根,得出相应的c个非零特征向量d1,d2,...dc,聚类子空间的映射矩阵D的最优解为[d1,d2,...dc]。
(3)根据映射矩阵D的最优解[d1,d2,...dc],求解最优坐标矩阵
Y=DTX    (9)
式(9)中:T表示转置运算;
X表示图像视觉特征矩阵。
(4)根据最优坐标矩阵Y,找到图像样本在聚类子空间中对应的坐标,采用Kmeans聚类算法,得到图像聚类结果。
实施例2
一种基于局部线性回归的半监督图像聚类子空间学习算法,其具体步骤如下:
第一步、特征向量x的预测误差
(1)收集老虎、汽车、爆炸、鸟、闪电和海豚共六种类别的图像构成训练数据集,包括标记样本和未标记样本,其中每个类别包含300幅图像。
(2)对训练数据集中的每幅图像,提取底层的颜色、纹理和形状特征,具体包括HSV颜色直方图、颜色聚合矢量和Tamura方向度,构成特征向量x。
(3)采用局部线性回归方法,预测特征向量x在聚类子空间中的坐标,得到预测值
z=ψTx+ξ(1)
式(1)中:ψ表示回归矩阵;
ξ表示偏向;
T表示转置运算。
(4)设特征向量x在聚类子空间中的坐标最佳取值为y,则预测值z与最佳取值y之间的差为特征向量x的预测误差
q=||z-y||2=||ψTx+ξ-y||2(2)
式(2)中:||||2表示二范式。
第二步、基于近邻关系的局部预测误差之和
(1)根据欧氏距离,从训练数据集中找到与特征向量x相邻的图像6幅。
(2)采用第一步中第(3)和第(4)分步所述方法,得到特征向量x相邻的图像中每幅图像的预测误差q,然后对特征向量x相邻的图像中每幅图像的预测误差q进行累加,得到基于近邻关系的局部预测误差之和σ
第三步、基于总预测误差的优化函数
(1)在整个训练数据集的范围内,对基于近邻关系的局部预测误差之和σ进行累加,得到全局范围内的总预测误差,将总预测误差最小化,得到总预测误差的优化函数
min &Sigma; i = 1 n ( | | &psi; T x + &xi; - y | | 2 + &alpha; | | &psi; | | 2 ) - - - ( 3 )
式(3)中:min表示最小化函数;
Figure BDA00002208582500122
表示从数据集中第1幅图像到第n幅图像进行累加;
n表示训练数据集中图像的总个数,本实施例取n为1800;
ξ表示偏向;
α为权重参数(0<α<1),本实施例取α为0.2;
ψ表示回归矩阵;
T表示转置运算;
x表示特征向量;
y表示特征向量x在聚类子空间中的坐标的最佳取值;
α||ψ||2是加入的正则项,以避免出现过学习现象。
(2)对式(3)中的参数ψ和参数ξ求导,根据矩阵运算规则,式(3)的总预测误差的优化函数变形为
mintr(YLYT)(4)
式(4)中:tr表示矩阵的迹运算;
min表示最小化函数;
Y表示由所有图像样本在聚类子空间中坐标的最佳取值构成的最优坐标矩阵,即为待求解的聚类子空间;
T表示转置运算;
L为相关性矩阵,记录了图像样本之间的相邻关系。
第四步、聚类约束条件
(1)在聚类过程中,除了需要满足式(4)之外,还增加两个聚类约束条件,分别是训练数据集的类内离散度最小和训练数据集的类间离散度最大。
(2)训练数据集中标记样本的类间离散度
b = &Sigma; i = 1 c maa T - - - ( 5 )
式(5)中:c为正整数,表示训练数据集中标记样本的语义类别数,
本实施例取c为6;
i为正整数;
a表示每个语义类别的特征均值;
m表示语义类别中标记样本的个数,本实施例取m为200;
T表示转置运算。
(3)将式(5)扩展到整个训练数据集,包括标记样本和未标记样本,根据矩阵运算规则,得到训练数据集的类间离散度
B=XLXT    (6)
式(6)中:X表示图像视觉特征矩阵;
L为式(4)中的相关性矩阵;
T表示转置运算。
(4)训练数据集的类内离散度
W=XXT    (7)
式(7)中:X表示图像视觉特征矩阵;
T表示转置运算。
第五步、总目标函数的定义和求解
(1)根据式(4)、式(6)和式(7)得到总目标函数
max D tr [ D T BD ( D T WD + &lambda;D T XL X T D ) - 1 ] - - - ( 8 )
式(8)中:D表示聚类子空间的映射矩阵;
W表示类内离散度;
B表示类间离散度;
-1表示矩阵的逆运算;
λ表示权重参数;
T表示转置运算;
L为式(4)中的相关性矩阵;
X表示图像视觉特征矩阵;
tr表示矩阵的迹运算。
(2)用广义特征根方法求解式(8),得到20个非零特征根,取其中10个最大的非零特征根,得出相应的10个非零特征向量d1,d2,...d10,聚类子空间的映射矩阵D的最优解为[d1,d2,...d10]。
(3)根据映射矩阵D的最优解[d1,d2,...d10],求解最优坐标矩阵
Y=DTX    (9)
式(9)中:T表示转置运算;
X表示图像视觉特征矩阵。
(4)根据最优坐标矩阵Y,找到图像样本在聚类子空间中对应的坐标,采用Kmeans聚类算法,得到图像聚类结果,然后从每个聚类中抽取离聚类中心最近的六幅图像,排成一列,得到图2所示的六列聚类结果:在第(1)列老虎类别的聚类结果中有5个正确结果;在第(2)列海豚类别的聚类结果中有6个正确结果;在第(3)列闪电类别的聚类结果中有6个正确结果;在第(4)列汽车类别的聚类结果中有5个正确结果;在第(5)列鸟类别的聚类结果中有5个正确结果;在第(6)列爆炸类别的聚类结果中有4个正确结果。
本具体实施方式与现有技术相比具有如下积极效果:
本具体实施方式采用局部线性回归方法,预测训练数据集中每幅图像的特征向量x在聚类子空间中的坐标,得到预测值z;进而建立了基于局部近邻关系的局部预测误差之和σ和总预测误差的优化函数。因此,既挖掘了训练数据集中的空间几何关系,又通过最小化总预测误差使得聚类子空间尽可能地保持了原有的近邻关系,提高了聚类质量;此外,还引入了两个聚类约束条件,使总目标函数的定义既在满足聚类约束条件的情况下,又使得总预测误差最小;从而从多个角度优化了聚类性能,取得的聚类效果也较好。

Claims (1)

1.一种基于局部线性回归的半监督图像聚类子空间学习算法,其特征在于包括如下步骤:
第一步、特征向量x的预测误差
(1)构建训练数据集,包括标记样本和未标记样本;
(2)对训练数据集中的每幅图像,提取底层的颜色、纹理和形状特征,构成特征向量x;
(3)采用局部线性回归方法,预测特征向量x在聚类子空间中的坐标,得到预测值
z=ψTx+ξ(1)
式(1)中:ψ表示回归矩阵,
ξ表示偏向,
T表示转置运算;
(4)设特征向量x在聚类子空间中的坐标最佳取值为y,则预测值z与最佳取值y之间的差为特征向量x的预测误差
q=||z-y||2=||ψTx+ξ-y||2(2)
式(2)中:||||2表示二范式;
第二步、基于近邻关系的局部预测误差之和
(1)根据欧氏距离,从训练数据集中找到与特征向量x相邻的图像5~8幅;
(2)采用第一步中第(3)和第(4)分步所述方法,得到特征向量x相邻的图像中每幅图像的预测误差q,然后对特征向量x相邻的图像中每幅图像的预测误差q进行累加,得到基于近邻关系的局部预测误差之和σ;
第三步、基于总预测误差的优化函数
(1)在整个训练数据集的范围内,对基于近邻关系的局部预测误差之和σ进行累加,得到全局范围内的总预测误差,将总预测误差最小化,得到总预测误差的优化函数
min &Sigma; i = 1 n ( | | &psi; T x + &xi; - y | | 2 + &alpha; | | &psi; | | 2 ) - - - ( 3 )
式(3)中:min表示最小化函数,
表示从数据集中第1幅图像到第n幅图像进行累加,
n表示训练数据集中图像的总个数;
ξ表示偏向,
α为权重参数(0<α<1),
ψ表示回归矩阵,
T表示转置运算,
x表示特征向量,
y表示特征向量x在聚类子空间中的坐标的最佳取值,
α||ψ||2是加入的正则项,以避免出现过学习现象;
(2)对式(3)中的参数ψ和参数ξ求导,根据矩阵运算规则,式(3)的总预测误差的优化函数变形为
mintr(YLYT)(4)
式(4)中:tr表示矩阵的迹运算,
min表示最小化函数,
Y表示由所有图像样本在聚类子空间中坐标的最佳取值构成的最优坐标矩阵,即为待求解的聚类子空间,
T表示转置运算,
L为相关性矩阵,记录了图像样本之间的相邻关系;
第四步、聚类约束条件
(1)在聚类过程中,除了需要满足式(4)之外,还增加两个聚类约束条件,分别是训练数据集的类内离散度最小和训练数据集的类间离散度最大;
(2)训练数据集中标记样本的类间离散度
b = &Sigma; i = 1 c maa T - - - ( 5 )
式(5)中:c为正整数,表示训练数据集中标记样本的语义类别数,
i为正整数,
a表示每个语义类别的特征均值,
m表示语义类别中标记样本的个数,
T表示转置运算;
(3)将式(5)扩展到整个训练数据集,包括标记样本和未标记样本,根据矩阵运算规则,得到训练数据集的类间离散度
B=XLXT    (6)
式(6)中:X表示图像视觉特征矩阵,
L为式(4)中的相关性矩阵,
T表示转置运算;
(4)训练数据集的类内离散度
W=XXT    (7)
式(7)中:X表示图像视觉特征矩阵,
T表示转置运算;
第五步、总目标函数的定义和求解
(1)根据式(4)、式(6)和式(7)得到总目标函数
max D tr [ D T BD ( D T WD + &lambda;D T XL X T D ) - 1 ] - - - ( 8 )
式(8)中:D表示聚类子空间的映射矩阵,
W表示类内离散度,
B表示类间离散度,
-1表示矩阵的逆运算,
λ表示权重参数,
T表示转置运算,
L为式(4)中的相关性矩阵,
X表示图像视觉特征矩阵,
tr表示矩阵的迹运算;
(2)用广义特征根方法求解式(8),得到2c个非零特征根,取其中c个最大的非零特征根,得出相应的c个非零特征向量d1,d2,...dc,聚类子空间的映射矩阵D的最优解为[d1,d2,...dc];
(3)根据映射矩阵D的最优解[d1,d2,...dc],求解最优坐标矩阵
Y=DTX    (9)
式(9)中:T表示转置运算,
X表示图像视觉特征矩阵;
(4)根据最优坐标矩阵Y,找到图像样本在聚类子空间中对应的坐标,采用Kmeans聚类算法,得到图像聚类结果。
CN2012103701790A 2012-09-28 2012-09-28 基于局部线性回归的半监督图像聚类子空间学习算法 Pending CN102968639A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103701790A CN102968639A (zh) 2012-09-28 2012-09-28 基于局部线性回归的半监督图像聚类子空间学习算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103701790A CN102968639A (zh) 2012-09-28 2012-09-28 基于局部线性回归的半监督图像聚类子空间学习算法

Publications (1)

Publication Number Publication Date
CN102968639A true CN102968639A (zh) 2013-03-13

Family

ID=47798770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103701790A Pending CN102968639A (zh) 2012-09-28 2012-09-28 基于局部线性回归的半监督图像聚类子空间学习算法

Country Status (1)

Country Link
CN (1) CN102968639A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745235A (zh) * 2013-12-18 2014-04-23 小米科技有限责任公司 人脸识别方法、装置及终端设备
CN104700833A (zh) * 2014-12-29 2015-06-10 芜湖乐锐思信息咨询有限公司 一种大数据语音分类方法
CN105139031A (zh) * 2015-08-21 2015-12-09 天津中科智能识别产业技术研究院有限公司 一种基于子空间聚类的数据处理方法
CN107958216A (zh) * 2017-11-27 2018-04-24 沈阳航空航天大学 基于半监督的多模态深度学习分类方法
CN113033641A (zh) * 2021-03-17 2021-06-25 华南理工大学 一种高维数据半监督分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7010167B1 (en) * 2002-04-30 2006-03-07 The United States Of America As Represented By The National Security Agency Method of geometric linear discriminant analysis pattern recognition
CN101916376B (zh) * 2010-07-06 2012-08-29 浙江大学 基于局部样条嵌入的正交半监督子空间图像分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7010167B1 (en) * 2002-04-30 2006-03-07 The United States Of America As Represented By The National Security Agency Method of geometric linear discriminant analysis pattern recognition
CN101916376B (zh) * 2010-07-06 2012-08-29 浙江大学 基于局部样条嵌入的正交半监督子空间图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONG ZHANG ET AL.: "Semi-supervised Distance Metric Learning Based on Local Linear Regression for Data Clustering", 《NEUROCOMPUTING》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745235A (zh) * 2013-12-18 2014-04-23 小米科技有限责任公司 人脸识别方法、装置及终端设备
CN103745235B (zh) * 2013-12-18 2017-07-04 小米科技有限责任公司 人脸识别方法、装置及终端设备
CN104700833A (zh) * 2014-12-29 2015-06-10 芜湖乐锐思信息咨询有限公司 一种大数据语音分类方法
CN105139031A (zh) * 2015-08-21 2015-12-09 天津中科智能识别产业技术研究院有限公司 一种基于子空间聚类的数据处理方法
CN107958216A (zh) * 2017-11-27 2018-04-24 沈阳航空航天大学 基于半监督的多模态深度学习分类方法
CN113033641A (zh) * 2021-03-17 2021-06-25 华南理工大学 一种高维数据半监督分类方法

Similar Documents

Publication Publication Date Title
CN110807465B (zh) 一种基于通道损失函数的细粒度图像识别方法
CN109389180A (zh) 一款基于深度学习的电力设备图像识别方法及巡查机器人
Xu et al. Interpreting adversarial examples by activation promotion and suppression
CN113657455B (zh) 一种基于三重网络与标注一致性正则化的半监督学习方法
CN102968639A (zh) 基于局部线性回归的半监督图像聚类子空间学习算法
CN105184772A (zh) 一种基于超像素的自适应彩色图像分割方法
CN109034035A (zh) 基于显著性检测和特征融合的行人重识别方法
CN103679186A (zh) 检测和跟踪目标的方法和装置
CN103942749A (zh) 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
CN104182538A (zh) 基于半监督哈希的图像检索方法
CN111339924B (zh) 一种基于超像素和全卷积网络的极化sar图像分类方法
CN114092747A (zh) 基于深度元度量模型互学习的小样本图像分类方法
CN105631469A (zh) 一种多层稀疏编码特征的鸟类图像识别方法
CN110334584A (zh) 一种基于区域全卷积网络的手势识别方法
Qiu et al. Recognition of transmission line related bird species based on image feature extraction and support vector machine
CN101877065B (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
CN102289685A (zh) 一种基于正则回归的秩-1张量投影的行为识别方法
CN113505856B (zh) 一种高光谱影像无监督自适应分类方法
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN111127407B (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
CN105678265B (zh) 基于流形学习的数据降维方法及装置
CN101877053B (zh) 人脸识别的半监督邻域判别分析方法
CN104008095A (zh) 一种基于语义特征提取与匹配的物体识别方法
CN108121965B (zh) 基于鲁棒联合稀疏特征提取的图像识别方法
WO2015011470A1 (en) Method and system for classifying images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130313