CN101916376B - 基于局部样条嵌入的正交半监督子空间图像分类方法 - Google Patents

基于局部样条嵌入的正交半监督子空间图像分类方法 Download PDF

Info

Publication number
CN101916376B
CN101916376B CN2010102201327A CN201010220132A CN101916376B CN 101916376 B CN101916376 B CN 101916376B CN 2010102201327 A CN2010102201327 A CN 2010102201327A CN 201010220132 A CN201010220132 A CN 201010220132A CN 101916376 B CN101916376 B CN 101916376B
Authority
CN
China
Prior art keywords
matrix
sample
training sample
training
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102201327A
Other languages
English (en)
Other versions
CN101916376A (zh
Inventor
邵建
张寅�
朱科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2010102201327A priority Critical patent/CN101916376B/zh
Publication of CN101916376A publication Critical patent/CN101916376A/zh
Application granted granted Critical
Publication of CN101916376B publication Critical patent/CN101916376B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于局部样条嵌入的正交半监督子空间图像分类方法。包括如下步骤:1)对图像数据集选取n个样本作为训练集,包括有标注数据和未标注数据,其余作为测试集;2)利用有标注数据构造类间散度矩阵和类内散度矩阵;3)利用整体训练数据特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;4)根据局部样条嵌入正交半监督子空间模型,寻找投影矩阵对原始高维特征向量进行降维;5)采用支持向量机对降维后训练样本建立分类器;6)利用投影矩阵对测试集进行降维,再通过分类器对降维后的测试集进行分类。本发明充分利用了图像样本标注和特征空间分布等信息,能挖掘图像数据之间潜在语义关联,对图像语义进行了较好的分析与表达。

Description

基于局部样条嵌入的正交半监督子空间图像分类方法
技术领域
本发明涉及一种基于局部样条嵌入的正交半监督子空间图像分类方法。该方法对图像数据进行特征提取表示为特征向量,并寻找有效的降维方法将其投影到低维语义空间,从而通过训练分类器模型实现对图像数据的分类。
背景技术
随着数字照相机普及和互联网发展,图像数据采集、存储和访问数量呈爆炸式增长,如何对规模日益庞大的图像数据进行高效管理变得日益重要。为了对图像进行更好管理,一个有效手段便是对图像数据分门别类地进行管理。因此,对图像数据进行分类已成为近年来热点研究问题。
在图像分类的研究中,所面临的最大挑战是语义鸿沟,即图像底层特征无法充分反映其高层语义。鉴于以数据驱动为中心的机器学习和统计分析等理论所取得进展,为了克服语义鸿沟,一个有效手段是在提取图像底层特征基础上,应用机器学习理论,训练得到图像语义的抽象表达,然后基于该表达,再对图像进行聚类与分类。在这个过程中,有监督学习分类算法被大量使用。虽然有监督算法可有效提高图像表达准确性,但是现有监督算法仍然存在局限性,尤其是获得精确标注信息需要耗费大量时间。随着图像数据数量快速增长,无标注数据获取更加便利,使得仅能单纯处理标注数据的监督学习算法局限性更为明显。考虑到带有标注信息的数据较难获得,而未标注数据则相对容易获得,半监督算法逐渐吸引了越来越多研究者注意。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于局部样条嵌入的正交半监督子空间图像分类方法。
基于局部样条嵌入的正交半监督子空间图像分类方法包括如下步骤:
1)对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2)利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵;
3)利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;
4)根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本;
5)采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型;
6)对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类。
所述的利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵步骤为:给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure BSA00000176454900021
i=1,...,n,前l个样本具有类别标注信息
Figure BSA00000176454900023
剩余n-l个样本
Figure BSA00000176454900024
没有被标注,利用包含标注信息训练样本
Figure BSA00000176454900025
构造类间散度矩阵
Figure BSA00000176454900026
和类内散度矩阵其中,lk表示属于第k类的训练样本个数,
Figure BSA00000176454900028
表示第k类中第i个样本,
Figure BSA00000176454900029
Figure BSA000001764549000210
均值,
Figure BSA000001764549000211
表示第k类中样本均值。
所述的利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵步骤为:
1)假定给定样本
Figure BSA000001764549000212
的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure BSA000001764549000213
Figure BSA000001764549000214
1≤i≤n,1≤j≤k,对于m维中的每一分量,分别构造一个样条函数g(t),使得fj=g(tj);对如下函数:
Figure BSA000001764549000215
进行最小化,得到样条函数g,其中λ>0是一个正则化参数,
Figure BSA000001764549000216
是样条函数g在d维空间里的罚函数,当
Figure BSA000001764549000217
时,上式存在唯一解,其中l=(d+s-1)!/(d!(s-1)!),
Figure BSA000001764549000218
构成了一个阶数不小于s的多项式空间,2s>d,φj(t)是一个格林函数,
Figure BSA000001764549000219
和β=[β1,β2,...,βl]T是系数向量;
2)通过解下面的线性方程组获得系数向量η和β:
A · η β = f 0
其中f=[f1,...,fk]T
Figure BSA00000176454900031
K是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj),得到τ(g)=fTBf
3)对于m维中的每一分量,τ(g)由全局坐标f来表达,将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure BSA00000176454900033
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSB S T F T )
令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
所述的根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本步骤为:
1)通过学习得到正交投影矩阵
Figure BSA00000176454900035
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻,即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a;
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
所述的采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型步骤为:分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量
Figure BSA00000176454900037
以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure BSA00000176454900038
通过求解最优化问题
Figure BSA000001764549000310
得到
Figure BSA000001764549000311
和b,其中c是常量,ξ是松弛因子。
所述的对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类步骤为:训练样本集合外的测试样本数据
Figure BSA00000176454900041
由正交投影矩阵a映射为低维子空间中的
Figure BSA00000176454900042
然后通过分类器模型进行类别检测,即计算
Figure BSA00000176454900043
来得到测试数据的类别标识yt∈{+1,-1}。
本发明有效利用了有标注训练样本和未标注训练样本,通过局部样条回归将局部低维嵌入坐标映射成全局低维嵌入坐标,保持了图像数据集合的流形空间本征结构。有效地解决了高维度带来的困难,通过对降维后的数据采用支持向量机来训练分类器模型并对测试数据分类,取得了比传统的分类方法更准确的分类结果。
附图说明
图1是基于局部样条嵌入的正交半监督子空间图像分类方法流程图;
图2是举例本发明的5幅图像分类结果。
具体实施方式
基于局部样条嵌入的正交半监督子空间图像分类方法包括如下步骤:
1)对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2)利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵;
3)利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;
4)根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本;
5)采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型;
6)对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类。
所述的利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵步骤为:给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure BSA00000176454900044
i=1,...,n,前l个样本具有类别标注信息
Figure BSA00000176454900046
剩余n-l个样本
Figure BSA00000176454900047
没有被标注,利用包含标注信息训练样本
Figure BSA00000176454900048
构造类间散度矩阵
Figure BSA00000176454900051
和类内散度矩阵
Figure BSA00000176454900052
其中,lk表示属于第k类的训练样本个数,
Figure BSA00000176454900053
表示第k类中第i个样本,
Figure BSA00000176454900055
均值,表示第k类中样本均值。
所述的利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵步骤为:
1)假定给定样本的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure BSA00000176454900058
Figure BSA00000176454900059
1≤i≤n,1≤j≤k,对于m维中的每一分量,分别构造一个样条函数g(t),使得fj=g(tj);对如下函数:
Figure BSA000001764549000510
进行最小化,得到样条函数g,其中λ>0是一个正则化参数,
Figure BSA000001764549000511
是样条函数g在d维空间里的罚函数,当
Figure BSA000001764549000512
时,上式存在唯一解,其中l=(d+s-1)!/(d!(s-1)!),构成了一个阶数不小于s的多项式空间,2s>d,φj(t)是一个格林函数,
Figure BSA000001764549000514
和β=[β1,β2,...,βl]T是系数向量;
2)通过解下面的线性方程组获得系数向量η和β:
A · η β = f 0
其中f=[f1,...,fk]T
Figure BSA000001764549000516
K是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj),得到τ(g)=fTBf
3)对于m维中的每一分量,τ(g)由全局坐标f来表达,将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSBS T F T )
令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
所述的根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本步骤为:
1)通过学习得到正交投影矩阵
Figure BSA00000176454900062
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻,即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a;
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
所述的采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型步骤为:分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量
Figure BSA00000176454900064
以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure BSA00000176454900065
Figure BSA00000176454900066
通过求解最优化问题
Figure BSA00000176454900067
得到
Figure BSA00000176454900068
和b,其中c是常量,ξ是松弛因子。
所述的对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类步骤为:训练样本集合外的测试样本数据
Figure BSA00000176454900069
由正交投影矩阵a映射为低维子空间中的
Figure BSA000001764549000610
然后通过分类器模型进行类别检测,即计算
Figure BSA000001764549000611
来得到测试数据的类别标识yt∈{+1,-1}。
实施例
1.对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2.利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵:
给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure BSA00000176454900071
i=1,...,n,前l个样本
Figure BSA00000176454900072
具有类别标注信息
Figure BSA00000176454900073
剩余n-l个样本
Figure BSA00000176454900074
没有被标注。利用包含标注信息训练样本构造类间散度矩阵Sb和类内散度矩阵Sw
S b = Σ k = 1 c l k ( μ ( k ) - μ ) ( μ ( k ) - μ ) T
S w = Σ k = 1 c ( Σ i = 1 l k ( x i ( k ) - μ ( k ) ) ( x i ( k ) - μ ( k ) ) T )
其中,lk表示属于第k类的训练样本个数,
Figure BSA00000176454900078
表示第k类中第i个样本,
Figure BSA00000176454900079
Figure BSA000001764549000710
均值,
Figure BSA000001764549000711
表示第k类中样本均值。
3.利用整体训练样本数据的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵:
假定给定样本
Figure BSA000001764549000712
的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure BSA000001764549000713
Figure BSA000001764549000714
1≤i≤n,1≤j≤k。对于m维中的每一分量,希望分别构造一个样条函数g(t),使得如下插值条件成立:
fj=g(tj),j=1,2,...,k    (1)
为了得到样条函数g,最小化如下函数:
τ ( g ) = 1 k Σ j = 1 k ( f j - g ( t j ) ) 2 + λτ s d ( g ) - - - ( 2 )
其中λ>0是一个正则化参数,
Figure BSA000001764549000716
是样条函数g在d维空间里的罚函数。
在一定条件下,存在一个唯一的样条函数使得公式(2)中样条函数g(t)最小化:
g ( t ) = Σ i = 1 l β i p i ( t ) + Σ j = 1 k η j φ j ( t ) - - - ( 3 )
其中l=(d+s-1)!/(d!(s-1)!),
Figure BSA00000176454900081
构成了一个阶数不小于s的多项式空间,2s>d。φj(t)是一个格林函数。
为了保证解的唯一性,还需要满足如下边界条件:
Σ j = 1 k η j · p i ( t j ) = 0 , i = 1 , . . . , l - - - ( 4 )
当满足式(4)时,式(3)中的函数φj(·)是条件正定的。
将式(1)和式(4)代入式(3),系数向量
Figure BSA00000176454900083
β=[β1,β2,...,βl]T通过解下面的线性方程组获得:
A · η β = f 0
其中f=[f1,...,fk]T
Figure BSA00000176454900085
K是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj)。因为φj(·)是一条件正定函数,因此上述方程组存在唯一解。
化简式(2)得:
τ(g)∝ηTKη=fTBf                            (5)
其中B是A-1中大小为k×k最左上子矩阵。
根据式(5),对于m维中的每一分量,式(2)的值τ(g)可以由全局坐标f来表达。将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure BSA00000176454900087
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSBS T F T ) - - - ( 6 )
其中F=[f1,f2,...,fn],
Figure BSA000001764549000810
是列选择矩阵,使得Fi=FSi。令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
4.根据局部样条嵌入的正交半监督子空间模型,通过寻找转换矩阵实现对原始高维特征向量的维度降低:
1)通过学习得到正交投影矩阵
Figure BSA00000176454900091
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻。即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a:
Sba=λeig(Sw+γXL′XT)a
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
5.采用支持向量机对降维后的训练样本集合建立分类器模型:
分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量
Figure BSA00000176454900093
以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure BSA00000176454900095
通过求解最优化问题
Figure BSA00000176454900096
得到
Figure BSA00000176454900097
和b,其中c是常量,ξ是松弛因子。
6.对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类:
训练样本集合外的测试样本数据
Figure BSA00000176454900098
由正交投影矩阵a映射为低维子空间中的
Figure BSA00000176454900099
然后通过分类器模型进行类别检测,即计算
Figure BSA000001764549000910
来得到测试数据的类别标识yt∈{+1,-1}。
图2给出了本发明的5幅图像分类结果。

Claims (2)

1.一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特点在于包括如下步骤:
1)对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2)利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵;
3)利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;
4)根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找投影矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本;
5)采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型;
6)对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类;
所述的利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵步骤为:给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure FSB00000784798500011
i=1,...n,前l个样本具有类别标注信息
Figure FSB00000784798500013
剩余n-l个样本没有被标注,利用包含标注信息训练样本
Figure FSB00000784798500015
构造类间散度矩阵 S b = Σ k = 1 c l k ( μ ( k ) - μ ) ( μ ( k ) - μ ) T 和类内散度矩阵 S w = Σ k = 1 c ( Σ i = 1 l k ( x i ( k ) - μ ( k ) ) ( x i ( k ) - μ ( k ) ) T ) , 其中,lk表示属于第k类的训练样本个数,
Figure FSB00000784798500018
表示第k类中第i个样本,
Figure FSB00000784798500019
Figure FSB000007847985000110
均值,
Figure FSB000007847985000111
表示第k类中样本均值;
所述的利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵步骤为:
1)假定给定样本
Figure FSB000007847985000112
的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure FSB000007847985000113
Figure FSB000007847985000114
1≤i≤n,1≤j≤k,对于m维中的每一分量,分别构造一个样条函数g(t),使得fj=g(tj);对如下函数:
Figure FSB000007847985000115
进行最小化,得到样条函数g,其中λ>0是一个正则化参数,
Figure FSB00000784798500021
是样条函数g在d维空间里的罚函数,当 g ( t ) = Σ i = 1 l β i p i ( t ) + Σ j = 1 k η j φ j ( t ) 时,上式 τ ( g ) = 1 k Σ j = 1 k ( f j - g ( t j ) ) 2 + λτ s d ( g ) 存在唯一解,其中l=(d+s-1)!/(d!(s-1)!),
Figure FSB00000784798500024
构成了一个阶数不小于s的多项式空间,2s>d,φj(t)是一个格林函数,
Figure FSB00000784798500025
和β=[β1,β2,...,βl]T是系数向量;
2)通过解下面的线性方程组获得系数向量η和β:
A · η β = f 0
其中f=[f1,...,fk]T
Figure FSB00000784798500027
K是一个k×k的对称矩阵,Kij=φ(||ti-tj||),P是一个l×k的矩阵,Pij=pi(tj),得到τ(g)=fTBf
3)对于m维中的每一分量,τ(g)由全局坐标f来表达,将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure FSB00000784798500029
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSBS T F T )
令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′;
所述的根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找投影矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本步骤为:
1)通过学习得到正交投影矩阵
Figure FSB000007847985000211
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻,即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a;
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX;
所述的采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型步骤为:分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure FSB00000784798500032
Figure FSB00000784798500033
通过求解最优化问题 min w , b , ξ 1 2 | | w | | 2 + c Σ i = 1 l ξ i s . t . y i ( w T X i ′ + b ) ≥ 1 - ξ i ξ i ≥ 0 得到
Figure FSB00000784798500035
和b,其中c是常量,ξ是松弛因子。
2.根据权利要求1所述的一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特征在于所述的对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类步骤为:训练样本集合外的测试样本数据
Figure FSB00000784798500036
由正交投影矩阵a映射为低维子空间中的
Figure FSB00000784798500037
然后通过分类器模型进行类别检测,即计算yt=sign(wT×Xt′)+b,来得到测试数据的类别标识yt∈{+1,-1}。
CN2010102201327A 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法 Expired - Fee Related CN101916376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102201327A CN101916376B (zh) 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102201327A CN101916376B (zh) 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法

Publications (2)

Publication Number Publication Date
CN101916376A CN101916376A (zh) 2010-12-15
CN101916376B true CN101916376B (zh) 2012-08-29

Family

ID=43323885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102201327A Expired - Fee Related CN101916376B (zh) 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法

Country Status (1)

Country Link
CN (1) CN101916376B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968639A (zh) * 2012-09-28 2013-03-13 武汉科技大学 基于局部线性回归的半监督图像聚类子空间学习算法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542293A (zh) * 2011-12-27 2012-07-04 上海交通大学 一种针对高分辨率sar图像场景解译的一类提取分类方法
CN102609693A (zh) * 2012-02-14 2012-07-25 南昌航空大学 基于模糊二维核主成分分析的人脸识别方法
CN103593357B (zh) * 2012-08-15 2017-03-01 富士通株式会社 一种半监督的特征变换方法和装置
CN103400144B (zh) * 2013-07-17 2017-02-22 山东师范大学 一种基于k近邻的支持向量机主动学习的方法
CN103488744B (zh) * 2013-09-22 2016-10-05 华南理工大学 一种大数据图像分类方法
CN103605667B (zh) * 2013-10-28 2017-02-08 中国计量学院 一种图像自动标注算法
CN104504305B (zh) * 2014-12-24 2018-03-06 西安电子科技大学 监督基因表达数据分类方法
CN107133226B (zh) * 2016-02-26 2021-12-07 阿里巴巴集团控股有限公司 一种区分主题的方法及装置
CN106407664B (zh) * 2016-08-31 2018-11-23 深圳市中识健康科技有限公司 呼吸气体诊断系统的领域自适应装置
CN107657214B (zh) * 2017-09-04 2021-02-26 重庆大学 一种局部判别保持投影的电子舌味觉识别方法
CN107808166B (zh) * 2017-10-26 2020-08-11 杭州电子科技大学 一种memd张量线性拉普拉斯判别的肌电特征提取方法
CN107977642B (zh) * 2017-12-15 2021-10-22 南京航空航天大学 一种核自适应均值判别分析的高分辨距离像目标识别方法
CN108537290A (zh) * 2018-04-25 2018-09-14 攀枝花学院 基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
CN109117739A (zh) * 2018-07-18 2019-01-01 成都识达科技有限公司 一种基于邻域样本定向鉴别投影特征提取方法
CN109299732B (zh) 2018-09-12 2020-05-05 北京三快在线科技有限公司 无人驾驶行为决策及模型训练的方法、装置及电子设备
CN109635845B (zh) * 2018-11-14 2021-10-22 湖南金石分选智能科技有限公司 基于主成分分析和支持向量机结合的物料分选方法及系统
CN109901064B (zh) * 2019-03-15 2021-02-12 西安工程大学 基于ica-lvq的高压断路器故障诊断方法
CN110147725A (zh) * 2019-04-12 2019-08-20 杭州电子科技大学 一种基于正交指数局保投影的高光谱图像特征提取方法
CN110097117B (zh) * 2019-04-30 2023-12-12 哈尔滨工程大学 基于线性判别分析与多元自适应样条的数据分类方法
CN110738248B (zh) * 2019-09-30 2022-09-27 朔黄铁路发展有限责任公司 状态感知数据特征提取方法及装置、系统性能评估方法
CN110717854B (zh) * 2019-10-10 2023-05-09 广东工业大学 一种图像降维方法
CN111062495B (zh) * 2019-11-28 2024-03-19 深圳市华尊科技股份有限公司 机器学习方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295360A (zh) * 2008-05-07 2008-10-29 清华大学 一种基于带权图的半监督图像分类方法
CN101520847A (zh) * 2008-02-29 2009-09-02 富士通株式会社 模式识别装置和方法
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520847A (zh) * 2008-02-29 2009-09-02 富士通株式会社 模式识别装置和方法
CN101295360A (zh) * 2008-05-07 2008-10-29 清华大学 一种基于带权图的半监督图像分类方法
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯海亮等.基于Semi-Supervised LLE的人脸表情识别方法.《沈阳建筑大学学报(自然科学版)》.2008,第24卷(第6期),1109-1113. *
陈烨等.基于社群隐含主题挖掘和多社群.《中国图象图形学报》.2010,第15卷(第6期),944-950. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968639A (zh) * 2012-09-28 2013-03-13 武汉科技大学 基于局部线性回归的半监督图像聚类子空间学习算法

Also Published As

Publication number Publication date
CN101916376A (zh) 2010-12-15

Similar Documents

Publication Publication Date Title
CN101916376B (zh) 基于局部样条嵌入的正交半监督子空间图像分类方法
Rao et al. Learning multi-level deep representations for image emotion classification
CN103345645B (zh) 面向网购平台的商品图像类别预测方法
Zhao et al. Spectral feature selection for data mining
Huang et al. Shrink: a structural clustering algorithm for detecting hierarchical communities in networks
CN102314614B (zh) 一种基于类共享多核学习的图像语义分类方法
CN106528874B (zh) 基于Spark内存计算大数据平台的CLR多标签数据分类方法
CN105205096B (zh) 一种跨文本模态和图像模态的数据检索方法
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
CN103942749B (zh) 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
CN103942571B (zh) 一种基于遗传规划算法的图形图像分类方法
CN101710334A (zh) 基于图像哈希的大规模图像库检索方法
Zhao et al. Scene classification via latent Dirichlet allocation using a hybrid generative/discriminative strategy for high spatial resolution remote sensing imagery
CN106156067B (zh) 用于为关系数据创建数据模型的方法和系统
CN105718532A (zh) 一种基于多深度网络结构的跨媒体排序方法
CN107004141A (zh) 对大样本组的高效标注
CN107220311A (zh) 一种利用局部嵌入话题建模的文本表示方法
CN109284411A (zh) 一种基于有监督超图离散化图像二值编码方法
CN103473308B (zh) 基于最大间隔张量学习的高维多媒体数据分类方法
CN105701225A (zh) 一种基于统一关联超图规约的跨媒体检索方法
CN103473275A (zh) 一种采用多特征融合的图像自动标注方法和系统
Deng et al. Citrus disease recognition based on weighted scalable vocabulary tree
Aiwan et al. Image spam filtering using convolutional neural networks
CN102831161B (zh) 用于图像检索的基于流形正则化的半监督排序学习方法
Gao et al. The intellectual structure of digital humanities: An author co-citation analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120829

Termination date: 20180706