CN101916376A - 基于局部样条嵌入的正交半监督子空间图像分类方法 - Google Patents

基于局部样条嵌入的正交半监督子空间图像分类方法 Download PDF

Info

Publication number
CN101916376A
CN101916376A CN 201010220132 CN201010220132A CN101916376A CN 101916376 A CN101916376 A CN 101916376A CN 201010220132 CN201010220132 CN 201010220132 CN 201010220132 A CN201010220132 A CN 201010220132A CN 101916376 A CN101916376 A CN 101916376A
Authority
CN
China
Prior art keywords
matrix
class
sample
training sample
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010220132
Other languages
English (en)
Other versions
CN101916376B (zh
Inventor
邵建
张寅�
朱科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2010102201327A priority Critical patent/CN101916376B/zh
Publication of CN101916376A publication Critical patent/CN101916376A/zh
Application granted granted Critical
Publication of CN101916376B publication Critical patent/CN101916376B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于局部样条嵌入的正交半监督子空间图像分类方法。包括如下步骤:1)对图像数据集选取n个样本作为训练集,包括有标注数据和未标注数据,其余作为测试集;2)利用有标注数据构造类间散度矩阵和类内散度矩阵;3)利用整体训练数据特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;4)根据局部样条嵌入正交半监督子空间模型,寻找投影矩阵对原始高维特征向量进行降维;5)采用支持向量机对降维后训练样本建立分类器;6)利用投影矩阵对测试集进行降维,再通过分类器对降维后的测试集进行分类。本发明充分利用了图像样本标注和特征空间分布等信息,能挖掘图像数据之间潜在语义关联,对图像语义进行了较好的分析与表达。

Description

基于局部样条嵌入的正交半监督子空间图像分类方法
技术领域
本发明涉及一种基于局部样条嵌入的正交半监督子空间图像分类方法。该方法对图像数据进行特征提取表示为特征向量,并寻找有效的降维方法将其投影到低维语义空间,从而通过训练分类器模型实现对图像数据的分类。
背景技术
随着数字照相机普及和互联网发展,图像数据采集、存储和访问数量呈爆炸式增长,如何对规模日益庞大的图像数据进行高效管理变得日益重要。为了对图像进行更好管理,一个有效手段便是对图像数据分门别类地进行管理。因此,对图像数据进行分类已成为近年来热点研究问题。
在图像分类的研究中,所面临的最大挑战是语义鸿沟,即图像底层特征无法充分反映其高层语义。鉴于以数据驱动为中心的机器学习和统计分析等理论所取得进展,为了克服语义鸿沟,一个有效手段是在提取图像底层特征基础上,应用机器学习理论,训练得到图像语义的抽象表达,然后基于该表达,再对图像进行聚类与分类。在这个过程中,有监督学习分类算法被大量使用。虽然有监督算法可有效提高图像表达准确性,但是现有监督算法仍然存在局限性,尤其是获得精确标注信息需要耗费大量时间。随着图像数据数量快速增长,无标注数据获取更加便利,使得仅能单纯处理标注数据的监督学习算法局限性更为明显。考虑到带有标注信息的数据较难获得,而未标注数据则相对容易获得,半监督算法逐渐吸引了越来越多研究者注意。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于局部样条嵌入的正交半监督子空间图像分类方法。
基于局部样条嵌入的正交半监督子空间图像分类方法包括如下步骤:
1)对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2)利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵;
3)利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;
4)根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本;
5)采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型;
6)对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类。
所述的利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵步骤为:给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure BSA00000176454900021
i=1,...,n,前l个样本
Figure BSA00000176454900022
具有类别标注信息
Figure BSA00000176454900023
剩余n-l个样本
Figure BSA00000176454900024
没有被标注,利用包含标注信息训练样本
Figure BSA00000176454900025
构造类间散度矩阵
Figure BSA00000176454900026
和类内散度矩阵
Figure BSA00000176454900027
其中,lk表示属于第k类的训练样本个数,
Figure BSA00000176454900028
表示第k类中第i个样本,
Figure BSA00000176454900029
Figure BSA000001764549000210
均值,
Figure BSA000001764549000211
表示第k类中样本均值。
所述的利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵步骤为:
1)假定给定样本
Figure BSA000001764549000212
的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure BSA000001764549000213
Figure BSA000001764549000214
1≤i≤n,1≤j≤k,对于m维中的每一分量,分别构造一个样条函数g(t),使得fj=g(tj);对如下函数:
Figure BSA000001764549000215
进行最小化,得到样条函数g,其中λ>0是一个正则化参数,
Figure BSA000001764549000216
是样条函数g在d维空间里的罚函数,当
Figure BSA000001764549000217
时,上式存在唯一解,其中l=(d+s-1)!/(d!(s-1)!),
Figure BSA000001764549000218
构成了一个阶数不小于s的多项式空间,2s>d,φj(t)是一个格林函数,
Figure BSA000001764549000219
和β=[β1,β2,...,βl]T是系数向量;
2)通过解下面的线性方程组获得系数向量η和β:
A · η β = f 0
其中f=[f1,...,fk]T
Figure BSA00000176454900031
K是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj),得到τ(g)=fTBf
3)对于m维中的每一分量,τ(g)由全局坐标f来表达,将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure BSA00000176454900033
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSB S T F T )
令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
所述的根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本步骤为:
1)通过学习得到正交投影矩阵m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻,即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a;
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
所述的采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型步骤为:分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量
Figure BSA00000176454900037
以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure BSA00000176454900038
Figure BSA00000176454900039
通过求解最优化问题
Figure BSA000001764549000310
得到
Figure BSA000001764549000311
和b,其中c是常量,ξ是松弛因子。
所述的对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类步骤为:训练样本集合外的测试样本数据
Figure BSA00000176454900041
由正交投影矩阵a映射为低维子空间中的
Figure BSA00000176454900042
然后通过分类器模型进行类别检测,即计算
Figure BSA00000176454900043
来得到测试数据的类别标识yt∈{+1,-1}。
本发明有效利用了有标注训练样本和未标注训练样本,通过局部样条回归将局部低维嵌入坐标映射成全局低维嵌入坐标,保持了图像数据集合的流形空间本征结构。有效地解决了高维度带来的困难,通过对降维后的数据采用支持向量机来训练分类器模型并对测试数据分类,取得了比传统的分类方法更准确的分类结果。
附图说明
图1是基于局部样条嵌入的正交半监督子空间图像分类方法流程图;
图2是举例本发明的5幅图像分类结果。
具体实施方式
基于局部样条嵌入的正交半监督子空间图像分类方法包括如下步骤:
1)对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2)利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵;
3)利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;
4)根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本;
5)采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型;
6)对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类。
所述的利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵步骤为:给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure BSA00000176454900044
i=1,...,n,前l个样本
Figure BSA00000176454900045
具有类别标注信息
Figure BSA00000176454900046
剩余n-l个样本
Figure BSA00000176454900047
没有被标注,利用包含标注信息训练样本构造类间散度矩阵和类内散度矩阵
Figure BSA00000176454900052
其中,lk表示属于第k类的训练样本个数,
Figure BSA00000176454900053
表示第k类中第i个样本,均值,表示第k类中样本均值。
所述的利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵步骤为:
1)假定给定样本
Figure BSA00000176454900057
的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure BSA00000176454900058
1≤i≤n,1≤j≤k,对于m维中的每一分量,分别构造一个样条函数g(t),使得fj=g(tj);对如下函数:
Figure BSA000001764549000510
进行最小化,得到样条函数g,其中λ>0是一个正则化参数,
Figure BSA000001764549000511
是样条函数g在d维空间里的罚函数,当
Figure BSA000001764549000512
时,上式存在唯一解,其中l=(d+s-1)!/(d!(s-1)!),
Figure BSA000001764549000513
构成了一个阶数不小于s的多项式空间,2s>d,φj(t)是一个格林函数,和β=[β1,β2,...,βl]T是系数向量;
2)通过解下面的线性方程组获得系数向量η和β:
A · η β = f 0
其中f=[f1,...,fk]T
Figure BSA000001764549000516
K是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj),得到τ(g)=fTBf
3)对于m维中的每一分量,τ(g)由全局坐标f来表达,将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure BSA000001764549000518
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSBS T F T )
令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
所述的根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本步骤为:
1)通过学习得到正交投影矩阵
Figure BSA00000176454900062
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻,即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a;
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
所述的采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型步骤为:分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure BSA00000176454900065
Figure BSA00000176454900066
通过求解最优化问题
Figure BSA00000176454900067
得到和b,其中c是常量,ξ是松弛因子。
所述的对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类步骤为:训练样本集合外的测试样本数据由正交投影矩阵a映射为低维子空间中的
Figure BSA000001764549000610
然后通过分类器模型进行类别检测,即计算来得到测试数据的类别标识yt∈{+1,-1}。
实施例
1.对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2.利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵:
给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure BSA00000176454900071
i=1,...,n,前l个样本具有类别标注信息
Figure BSA00000176454900073
剩余n-l个样本
Figure BSA00000176454900074
没有被标注。利用包含标注信息训练样本
Figure BSA00000176454900075
构造类间散度矩阵Sb和类内散度矩阵Sw
S b = Σ k = 1 c l k ( μ ( k ) - μ ) ( μ ( k ) - μ ) T
S w = Σ k = 1 c ( Σ i = 1 l k ( x i ( k ) - μ ( k ) ) ( x i ( k ) - μ ( k ) ) T )
其中,lk表示属于第k类的训练样本个数,
Figure BSA00000176454900078
表示第k类中第i个样本,
Figure BSA000001764549000710
均值,
Figure BSA000001764549000711
表示第k类中样本均值。
3.利用整体训练样本数据的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵:
假定给定样本
Figure BSA000001764549000712
的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure BSA000001764549000713
Figure BSA000001764549000714
1≤i≤n,1≤j≤k。对于m维中的每一分量,希望分别构造一个样条函数g(t),使得如下插值条件成立:
fj=g(tj),j=1,2,...,k    (1)
为了得到样条函数g,最小化如下函数:
τ ( g ) = 1 k Σ j = 1 k ( f j - g ( t j ) ) 2 + λτ s d ( g ) - - - ( 2 )
其中λ>0是一个正则化参数,
Figure BSA000001764549000716
是样条函数g在d维空间里的罚函数。
在一定条件下,存在一个唯一的样条函数使得公式(2)中样条函数g(t)最小化:
g ( t ) = Σ i = 1 l β i p i ( t ) + Σ j = 1 k η j φ j ( t ) - - - ( 3 )
其中l=(d+s-1)!/(d!(s-1)!),
Figure BSA00000176454900081
构成了一个阶数不小于s的多项式空间,2s>d。φj(t)是一个格林函数。
为了保证解的唯一性,还需要满足如下边界条件:
Σ j = 1 k η j · p i ( t j ) = 0 , i = 1 , . . . , l - - - ( 4 )
当满足式(4)时,式(3)中的函数φj(·)是条件正定的。
将式(1)和式(4)代入式(3),系数向量
Figure BSA00000176454900083
β=[β1,β2,...,βl]T通过解下面的线性方程组获得:
A · η β = f 0
其中f=[f1,...,fk]TK是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj)。因为φj(·)是一条件正定函数,因此上述方程组存在唯一解。
化简式(2)得:
τ(g)∝ηTKη=fTBf                            (5)
其中B是A-1中大小为k×k最左上子矩阵。
根据式(5),对于m维中的每一分量,式(2)的值τ(g)可以由全局坐标f来表达。将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure BSA00000176454900087
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSBS T F T ) - - - ( 6 )
其中
Figure BSA00000176454900089
F=[f1,f2,...,fn],
Figure BSA000001764549000810
是列选择矩阵,使得Fi=FSi。令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
4.根据局部样条嵌入的正交半监督子空间模型,通过寻找转换矩阵实现对原始高维特征向量的维度降低:
1)通过学习得到正交投影矩阵
Figure BSA00000176454900091
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻。即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a:
Sba=λeig(Sw+γXL′XT)a
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
5.采用支持向量机对降维后的训练样本集合建立分类器模型:
分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量
Figure BSA00000176454900093
以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure BSA00000176454900094
Figure BSA00000176454900095
通过求解最优化问题
Figure BSA00000176454900096
得到
Figure BSA00000176454900097
和b,其中c是常量,ξ是松弛因子。
6.对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类:
训练样本集合外的测试样本数据
Figure BSA00000176454900098
由正交投影矩阵a映射为低维子空间中的
Figure BSA00000176454900099
然后通过分类器模型进行类别检测,即计算
Figure BSA000001764549000910
来得到测试数据的类别标识yt∈{+1,-1}。
图2给出了本发明的5幅图像分类结果。

Claims (6)

1.一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特点在于包括如下步骤:
1)对每个图像数据集选取n个样本数据作为训练集,训练集包括有标注信息的训练样本和未标注信息的训练样本,其余作为测试集;
2)利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵;
3)利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;
4)根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本;
5)采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型;
6)对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类。
2.根据权利要求1所述的一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特点在于所述的利用有标注信息的训练样本构造类间散度矩阵和类内散度矩阵步骤为:给定属于c类的n个样本所组成的训练集合X={x1,..,xl,xl+1,...,xn},其中
Figure FSA00000176454800011
i=1,...,n,前l个样本
Figure FSA00000176454800012
具有类别标注信息剩余n-l个样本
Figure FSA00000176454800014
没有被标注,利用包含标注信息训练样本
Figure FSA00000176454800015
构造类间散度矩阵
Figure FSA00000176454800016
和类内散度矩阵
Figure FSA00000176454800017
其中,lk表示属于第k类的训练样本个数,
Figure FSA00000176454800018
表示第k类中第i个样本,
Figure FSA00000176454800019
Figure FSA000001764548000110
均值,
Figure FSA000001764548000111
表示第k类中样本均值。
3.根据权利要求1所述的一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特点在于所述的利用有标注信息的训练样本和未标注信息的训练样本的特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵步骤为:
1)假定给定样本的k近邻数据的局部低维嵌入坐标和全局低维嵌入坐标为
Figure FSA00000176454800022
Figure FSA00000176454800023
1≤i≤n,1≤j≤k,对于m维中的每一分量,分别构造一个样条函数g(t),使得fj=g(tj);对如下函数:
Figure FSA00000176454800024
进行最小化,得到样条函数g,其中λ>0是一个正则化参数,
Figure FSA00000176454800025
是样条函数g在d维空间里的罚函数,当
Figure FSA00000176454800026
时,上式存在唯一解,其中l=(d+s-1)!/(d!(s-1)!),
Figure FSA00000176454800027
构成了一个阶数不小于s的多项式空间,2s>d,φj(t)是一个格林函数,和β=[β1,β2,...,βl]T是系数向量;
2)通过解下面的线性方程组获得系数向量η和β:
A · η β = f 0
其中f=[f1,...,fk]TK是一个k×k的对称矩阵,Kij=φ(‖ti-tj‖),P是一个l×k的矩阵,Pij=pi(tj),得到τ(g)=fTBf
3)对于m维中的每一分量,τ(g)由全局坐标f来表达,将m维中值τ(g)累加起来,对于第i个样本xi,得到目标值为:
e i = Σ r = 1 m f ( r ) · B i · ( f ( r ) ) T = tr ( F i · B i · F i T )
其中
Figure FSA000001764548000212
将所有n个训练数据的目标值加起来,得到总体的目标值:
E ( F ) = Σ i = 1 n e i = Σ i = 1 n tr ( F i B i F i T ) = tr ( FSBS T F T )
令L′=SBST,这样就得到了基于局部样条嵌入的拉普拉斯矩阵L′。
4.根据权利要求1所述的一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特点在于所述的根据类间散度矩阵和类内散度矩阵以及拉普拉斯矩阵构成局部样条嵌入正交半监督子空间模型,通过寻找转换矩阵来对原始高维特征向量训练样本进行降维,得到低维特征向量训练样本步骤为:
1)通过学习得到正交投影矩阵
Figure FSA00000176454800031
m<d,能保证训练样本在经过a降维后类间离散度尽量大和类内离散度尽量小,同时使得原始空间中相邻样本在投影后低维子空间中仍然相邻,即求解以下最优化问题:
a opt = arg max a tr [ ( a T ( S w + γ XL ′ X T ) a ) - 1 a T S b a ]
s.t.aTa=I
这样,可通过求解矩阵的广义特征根得到优化的投影矩阵a;
2)由投影矩阵a实现对原始高维特征向量的维度降低,从而获得图像数据的低维表达X′=aTX。
5.根据权利要求1所述的一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特点在于所述的采用支持向量机对降维后的低维特征向量训练样本集合建立分类器模型步骤为:分类器模型的输入是经过正交投影矩阵a降维得到的低维特征向量
Figure FSA00000176454800033
以及相应的类别标识yi∈{+1,-1},输出是分类器模型的张量超平面参数
Figure FSA00000176454800034
Figure FSA00000176454800035
通过求解最优化问题得到
Figure FSA00000176454800037
和b,其中c是常量,ξ是松弛因子。
6.根据权利要求1所述的一种基于局部样条嵌入的正交半监督子空间图像分类方法,其特征在于所述的对于测试数据集,由训练集合计算得到的投影矩阵进行投影后,再通过分类器模型进行分类步骤为:训练样本集合外的测试样本数据
Figure FSA00000176454800038
由正交投影矩阵a映射为低维子空间中的
Figure FSA00000176454800039
然后通过分类器模型进行类别检测,即计算
Figure FSA000001764548000310
来得到测试数据的类别标识yt∈{+1,-1}。
CN2010102201327A 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法 Expired - Fee Related CN101916376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102201327A CN101916376B (zh) 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102201327A CN101916376B (zh) 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法

Publications (2)

Publication Number Publication Date
CN101916376A true CN101916376A (zh) 2010-12-15
CN101916376B CN101916376B (zh) 2012-08-29

Family

ID=43323885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102201327A Expired - Fee Related CN101916376B (zh) 2010-07-06 2010-07-06 基于局部样条嵌入的正交半监督子空间图像分类方法

Country Status (1)

Country Link
CN (1) CN101916376B (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542293A (zh) * 2011-12-27 2012-07-04 上海交通大学 一种针对高分辨率sar图像场景解译的一类提取分类方法
CN102609693A (zh) * 2012-02-14 2012-07-25 南昌航空大学 基于模糊二维核主成分分析的人脸识别方法
CN103400144A (zh) * 2013-07-17 2013-11-20 山东师范大学 一种基于k近邻的支持向量机主动学习的方法
CN103488744A (zh) * 2013-09-22 2014-01-01 华南理工大学 一种大数据图像分类方法
CN103605667A (zh) * 2013-10-28 2014-02-26 中国计量学院 一种图像自动标注算法
CN104504305A (zh) * 2014-12-24 2015-04-08 西安电子科技大学 监督基因表达数据分类方法
CN106407664A (zh) * 2016-08-31 2017-02-15 深圳市中识创新科技有限公司 呼吸气体诊断系统的领域自适应方法及装置
CN103593357B (zh) * 2012-08-15 2017-03-01 富士通株式会社 一种半监督的特征变换方法和装置
CN107133226A (zh) * 2016-02-26 2017-09-05 阿里巴巴集团控股有限公司 一种区分主题的方法及装置
CN107657214A (zh) * 2017-09-04 2018-02-02 重庆大学 一种局部判别保持投影的电子舌味觉识别方法
CN107808166A (zh) * 2017-10-26 2018-03-16 杭州电子科技大学 一种memd张量线性拉普拉斯判别的肌电特征提取方法
CN107977642A (zh) * 2017-12-15 2018-05-01 南京航空航天大学 一种核自适应均值判别分析的高分辨距离像目标识别方法
CN108537290A (zh) * 2018-04-25 2018-09-14 攀枝花学院 基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
CN109117739A (zh) * 2018-07-18 2019-01-01 成都识达科技有限公司 一种基于邻域样本定向鉴别投影特征提取方法
CN109299732A (zh) * 2018-09-12 2019-02-01 北京三快在线科技有限公司 无人驾驶行为决策及模型训练的方法、装置及电子设备
CN109635845A (zh) * 2018-11-14 2019-04-16 湖南金石分选智能科技有限公司 基于主成分分析和支持向量机结合的物料分选方法及系统
CN109901064A (zh) * 2019-03-15 2019-06-18 西安工程大学 基于ica-lvq的高压断路器故障诊断方法
CN110097117A (zh) * 2019-04-30 2019-08-06 哈尔滨工程大学 基于线性判别分析与多元自适应样条的数据分类方法
CN110147725A (zh) * 2019-04-12 2019-08-20 杭州电子科技大学 一种基于正交指数局保投影的高光谱图像特征提取方法
CN110717854A (zh) * 2019-10-10 2020-01-21 广东工业大学 一种图像降维方法
CN110738248A (zh) * 2019-09-30 2020-01-31 朔黄铁路发展有限责任公司 状态感知数据特征提取方法及装置、系统性能评估方法
CN111062495A (zh) * 2019-11-28 2020-04-24 深圳市华尊科技股份有限公司 机器学习方法及相关装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968639A (zh) * 2012-09-28 2013-03-13 武汉科技大学 基于局部线性回归的半监督图像聚类子空间学习算法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295360A (zh) * 2008-05-07 2008-10-29 清华大学 一种基于带权图的半监督图像分类方法
CN101520847A (zh) * 2008-02-29 2009-09-02 富士通株式会社 模式识别装置和方法
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520847A (zh) * 2008-02-29 2009-09-02 富士通株式会社 模式识别装置和方法
CN101295360A (zh) * 2008-05-07 2008-10-29 清华大学 一种基于带权图的半监督图像分类方法
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《中国图象图形学报》 20100630 陈烨等 基于社群隐含主题挖掘和多社群 944-950 1-6 第15卷, 第6期 2 *
《沈阳建筑大学学报(自然科学版)》 20081130 冯海亮等 基于Semi-Supervised LLE的人脸表情识别方法 1109-1113 1-6 第24卷, 第6期 2 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542293A (zh) * 2011-12-27 2012-07-04 上海交通大学 一种针对高分辨率sar图像场景解译的一类提取分类方法
CN102609693A (zh) * 2012-02-14 2012-07-25 南昌航空大学 基于模糊二维核主成分分析的人脸识别方法
CN103593357B (zh) * 2012-08-15 2017-03-01 富士通株式会社 一种半监督的特征变换方法和装置
CN103400144B (zh) * 2013-07-17 2017-02-22 山东师范大学 一种基于k近邻的支持向量机主动学习的方法
CN103400144A (zh) * 2013-07-17 2013-11-20 山东师范大学 一种基于k近邻的支持向量机主动学习的方法
CN103488744A (zh) * 2013-09-22 2014-01-01 华南理工大学 一种大数据图像分类方法
CN103488744B (zh) * 2013-09-22 2016-10-05 华南理工大学 一种大数据图像分类方法
CN103605667A (zh) * 2013-10-28 2014-02-26 中国计量学院 一种图像自动标注算法
CN103605667B (zh) * 2013-10-28 2017-02-08 中国计量学院 一种图像自动标注算法
CN104504305A (zh) * 2014-12-24 2015-04-08 西安电子科技大学 监督基因表达数据分类方法
CN104504305B (zh) * 2014-12-24 2018-03-06 西安电子科技大学 监督基因表达数据分类方法
CN107133226A (zh) * 2016-02-26 2017-09-05 阿里巴巴集团控股有限公司 一种区分主题的方法及装置
CN107133226B (zh) * 2016-02-26 2021-12-07 阿里巴巴集团控股有限公司 一种区分主题的方法及装置
CN106407664A (zh) * 2016-08-31 2017-02-15 深圳市中识创新科技有限公司 呼吸气体诊断系统的领域自适应方法及装置
CN106407664B (zh) * 2016-08-31 2018-11-23 深圳市中识健康科技有限公司 呼吸气体诊断系统的领域自适应装置
CN107657214A (zh) * 2017-09-04 2018-02-02 重庆大学 一种局部判别保持投影的电子舌味觉识别方法
CN107808166A (zh) * 2017-10-26 2018-03-16 杭州电子科技大学 一种memd张量线性拉普拉斯判别的肌电特征提取方法
CN107808166B (zh) * 2017-10-26 2020-08-11 杭州电子科技大学 一种memd张量线性拉普拉斯判别的肌电特征提取方法
CN107977642A (zh) * 2017-12-15 2018-05-01 南京航空航天大学 一种核自适应均值判别分析的高分辨距离像目标识别方法
CN107977642B (zh) * 2017-12-15 2021-10-22 南京航空航天大学 一种核自适应均值判别分析的高分辨距离像目标识别方法
CN108537290A (zh) * 2018-04-25 2018-09-14 攀枝花学院 基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
CN109117739A (zh) * 2018-07-18 2019-01-01 成都识达科技有限公司 一种基于邻域样本定向鉴别投影特征提取方法
US11983245B2 (en) 2018-09-12 2024-05-14 Beijing Sankuai Online Technology Co., Ltd Unmanned driving behavior decision-making and model training
CN109299732A (zh) * 2018-09-12 2019-02-01 北京三快在线科技有限公司 无人驾驶行为决策及模型训练的方法、装置及电子设备
CN109635845A (zh) * 2018-11-14 2019-04-16 湖南金石分选智能科技有限公司 基于主成分分析和支持向量机结合的物料分选方法及系统
CN109901064A (zh) * 2019-03-15 2019-06-18 西安工程大学 基于ica-lvq的高压断路器故障诊断方法
CN110147725A (zh) * 2019-04-12 2019-08-20 杭州电子科技大学 一种基于正交指数局保投影的高光谱图像特征提取方法
CN110097117A (zh) * 2019-04-30 2019-08-06 哈尔滨工程大学 基于线性判别分析与多元自适应样条的数据分类方法
CN110097117B (zh) * 2019-04-30 2023-12-12 哈尔滨工程大学 基于线性判别分析与多元自适应样条的数据分类方法
CN110738248B (zh) * 2019-09-30 2022-09-27 朔黄铁路发展有限责任公司 状态感知数据特征提取方法及装置、系统性能评估方法
CN110738248A (zh) * 2019-09-30 2020-01-31 朔黄铁路发展有限责任公司 状态感知数据特征提取方法及装置、系统性能评估方法
CN110717854B (zh) * 2019-10-10 2023-05-09 广东工业大学 一种图像降维方法
CN110717854A (zh) * 2019-10-10 2020-01-21 广东工业大学 一种图像降维方法
CN111062495A (zh) * 2019-11-28 2020-04-24 深圳市华尊科技股份有限公司 机器学习方法及相关装置
CN111062495B (zh) * 2019-11-28 2024-03-19 深圳市华尊科技股份有限公司 机器学习方法及相关装置

Also Published As

Publication number Publication date
CN101916376B (zh) 2012-08-29

Similar Documents

Publication Publication Date Title
CN101916376B (zh) 基于局部样条嵌入的正交半监督子空间图像分类方法
CN103345645B (zh) 面向网购平台的商品图像类别预测方法
Huang et al. Shrink: a structural clustering algorithm for detecting hierarchical communities in networks
CN105205096B (zh) 一种跨文本模态和图像模态的数据检索方法
CN104834693B (zh) 基于深度搜索的视觉图像检索方法及系统
CN102314614B (zh) 一种基于类共享多核学习的图像语义分类方法
CN106528874B (zh) 基于Spark内存计算大数据平台的CLR多标签数据分类方法
CN103942749B (zh) 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
CN103064903B (zh) 图片检索方法和装置
CN103699902A (zh) 一种地基可见光云图的分类方法
CN107451278A (zh) 基于多隐层极限学习机的中文文本分类方法
CN104346481B (zh) 一种基于动态同步模型的社区检测方法
CN104346440A (zh) 一种基于神经网络的跨媒体哈希索引方法
CN106156067B (zh) 用于为关系数据创建数据模型的方法和系统
CN107220311A (zh) 一种利用局部嵌入话题建模的文本表示方法
CN103473308B (zh) 基于最大间隔张量学习的高维多媒体数据分类方法
CN105701225A (zh) 一种基于统一关联超图规约的跨媒体检索方法
CN103473275A (zh) 一种采用多特征融合的图像自动标注方法和系统
Aiwan et al. Image spam filtering using convolutional neural networks
CN102831161B (zh) 用于图像检索的基于流形正则化的半监督排序学习方法
Zhou et al. The survey of large-scale query classification
CN103942779A (zh) 一种基于图论和半监督学习相结合的图像分割方法
Jian-Xiang et al. Application of genetic algorithm in document clustering
CN107577681B (zh) 一种基于社交媒体图片的地域分析、推荐方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120829

Termination date: 20180706

CF01 Termination of patent right due to non-payment of annual fee