CN109284781A - 基于流形学习的图像分类算法和系统 - Google Patents
基于流形学习的图像分类算法和系统 Download PDFInfo
- Publication number
- CN109284781A CN109284781A CN201811049534.8A CN201811049534A CN109284781A CN 109284781 A CN109284781 A CN 109284781A CN 201811049534 A CN201811049534 A CN 201811049534A CN 109284781 A CN109284781 A CN 109284781A
- Authority
- CN
- China
- Prior art keywords
- point
- characteristic point
- formula
- sample
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007635 classification algorithm Methods 0.000 title claims abstract description 13
- 230000009467 reduction Effects 0.000 claims abstract description 65
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000012706 support-vector machine Methods 0.000 claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 25
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000013507 mapping Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 51
- 230000006870 function Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 35
- 230000004044 response Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000009795 derivation Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 6
- 238000002474 experimental method Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Abstract
本发明公开一种基于流形学习的图像分类算法和系统,包括:步骤1,选取训练样本集和测试样本集;步骤2,利用sift算法提取两个样本集图像的特征点;步骤3,利用流形学习方法中的局部线性嵌入或拉布拉斯特征映射对分别对两个样本集中的特征点进行降维;步骤4,将训练样本集降维后的特征点输入到支持向量机分类器中进行训练;步骤5,利用训练好的支持向量机分类器对测试样本集进行分类。本发明将SIFT特征提取算法与非线性流形学习降维算法相结合,提取出图像的中层特征,然后再利用SVM分类器进行分类处理,可以有效的提高计算速度及其分类的精度。
Description
技术领域
本发明涉及图像分类技术领域,适用于目标分类、目标识别和目标检测等领 域。
背景技术
图像分类技术,即根据图像特征的差异,将不同类的目标标记为相应种类的 技术。传统的图像分类方法先利用方向梯度直方图(Histogram of Oriented Gradient,HOG)、LBP(Local Binary Pattern,局部二值模式)和Haar等算法提取图像 的特征,然后利用分类器将不同的图像分为相应的种类。根据提取特征的不同, 最终能够达到的分类效果也有很大的差异;因此,选择合适的能够充分描述图像 的特征提取方式,筛选出更多有利于图像分类的特征便十分的重要。
如果直接对提取的HOG、LBP或者Haar等特征进行分类计算,由于样本数 量多,以及图像特征的维数高;同时高维数据中常常包含许多冗余特征可能还有 噪声特征,还存在着维数灾难的问题;这大大的增加了计算量,需要花费更多的 时间来完成学习、训练的过程,同时会降低图像分类处理的精度。为了解决这一 系列棘手的问题,众多研究人员提出了诸如PCA、LDA和LFA等方法来将图像 特征从D维降低到d维(d<D)。主成分分析(PrincipalComponent Analysis,PCA) 是最常用的线性降维方法,它通过正交变换将原始的高维空间的的数据投影到低 维空间中。主成分分析法可以有效地减少数据的冗余、简约特征维数,同时还可 以减少代数运算中噪声造成的误差。但是这个方法是基于很多假设条件的,这些条件都直接限制着PCA降维的应用。例如由于PCA是基于线性变换的,所以它 需要处理的数据之间的关系是线性的,否则PCA不能很好的保持数据之间的结 构,会出现错误的投影,导致原数据的几何信息失真,使得主成分分析法的效果 不明显。传统的特征提取的方法大多是线性的,它们可以很好的处理线性问题, 但是很难有效的将高维空间中复杂的非线性数据进行降维。相比之下,2000年, Roweis和Saul在《Science》上发表的《NonlinearDimensionality Reduction by Locally Linear Embedding》提出了一种针对非线性数据的新的无监督的降维方法, 局部嵌入算法(Locally Linear Embedding,LLE),LLE是一种流形学习方法, 能够使降维的数据保持原有的拓扑结构,具有平移、旋转和压缩不变性,可以广 泛的应用于非线性数据的降维。在此基础上,学者们发展出一系列其他的具有各 自特点的非线性降维算法。由此可见,选取合适的降维方法,以保证在降维的同 时,依然能够充分的保持数据结构的不变性非常的有意义。
可见在传统的机器学习中,先提取图像特征,然后导入分类器SVM(支持 向量机)、KNN(k近邻)、随机森林等进行分类处理,存在计算量大、操作复杂、 分类精度不高等问题,都是需急需解决的。
发明内容
本发明旨在针对上述传统图像分类方法中存在的不足之处,提出了基于流形 学习的图像分类算法,将SIFT特征提取算法与非线性流形学习降维算法相结合, 提取出图像的中层特征,然后再利用SVM分类器进行分类处理,可以有效的提 高计算速度及其分类的精度。
本发明提供的技术方案为一种基于流形学习的图像分类算法,包括如下步骤:
步骤1,选取训练样本集和测试样本集;
步骤2,利用sift算法提取两个样本集图像的特征点;
步骤3,利用流形学习方法中的局部线性嵌入或拉布拉斯特征映射对分别对 两个样本集中的特征点进行降维;
步骤4,将训练样本集降维后的特征点输入到支持向量机分类器中进行训练;
步骤5,利用训练好的支持向量机分类器对测试样本集进行分类。
进一步的,步骤2中利用sift算法提取图像特征点的具体实现方式如下,
步骤2a,构建尺度空间,首先通过图像与高斯函数卷积来建立高斯金字塔, 高斯金字塔中二维图像尺度空定义如式1-1:
Li(x,y,σ)=Gi(x,y,σ)*Ii(x,y) 公式1-1
其中Gi(x,y,σ)是高斯函数,x,y为空间坐标,σ为尺度坐标,用于决定图 像的尺度;将原图扩大一倍作为高斯金字塔的最底层,自底层向上,每组图像的 大小依次缩小1倍,同时高斯函数与每层图像卷积的σ值依次扩大k倍即可构 建高斯金字塔;
构建高斯差分尺度空间,并用Fi(x,y,σ)表示,具体定义如公式1-2所示:
Fi(x,y,σ)=Li(x,y,kσ)-Li(x,y,σ) 公式1-2
步骤2b,寻找特征点,将每个采样点与相邻的26个相邻点进行比较(包含不 同层),若为极值点,初步认定为特征点;
步骤2c,精确特征点位置,首先消除虚假极值,将空间尺度函数进行泰勒 展开如公式1-3,
对公式1-3进行求导并使方程等于0,得到X的值如公式1-4,并将其代入 F(X)如公式1-5,并根据结果除掉对比度较低的特征点;
|F(X)|≥0.03,此采集点保存为特征点,否则舍弃;
步骤2d,消除边缘响应,利用海森矩阵求出特征点处的主曲率,滤除主曲 率比值大于一定阈值的点,从而消除边缘响应;
令海森矩阵为Hs,FXX、FXY、FYY为各个方向上的偏导数, 令FXX=a,FYY=b,且a=b*x,Trace(Hs)为海森矩阵的迹,|Hs|为海森矩阵的行 列式,
F的主曲率和HS的特征值成正比,S在a=b时最小,特征值之间的比值越 大S也就越大;时保留特征点,否则滤除特征点;
步骤2e,确定特征点方向,用特征点邻域像素方向分布特性,为每个特征 点指定方向参数,从而使描述子对图像具有旋转不变性,
利用公式1-7求得每个像素的梯度幅值,利用公式1-8求得每个像素的梯度 方向,并特征点周围样本点统计出方向直方图,方向直方图中,最大峰值方向是 特征点的主方向;
步骤2f,生产特征点描述子,具体过程为:1、确定计算描述子所需的图像 区域半径,2、将坐标轴x方向移至特征点主方向,3、对图像半径区域内所有样 本点求梯度幅值与方向,生成方向直方图。
进一步的,步骤3中利用局部线性嵌入进行降维的实现方式如下;
步骤3-1a,寻找每个样本点的k个近邻点,将k个距离最近的样本点规定为 所求样本点的近邻点,这里的样本点和近邻点均为步骤2中提取的特征点,k是 一个预先给定值;
步骤3-1b,由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
步骤3-1c,由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输 出值。
进一步的,步骤3中利用拉布拉斯特征映射进行降维的实现方式如下;
步骤3-2a,近邻图的构造,首先连接样本点(即步骤2提取的特征点),连 接每个点最近的k个点,k值为事先设定;
步骤3-2b,使用热核函数确定相邻点之间的权重大小如式2-8,t是热核宽 度,x1与x2为相邻点;
步骤3-2c,让相似的样本点在降维后空间中距离较近,构建优化目标函数 f(x)如式2-9:
ya,yb是特征点在m维空间中的列向量,其拉普拉斯矩阵为L=D-W,其中 D为图的度矩阵,W为图的邻接矩阵,对图拉普拉斯矩阵进行特征值分解,使 用最小的m个特征值(非零)对应的特征向量作为降维后的结果。
本发明还提供一种基于流形学习的图像分类系统,包括如下模块:
样本构建模块,用于选取训练样本集和测试样本集;
特征提取模块,用于利用sift算法提取两个样本集图像的特征点;
特征降维模块,用于利用流形学习方法中的局部线性嵌入或拉布拉斯特征映 射对分别对两个样本集中的特征点进行降维;
SVM训练模块,用于将训练样本集降维后的特征点输入到支持向量机分类 器中进行训练;
分类模块,用于利用训练好的支持向量机分类器对测试样本集进行分类。
进一步的,特征提取模块中利用sift算法提取图像特征点的具体实现方式如 下,
步骤2a,构建尺度空间,首先通过图像与高斯函数卷积来建立高斯金字塔, 高斯金字塔中二维图像尺度空定义如式1-1:
Li(x,y,σ)=Gi(x,y,σ)*Ii(x,y) 公式1-1
其中Gi(x,y,σ)是高斯函数,x,y为空间坐标,σ为尺度坐标,用于决定图 像的尺度;将原图扩大一倍作为高斯金字塔的最底层,自底层向上,每组图像的 大小依次缩小1倍,同时高斯函数与每层图像卷积的σ值依次扩大k倍即可构 建高斯金字塔;
构建高斯差分尺度空间,并用Fi(x,y,σ)表示,具体定义如公式1-2所示:
Fi(x,y,σ)=Li(x,y,kσ)-Li(x,y,σ) 公式1-2
步骤2b,寻找特征点,将每个采样点与相邻的26个相邻点进行比较(包含不 同层),若为极值点,初步认定为特征点;
步骤2c,精确特征点位置,首先消除虚假极值,将空间尺度函数进行泰勒 展开如公式1-3,
对公式1-3进行求导并使方程等于0,得到X的值如公式1-4,并将其代入 F(X)如公式1-5,并根据结果除掉对比度较低的特征点;
|F(X)|≥0.03,此采集点保存为特征点,否则舍弃;
步骤2d,消除边缘响应,利用海森矩阵求出特征点处的主曲率,滤除主曲 率比值大于一定阈值的点,从而消除边缘响应;
令海森矩阵为Hs,FXX、FXY、FYY为各个方向上的偏导数, 令FXX=a,FYY=b,且a=b*x,Trace(Hs)为海森矩阵的迹,|Hs|为海森矩阵的行 列式,
F的主曲率和HS的特征值成正比,S在a=b时最小,特征值之间的比值越 大,S也就越大;时保留特征点,否则滤除特征点;
步骤2e,确定特征点方向,用特征点邻域像素方向分布特性,为每个特征 点指定方向参数,从而使描述子对图像具有旋转不变性,
利用公式1-7求得每个像素的梯度幅值,利用公式1-8求得每个像素的梯度 方向,并特征点周围样本点统计出方向直方图,方向直方图中,最大峰值方向是 特征点的主方向;
步骤2f,生产特征点描述子,具体过程为:1、确定计算描述子所需的图像 区域半径,2、将坐标轴x方向移至特征点主方向,3、对图像半径区域内所有样 本点求梯度幅值与方向,生成方向直方图。
进一步的,特征降维模块中利用局部线性嵌入进行降维的实现方式如下;
步骤3-1a,寻找每个样本点的k个近邻点,将k个距离最近的样本点规定为 所求样本点的近邻点,这里的样本点和近邻点均为步骤2中提取的特征点,k是 一个预先给定值;
步骤3-1b,由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
步骤3-1c,由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输 出值。
进一步的,特征降维模块中利用拉布拉斯特征映射进行降维的实现方式如下;
步骤3-2a,近邻图的构造,首先连接样本点(即步骤2提取的特征点),连 接每个点最近的k个点,k值为事先设定;
步骤3-2b,使用热核函数确定相邻点之间的权重大小如式2-8,t是热核宽 度,x1与x2为相邻点;
步骤2-2c,让相似的样本点在降维后空间中距离较近,构建优化目标函数 f(x)如式2-9:
ya,yb是特征点在m维空间中的列向量,其拉普拉斯矩阵为L=D-W,其中 D为图的度矩阵,W为图的邻接矩阵,对图拉普拉斯矩阵进行特征值分解,使 用最小的m个特征值(非零)对应的特征向量作为降维后的结果。
本发明与传统方法比较具有以下优点:
1、本发明在保证精度的情况下,比较其他算法能够使用更少的时间来完成图像的分类,且计算的复杂度相对较低,易于实现。
2、本发明中采用了SIFT特征提取方法,能够去除几何变形因素的影响,减轻 光照影响,拥有良好的鉴别性。
3、本发明采用了非线性流形学习降维算法,具有良好的处理非线性数据的能力,并且经过处理后的低维数据能够完好的保留原先的拓扑关系。
4、本发明在数据分类的过程中选择使用支持向量机对数据进行分类,利于获取关键样本点,有效的解决了数据冗余的问题,且具有良好的鲁棒性。
5、本发明结合SIFT特征提取算法,流行学习方法,并使用支持向量机对处理 后的数据进行分类。能够有效的降低运算量从而提高分类的速率,同时保持 数据的结构特征,在使用支持向量机分类后,能够得到拥有良好的分类状况, 从实验结果中能够明显看出本发明对于中层特征的分类精度具有较为显著 的提升。
附图说明
图1为本发明算法流程图;
图2为SIFT特征提取流程图;
图3为LLE/LE降维结果图;
图4为支持向量机的结构示意图;
图5为测试集分类结果展示图。
具体实施方式
如图1所示,可将本发明中的图像分类方法分为5个步骤,步骤1选取训 练所需的样本集与测试所需的样本集,步骤2提取所有样本的SIFT特征,步骤 3利用流形学习降低所有样本的高维特征,步骤4通过SVM分类器训练样本集, 步骤5利用训练好的模型对测试样本集进行分类。具体步骤如下:
步骤1:选取训练所需的样本集与测试所需的样本集。
步骤2:通过使用sift算法提取两个样本集图像特征,如图2所示。
步骤2a:构建尺度空间,首先通过图像与高斯函数卷积来建立高斯金字塔, 高斯金字塔中二维图像尺度空定义如式1-1:
Li(x,y,σ)=Gi(x,y,σ)*Ii(x,y) 公式1-1
其中Gi(x,y,σ)是高斯函数,x,y为空间坐标,σ为尺度坐标,用于决定图像 的尺度;将原图扩大一倍作为高斯金字塔的最底层,自底层向上,每组图像的大 小依次缩小1倍,同时高斯函数与每层图像卷积的σ值依次扩大k倍即可构建高 斯金字塔。DOG金字塔的第1组第1层是由高斯金字塔的第1组第2层减第1 组第1层得到的。以此类推,逐组逐层生成每一个差分图像,所有差分图像构成 DOG尺度空间如图2所示,DOG尺度空间用Fi(x,y,σ)表示,具体定义如公式1-2 所示。空间尺度函数用Fi(x,y,σ)表示定义如公式1-2:
Fi(x,y,σ)=Li(x,y,kσ)-Li(x,y,σ) 公式1-2
步骤2b:寻找特征点,每个采样点需要相邻的26个相邻点进行比较(包含不 同层),若为极值点,初步可以认定为特征点,因为采样点得到是离散的,有可 能并不是真正的极值点,此类点需要舍去。
步骤2c:精确特征点位置,首先消除虚假极值,将空间尺度函数进行泰勒 展开如公式1-3,
对公式1-3进行求导并使方程等于0,得到X的值如公式1-4,并将其代入 F(X)如公式1-5,并根据结果除掉对比度较低的特征点。
|F(X)|≥0.03,此采集点保存为特征点,否则舍弃。
步骤2d:消除边缘响应
主曲率值在边缘梯度方向上较大,边缘方向上较小,边缘上得到的特征点相 较于非边缘区域得到的特征点,响应更强,因而会出现较强的边缘效应。
利用海森矩阵求出能够特征点处的主曲率,滤除主曲率比值大于一定阈值的 点,能够消除边缘响应。令海森矩阵为Hs,FXX、FXY、FYY为 各个方向上的偏导数,令FXX=a,FYY=b,且a=b*x,Trace(Hs)为海森矩阵的迹, |Hs|为海森矩阵的行列式。
F的主曲率和HS的特征值成正比,S在a=b时最小,特征值之间的比值越 大,S也就越大。我们需要去除主曲率比值大于一定阈值的点,主曲率比值取值 问题转化为求S值问题,S定义如公式1-6。时保留特征点,否则滤除特 征点,经过测试x=10为主曲率比值阈值处理效果最好。
步骤2e:确定特征点方向,用特征点邻域像素方向分布特性,为每个特征 点指定方向参数,从而使描述子对图像具有旋转不变性。
利用公式1-7求得每个像素的梯度幅值,利用公式1-8求得每个像素的梯度 方向,并特征点周围样本点统计出方向直方图,方向直方图中,最大峰值方向是 特征点的主方向。对于大于0.8倍最大峰值的峰值,这些峰值的方向能够作为辅 助方向。
步骤2f:特征点描述,在完成特征点的计算后得到了特征点的位置等信息, 我们可以通过一组向量来完成对一组图像的描述。描述子包含特征点以及影响特 征点的邻域点。将特征点周围区域划分为独立区域,大小不固定,计算块内梯度 直方图,生成具有独特性的向量。实验结果表明:描述子采用4*4*8=128维向量 时效果最好。描述子确定过程如下:1、确定计算描述子所需的图像区域半径。2、 将坐标轴x方向移至特征点主方向。3、对图像半径区域内所有样本点求梯度幅 值与方向,生成方向直方图。
步骤3:本发明使用流形学习方法对sift提取的特征进行降维,可选取LLE、 LE两种方法对提取的特征进行降维,实验结果图如图3所示,其中左图是LLE 降维映射结果,右图是LE降维映射结果。
方法一:使用LLE方法进行特征降维,LLE局部线性嵌入(Locally-linearembedding,LLE)属于流形学习(Manifold Learning)的一种,能够用于针对非线性 数据进行降维,并在降维后能够保持原有的拓扑关系。
其具体实现过程如下:
步骤3-1a:寻找每个样本点的k个近邻点,将k个距离最近的样本点规定为 所求样本点的近邻点,这里的样本点和近邻点均为步骤1中获得的特征点。
步骤3-1b:构建样本点的局部重建权值矩阵D。首先定义一个代价函数如式 2-1,Dmn为近邻点am和an之间的权值。
构建局部协方差矩阵C如公式2-2,a表示特定点,和分别表示am和an的 K个近邻点。
将∑nDn=1与式2-2结合,利用拉格朗日乘子能够求出局部重建权值Dn。
步骤3-1c:映射样本点至低维空间,需要满足条件如式2-3,其中bm和bn是 am和an的输出向量。
Df=(I-D)T(I-D) 公式2-6
对公式2-3进行变换可以得到Df如公式2-6所示,单位协方差值定义如公式 2-4,对公式2-6在2-4、2-5条件下进行化简可以得到Df*b=λ*b,b是D的 最小n个非零特征值对应的特征向量,λ是D的特征值,将Df的特征值大小顺序 排列,舍弃掉最接近于0的第一项,将第2项到n+1项当作输出。假设数据有m 个,输出结果会是一个m*n的数据矩阵。
方法二:使用LE进行特征降维,拉布拉斯特征映射(Laplacian Eigenmaps) 简称为LE,LE是从局部的角度去构建数据之间的关系,LE通过构建相似关系 图来重构数据流形的局部结构特征,将相似度较高的两个样本点在降维后的空间 中应当距离较近。
其设计流程如下:
步骤3-2a:近邻图的构造,首先连接样本点,连接每个点最近的k个点,k 值为事先设定。
步骤3-2b:确定相邻点之间的权重大小如式2-7,一般使用热核函数,t是热 核宽度,x1与x2为相邻点。
此外我们可以默认设定Weight=1,但是在x1,x2两点相连接时不成立,两点 相连时Weight=0。
步骤3-2c:让相似的样本点在降维后空间中距离较近,构建优化目标函数 f(x)如式2-8:
ya,yb是特征点在m维空间中的列向量。其拉普拉斯矩阵为L=D-W,其中 D为图的度矩阵,W为图的邻接矩阵。对图拉普拉斯矩阵进行特征值分解,使 用最小的m个特征值(非零)对应的特征向量作为降维后的结果。
步骤4:利用训练集降维后的数据训练支持向量机分类,并得出模型。支持 向量机的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超 平面。为了求解最优分类超平面,其实就是求解一个二次规划问题,经典求解方 法为Lagrange乘子法,Lagrange方程如公式3-1,式中W为系数向量,b为常数, ai是拉格朗日乘子。
步骤4a:对W和b求偏导得到式3-2,式中Xi和Xj为图像像素点坐标,yi,yj为 分类标记,用于表述当前点所属类别,求解该方程得到向量W*,结果如式3-3 所示,
步骤4b:求解最优a*、b*值以及最优判别函数。最优a*由约束条件公式 3-4所确定,a*和W*可由二次规划算法求得,然后选取一个支持向量Xi,可求 得b*的值,如公式3-5所示,最终得到最优判别函数为式3-6所示。
a*[yi[(<W*·Xi>+b*)-1]]=0 公式3-4
b*=yi-<W*·Xi> 公式3-5
针对数据集在低纬平面难以找到相应的分类超平面,我们引入核函数来将数 据转换成高维平面,有利于找到更加有效地分类面。支持向量机判别函数形式上 类似于一个神经网络,输出是M个中间结点的线性组合,每个中间结点对应一 个支持向量,如图4所示。
步骤5:利用训练好的模型对测试样本集进行分类。
本发明实施例中一种基于流形学习的图像分类系统,包括如下模块:
样本构建模块,用于选取训练样本集和测试样本集;
特征提取模块,用于利用sift算法提取两个样本集图像的特征点;
特征降维模块,用于利用流形学习方法中的局部线性嵌入或拉布拉斯特征映 射对分别对两个样本集中的特征点进行降维;
SVM训练模块,用于将训练样本集降维后的特征点输入到支持向量机分类 器中进行训练;
分类模块,用于利用训练好的支持向量机分类器对测试样本集进行分类。
各模块的具体实现方式与各步骤相应,本发明不予撰述。
本发明的有益效果可以通过以下实验来实现:
1)实验条件
可在CPU为i7-6700HQ,内存16G,GPU为NVIDIA1080,WINDOWS 10 系统上使用Matlab2018进行实验。
2)实验内容
本实验在VOC2012数据集中抽取的6类样本,分别为aeroplane、bicycle、 bus、cat、dog和horse,其中每一类样本选取100张作为训练集;测试集为网络 上随机下载的6类样本各20张。按照上述步骤,先提取图像的SIFT特征,然后 利用LE、LLE流形学习方法对提取出的高维特征进行降维,最后利用SVM分 类器进行训练和测试。同时引入多种其他传统的图像分类算法,分别计算它们的 精度和训练耗费的时间来进行对比。
下面就对比方法做简单介绍:
A.LBP_SVM:先提取样本的LBP特征,然后利用SVM分类器进行训练;
B.FLBP_SVM:FLBP为本人改进版的LBP,分类器同为SVM;
C.SIFT_PCA_SVM:提取SIFT特征,利用PCA降维,SVM分类器训练;
D.SIFT_PCA_KNN:提取SIFT特征,利用PCA降维,KNN分类器训练;
E.SIFT_PCA_RCF:提取SIFT特征,利用PCA降维,RCF分类器训练;
F.SIFT_LLE_KNN:提取SIFT特征,利用LLE降维,KNN分类器训练;
G.SIFT_LLE_RCF:提取SIFT特征,利用LLE降维,RCF分类器训练;
H.SIFT_LE_KNN:提取SIFT特征,利用LE降维,KNN分类器训练;
I.SIFT_LE_RCF:提取SIFT特征,利用LE降维,RCF分类器训练。
3)实验参数设置
在LE/LLE流形学习算法中,最优领域点数设置为10最大嵌入维度为8
4)实验结果
图像分类实验结果部分展示图如图5所示,数据对比如表1所示,表中分别 列出了本发明提到的两种基于流形学习的图像分类算法SIFT_LLE_SVM、 SIFT_LE_SVM以及另外九种对比实验的精度以及训练所耗费的时间。
表1
5)结果分析
评价一个图像分类方法的好坏,首先是它的精度,其次是训练时间。两种指 标相结合能做出准确的判断,不能仅仅拿其中一者来衡量;例如表1中所示的 LBP_SVM方法虽然仅仅花了19s就训练完了,可是其精度只有44.17%,非常的 低;而SIFT_PCA_SVM方法,精度可以达到65%,但是需要花费690.64s来完 成训练,耗时太长。
从表1的实验结果数据对比可以看出,本发明提到的SIFT_LLE_SVM和 SIFT_LE_SVM图像分类算法,对于每类的样本测试集的分类精度相对于其它几 种方法大部分都有提高,对于总测试集的分类精度更是分别达到了83.00%和 83.83%之高,相比其他方法有非常不错的分类效果;同时,本发明提到的两种算 法训练所用的时间分别为266.92s和266s,尽管相比LBP_SVM和FLBP_SVM 方法所耗费的19s和64s要久,但是其精度几乎是这两种方法的两倍;而相比于 SIFT_PCA_SVM、SIFT_PCA_KNN和SIFT_LLE_KNN等方法所用的时间要更短。
总的来说,本发明提到的SIFT_LLE_SVM和SIFT_LE_SVM两种算法,在 保证分类精度在80%以上的同时,训练时间也保持在一个不错的时间内。因此, 综合精度和训练时间两个指标来看可以得出结论:本发明提到的基于流形学习的 图像分类算法比本文中绝大部分其他的图像分类方法要好。
Claims (8)
1.一种基于流形学习的图像分类算法,其特征在于,包括如下步骤:
步骤1,选取训练样本集和测试样本集;
步骤2,利用sift算法提取两个样本集图像的特征点;
步骤3,利用流形学习方法中的局部线性嵌入或拉布拉斯特征映射对分别对两个样本集中的特征点进行降维;
步骤4,将训练样本集降维后的特征点输入到支持向量机分类器中进行训练;
步骤5,利用训练好的支持向量机分类器对测试样本集进行分类。
2.如权利要求1所述的一种基于流形学习的图像分类算法,其特征在于:步骤2中利用sift算法提取图像特征点的具体实现方式如下,
步骤2a,构建尺度空间,首先通过图像与高斯函数卷积来建立高斯金字塔,高斯金字塔中二维图像尺度空定义如式1-1:
Li(x,y,σ)=Gi(x,y,σ)*Ii(x,y) 公式1-1
其中Gi(x,y,σ)是高斯函数,x,y为空间坐标,σ为尺度坐标,用于决定图像的尺度;将原图扩大一倍作为高斯金字塔的最底层,自底层向上,每组图像的大小依次缩小1倍,同时高斯函数与每层图像卷积的σ值依次扩大k倍即可构建高斯金字塔;
构建高斯差分尺度空间,并用Fi(x,y,σ)表示,具体定义如公式1-2所示:
Fi(x,y,σ)=Li(x,y,kσ)-Li(x,y,σ) 公式1-2
步骤2b,寻找特征点,将每个采样点与相邻的26个相邻点进行比较(包含不同层),若为极值点,初步认定为特征点;
步骤2c,精确特征点位置,首先消除虚假极值,将空间尺度函数进行泰勒展开如公式1-3,
对公式1-3进行求导并使方程等于0,得到X的值如公式1-4,并将其代入F(X)如公式1-5,并根据结果除掉对比度较低的特征点;
|F(X)|≥0.03,此采集点保存为特征点,否则舍弃;
步骤2d,消除边缘响应,利用海森矩阵求出特征点处的主曲率,滤除主曲率比值大于一定阈值的点,从而消除边缘响应;
令海森矩阵为Hs,FXX、FXY、FYY为各个方向上的偏导数,令FXX=a,FYY=b,且a=b*x,Trace(Hs)为海森矩阵的迹,|Hs|为海森矩阵的行列式,
F的主曲率和HS的特征值成正比,S在a=b时最小,特征值之间的比值越大S越大;时保留特征点,否则滤除特征点;
步骤2e,确定特征点方向,用特征点邻域像素方向分布特性,为每个特征点指定方向参数,从而使描述子对图像具有旋转不变性,
利用公式1-7求得每个像素的梯度幅值,利用公式1-8求得每个像素的梯度方向,并特征点周围样本点统计出方向直方图,方向直方图中,最大峰值方向是特征点的主方向;
步骤2f,生产特征点描述子,具体过程为:1、确定计算描述子所需的图像区域半径,2、将坐标轴x方向移至特征点主方向,3、对图像半径区域内所有样本点求梯度幅值与方向,生成方向直方图。
3.如权利要求1所述的一种基于流形学习的图像分类算法,其特征在于:步骤3中利用局部线性嵌入进行降维的实现方式如下;
步骤3-1a,寻找每个样本点的k个近邻点,将k个距离最近的样本点规定为所求样本点的近邻点,这里的样本点和近邻点均为步骤2中提取的特征点,k是一个预先给定值;
步骤3-1b,由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
步骤3-1c,由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。
4.如权利要求1所述的一种基于流形学习的图像分类算法,其特征在于:步骤3中利用拉布拉斯特征映射进行降维的实现方式如下;
步骤3-2a,近邻图的构造,首先连接样本点(即步骤2提取的特征点),连接每个点最近的k个点,k值为事先设定;
步骤3-2b,使用热核函数确定相邻点之间的权重大小如式2-8,t是热核宽度,x1与x2为相邻点;
步骤3-2c,让相似的样本点在降维后空间中距离较近,构建优化目标函数f(x)如式2-9:
ya,yb是特征点在m维空间中的列向量,其拉普拉斯矩阵为L=D-W,其中D为图的度矩阵,W为图的邻接矩阵,对图拉普拉斯矩阵进行特征值分解,使用最小的m个特征值(非零)对应的特征向量作为降维后的结果。
5.一种基于流形学习的图像分类系统,其特征在于,包括如下模块:
样本构建模块,用于选取训练样本集和测试样本集;
特征提取模块,用于利用sift算法提取两个样本集图像的特征点;
特征降维模块,用于利用流形学习方法中的局部线性嵌入或拉布拉斯特征映射对分别对两个样本集中的特征点进行降维;
SVM训练模块,用于将训练样本集降维后的特征点输入到支持向量机分类器中进行训练;
分类模块,用于利用训练好的支持向量机分类器对测试样本集进行分类。
6.如权利要求5所述的一种基于流形学习的图像分类系统,其特征在于:特征提取模块中利用sift算法提取图像特征点的具体实现方式如下;
步骤2a,构建尺度空间,首先通过图像与高斯函数卷积来建立高斯金字塔,高斯金字塔中二维图像尺度空定义如式1-1:
Li(x,y,σ)=Gi(x,y,σ)*Ii(x,y) 公式1-1
其中Gi(x,y,σ)是高斯函数,x,y为空间坐标,σ为尺度坐标,用于决定图像的尺度;将原图扩大一倍作为高斯金字塔的最底层,自底层向上,每组图像的大小依次缩小1倍,同时高斯函数与每层图像卷积的σ值依次扩大k倍即可构建高斯金字塔;
构建高斯差分尺度空间,并用Fi(x,y,σ)表示,具体定义如公式1-2所示:
Fi(x,y,σ)=Li(x,y,kσ)-Li(x,y,σ) 公式1-2
步骤2b,寻找特征点,将每个采样点与相邻的26个相邻点进行比较(包含不同层),若为极值点,初步认定为特征点;
步骤2c,精确特征点位置,首先消除虚假极值,将空间尺度函数进行泰勒展开如公式1-3,
对公式1-3进行求导并使方程等于0,得到X的值如公式1-4,并将其代入F(X)如公式1-5,并根据结果除掉对比度较低的特征点;
|F(X)|≥0.03,此采集点保存为特征点,否则舍弃;
步骤2d,消除边缘响应,利用海森矩阵求出特征点处的主曲率,滤除主曲率比值大于一定阈值的点,从而消除边缘响应;
令海森矩阵为Hs,FXX、FXY、FYY为各个方向上的偏导数,令FXX=a,FYY=b,且a=b*x,Trace(Hs)为海森矩阵的迹,|Hs|为海森矩阵的行列式,
F的主曲率和HS的特征值成正比,S在a=b时最小,特征值之间的比值越大S越大;时保留特征点,否则滤除特征点;
步骤2e,确定特征点方向,用特征点邻域像素方向分布特性,为每个特征点指定方向参数,从而使描述子对图像具有旋转不变性,
利用公式1-7求得每个像素的梯度幅值,利用公式1-8求得每个像素的梯度方向,并特征点周围样本点统计出方向直方图,方向直方图中,最大峰值方向是特征点的主方向;
步骤2f,生产特征点描述子,具体过程为:1、确定计算描述子所需的图像区域半径,2、将坐标轴x方向移至特征点主方向,3、对图像半径区域内所有样本点求梯度幅值与方向,生成方向直方图。
7.如权利要求5所述的一种基于流形学习的图像分类系统,其特征在于:特征降维模块中利用局部线性嵌入进行降维的实现方式如下;
步骤3-1a,寻找每个样本点的k个近邻点,将k个距离最近的样本点规定为所求样本点的近邻点,这里的样本点和近邻点均为步骤2中提取的特征点,k是一个预先给定值;
步骤3-1b,由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
步骤3-1c,由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。
8.如权利要求5所述的一种基于流形学习的图像分类系统,其特征在于:特征降维模块中利用拉布拉斯特征映射进行降维的实现方式如下;
步骤3-2a,近邻图的构造,首先连接样本点(即步骤2提取的特征点),连接每个点最近的k个点,k值为事先设定;
步骤3-2b,使用热核函数确定相邻点之间的权重大小如式2-8,t是热核宽度,x1与x2为相邻点;
步骤2-2c,让相似的样本点在降维后空间中距离较近,构建优化目标函数f(x)如式2-9:
ya,yb是特征点在m维空间中的列向量,其拉普拉斯矩阵为L=D-W,其中D为图的度矩阵,W为图的邻接矩阵,对图拉普拉斯矩阵进行特征值分解,使用最小的m个特征值(非零)对应的特征向量作为降维后的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811049534.8A CN109284781A (zh) | 2018-09-10 | 2018-09-10 | 基于流形学习的图像分类算法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811049534.8A CN109284781A (zh) | 2018-09-10 | 2018-09-10 | 基于流形学习的图像分类算法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109284781A true CN109284781A (zh) | 2019-01-29 |
Family
ID=65180457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811049534.8A Pending CN109284781A (zh) | 2018-09-10 | 2018-09-10 | 基于流形学习的图像分类算法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109284781A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046623A (zh) * | 2019-03-04 | 2019-07-23 | 青岛小鸟看看科技有限公司 | 一种图像特征点提取方法和相机 |
CN110097051A (zh) * | 2019-04-04 | 2019-08-06 | 平安科技(深圳)有限公司 | 图像分类方法、装置及计算机可读存储介质 |
CN110648276A (zh) * | 2019-09-25 | 2020-01-03 | 重庆大学 | 基于流形映射与字典学习的高维图像数据降维方法 |
CN113449812A (zh) * | 2021-07-16 | 2021-09-28 | 上海海洋大学 | 一种基于局部线性嵌入算法的gnss-r海冰检测方法及装置 |
CN113447771A (zh) * | 2021-06-09 | 2021-09-28 | 上海交通大学 | 一种基于sift-lda特征的局部放电模式识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050049985A1 (en) * | 2003-08-28 | 2005-03-03 | Mangasarian Olvi L. | Input feature and kernel selection for support vector machine classification |
CN104318252A (zh) * | 2014-11-02 | 2015-01-28 | 西安电子科技大学 | 基于分层概率模型的高光谱图像分类方法 |
CN105868700A (zh) * | 2016-03-25 | 2016-08-17 | 哈尔滨工业大学深圳研究生院 | 一种基于监控视频的车型识别与跟踪方法及系统 |
-
2018
- 2018-09-10 CN CN201811049534.8A patent/CN109284781A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050049985A1 (en) * | 2003-08-28 | 2005-03-03 | Mangasarian Olvi L. | Input feature and kernel selection for support vector machine classification |
CN104318252A (zh) * | 2014-11-02 | 2015-01-28 | 西安电子科技大学 | 基于分层概率模型的高光谱图像分类方法 |
CN105868700A (zh) * | 2016-03-25 | 2016-08-17 | 哈尔滨工业大学深圳研究生院 | 一种基于监控视频的车型识别与跟踪方法及系统 |
Non-Patent Citations (3)
Title |
---|
李婵娟: "高维数据降维处理关键技术研究", 《中国优秀硕士学位论文全文数据库(电子期刊网)》 * |
李洋: "基于SIFT算法的图像特征点配准技术应用", 《中国优秀硕士学位论文全文数据库(电子期刊网)》 * |
邹艳: "高维数据降维方法的研究", 《中国优秀硕士学位论文全文数据库(电子期刊网)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046623A (zh) * | 2019-03-04 | 2019-07-23 | 青岛小鸟看看科技有限公司 | 一种图像特征点提取方法和相机 |
CN110097051A (zh) * | 2019-04-04 | 2019-08-06 | 平安科技(深圳)有限公司 | 图像分类方法、装置及计算机可读存储介质 |
CN110648276A (zh) * | 2019-09-25 | 2020-01-03 | 重庆大学 | 基于流形映射与字典学习的高维图像数据降维方法 |
CN113447771A (zh) * | 2021-06-09 | 2021-09-28 | 上海交通大学 | 一种基于sift-lda特征的局部放电模式识别方法 |
CN113449812A (zh) * | 2021-07-16 | 2021-09-28 | 上海海洋大学 | 一种基于局部线性嵌入算法的gnss-r海冰检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pashaei et al. | Brain tumor classification via convolutional neural network and extreme learning machines | |
CN109284781A (zh) | 基于流形学习的图像分类算法和系统 | |
WO2017128799A1 (zh) | 基于三维Gabor特征选择的高光谱遥感图像分类方法及系统 | |
Jha et al. | Alzheimer's disease detection using extreme learning machine, complex dual tree wavelet principal coefficients and linear discriminant analysis | |
Islam et al. | Analysis of CT scan images to predict lung cancer stages using image processing techniques | |
Kukar et al. | Modern parameterization and explanation techniques in diagnostic decision support system: A case study in diagnostics of coronary artery disease | |
Zhang et al. | A novel algorithm for breast mass classification in digital mammography based on feature fusion | |
CN110264454A (zh) | 基于多隐藏层条件随机场的宫颈癌组织病理图像诊断方法 | |
Gao et al. | An effective retinal blood vessel segmentation by using automatic random walks based on centerline extraction | |
Sreejini et al. | Retrieval of pathological retina images using Bag of Visual Words and pLSA model | |
Swaraja et al. | Segmentation and detection of brain tumor through optimal selection of integrated features using transfer learning | |
Saif et al. | Exploiting cascaded ensemble of features for the detection of tuberculosis using chest radiographs | |
El‐Dahshan et al. | Computational intelligence techniques for human brain MRI classification | |
Zhu et al. | Matching intensity for image visibility graphs: a new method to extract image features | |
Yang et al. | Classification of human epithelial type 2 cell images using independent component analysis | |
Chandra et al. | Detection of brain tumors from MRI using gaussian RBF kernel based support vector machine | |
Sundararaj et al. | An expert system based on texture features and decision tree classifier for diagnosis of tumor in brain MR images | |
Zhang et al. | Group-wise learning for aurora image classification with multiple representations | |
Suresha et al. | Relieff feature selection based Alzheimer disease classification using hybrid features and support vector machine in magnetic resonance imaging | |
Singh et al. | Detection of Brain Tumors Through the Application of Deep Learning and Machine Learning Models | |
Naeem et al. | A new approach for image detection based on refined Bag of Words algorithm | |
Yancey | Deep Feature Fusion for Mitosis Counting | |
Ramalakshmi et al. | Soft computing-based edge-enhanced dominant peak and discrete Tchebichef extraction for image segmentation and classification using DCML-IC | |
Gong et al. | ConvTransSeg: A Multi-resolution Convolution-Transformer Network for Medical Image Segmentation | |
Beulah et al. | Classification of intervertebral disc on lumbar MR images using SVM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190129 |
|
RJ01 | Rejection of invention patent application after publication |