CN104881682A - 一种基于保局映射与主成分分析的图像分类方法 - Google Patents
一种基于保局映射与主成分分析的图像分类方法 Download PDFInfo
- Publication number
- CN104881682A CN104881682A CN201510274498.5A CN201510274498A CN104881682A CN 104881682 A CN104881682 A CN 104881682A CN 201510274498 A CN201510274498 A CN 201510274498A CN 104881682 A CN104881682 A CN 104881682A
- Authority
- CN
- China
- Prior art keywords
- layer
- image
- mrow
- msup
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000013507 mapping Methods 0.000 title claims abstract description 45
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000012360 testing method Methods 0.000 claims abstract description 27
- 238000012706 support-vector machine Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 81
- 230000009467 reduction Effects 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012847 principal component analysis method Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000012952 Resampling Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 241000287196 Asthenes Species 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
- 238000012795 verification Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于保局映射与主成分分析的图像分类方法,包括以下步骤:1、输入训练对象;2、建立一层或两层的流形学习网络,对于每一种具体的网络,学习得到每一层的滤波器;3、建立流形学习网络的输出层得到最终特征向量;4、将步骤3中最终得到的所有的特征向量输入支持向量机分类器进行训练;5、用校验图像集进行校验,调整到最佳网络参数;6、对测试图像进行测试,统计分类结果,计算识别率。本发明通过构造三种结构相似但不同网络层的网络,应用一种流形方法即保局映射获得图像更加本质的局部结构,使得在各种分类任务中,构造的网络更加具有分辨力,获得更高的图像的分类准确率。
Description
技术领域
本发明涉及数字图像领域,具体涉及一种基于保局映射与主成分分析结合的图像分类方法。
背景技术
对于图像的分类问题,由于图像本身存在的维数高的问题,通常需要对初步提取到的图像特征进行降维处理。在本方法中,主要使用的是两种降维方法:1、保局映射2、主成分分析。保局映射是一种提取能够保持图像空间局部流形结构的性质的降维方法,主成分分析法能够使用较少的矩阵维度保持原始图像最大限度的信息。两者用于深度学习都是属于无监督的降维方法。
1、主成分分析(PCA)
PCA是一种线性降维方法,它通过找出样本空间变化较大的一些正交的坐标方向,可认为就是样本的主成分,然后将样本投影到这些坐标从而降维到一个线性子空间。
假设有N个样本Xi,i=1,2,...,N, 是去均值后的样本列向量。表示去均值后的所有样本的协方差矩阵。
则按照最大化投影后方差的原则,PCA的优化目标是:
max wTSw s.t.wTw=Id (1)
其中w表示投影方向,d表示降维后的样本的维数。
具体算法为:
(a)对样本中每一个维度去均值。即
(b)求样本的协方差矩阵。即
(c)对S作奇异值分解,求得它的特征值与特征向量,选取最大的前d个特征值所对应的特征向量作为新的样本空间的基向量。
2、保局映射(Locality Preserving Projection,LPP)
保局映射的一个直接出发点是用于图像的降维,直接考虑了图像流形结构,也就是说通过构造一个图像的近邻图作为图像的流形结构,这个流形结构能够保持图像中的局部特征。
这里假设原始的样本向量为X=[x1,x2,...,xn],降维后的向量为Y=[y1,y2,...,yn],LPP的目标函数是:
其中yi是xi的低维表示,而Sij是一个相似性矩阵,其中的矩阵元素可以看做是流形结构中节点xi和节点xj的之间的权值。它的定义如下:
这里ε>0足够小,它决定了流形结构中的的局部性质,在实际应用中我们人为的选用的是KNN的构造方法,使得每个图像空间中的点都有K个邻居点。
进一步地,(2)式的优化问题经过等价的代数推导可变为:
其中Dii=∑jSji,是一个对角矩阵;L=D-S被成为拉普拉斯矩阵,w是投影向量。通过求解如下广义特征值问题,可以得到w向量:
XLXTw=λXDXTw (5)
这里,我们选取的特征向量是前k个最小的特征值对应的特征向量作为整个投影矩阵WLPP。
这里要注意的是矩阵XDXT可能是奇异的,这是由于训练的样本数小于图像的维数导致的,为了避免这个问题,我们确保训练的样本数大于等于图像维数。事实上,在我们这个深度学习的框架中,我们输入到LPP算法中的是一个方阵(协方差矩阵)。
发明内容
为了克服现有技术中存在的不足,利用深度学习与流形学习在图像分类中的优势,提高图像分类识别的准确率与鲁棒性,本发明提出了一种基于保局映射与主成分分析的图像分类方法。
为实现上述目的,本发明采用的技术方案为:
一种基于保局映射与主成分分析的图像分类方法,包括以下步骤:
步骤1:对N幅大小均为m×n像素的输入图像进行预处理,得到输入图像特征矩阵X,其中N、m、n为正整数,i=1,2...,N;
步骤2:建立一层或两层的流形学习网络,得到每一层网络中训练图像卷积所用的滤波器,其中第一层的滤波器V1用保局映射降维方法构造,如果有第二层网络,第二层的滤波器V2可选用主成分分析法或者继续选用保局映射降维方法构造,将输入图像与第一层的滤波器V1进行卷积,得到第一层输出图像其中Vl 1表示第一层中的第l个滤波器,L1表示第一层的滤波器的个数;如果有第二层网络,再将第一层输出图像与第二层的滤波器V2进行卷积,得到第二层输出图像其中Vi 2表示第二层中的第l个滤波器,L2表示第二层的滤波器的个数;得到的最终输出图像为最后一层网络的输出图像;
步骤3:建立流形学习网络的输出层;即将步骤2得到的最终输出图像进行二值化操作,并对二值化后的图像分块并统计每一块图像上的直方图,将此直方图作为特征向量fi,i=1,2...,N;
步骤4:将步骤4中最终得到的所有的特征向量fi输入支持向量机分类器进行训练;
步骤5:用校验图像集进行校验,调整到最佳网络参数;
步骤6:对测试图像进行测试,统计分类结果,计算识别率。
进一步地,步骤1中所述的预处理操作具体为:
对于每一幅输入图像使用大小为k1×k2像素的滑块遍历其每个像素,每个像素所在的滑块区域重新排列成一个列向量,其中k1,k2均为奇数,这样每一幅图像都能得到一个行数为k1k2,列数为m′n′的重采样矩阵,其中代表大小为k1×k2像素的滑块以行间隔为b1进行取样所能得到的行数,代表大小为k1×k2像素的滑块以列间隔为b2进行取样所能得到的列数,b1,b2分别表示的是滑块每次滑动的行间隔和列间隔,默认设置都为1;此采样矩阵记为
然后对采样矩阵的每个元素都减去其行均值,得到去均值化重采样矩阵其中
将N幅输入图像所得到的去均值化采样矩阵放置在一起得到输入图像特征矩阵
进一步地,步骤2所述的中使用保局映射降维方法得到第一层的滤波器V1的操作具体为:
首先,求出输入图像特征矩阵X的协方差矩阵
其次,根据保局映射的算法求出保局映射中协方差矩阵C的投影向量矩阵L1表示第一层中滤波器的个数;
再次将中的第l个列向量重新排列成一个k1×k2的矩阵作为第一层第l个滤波器Vl 1;第一层的滤波器
进一步地,采用两层的流形学习网络,所述步骤2中第二层选用主成分分析法构造第二层滤波器V2,其具体操作为:
首先,对于每一幅第一层输出图像再进行步骤1所述的相同的预处理步骤,得到第二层输入特征矩阵其中 而表示第i幅输入图像经过第l个第一层滤波器卷积后再进行滑块预处理后的输入特征矩阵;表示在经过第l个滤波器滤波后的第i幅输入图像中第j列去均值化后的列向量;
然后,求出第二层输入特征矩阵Y的协方差矩阵C',并对其进行主成分分析,求出L2个主特征向量,将这些主特征向量分别重新排列成L2个k1×k2的小矩阵,得到第二层的滤波器V2。
进一步地,采用两层的流形学习网络,所述步骤2中第二层继续选用保局映射降维法构造第二层滤波器,则以第一层的输出图像作为第二层的输入图像重复步骤1与步骤2中的具体操作,得到第二层的滤波器V2。
进一步地,步骤3中所述的二值化具体操作为:对于每一幅输入图像经过两层网络后,都会产生出L1L2幅最终输出图像,每一幅最终输出图像的尺寸都是m×n;特别地,对于第一层输出的图像第二层网络就会有L2幅输出图像l=1,2,…,L2,将图像进行二值化操作,即该像素点灰度值若大于零则重置为1,否则重置为0;之后将这L2幅图像对应像素点的值加权求和,合并为一张图像,即其中函数H(·)表示二值化函数,表示将输入矩阵的元素大于零的值重置为1,否则的话置为0;这样对于每一幅输入图像Ii,就对应了L1幅输出图像,一共就有NL1幅输出图像。
进一步地,步骤3中所述的得到特征向量fi具体操作为:将每一幅Ti l分成B块,B为正整数,每一块大小为HistBlockSize,块与块之间可以有重叠,重叠率为OverlapRatio,OverlapRatio的值大于等于0小于1,分别统计这B块的直方图,并将其连接成一个向量,记为Bhist(Ti l),则由输入图像的最终的得到的训练分类用的特征向量可以表示为
进一步地,所述步骤4具体操作为:将所有N幅训练图像的特征向量fi连接成一个特征向量矩阵,记为将此特征向量矩阵加上原始图像类别标记共同输入到支持向量机分类器中进行训练。
进一步地,所述步骤5中调整到最佳网络参数的方法为:对于一个较大的数据集,分割成三部分,一部分数据集为训练集,一部分为校验集,另一部分为测试集,当采用训练集得到所构造的网络的滤波器后,再采用校验集进行参数的调优,获得最佳网络参数。
进一步地,步骤6具体操作为:采用经过调优后的网络参数,输入测试集及其标签信息,统计出识别率。
本发明的基于保局映射与主成分分析的图像分类方法具有以下有益效果:
(1)本方法通过在第一层使用流形学习的方式,将重采样得到的数据映射到一个较低维的子空间中进行分析,这个子空间并不是传统的欧式空间而是保持了图像本征的流形结构的子空间。
(2)本方法构造了一个两层的或者仅使用流形方法的一层网络,利用深度学习的优势,自动学习图像的有着更多语义更加抽象的高维特征,充分利用了原始图像的信息。
(3)本方法构造的网络对于光照、遮盖、形变都具有相当的鲁棒性,尤其是对于各种情况下的人脸的识别特别有效。
附图说明
图1为本发明基于保局映射与主成分分析(两层)的图像分类方法示意图;
图2为本发明中仅有一层保局映射层网络的图像分类方法示意图;
图3为本发明中基于保局映射与主成分分析的图像分类方法总体流程示意图;
图4为本发明中训练滤波器与分类器的流程图;
图5为4种子类型的AR数据集人脸示例图;
图6为一幅人脸图像通过一层LPP网络和一层PCA网络后的效果图。
具体实施方式
下面对本发明技术方案结合附图和实施例进行详细说明。
本发明中基于保局映射与主成分分析的图像分类方法通过在两层或一层的网络中训练图像卷积所用的滤波器来提取图像最终的特征向量,其中第一层使用保局映射降维方法得到滤波器向量;第二层网络为可选层,也就是,可以构建具有两层的网络而第二层可以继续选用保局映射降维方法构造滤波器,或者使用主成分分析法构造第二层的滤波器,如图3所示,可以看出整体流程主要包含两个阶段:训练阶段和校验测试阶段。
(1)训练阶段:
此阶段包含步骤1-4,具体如下:
步骤1:输入N幅图像,每一幅图像的尺寸为m×n。首先进行图像的预处理,即使用一个k1×k2的滑块对原图像重采样,之后去均值化得到初步的输入图像特征矩阵X。
对于每一幅图像i=1,2...,N,使用大小为k1×k2的滑块遍历每一个像素,每个像素所在的滑块区域重新排列成一个列向量,其中k1,k2均为奇数,这样每一幅图像都能得到一个k1k2行,列的矩阵,其中b1,b2分别表示的是滑块每次滑动的行间隔和列间隔,默认设置都为1。这个矩阵记为:
然后对这个矩阵的每个元素都减去其行均值,得到:
其中
这样对所有的N幅图像都进行这样一种过程建立类似的矩阵,并将其放置在一起得到所有输入图像特征矩阵:
步骤2:建立流形学习网络的的第一层,LPP层。根据输入特征矩阵X,求出协方差矩阵,再根据保局映射的算法,对此协方差矩阵进行投影得到特征投影矩阵从而构成第一层LPP层的滤波器V1,将此滤波器与每一幅输入图像进行卷积得到第一层的输出图像。
具体操作如下:
首先求出所有输入图像特征矩阵的协方差矩阵C:
其次,根据保局映射的算法求出保局映射中的投影向量矩阵
其中,L1表示第一层中的滤波器个数。
再次将中的第l个列向量重新排列成一个k1×k2的矩阵作为第一层第l个滤波器。可以用如下式子表示为:
其中,ql(·)表示取第l个列向量。最后将原始输入的图像与每一个滤波器进行卷积注意卷积前要进行要对零填充以保证卷积完后与输入图像的尺寸相同),得到第一阶段的输出,即:
然后建立流形学习网络的第二层(可选),主成分分析层(PCA层)或LPP层。
(1)若第二层选用主成分分析,则把第一层训练输出的图像再次进行预处理,得到新的输入图像特征矩阵Y,对Y计算出协方差矩阵,再进行主成分分析得到若干主特征向量,构成第二层的滤波器V2,将这些滤波器与第一层的输出图像再次进行卷积得到第二层的输出图像。
其具体操作如下:
对于第一层输出的每一幅图像再进行与权利要求2中所述的相同的预处理步骤,得到第二层的初步的输入特征矩阵Y:
令表示第i幅原始输入图像经过第l个第一层滤波器卷积后再进行滑块预处理后的输入特征矩阵。其中,表示在经过第l个滤波器滤波后的第i幅图像中第j列去均值化后的列向量。于是,可以这样表示Y:
接下来,求出第二层输入特征矩阵的协方差矩阵C',并对其进行主成分分析,求出L2个主特征向量,将这些主特征向量再进行与权利要求3中所述(6)式的类似步骤,即重新排列成L2个k1×k2的小矩阵,于是得到第二层网络的滤波器V2。
再将第一层中得到的输出图像与V2进行卷积(注意卷积前要进行要对零填充以保证卷积完后与输入图像的尺寸相同),即:
这里L2是第二层设置的滤波器个数。
(2)若第二层选用的是LPP层,则把第一层训练输出的图像再次进行预处理,得到新的输入特征矩阵Y,再进行与步骤2同样的步骤,得到第二层的特征投影矩阵从而构成第二层的滤波器V2,将这些滤波器与第一层的输出图像再次进行卷积得到第二层的输出图像。
步骤3:建立流形学习网络的输出层。也就是,将第二层中的所有输出图像二值化,并对二值化后的图像分块并统计每一块上的直方图,将此直方图作为特征向量。其具体操作如下:
对于每一幅原始图像经过两层网络后,都会产生出L1L2幅输出图像,每一幅图像的尺寸都是m×n。特别地,对于第一层输出的图像第二层网络就会有L2幅输出图像l=1,2,…,L2,将图像进行二值化操作,即该像素点灰度值若大于零则重置为1,否则重置为0。之后将这L2幅图像对应像素点的值加权求和,合并为一张图像,即:
其中H(·)表示二值化函数,表示将输入矩阵的元素大于零的值重置为1,否则的话置为0。这样对于每一幅原始图像Ii,就对应了L1幅输出图像,一共就有NL1幅输出图像。
接下来,将每一幅Ti l分成B块,每一块大小为HistBlockSize,块与块之间可以有重叠,重叠率为OverlapRatio(0≤OverlapRatio<1),分别统计这B块的直方图,并将其连接成一个向量,记为Bhist(Ti l),则的最终的得到的训练分类用的特征向量可以表示为:
步骤4:将步骤3中得到的最终的所有图像的特征向量输入支持向量机分类器进行训练。具体为:将所有N幅训练图像的f特征连接成一个矩阵,即:
将此特征向量矩阵加上原始图像类别标记共同输入到支持向量机分类器中进行训练。
如图4所示流程图,经过步骤1-4,得到关键的两个滤波器和V2={Vl 2,l=1,2,...,L2}以及一个分类器。
(2)校验测试阶段(包含以上步骤5-6):
此阶段包含步骤5-6,具体操作如下:
步骤5:对于一个较大的数据集,分割成三部分,一部分数据集为训练集,一部分为校验集,另一部分为测试集,当采用训练集得到所构造的网络的滤波器后,再采用校验集进行参数的调优,获得最佳网络参数。
:步骤6为:采用经过调优后的网络参数,输入测试集及其标签信息,统计出识别率。
考虑到本方法的第一层必须选用保局映射来构造滤波器,因此先在仅有一层LPP的网络中进行参数的调优,首先是决定滑块尺寸Patchsize的尺寸,Patchsize的尺寸要求为奇数,图像的大小也对最优Patchsize的尺寸有着影响,对于AR数据集,先固定其他参数,我们分别测试了如下尺寸:
5×5,7×7,9×9,11×11,13×13,15×15,17×17
在得到最优的Patchsize后,我们就把整个网络的第一层的滑块固定为此尺寸,接着我们仍对仅有LPP层的网络进行测试,调整分块统计直方图时的最佳分块大小Patchsize,我们对相当于原始图像尺寸的1/2,1/4,1/8,1/16,进行测试,并做了适当微调。
这样,经过以上两个阶段,能够进行图像分类识别的网络就已经构造完毕。两层网络的识别过程如下:如图1所示,正方形方块表示一幅图像,若要进行任意一张图像的识别,则首先在LPP层中将与Vl 1,l=1,2,...,L1进行卷积操作,注意卷积前须对Ii图像的四周进行零填充以保证卷积后的图像尺寸与原图保持一致;这样得到进入第二层,第二层的滤波器可以选用LPP滤波器或者PCA滤波器,经过Vl 2,l=1,2,...,L2的卷积后,每一幅j=1,2,...,L1都能得到L2幅输出图像,记为k=1,2,...,L2,这样最原始的一幅Ii经过两层滤波后,变为L1L2幅图像;接着进入输出层,即将每L2幅图像二值化为像素点的值只有0和1的图像,加权求和(权值为)后成为Ti l,l=1,2,...,L1,此后需要对这L1幅图像进行分块,如图中虚线所示,实际情况中块与块之间可以有重叠,重叠率为OverlapRatio(0≤OverlapRatio<1),最后在每一块中进行直方图统计,得到直方图向量(如图中的小圆圈所示),需要将所有向量排成一个列向量,得到最终的特征向量fi。在分类器训练阶段,只要将此向量输入支持向量机分类器即可输出预测的图像类别。
对于只有一层的图像分类网络的识别过程,如图2所示:
相比于图1,第二层省略了,直接对第一层得到的进行加权求和(权值为),之后同样进行分块直方图统计的过程。
实施例:下面以AR数据集为例来详细说明本发明的步骤。
实验条件:现选取一台计算机进行图像分类,该计算机的配置有Intel(R)处理器(3.2GHz)和20GB随机存取存储器(RAM),64位操作系统,编程语言用的是Matlab(R2014b版本)。
实验对象:AR数据集是一个人脸数据集,包含了不同光照、表情以及遮挡条件下的人脸图像,它一共含有126种人脸,包含男性70名,女性56名,共2600幅图像,每一幅图像的尺寸为120×165,高165。现选取50名男性与50名女性,每人2幅图像用于训练,即一共200幅图像用于训练,在表情、光照、戴眼镜,带围巾遮住脸这四种情况下每种情况都选取600幅图像进行测试,并且在测试集中又选取300幅图像进行参数校验调优。
本发明一共提出了3种构造网络的方法,现仅以第一层设置为LPP层,第二层设置为PCA层为例进行说明,其余两种类似。
实验步骤:
步骤1:提取所需的训练图像数据以及测试用图像数据矩阵,训练矩阵为标签为不同表情图像数据矩阵为标签为不同光照人脸图像的数据矩阵为标签为戴眼镜的人脸图像数据矩阵为标签为带围巾的人脸数据图像矩阵为标签为然后将训练数据保存到一个165×120×200的一个元胞中,暂时Patchsize的尺寸设置为7×7,用这小滑块遍历元胞内所有的图像,得到初步的特征矩阵再减去行均值得到
步骤2:
(a)求得的协方差矩阵
(b)设置两层滤波器个数都是8,调用LPP降维算法,使用KNN构造流形结构,K(也就是周围点的个数)设置为12,t值设置为2,按照LPP算法,为了求解投影矩阵对XLXT w=λXDXT w进行奇异值分解,这样将协方差矩阵C的维数降为了8,同时也能得到第一层LPP层的8个滤波器Vl 1,l=1,2,...,8,滤波器的尺寸与滑块的尺寸Patchsize一样,都是7×7。
(c)将原始输入图像IIn与该滤波器卷积,每一幅图像都可以得到8幅图像,这样一共能得到1600幅图像,卷积后的结果i=1,2,...,200,l=1,2,...,8保存在一个165×120×1600的元胞中。
(d)将上一步得到的输出图像i=1,2,...,200,l=1,2,...,8作为第二层的输入,同样的用相同大小的滑块遍历所有图像,得到去均值之后的特征矩阵
(e)求得的协方差矩阵
(f)根据主成分分析,求出C'的前8个最大的特征值对应的特征向量作为第二层的滤波器Vl 2,l=1,2,...,8,同样的,滤波器的大小为7×7。
(g)将步骤2中所得到的图像i=1,2,...,200,l=1,2,...,8与此滤波器卷积,卷积后将会得到12800幅图像,
步骤3:
将最终输出的图像 作二值化处理并且每8幅图像加权求和,最后分块统计直方图向量,这里HistBlockSize暂时设置为[86],重叠率设置为0.5,这样就能得到最终的特征向量的稀疏表示。
步骤4:
将得到的训练数据的最终特征向量以及代入支持向量机分类器,得到支持向量机模型的参数。
步骤5:
根据经验,PCA层7×7的Patchsize和8×6的HistBlockSize比较合适。因此我们这里仅校验一层LPP情况下的最优参数。将以上测试数据集例如降采样得到300个校验数据集,用于调整参数Patchsize与HistBlockSize。用于校验的数据集只需要提取到最终的特征矩阵。正如图1所示的过程,只需要和两个滤波器层层卷积得到最终的F向量即可。我们测试比较如下几对值:
Patchsize:5×5,7×7,9×9,11×11,13×13,15×15,17×17
HistBlockSize:1/2,1/4,1/8,1/16,以及适当的微调。
在此例中,对于这个Expressionfea校验集,可以得到最优的Patchsize在LPP层时是13×13,HistBlockSize取为原图像的1/8比较合适,也就是[2015]可以达到最优识别率。全部的校验数据集的参数测试结果如表1和表2所示,可以对照此表选择网络的参数进行测试集的测试。
表1 不同情况下小滑块(滤波器尺寸)的选择
表2 不同情况下分块尺寸的选择
步骤6:
测试所有情况下的人脸的识别率,采用校验集验证得到的最优参数,每一小类测试集都是600个样例。
测试结果如下表3所示:
表3 AR数据集3种分类方法的测试结果
从表3的结果可以看到,提出的基于保局映射与主成分分析的图像分类方法在进行人脸的识别时非常有效,对于不同情况下如不同表情的人脸,不同光照条件下的人脸以及有遮挡的人脸的识别率都很高而且具有鲁棒性,因此也证明了本方法的有效性。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于保局映射与主成分分析的图像分类方法,其特征在于:包括以下步骤
步骤1:对N幅大小均为m×n像素的输入图像进行预处理,得到输入图像特征矩阵X,其中N、m、n为正整数,i=1,2...,N;
步骤2:建立一层或两层的流形学习网络,得到每一层网络中训练图像卷积所用的滤波器,其中第一层的滤波器V1用保局映射降维方法构造,如果有第二层网络,第二层的滤波器V2可选用主成分分析法或者继续选用保局映射降维方法构造,将输入图像与第一层的滤波器V1进行卷积,得到第一层输出图像其中Vl 1表示第一层中的第l个滤波器,L1表示第一层的滤波器的个数;如果有第二层网络,再将第一层输出图像与第二层的滤波器V2进行卷积,得到第二层输出图像其中Vi 2表示第二层中的第l个滤波器,L2表示第二层的滤波器的个数;得到的最终输出图像为最后一层网络的输出图像;
步骤3:建立流形学习网络的输出层;即将步骤2得到的最终输出图像进行二值化操作,并对二值化后的图像分块并统计每一块图像上的直方图,将此直方图作为特征向量fi,i=1,2...,N;
步骤4:将步骤4中最终得到的所有的特征向量fi输入支持向量机分类器进行训练;
步骤5:用校验图像集进行校验,调整到最佳网络参数;
步骤6:对测试图像进行测试,统计分类结果,计算识别率。
2.根据权利要求1所述的基于保局映射与主成分分析的图像分类方法,其特征在于,步骤1中所述的预处理操作具体为:
对于每一幅输入图像使用大小为k1×k2像素的滑块遍历其每个像素,每个像素所在的滑块区域重新排列成一个列向量,其中k1,k2均为奇数,这样每一幅图像都能得到一个行数为k1k2,列数为m′n′的重采样矩阵,其中代表大小为k1×k2像素的滑块以行间隔为b1进行取样所能得到的行数,代表大小为k1×k2像素的滑块以列间隔为b2进行取样所能得到的列数,b1,b2分别表示的是滑块每次滑动的行间隔和列间隔,默认设置都为1;此采样矩阵记为
然后对采样矩阵的每个元素都减去其行均值,得到去均值化重采样矩阵其中
将N幅输入图像所得到的去均值化采样矩阵放置在一起得到输入图像特征矩阵
3.根据权利要求2所述的基于保局映射与主成分分析的图像分类方法,其特征在于,步骤2所述的中使用保局映射降维方法得到第一层的滤波器V1的操作具体为:
首先,求出输入图像特征矩阵X的协方差矩阵
其次,根据保局映射的算法求出保局映射中协方差矩阵C的投影向量矩阵L1表示第一层中滤波器的个数;
再次将中的第l个列向量重新排列成一个k1×k2的矩阵作为第一层第l个滤波器Vl 1;第一层的滤波器
4.根据权利要求3所述的基于保局映射与主成分分析的图像分类方法,其特征在于:采用两层的流形学习网络,所述步骤2中第二层选用主成分分析法构造第二层滤波器V2,其具体操作为:
首先,对于每一幅第一层输出图像再进行步骤1所述的相同的预处理步骤,得到第二层输入特征矩阵其中 而L1表示第i幅输入图像经过第l个第一层滤波器卷积后再进行滑块预处理后的输入特征矩阵;表示在经过第l个滤波器滤波后的第i幅输入图像中第j列去均值化后的列向量;
然后,求出第二层输入特征矩阵Y的协方差矩阵C',并对其进行主成分分析,求出L2个主特征向量,将这些主特征向量分别重新排列成L2个k1×k2的小矩阵,得到第二层的滤波器V2。
5.根据权利要求3所述的基于保局映射与主成分分析的图像分类方法,其特征在于:采用两层的流形学习网络,所述步骤2中第二层继续选用保局映射降维法构造第二层滤波器,则以第一层的输出图像作为第二层的输入图像重复步骤1与步骤2中的具体操作,得到第二层的滤波器V2。
6.根据权利要求4或5所述的基于保局映射与主成分分析的图像分类方法,其特征在于,步骤3中所述的二值化具体操作为:对于每一幅输入图像经过两层网络后,都会产生出L1L2幅最终输出图像,每一幅最终输出图像的尺寸都是m×n;特别地,对于第一层输出的图像第二层网络就会有L2幅输出图像将图像进行二值化操作,即该像素点灰度值若大于零则重置为1,否则重置为0;之后将这L2幅图像对应像素点的值加权求和,合并为一张图像,即其中函数H(·)表示二值化函数,表示将输入矩阵的元素大于零的值重置为1,否则的话置为0;这样对于每一幅输入图像Ii,就对应了L1幅输出图像,一共就有NL1幅输出图像。
7.根据权利要求6所述的基于保局映射与主成分分析的图像分类方法,其特征在于,步骤3中所述的得到特征向量fi具体操作为:将每一幅Ti l分成B块,B为正整数,每一块大小为HistBlockSize,块与块之间可以有重叠,重叠率为OverlapRatio,OverlapRatio的值大于等于0小于1,分别统计这B块的直方图,并将其连接成一个向量,记为则由输入图像的最终的得到的训练分类用的特征向量可以表示为
8.根据权利要求1或7所述的基于保局映射与主成分分析的图像分类方法,其特征在于,所述步骤4具体操作为:将所有N幅训练图像的特征向量fi连接成一个特征向量矩阵,记为将此特征向量矩阵加上原始图像类别标记共同输入到支持向量机分类器中进行训练。
9.根据权利要求1所述的基于保局映射与主成分分析的图像分类方法,其特征在于:所述步骤5中调整到最佳网络参数的方法为:对于一个较大的数据集,分割成三部分,一部分数据集为训练集,一部分为校验集,另一部分为测试集,当采用训练集得到所构造的网络的滤波器后,再采用校验集进行参数的调优,获得最佳网络参数。
10.根据权利要求1所述的基于保局映射与主成分分析的图像分类方法,其特征在于,步骤6具体操作为:采用经过调优后的网络参数,输入测试集及其标签信息,统计出识别率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510274498.5A CN104881682B (zh) | 2015-05-26 | 2015-05-26 | 一种基于保局映射与主成分分析的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510274498.5A CN104881682B (zh) | 2015-05-26 | 2015-05-26 | 一种基于保局映射与主成分分析的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104881682A true CN104881682A (zh) | 2015-09-02 |
CN104881682B CN104881682B (zh) | 2019-03-05 |
Family
ID=53949169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510274498.5A Active CN104881682B (zh) | 2015-05-26 | 2015-05-26 | 一种基于保局映射与主成分分析的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104881682B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654130A (zh) * | 2015-12-30 | 2016-06-08 | 成都数联铭品科技有限公司 | 一种基于递归神经网络的复杂图像文字序列识别系统 |
CN105678300A (zh) * | 2015-12-30 | 2016-06-15 | 成都数联铭品科技有限公司 | 一种复杂图像文字序列识别方法 |
CN111222559A (zh) * | 2019-12-31 | 2020-06-02 | 深圳大学 | 对小样本图像进行分类的主成分分析网络的训练方法 |
CN111401434A (zh) * | 2020-03-12 | 2020-07-10 | 西北工业大学 | 一种基于无监督特征学习的图像分类方法 |
CN111699494A (zh) * | 2017-11-27 | 2020-09-22 | 埃因霍温科技大学 | 使用通过主成分分析和重复频谱聚类进行训练的卷积神经网络的对象识别 |
CN111708830A (zh) * | 2020-07-12 | 2020-09-25 | 国网山西省电力公司电力科学研究院 | 一种基于图像处理的光伏电站光伏板污染物智能检测辅助系统及方法 |
CN111863204A (zh) * | 2020-07-22 | 2020-10-30 | 北京青燕祥云科技有限公司 | 基于钼靶x线摄影检查的乳腺疾病ai辅助诊断方法及系统 |
CN114419383A (zh) * | 2022-01-21 | 2022-04-29 | 北部湾大学 | 一种基于主成分分析的图像光照校正算法 |
CN115243055A (zh) * | 2022-06-13 | 2022-10-25 | 中银金融科技有限公司 | 一种图像压缩方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8218880B2 (en) * | 2008-05-29 | 2012-07-10 | Microsoft Corporation | Linear laplacian discrimination for feature extraction |
CN102737237A (zh) * | 2012-07-18 | 2012-10-17 | 山东师范大学 | 基于局部关联保持的人脸图像降维方法 |
CN102915435A (zh) * | 2012-10-23 | 2013-02-06 | 哈尔滨工程大学 | 一种基于人脸能量图的多姿态人脸识别方法 |
CN103390154A (zh) * | 2013-07-31 | 2013-11-13 | 中国人民解放军国防科学技术大学 | 基于进化多特征提取的人脸识别方法 |
CN103942564A (zh) * | 2014-04-08 | 2014-07-23 | 武汉大学 | 基于非监督特征学习的高分辨率遥感影像场景分类方法 |
US8873813B2 (en) * | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
CN104573729A (zh) * | 2015-01-23 | 2015-04-29 | 东南大学 | 一种基于核主成分分析网络的图像分类方法 |
-
2015
- 2015-05-26 CN CN201510274498.5A patent/CN104881682B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8218880B2 (en) * | 2008-05-29 | 2012-07-10 | Microsoft Corporation | Linear laplacian discrimination for feature extraction |
CN102737237A (zh) * | 2012-07-18 | 2012-10-17 | 山东师范大学 | 基于局部关联保持的人脸图像降维方法 |
US8873813B2 (en) * | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
CN102915435A (zh) * | 2012-10-23 | 2013-02-06 | 哈尔滨工程大学 | 一种基于人脸能量图的多姿态人脸识别方法 |
CN103390154A (zh) * | 2013-07-31 | 2013-11-13 | 中国人民解放军国防科学技术大学 | 基于进化多特征提取的人脸识别方法 |
CN103942564A (zh) * | 2014-04-08 | 2014-07-23 | 武汉大学 | 基于非监督特征学习的高分辨率遥感影像场景分类方法 |
CN104573729A (zh) * | 2015-01-23 | 2015-04-29 | 东南大学 | 一种基于核主成分分析网络的图像分类方法 |
Non-Patent Citations (2)
Title |
---|
CHUANLIANG CHEN等: "Combining LPP with PCA for Microarray Data Clustering", 《2008 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION(CEC 2008)》 * |
张敏情 等: ""基于局部保持映射的图像隐密检测算法"", 《计算机工程与应用》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654130A (zh) * | 2015-12-30 | 2016-06-08 | 成都数联铭品科技有限公司 | 一种基于递归神经网络的复杂图像文字序列识别系统 |
CN105678300A (zh) * | 2015-12-30 | 2016-06-15 | 成都数联铭品科技有限公司 | 一种复杂图像文字序列识别方法 |
CN111699494A (zh) * | 2017-11-27 | 2020-09-22 | 埃因霍温科技大学 | 使用通过主成分分析和重复频谱聚类进行训练的卷积神经网络的对象识别 |
CN111222559A (zh) * | 2019-12-31 | 2020-06-02 | 深圳大学 | 对小样本图像进行分类的主成分分析网络的训练方法 |
CN111222559B (zh) * | 2019-12-31 | 2023-03-31 | 深圳大学 | 对小样本图像进行分类的主成分分析网络的训练方法 |
CN111401434A (zh) * | 2020-03-12 | 2020-07-10 | 西北工业大学 | 一种基于无监督特征学习的图像分类方法 |
CN111401434B (zh) * | 2020-03-12 | 2024-03-08 | 西北工业大学 | 一种基于无监督特征学习的图像分类方法 |
CN111708830A (zh) * | 2020-07-12 | 2020-09-25 | 国网山西省电力公司电力科学研究院 | 一种基于图像处理的光伏电站光伏板污染物智能检测辅助系统及方法 |
CN111863204A (zh) * | 2020-07-22 | 2020-10-30 | 北京青燕祥云科技有限公司 | 基于钼靶x线摄影检查的乳腺疾病ai辅助诊断方法及系统 |
CN114419383A (zh) * | 2022-01-21 | 2022-04-29 | 北部湾大学 | 一种基于主成分分析的图像光照校正算法 |
CN115243055A (zh) * | 2022-06-13 | 2022-10-25 | 中银金融科技有限公司 | 一种图像压缩方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104881682B (zh) | 2019-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104881682B (zh) | 一种基于保局映射与主成分分析的图像分类方法 | |
US11403838B2 (en) | Image processing method, apparatus, equipment, and storage medium to obtain target image features | |
US11354577B2 (en) | System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions | |
Wang et al. | Understanding convolution for semantic segmentation | |
US11256960B2 (en) | Panoptic segmentation | |
US10713563B2 (en) | Object recognition using a convolutional neural network trained by principal component analysis and repeated spectral clustering | |
Lin et al. | Spectral-spatial classification of hyperspectral image using autoencoders | |
EP3921776B1 (en) | Method and system for classification and visualisation of 3d images | |
US9400919B2 (en) | Learning deep face representation | |
US20220122250A1 (en) | Brain feature prediction using geometric deep learning on graph representations of medical image data | |
EP3427195B1 (en) | Convolutional neural networks, particularly for image analysis | |
US9405960B2 (en) | Face hallucination using convolutional neural networks | |
US20210312591A1 (en) | Systems and method of training networks for real-world super resolution with unknown degradations | |
CN110110596B (zh) | 高光谱图像特征提取、分类模型构建及分类方法 | |
Ren et al. | CT-SRCNN: cascade trained and trimmed deep convolutional neural networks for image super resolution | |
Abdelmaguid et al. | Left ventricle segmentation and volume estimation on cardiac mri using deep learning | |
CN111460966B (zh) | 基于度量学习和近邻增强的高光谱遥感图像分类方法 | |
Pichel et al. | A new approach for sparse matrix classification based on deep learning techniques | |
CN114795178B (zh) | 一种基于多注意力神经网络的大脑状态解码方法 | |
CN115035074A (zh) | 基于全局空间感知网络的宫颈上皮组织病理图像识别方法 | |
DE102022105808A1 (de) | Effiziente quantisierung für eine bereitstellung und ausführung von neuronalen netzen | |
CN117689547A (zh) | 一种基于多阶段增强框架的渐进式人脸超分辨率计算方法 | |
CN116778339A (zh) | 局部视图辅助判别高光谱波段选择方法及系统 | |
CN114821205B (zh) | 一种基于多维特征的图像处理方法、装置及设备 | |
CN114862685A (zh) | 一种图像降噪方法、及图像降噪模组 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |