CN104573727A - 一种手写体数字图像降维方法 - Google Patents
一种手写体数字图像降维方法 Download PDFInfo
- Publication number
- CN104573727A CN104573727A CN201510024751.1A CN201510024751A CN104573727A CN 104573727 A CN104573727 A CN 104573727A CN 201510024751 A CN201510024751 A CN 201510024751A CN 104573727 A CN104573727 A CN 104573727A
- Authority
- CN
- China
- Prior art keywords
- sample
- digital image
- matrix
- test
- neighbour
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明提出了一种手写体数字图像降维的方法,方法考虑了近邻之间的关系,并保持了数据的流形结构。首先,通过构建一个近邻矩阵,使近邻互相靠近,然后构造一个类似PCA的泛化协方差矩阵,通过求解协方差的特征问题,生成子空间转换矩阵。常规的降维方法中,我们不知道保持数据的全局结构好还是局部结构好,或者如何平衡这两者,不同于常规的,本发明能够在同一个模型中保持这两种结构。本发明通过使近邻在低维中尽可能靠近,因为相互靠近的样本有很大的可能性属于同一类,所以能提高分类或聚类准确度。并通过实验证明了本发明的有效性。
Description
技术领域
本发明涉及模式识别领域,更具体地说,涉及一种手写体数字图像降维方法。
背景技术
随着计算机技术和图像处理技术的飞速发展,手写体数字识别由于其广泛的应用,得到众多研究者的关注,成为现代模式识别技术研究中的一个重要方面。
然而,手写体数据图像是高维数据,如果直接对其进行识别,往往花费时间较长,计算复杂度高,甚至识别效果较差,因此,常常对图像数据进行降维后,再进行识别。目前主要采用的降维方法包括PCA(主成分分析)、LDA(线性判别分析)、MDS(多维尺度分析)等。PCA是一种线性的非监督降维方法,因其简单有效而被广泛应用。它保持数据的方差最大,降维结果是原始特征的线性组合。但是,它对噪声很敏感,并依赖于欧氏距离,对于复杂的非线性数据也不能很好地处理。LDA作为一种有监督的降维方法,利用了标记信息,通过选择一个投影向量使同类的点经投影后尽可能靠近,不同类的点经投影后尽可能分散,使降维后的结果有助于后续的分类工作。但是,LDA和PCA存在相同的缺点,就是它们都不能保持数据的流形结构。
在保持数据的流形结构方面,已经出现了不少研究成果。MDS的思想是在尽可能保持数据对之间的距离不变的前提下,将高维空间中的数据映射到低维空间中去。由于成对样本在低维空间中的距离与它们在高维空间中的相似性之间最大限度地保持一致,它被广泛应用于图像与文本分析。Isomap采用微分几何中的测地线距离代替欧氏距离计算空间中数据点之间的距离,并且找到了一种用实际输入数据估计其测地线距离的算法,但是它是拓扑不稳定的。MDS和Isomap都是旨在保持数据降维后的全局结构性质不变。
与之不同的另一类方法则旨在保持数据的局部结构,比如近邻关系,其中的代表就是LLE(局部线性嵌入)和LE(拉普拉斯特征映射)。它们假设每一个样本都可以由其近邻线性重构,并且数据样本在低维空间中的代表可以由数据样本的原近邻在低维空间中的代表以相同的系数线性重构。LLE首先通过一个优化问题学习所有样本的重构权重,然后通过最小化重构损失函数获取低维表示。但是LLE只能对已知数据给出表示,对于新来的数据却不能清楚地表示。LE通过应用一个高斯核代价函数实现降维,但是它同样不能对新来的数据进行表示。LPP(局部保持映射)克服了LLE和LE的上述缺点,但是当样本个数小于样本维数时,它首先需要解决一个奇异矩阵的转置问题。
针对各类具体的应用,还有一些扩展的PCA方法。例如,2D-PCA是针对图像的表示和识别问题提出的,它将每个图像表示为一个二维的矩阵而不是传统的一个向量,比PCA更精确、计算效率更高。TIPCA(变换不变PCA)针对人脸识别问题,为人脸图像学习一个变换不变的子空间。
虽然已有上述多种降维方法,但是,在执行用于分类的数据降维时,对于特定的问题,我们不知道保持数据的全局特征更好还是保持数据的局部特征更好,也不知道如何获得两者之间的平衡。因此,如何能够在继承PCA方法的基础上,将数据的全局结构性质和局部结构性质统筹起来考虑,达到全局结构和局部结构之间的良好平衡,是目前研究的一个重点和难点。
发明内容
本发明提供一种手写体数字图像的降维方法。在传统PCA、非线性降维技术或其它PCA的变形方法中,要么只考虑数据的全局结构或者局部结构,要么在执行降维时在一个目标函数中显式地考虑数据的全局和局部两种结构特征。本发明提出的方法结合PCA,在一个降维模型中隐式地保持数据结构,并在全局结构和局部结构的保持上实现平衡。
为了实现上述目的,本发明方法考虑了近邻之间的关系,并保持了数据的流形结构。首先,通过构建一个近邻矩阵,使近邻互相靠近;然后构造一个类似PCA的泛化协方差矩阵,通过求解协方差的特征问题,生成子空间转换矩阵;再通过转换矩阵实现数据集的低维表示。为了检验降维方法的性能,通过k-NN(k=1近邻)分类器对降维后的低维样本数据进行分类,通过与原始类标作比较,得出识别精度。由于图像降维考虑了流形结构及低维流形空间的邻域结构信息,因此,能获得比原始数据更好的分类识别效果。
本发明的具体技术方案如下:
一种手写体数字图像降维方法,包括以下步骤:
步骤1:获取手写体图像数据集,其中每一个样本记为xi{i=1…n},n为样本个数X=[x1,x2,…,xn],样本维数为p;
步骤2:计算泛化协方差矩阵,具体方法为:
(1)首先对样本点xi{i=1…n},求得其与其他样本两两之间的欧氏距离,选择距离最小的k个样本点作为样本xi{i=1…n}的近邻,以此构造近邻图H=(v,e),其中H的顶点表示手写体数字图像,v表示顶点集合,e表示边集合,当且仅当图像xj是xi的近邻时,构造边eij将xj与xi连接,给近邻图的每条边eij赋予一个权重,其定义如下:
其中t为调节参数,hij为边eij的权重,并令hii=1,其中i=1…n;
(2)计算泛化转换矩阵其中O为对角矩阵,其对角元素定义为:其中oii为对角矩阵O的第i行第i列元素,i为正整数,且1≤i≤n;
(3)计算样本集X的泛化协方差矩阵为XGXT;
步骤3:对步骤2得到的泛化协方差矩阵求特征值,将特征值按照从大到小的顺序排序,取前q个不为零的特征值所对应的特征向量,组成子空间转换矩阵E=[v1,v2,…,vq],其中vi表示第i个特征值对应的特征向量;
步骤4:对原手写体图像数据集进行降维,即计算Y=ETX,Y为得到的低维数据集。
将上述方法应用到手写体数字图像识别中,可得到很好的识别效果,具体技术方案为:
一种手写体数字图像识别方法,包括以下步骤:
步骤1:获取手写体数字图像集合I,所述集合包括训练图像数据子集Itrain和测试图像数据子集Itest;
步骤2:依据步骤1得到的训练图像数据子集Itrain,计算泛化协方差矩阵,具体方法为:
(1)首先对样本点xi{i=1…n},求得其与其他样本两两之间的欧氏距离,选择距离最小的k个样本点作为样本xi{i=1…n}的近邻,以此构造近邻图H=(v,e),其中H的顶点表示手写体数字图像,v表示顶点集合,e表示边集合,当且仅当图像xj是xi的近邻时,构造边eij将xj与xi连接,给近邻图的每条边eij赋予一个权重,其定义如下:
其中t为调节参数,hij为边eij的权重,并令hii=1,其中i=1…n;
(2)计算泛化转换矩阵其中O为对角矩阵,其对角元素定义为:其中oii为对角矩阵O的第i行第i列元素,i为正整数,且1≤i≤n;
(3)计算样本集X的泛化协方差矩阵为XGXT;
步骤3:对步骤2得到的泛化协方差矩阵求特征值,将特征值按照从大到小的顺序排序,取前q个不为零的特征值所对应的特征向量,组成子空间转换矩阵E=[v1,v2,…,vq],其中vi表示第i个特征值对应的特征向量;
步骤4:依据步骤3得到的转换矩阵E和步骤1得到的测试样本集Itest,获取Xtest的低维表示Ytest=ETXtest;
步骤5:依据步骤4得到的低维表示Ytest,进行手写体数字图像的识别。
本发明的有益效果是:
有效保持了训练图像的邻域信息和流形结构。由于手写体数字图像本身具有流形结构,泛化协方差矩阵构造时同时考虑了图像的流形特征和邻域信息,因此,流形空间中得到的泛化协方差矩阵比原空间中的初始协方差矩阵更能准确地描述手写体的图像特征,提高图像识别准确度。
附图说明
图1为泛化协方差矩阵构造示意图;
图2为求解协方差矩阵特征问题示意图;
图3为手写体数字识别总流程图。
具体实施方式
下面将结合附图和实施例,对本发明实施例中的技术方案进行清楚、完整地描述。
请参阅图1,图1为泛化协方差矩阵构造示意图,包括:
获取图像数据集合I,所述图像数据集合包括训练图像数据子集Itrain和测试图像数据子集Itest;
假设手写体数字集I由两部分组成,I=[X,label],其中X=[x1,x2,…,xn],每一个样本xi{i=1…n}是一个p×1维的向量,p为样本维数,n为样本个数;
样本数据集I又可按需分为Itrain和Itest。本发明中使用的是5倍交叉验证,将样本数据集随机均匀地分成5份,每次取其中一份作为测试样本集Itest,其余四份则作为Itrain,实验可以重复5次。
根据步骤1得到的样本集Itrain,首先对Xtrain中的某一个样本点xi{i=1…n},求得其与其他样本两两之间的欧氏距离,根据距离大小,选择最小距离的k个样本点作为样本xi{i=1…n}的近邻ne(xi),以此构造近邻图H=(v,e),其中H的顶点表示手写体数字图像,v表示顶点集合,e表示边集合。当且仅当图像xj是xi的k(k=12)近邻时,构造边eij将xj与xi连接。给近邻图的每条边eij赋予一个权重,其定义如下:
其中t(t=1)为调节参数,hij为边eij的权重,并令hii=1,其中i=1…n。定义泛化转换矩阵其中O为对角矩阵,其对角元素定义为:
其中oii为对角矩阵O的第i行第i列元素。i为正整数,且1≤i≤n。定义样本集X的泛化协方差矩阵为XGXT。
请参阅图2,图2为求解协方差矩阵特征问题示意图:
根据步骤2得到的泛化协方差矩阵,求解它的特征问题,获取特征值和特征向量,第i个特征值为λi,第i个特征值对应的特征向量为vi;
将特征值按照从大到小的顺序获取前q个不为零的特征值所对应的特征向量,并将获取的特征向量组成子空间转换矩阵E=[v1,v2,…,vq];其中,q为预设的降维后的维数,所述xm对应的降维后的向量数据ym为所述向量数据矩阵Ytrain的第m行向量;
特征子空间可以表示为Y=ETX,其中,E是一个p×q的矩阵;
请参阅图3,图3为手写体数字识别总流程图,本发明的具体过程为:
步骤1.获取图像数据集合I,所述图像数据集合包括训练图像数据子集Itrain和测试图像数据子集Itest;
步骤2.依据步骤1得到的训练样本集Itrain,计算一个泛化协方差矩阵;
步骤3.依据步骤2得到的协方差矩阵,求解它的特征问题,获得低维子空间转换矩阵E;
步骤4.依据步骤3得到的转换矩阵E和步骤1得到的测试样本集Itest,可以获取Xtest的低维表示Ytest=ETXtest;
步骤5.依据步骤4得到的低维表示Ytest,对其进行识别。
以美国邮政手写体数字集(USPS)中的图像数据进行验证,USPS手写体数据库中包含0-9十个手写体数字,共有2007个已知数据类型的样本,像素为16x16。实验采用5倍交叉验证,将所有数据随机均匀分成5份,每次选取一组作为测试数据,其余的作为训练数据,实验重复5次取5次的平均值作为最终的识别准确率,准确率如表1所示。
所述步骤5是指:根据步骤4得到的测试样本集的低维表示Ytest,使用k-NN(k=1近邻)分类器对[Ytest,labeltest]进行分类,获取不同维下的识别精度(%)。
表1手写体数字集USPS上七种降维方法对分类的识别精度比较
Claims (5)
1.一种手写体数字图像降维方法,包括以下步骤:
步骤1:获取手写体图像数据集,其中每一个样本记为xi{i=1…n},n为样本个数X=[x1,x2,…,xn],样本维数为p;
步骤2:计算泛化协方差矩阵,具体方法为:
(1)首先对样本点xi{i=1…n},求得其与其他样本两两之间的欧氏距离,选择距离最小的k个样本点作为样本xi{i=1…n}的近邻,以此构造近邻图H=(v,e),其中H的顶点表示手写体数字图像,v表示顶点集合,e表示边集合,当且仅当图像xj是xi的近邻时,构造边eij将xj与xi连接,给近邻图的每条边eij赋予一个权重,其定义如下:
其中t为调节参数,hij为边eij的权重,并令hii=1,其中i=1…n;
(2)计算泛化转换矩阵其中O为对角矩阵,其对角元素定义为:其中oii为对角矩阵O的第i行第i列元素,i为正整数,且1≤i≤n;
(3)计算样本集X的泛化协方差矩阵为XGXT;
步骤3:对步骤2得到的泛化协方差矩阵求特征值,将特征值按照从大到小的顺序排序,取前q个不为零的特征值所对应的特征向量,组成子空间转换矩阵E=[v1,v2,…,vq],其中vi表示第i个特征值对应的特征向量;
步骤4:对原手写体图像数据集进行降维,即计算Y=ETX,Y为得到的低维数据集。
2.如权利要求1所述的手写体数字图像降维方法,其特征在于:步骤2中,k的值取12,t的值取1。
3.一种手写体数字图像识别方法,包括以下步骤:
步骤1:获取手写体数字图像集合I,所述集合包括训练图像数据子集Itrain和测试图像数据子集Itest;
步骤2:依据步骤1得到的训练图像数据子集Itrain,计算泛化协方差矩阵,具体方法为:
(1)首先对样本点xi{i=1…n},求得其与其他样本两两之间的欧氏距离,选择距离最小的k个样本点作为样本xi{i=1…n}的近邻,以此构造近邻图H=(v,e),其中H的顶点表示手写体数字图像,v表示顶点集合,e表示边集合,当且仅当图像xj是xi的近邻时,构造边eij将xj与xi连接,给近邻图的每条边eij赋予一个权重,其定义如下:
其中t为调节参数,hij为边eij的权重,并令hii=1,其中i=1…n;
(2)计算泛化转换矩阵其中O为对角矩阵,其对角元素定义为:其中oii为对角矩阵O的第i行第i列元素,i为正整数,且1≤i≤n;
(3)计算样本集X的泛化协方差矩阵为XGXT;
步骤3:对步骤2得到的泛化协方差矩阵求特征值,将特征值按照从大到小的顺序排序,取前q个不为零的特征值所对应的特征向量,组成子空间转换矩阵E=[v1,v2,…,vq],其中vi表示第i个特征值对应的特征向量;
步骤4:依据步骤3得到的转换矩阵E和步骤1得到的测试样本集Itest,获取Xtest的低维表示Ytest=ETXtest;
步骤5:依据步骤4得到的低维表示Ytest,进行手写体数字图像的识别。
4.如权利要求3所述的手写体数字图像识别方法,其特征在于:步骤2中,k的值取12,t的值取1。
5.如权利要求3所述的手写体数字图像识别方法,其特征在于:步骤5中,用1近邻分类器对低维的样本数据进行分类,通过与原始类标作比较,得到识别精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510024751.1A CN104573727B (zh) | 2015-01-16 | 2015-01-16 | 一种手写体数字图像降维方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510024751.1A CN104573727B (zh) | 2015-01-16 | 2015-01-16 | 一种手写体数字图像降维方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104573727A true CN104573727A (zh) | 2015-04-29 |
CN104573727B CN104573727B (zh) | 2017-11-07 |
Family
ID=53089747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510024751.1A Expired - Fee Related CN104573727B (zh) | 2015-01-16 | 2015-01-16 | 一种手写体数字图像降维方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104573727B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740784A (zh) * | 2016-01-25 | 2016-07-06 | 山东毅康科技股份有限公司 | 一种基于距离优化降维的手写字体识别系统 |
CN108885688A (zh) * | 2016-02-29 | 2018-11-23 | 亚德诺半导体无限责任公司 | 占用传感器 |
CN112766080A (zh) * | 2020-12-31 | 2021-05-07 | 北京搜狗科技发展有限公司 | 一种手写识别方法、装置、电子设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831609A (zh) * | 2012-08-10 | 2012-12-19 | 清华大学深圳研究生院 | 一种基于Graphcut的开关式抠图技术 |
-
2015
- 2015-01-16 CN CN201510024751.1A patent/CN104573727B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831609A (zh) * | 2012-08-10 | 2012-12-19 | 清华大学深圳研究生院 | 一种基于Graphcut的开关式抠图技术 |
Non-Patent Citations (2)
Title |
---|
吴德新: "《基于杂波协方差矩阵特征向量分析的STAP降维方法的性能分析》", 《电子与信息学报》 * |
钱广华、李颖、骆荣剑: "《一种高维航迹融合协方差交集算法降维实现方法》", 《科学技术与工程》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740784A (zh) * | 2016-01-25 | 2016-07-06 | 山东毅康科技股份有限公司 | 一种基于距离优化降维的手写字体识别系统 |
CN105740784B (zh) * | 2016-01-25 | 2019-01-08 | 毅康科技有限公司 | 一种基于距离优化降维的手写字体识别系统 |
CN108885688A (zh) * | 2016-02-29 | 2018-11-23 | 亚德诺半导体无限责任公司 | 占用传感器 |
CN108885688B (zh) * | 2016-02-29 | 2021-12-10 | 亚德诺半导体无限责任公司 | 占用传感器 |
CN112766080A (zh) * | 2020-12-31 | 2021-05-07 | 北京搜狗科技发展有限公司 | 一种手写识别方法、装置、电子设备及介质 |
WO2022142212A1 (zh) * | 2020-12-31 | 2022-07-07 | 北京搜狗科技发展有限公司 | 一种手写识别方法、装置、电子设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104573727B (zh) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104392251B (zh) | 一种基于半监督字典学习的高光谱图像分类方法 | |
CN103093235B (zh) | 一种基于改进距离核主成分分析的手写体数字识别方法 | |
Gao et al. | Small sample classification of hyperspectral image using model-agnostic meta-learning algorithm and convolutional neural network | |
CN103440512A (zh) | 一种基于张量局部保持投影的大脑认知状态的识别方法 | |
CN103942749B (zh) | 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法 | |
CN105678261B (zh) | 基于有监督图的直推式数据降维方法 | |
CN103177265B (zh) | 基于核函数与稀疏编码的高清图像分类方法 | |
CN103699874B (zh) | 基于surf流和lle稀疏表示的人群异常行为识别方法 | |
CN106503727A (zh) | 一种高光谱图像分类的方法及装置 | |
CN104392241A (zh) | 一种基于混合回归的头部姿态估计方法 | |
CN105046272A (zh) | 一种基于简洁非监督式卷积网络的图像分类方法 | |
CN103605985A (zh) | 一种基于张量全局-局部保持投影的数据降维方法 | |
CN102682089A (zh) | 一种利用鉴别随机邻域嵌入分析的数据降维方法 | |
Park et al. | Bayesian manifold learning: the locally linear latent variable model (LL-LVM) | |
CN104298999A (zh) | 基于递归自动编码的高光谱特征学习方法 | |
CN109034213B (zh) | 基于相关熵原则的高光谱图像分类方法和系统 | |
CN105160351A (zh) | 基于锚点稀疏图的半监督高光谱分类方法 | |
CN103268484A (zh) | 用于高精度人脸识别的分类器设计方法 | |
CN103473308B (zh) | 基于最大间隔张量学习的高维多媒体数据分类方法 | |
CN103617609A (zh) | 基于图论的k-means非线性流形聚类与代表点选取方法 | |
CN104881651A (zh) | 一种基于随机投影和Fisher向量的人物行为识别方法 | |
Li et al. | Adaptive mask sampling and manifold to Euclidean subspace learning with distance covariance representation for hyperspectral image classification | |
CN116452863A (zh) | 面向遥感影像场景分类的类中心知识蒸馏方法 | |
CN105069403A (zh) | 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别 | |
CN104573727A (zh) | 一种手写体数字图像降维方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20171107 Termination date: 20220116 |