CN103235947B - 一种手写体数字识别方法及装置 - Google Patents
一种手写体数字识别方法及装置 Download PDFInfo
- Publication number
- CN103235947B CN103235947B CN201310152411.8A CN201310152411A CN103235947B CN 103235947 B CN103235947 B CN 103235947B CN 201310152411 A CN201310152411 A CN 201310152411A CN 103235947 B CN103235947 B CN 103235947B
- Authority
- CN
- China
- Prior art keywords
- vector
- vector data
- data
- dimensionality reduction
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种手写体数字识别方法及装置,所述方法包括获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。通过本申请实施例中正交匹配追踪算法得到的计算解并非全部为0,相对于现有技术能够明显体现出局部稀疏性,且具有稳定性,进而使得最终识别出的数字图像准确率较高。
Description
技术领域
本申请涉及计算机应用技术领域,特别涉及一种手写体数字识别方法及装置。
背景技术
手写体数字识别技术在实际生活中越来越收到重视,手写体数字识别技术是指:对于目标图像中的图像数据进行获取之后,依据获取的图像数据识别出目标图像中与目标数字相同的数字。由于获取到的图像数据均为高维空间数据,因此,在进行目标数字识别之前,首先对其空间进行降维处理。例如,现有的手写体数字识别方案中,通常采用基于最小二乘算法的局部稀疏线性嵌入降维方法对高维图像数据对应的向量数据进行降维,进而对降维后的向量数据采用K近邻方法进行分类,得到降维后的与目标数字相对应的数字图像。
但上述方案中,由于最小二乘方法的计算解均不为0,无法达到有效的稀疏效果,且具有不稳定性,使得降维后的向量数据进行K近邻方法分类时的分类效果较差,进而使得最终识别出的数字图像不准确。
发明内容
本申请所要解决的技术问题是提供一种手写体数字识别方法及装置,用以解决现有数字识别方案中无法达到有效的稀疏效果且不具有不稳定性,使得数字识别的准确率较低的技术问题。
本申请提供了一种手写体数字识别方法,包括:
获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;
利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
上述方法,优选的,所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合,包括:
获取所述向量数据集合中的每个向量数据的K近邻点集,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合。
上述方法,优选的:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合,包括:
对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
上述方法,优选的,所述依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像,包括:
依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
上述方法,优选的,在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后,所述方法还包括:
依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
本申请还提供了一种手写体数字识别装置,包括:
图像数据获取单元,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
向量数据转换单元,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合;
向量数据降维单元,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
数字图像识别单元,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
上述装置,优选的,所述向量数据降维单元包括:
近邻点集获取子单元,用于获取所述向量数据集合中的每个向量数据的K近邻点集,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
加权系数计算子单元,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
降维向量计算子单元,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。
上述装置,优选的:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,所述向量数据转换单元包括:
第一向量转换子单元,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
第二向量转换子单元,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
向量数据组成子单元,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
上述装置,优选的,所述数字图像识别单元包括:
降维向量提取子单元,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
数字图像分类子单元,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中所述目标数字相对应的数字图像。
上述装置,优选的,所述装置还包括:
数字图像显示单元,用于在所述数字图像识别单元识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
由上述方案可知,本申请提供的一种手写体数字识别方法及装置,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种手写体数字识别方法实施例一的流程图;
图2为本申请实施例一的另一部分流程图;
图3为本申请提供的一种手写体数字识别装置实施例二的结构示意图;
图4为本申请实施例二的部分结构示意图;
图5为本申提供的一种手写体数字识别装置实施例三的部分结构示意图;
图6为本申请提供的一种手写体数字识别装置实施例四的部分结构示意图;
图7为本申请提供的一种手写体数字识别装置实施例五的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着科技的发展,手写体数字识别是文字识别中的一个重要研究课题,在实际生活中有深远的应用需求,一直得到广泛的重视。近年来随着计算机技术和数字图像处理技术的飞速发展,数字识别在电子商务、机器自动输入等场合已经获得成功的实际应用,例如,对手写体的邮政编码的扫描识别等应用。对于手写体数字识别,目前已经发展了很多种方法,典型的方法有基于K近邻分类(KNN)的方法、基于神经网络的算法、基于笔划特征的算法、基于遗传算法、基于小波变换算法、基于傅立叶变换算法、基于支持向量机算法和基于模板匹配算法等等。手写体数字识变体极多,对各类字体的数字识别特别是脱机手写数字识别仍然处于在发展阶段,识别效果仍然不够理想。因此,研究简单高效的手写数字识别依然是一个重要的研究方向。
目前,常用的手写体数字识别方法为K近邻分类,它是一种简单直观的识别方法,思想简单并且分类效果好,在类别分类的时候,影响分类的结果只与少量的最相似样本相关,所以,K近邻分类算法可以有效的避免样本分布不平衡带来的影响。但是K近邻分类需要全部样本,计算工作量较大,而且手写体数字是高维数据,如果直接对其识别,不仅时间计算复杂度大,而且不便于可视化观察分析。因而,常将手写体数字进行降维后再识别。能够降维且将数据可视化的方法较多,目前流形学习是非常引人瞩目一类方法,包括局部线性嵌入(LLE)、等距映射(Isomap)、拉普拉斯特征映射(Laplacian Eigenmap)等。局部线性嵌入方法是一种无参数、非迭代的算法,易实现,并且无需求解全局最小值,计算量较小。常用的局部线性嵌入方法中采用了最小二乘方法求解数据的局部线性表示系数。但是最小二乘方法的解是不稳定且不稀疏,所以容易导致降维后数据的分类效果不好。
参考图1,其示出了本申请提供的一种手写体数字识别方法实施例一的流程图,所述方法可以包括以下步骤:
步骤101:获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据。
其中,所述待识别的目标数字包括0至9之间的任意一个或任意组合的数字,如1,或7和3,或8和9等。本申请要实现的目的,即为在目标图像中的高维图像数据中识别出上述目标数字中的各个数字,得到数字图像。
例如,所述目标图像中,m和n分别表示所述目标图像的行像素数值和列像素数值,N为所述目标图像中所有图像数据的总个数,所述图像数据集合可以用{Ii}表示,其中,i>=1,且i<=N。
步骤102:对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合。
例如,对所述图像数据集合{Ii}中每个图像数据Ii进行向量转换,得到每个所述图像数据对应的向量数据Xi,所有所述向量数据Xi组成所述图像数据集合的向量数据集合,所述向量数据集合中包括N个向量数据。
其中,每个所述向量数据Xi可以通过对所述图像数据Ii行进行拉伸获得。
步骤103:利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合。
其中,参考图2,其示出了本申请实施例一的另一部分流程图,所述步骤103可以通过以下各个步骤实现:
步骤201:获取所述向量数据集合中的每个向量数据的K近邻点集。
其中,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数。
例如,每个所述向量数据Xi的K近邻点集
步骤202:利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量。
其中,所述步骤202可以通过以下方式实现:
利用及每个所述向量数据的K近邻点集中的每个近邻向量数据计算每个所述近邻向量数据的加权系数所有所述加权系数在空间上组成整个向量数据集合的加权系数向量Wi·,其中,所述加权系数向量Wi·中第j个元素Wij为:
步骤203:利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算,得到降维向量数据集合。
其中,所述步骤202中计算的到的所述加权系数向量Wi.用矩阵形式表示可以为:W=[W1·,W2·,…,WN·]。所述步骤203可以通过以下方式具体实现:
构造M=(I-W)T(I-W),其中,I为单位矩阵,M为中间矩阵;
预先设定M中的特征值按照由小到大的顺序排列,对M进行特征值分解,令第j个特征值对应λj和对应的特征向量为vj;
提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量,组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1],其中,d为降维后的维数,为预先设置;
所述向量数据矩阵Y=[v2,v3,…,vd+1]即为所述降维向量数据集合,其中,yi是Y的第i行向量,为xi对应的降维向量。
步骤104:依据所述降维向量数据集合,识别得到所述目标图像中与是目标数字相对应的数字图像。
其中,原始的图像数据为高维图像数据,通过上述向量转换及降维操作之后得到的向量数据维数明显低于原始数据,在进行所述步骤104中的分类识别等操作时,所耗费的时间及计算资源明显减少,同时达到识别出用户所需要维数的数字图像。
由上述方案可知,本申请提供的一种手写体数字识别方法实施例一,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。
其中,上述实施例中,所述图像数据集合中包括测试图像数据集合和训练图像数据集合,所述测试图像数据集合中包括至少一个图像数据,,所述训练图像数据集合中包括至少一个图像数据,且所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签。
例如,在所述图像数据集合{Ii}中的前M个图像数据设置有标签,即其中,li∈{1,…,c}是Ii的对应标签,c表示所述图像数据集合中所有图像数据的待识别数字的类别数;后N-M个是无标签的,组成所述图像数据集合中的测试图像数据集合而则为所述训练图像数据集合。
其中,上述实施例中,所述步骤102可以理解为:
对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
同时,对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
例如,所述图像数据集合{Ii}的向量数据集合中包括训练向量数据集合由所述图像数据集合{Ii}中的训练图像数据集合进行向量转换得到,所述训练向量数据集合中的每个元素设置有与其各自对应的图像数据相对应的标签;所述图像数据集合{Ii}的向量数据集合中包括测试向量数据集合由所述图像数据集合{Ii}中的测试图像数据集合进行向量转换得到。
由于所述向量数据集合包括训练向量数据集合和测试向量数据集合,因此,在对所述向量数据集合依据所述正交匹配追踪算法进行计算最终得到降维向量数据集合后,所述降维向量数据集合中包括与上述训练向量数据集合相对应的降维训练向量数据集合、和与所述测试向量数据集合相对应的降维测试向量数据集合。由上述实施例中描述的,设置有所述标签的降维向量数据为训练图像数据进行向量转换得到的训练向量数据,因此,为了提高降维分类识别的准确率,所述步骤104可以通过以下方式实现:
依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
例如,所述降维向量数据集合{Yi}中包括降维训练向量数据集合和降维测试向量数据集合由于所述降维训练向量数据集合中每个元素均设置有所述标签,由此,提取所述降维向量数据集合{Yi}中没有设置所述标签的元素,即为:提取所述降维测试向量数据集合对所述降维测试向量数据集合采用K近邻分类方法进行分类识别,得到所述目标图像中与所述目标数字相对应的数字图像。
另外,在对所述目标图像中与所述目标数字相对应的数字图像进行识别获取之后,可以选择对所述数字图像做进一步处理,其中,在所述步骤104之后,所述方法还包括以下步骤:
依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
其中,所述显示设备包括计算机显示器或显示屏幕等显示装置。
需要说明的是,所述数字图像为维数低于所述目标图像的图像,如二维图像或三维图像等,此时,可以依据用户需要将所述数字图像按照其可视化坐标如XY坐标或XYZ坐标显示于计算机屏幕中,提示给用户。
参考图3,其示出了本申请提供的一种手写体数字识别装置实施例二的结构示意图,所述装置包括:
图像数据获取单元301,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据。
其中,所述待识别的目标数字包括0至9之间的任意一个或任意组合的数字,如1,或7和3,或8和9等。本申请要实现的目的,即为在目标图像中的高维图像数据中识别出上述目标数字中的各个数字,得到数字图像。
例如,所述目标图像中,m和n分别表示所述目标图像的行像素数值和列像素数值,N为所述目标图像中所有图像数据的总个数,所述图像数据集合可以用{Ii}表示,其中,i>=1,且i<=N。
向量数据转换单元302,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合。
需要说明的是,所述向量数据转换单元302与所述图像数据获取单元301相连接。
例如,对所述图像数据集合{Ii}中每个图像数据Ii进行向量转换,得到每个所述图像数据对应的向量数据Xi,所有所述向量数据Xi组成所述图像数据集合的向量数据集合,所述向量数据集合中包括N个向量数据。
其中,每个所述向量数据Xi可以通过对所述图像数据Ii行进行拉伸获得。
向量数据降维单元303,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合。
需要说明的是,所述向量数据降维单元303与所述向量数据转换单元302相连接。
参考图4,其示出了本申请实施例二的部分结构示意图,所述向量数据降维单元303包括:
近邻点集获取子单元331,用于获取所述向量数据集合中的每个向量数据的K近邻点集。
其中,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数。
例如,每个所述向量数据Xi的K近邻点集
加权系数计算子单元332,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量。
需要说明的是,所述加权系数计算子单元332与所述近邻点集获取子单元331相连接。
其中,所述加权系数计算子单元332可以通过以下方式实现其功能:
利用及每个所述向量数据的K近邻点集中的每个近邻向量数据计算每个所述近邻向量数据的加权系数所有所述加权系数在空间上组成整个向量数据集合的加权系数向量Wi·,其中,所述加权系数向量Wi·中第j个元素Wij为:
降维向量计算子单元333,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。
需要说明的是,所述降维向量计算子单元333与所述加权系数计算子单元332相连接。
其中,所述加权系数计算子单元332中计算的到的所述加权系数向量Wi·用矩阵形式表示可以为:W=[W1·,W2·,…,WN·]。所述步骤降维向量计算子单元333可以通过以下方式具体实现其功能:
构造M=(I-W)T(I-W),其中,I为单位矩阵,M为中间矩阵;
预先设定M中的特征值按照由小到大的顺序排列,对M进行特征值分解,令第j个特征值对应λj和对应的特征向量为vj;
提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量,组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1],其中,d为降维后的维数,为预先设置;
所述向量数据矩阵Y=[v2,v3,…,vd+1]即为所述降维向量数据集合,其中,yi是Y的第i行向量,为xi对应的降维向量。
数字图像识别单元304,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
需要说明的是,所述数字图像识别单元与所述向量数据降维单元303相连接。
其中,原始的图像数据为高维图像数据,通过上述向量转换及降维操作之后得到的向量数据维数明显低于原始数据,在所述数字图像识别单元304进行分类识别等操作时,所耗费的时间及计算资源明显减少,同时达到识别出用户所需要维数的数字图像。
由上述方案可知,本申请提供的一种手写体数字识别装置实施例二,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。
其中,上述实施例中,所述图像数据集合中包括测试图像数据集合和训练图像数据集合,所述测试图像数据集合中包括至少一个图像数据,,所述训练图像数据集合中包括至少一个图像数据,且所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签。
例如,在所述图像数据集合{Ii}中的前M个图像数据设置有标签,即其中,li∈{1,…,c}是Ii的对应标签,c表示所述图像数据集合中所有图像数据的待识别数字的类别数;后N-M个是无标签的,组成所述图像数据集合中的测试图像数据集合而则为所述训练图像数据集合。
其中,参考图5,其示出了本申提供的一种手写体数字识别装置实施例三的部分结构示意图,其中,所述向量数据转换单元302包括:
第一向量转换子单元321,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合。
第二向量转换子单元322,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合。
向量数据组成子单元323,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
其中,所述向量数据组成子单元323分别与所述第一相连转换子单元321和所述第二向量转换子单元322相连接。
例如,所述图像数据集合{Ii}的向量数据集合中包括训练向量数据集合由所述图像数据集合{Ii}中的训练图像数据集合进行向量转换得到,所述训练向量数据集合中的每个元素设置有与其各自对应的图像数据相对应的标签;所述图像数据集合{Ii}的向量数据集合中包括测试向量数据集合由所述图像数据集合{Ii}中的测试图像数据集合进行向量转换得到。
由于所述向量数据集合包括训练向量数据集合和测试向量数据集合,因此,在对所述向量数据集合依据所述正交匹配追踪算法进行计算最终得到降维向量数据集合后,所述降维向量数据集合中包括与上述训练向量数据集合相对应的降维训练向量数据集合、和与所述测试向量数据集合相对应的降维测试向量数据集合。由上述实施例中描述的,设置有所述标签的降维向量数据为训练图像数据进行向量转换得到的训练向量数据,因此,为了提高降维分类识别的准确率,参考图6,其示出了本申请提供的一种手写体数字识别装置实施例四的部分结构示意图,其中,所述数字图像识别单元304可以包括:
降维向量提取子单元341,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合。
数字图像分类子单元342,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
其中,所述数字图像分类子单元342与所述降维向量提取子单元341相连接。
需要说明的是,所述数字图像分类子单元342中可以采用K近邻分类器对所述降维测试向量数据集合进行分类。
例如,所述降维向量数据集合{Yi}中包括降维训练向量数据集合和降维测试向量数据集合由于所述降维训练向量数据集合中每个元素均设置有所述标签,由此,提取所述降维向量数据集合{Yi}中没有设置所述标签的元素,即为:提取所述降维测试向量数据集合对所述降维测试向量数据集合采用K近邻分类方法进行分类识别,得到所述目标图像中与所述目标数字相对应的数字图像。
另外,在对所述目标图像中与所述目标数字相对应的数字图像进行识别获取之后,可以选择对所述数字图像做进一步处理,其中,参考图7,其示出了本申请提供的一种手写体数字识别装置实施例五的结构示意图,所述装置还包括:
数字图像显示单元305,用于在所述数字图像识别单元304识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
需要说明的是,图7中所示的实施例为基于如图3所示的装置,本申请实施例五中所述数字图像显示单元305同样适用于本申请中其他的装置实施例中。
其中,所述显示设备包括计算机显示器或显示屏幕等显示装置。
需要说明的是,所述数字图像为维数低于所述目标图像的图像,如二维图像或三维图像等,此时,可以依据用户需要将所述数字图像按照其可视化坐标如XY坐标或XYZ坐标显示于计算机屏幕中,提示给用户。
以下对本申请实施例应用于实际实验或应用进行有益效果说明:
本申请应用于MATLAB软件中进行实验,以MNIST手写体数据集为例来阐述本本申请。MNIST手写体数据集为包括0到9十个手写体数字。在本例中,选择相似形状的数字“1”、“3”、“7”、“8”、“9”进行实验,即目标数字为“1”、“3”、“7”、“8”和“9”。
应用本申请对目标图像中的图像数据进行获取,进行向量转换及降维操作,得到三维向量数据,再用K近邻分类器对三维测试向量数据进行分类,得到实验结果:实验中训练集每类个数200,测试集每类个数500.由于样本个数较多,K近邻分类器所应用算法中的参数为11,稀疏度为2。具体的实现流程如下:
1、输入图像数据集合{Ii},其中Ii∈Rm×n是第i个图像数据,m和n表示图像数据的行像素和列像素值,N表示图像数据的总个数。在{Ii}中,前M个是有标签的,即li∈{1,…,c}是Ii的标签,c表示所述目标图像中所有图像数据中的类别数;后N-M个是无标签的,称为是测试图像数据集合而是训练图像数据集合。
在本实施例中,m=n=28,M=1000,N=3500,c=5。
2、转换所述图像数据集合{Ii}为向量数据集合其中xi∈Rmn是对图像数据Ii行拉伸获得的。相对应的,获得训练向量数据集和测试向量数据集
3、对所述向量数据集合X中的每个元素xi获取各自的K近邻点集 在本实施例中,K=11。
用近邻点集Xi来局部稀疏线性表示xi,即其中是的加权系数,其值用正交匹配追踪算法来求解,所以也有可能为零,从而获得局部稀疏性。获得对xi在整个样本集合上的加权系数向量Wi·,其第j个元素为:
由此,得到加权系数矩阵W=[W1·,W2·,…,WN·]。
4、构造M=(I-W)T(I-W),其中I是单位矩阵,M为中间矩阵,对M进行特征值分解,预设特征值是按照从小到大的顺序排列,令其第j个特征值λj和对应的特征向量为vj。取第2个到第d+1个所对应的特征向量组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1]。xi对应的降维为yi是Y的第i行向量。
在本实施例中,d=3。
5、把降维后的向量数据集合分为降维训练向量数据集合和降维测试向量数据集合
6、对获得的降维测试向量数据集Ytest用K近邻方法分类并将可视化坐标集输出于计算机屏幕上。
本申请的有益效果效果可以通过如下实验验证:
实验中,采用三种方案进行手写体识别率对比,包括原空间(不降维)方案,现有基于最小二乘方法的局部线性嵌入降维方案和本申请方案,分类器均采用K近邻算法。
如下表1中所示,实验给出“1”,“3”,“7”,“8”,“9”这五个手写体数字测试集上的各自的识别率和平均识别率,及运行时间的比较。运行时间即本发明算法时间加K近邻方法分类时间、LLE算法时间加K近邻方法分类时间和原数据K近邻方法分类时间。实验重复二十次,取平均值,实验结果见表1所示。
表1示例实验结果
通过表1,可以看出本申请可视化后识别率比基于最小二乘方法的局部线性嵌入降维方案可视化后的识别率高,运行时间也比基于最小二乘方法的局部线性嵌入降维方案快。分类速度比原空间方案分类速度快得多,且对手写体“8”的识别率高于原空间中“8”的识别率,“3”的识别率(三维可视化)等于原空间中“3”的识别率。5个数字上的平均识别率稍低于原空间的平均识别率。本实验明显证明本申请有更好的实用价值。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种手写体数字识别方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (8)
1.一种手写体数字识别方法,其特征在于,包括:
获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;
利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像;
其中,所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合,包括:
获取所述向量数据集合中的每个向量数据的K近邻点集,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合;
其中,所述利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量,包括:
利用及每个所述向量数据Xi的K近邻点集中的每个近邻向量数据计算每个所述近邻向量数据的加权系数所有所述加权系数在空间上组成整个向量数据集合的加权系数向量Wi;
其中,所述利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合,包括:
构造M=(I-W)T(I-W),其中,I为单位矩阵,M为中间矩阵,W为所述加权系数向量Wi的矩阵形式;
预先设定M中的特征值按照由小到大的顺序排列,对M进行特征值分解,令第j个特征值对应λj和对应的特征向量为vj;
提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量,组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1],其中,d为降维后的维数,为预先设置;
所述向量数据矩阵Y=[v2,v3,…,vd+1]即为所述降维向量数据集合,其中,yi是Y的第i行向量,为xi对应的降维向量。
2.根据权利要求1所述的方法,其特征在于:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合,包括:
对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
3.根据权利要求2所述的方法,其特征在于,所述依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像,包括:
依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
4.根据权利要求1至3任意一项所述的方法,其特征在于,在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后,所述方法还包括:
依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
5.一种手写体数字识别装置,其特征在于,包括:
图像数据获取单元,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
向量数据转换单元,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;
向量数据降维单元,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
数字图像识别单元,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像;
所述向量数据降维单元包括:
近邻点集获取子单元,用于获取所述向量数据集合中的每个向量数据的K近邻点集,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
加权系数计算子单元,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
降维向量计算子单元,用于利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合;
其中,所述加权系数计算子单元通过以下方式实现其功能:
利用及每个所述向量数据Xi的K近邻点集中的每个近邻向量数据计算每个所述近邻向量数据的加权系数所有所述加权系数在空间上组成整个向量数据集合的加权系数向量Wi;
所述降维向量计算子单元通过以下方式具体实现其功能:
构造M=(I-W)T(I-W),其中,I为单位矩阵,M为中间矩阵,W为所述加权系数向量Wi的矩阵形式;
预先设定M中的特征值按照由小到大的顺序排列,对M进行特征值分解,令第j个特征值对应λj和对应的特征向量为vj;
提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量,组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1],其中,d为降维后的维数,为预先设置;
所述向量数据矩阵Y=[v2,v3,…,vd+1]即为所述降维向量数据集合,其中,yi是Y的第i行向量,为xi对应的降维向量。
6.根据权利要求5所述的装置,其特征在于:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,所述向量数据转换单元包括:
第一向量转换子单元,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
第二向量转换子单元,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
向量数据组成子单元,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
7.根据权利要求6所述的装置,其特征在于,所述数字图像识别单元包括:
降维向量提取子单元,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
数字图像分类子单元,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中所述目标数字相对应的数字图像。
8.根据权利要求5至7任意一项所述的装置,其特征在于,所述装置还包括:
数字图像显示单元,用于在所述数字图像识别单元识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310152411.8A CN103235947B (zh) | 2013-04-27 | 2013-04-27 | 一种手写体数字识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310152411.8A CN103235947B (zh) | 2013-04-27 | 2013-04-27 | 一种手写体数字识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103235947A CN103235947A (zh) | 2013-08-07 |
CN103235947B true CN103235947B (zh) | 2016-12-07 |
Family
ID=48883986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310152411.8A Active CN103235947B (zh) | 2013-04-27 | 2013-04-27 | 一种手写体数字识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103235947B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400161A (zh) * | 2013-07-18 | 2013-11-20 | 苏州大学 | 一种手写体数字识别方法及系统 |
CN103440506A (zh) * | 2013-08-27 | 2013-12-11 | 苏州大学 | 基于有监督稀疏线性嵌入的手写体数字可视化方法及系统 |
CN103679207A (zh) * | 2014-01-02 | 2014-03-26 | 苏州大学 | 一种手写体数字识别方法及系统 |
CN105095174A (zh) * | 2014-05-14 | 2015-11-25 | 联想移动通信软件(武汉)有限公司 | 一种信息处理方法、装置及终端 |
CN105740784B (zh) * | 2016-01-25 | 2019-01-08 | 毅康科技有限公司 | 一种基于距离优化降维的手写字体识别系统 |
CN106216279A (zh) * | 2016-08-03 | 2016-12-14 | 南京键通电子商务有限公司 | 一种密码覆膜卡刮卡及信息识别系统 |
CN108304357B (zh) * | 2018-01-31 | 2020-09-08 | 北京大学 | 一种基于字体流形的中文字库自动生成方法 |
CN109033415A (zh) * | 2018-08-06 | 2018-12-18 | 浙江大学 | 一种基于拉普拉斯特征映射的多维神经信号的降维和可视化方法 |
CN113903043B (zh) * | 2021-12-11 | 2022-05-06 | 绵阳职业技术学院 | 一种基于孪生度量模型的印刷汉字字体识别方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520847A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 模式识别装置和方法 |
-
2013
- 2013-04-27 CN CN201310152411.8A patent/CN103235947B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520847A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 模式识别装置和方法 |
Non-Patent Citations (2)
Title |
---|
一种基于流形学习的手写体数字识别;杨晓敏 等;《光电子激光》;20071231;第18卷(第12期);第1478-1480页 * |
基于稀疏表示的高噪声人脸识别及算法优化;蔡体健 等;《计算机应用》;20120801;第32卷;第2313-2314页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103235947A (zh) | 2013-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103235947B (zh) | 一种手写体数字识别方法及装置 | |
CN102663391B (zh) | 一种图像的多特征提取与融合方法及系统 | |
CN103049446B (zh) | 一种图像检索方法及装置 | |
CN105069811B (zh) | 一种多时相遥感图像变化检测方法 | |
CN107808129A (zh) | 一种基于单个卷积神经网络的面部多特征点定位方法 | |
CN102750347B (zh) | 一种用于图像或视频搜索重排序的方法 | |
CN103984966A (zh) | 基于稀疏表示的sar图像目标识别方法 | |
CN103164701B (zh) | 手写体数字识别方法及装置 | |
CN104167013B (zh) | 一种用于突出显示体数据中目标区域的体绘制方法 | |
CN104751175B (zh) | 基于增量支持向量机的sar图像多类标场景分类方法 | |
CN103745201B (zh) | 一种节目识别方法及装置 | |
CN105205449A (zh) | 基于深度学习的手语识别方法 | |
CN104392241A (zh) | 一种基于混合回归的头部姿态估计方法 | |
CN103745233B (zh) | 基于空间信息迁移的高光谱图像分类方法 | |
CN107609573A (zh) | 基于低秩分解和空谱约束的高光谱图像时变特征提取方法 | |
CN113516693B (zh) | 一种快速通用的图像配准方法 | |
CN109376787A (zh) | 流形学习网络及基于其的计算机视觉图像集分类方法 | |
CN105469063A (zh) | 鲁棒的人脸图像主成分特征提取方法及识别装置 | |
CN103839066A (zh) | 一种源于生物视觉的特征提取方法 | |
CN108764676A (zh) | 一种高维多目标评价方法及系统 | |
CN106228182A (zh) | 基于spm和深度增量svm的sar图像分类方法 | |
CN106250918A (zh) | 一种基于改进的推土距离的混合高斯模型匹配方法 | |
CN105718934A (zh) | 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法 | |
CN103310237B (zh) | 手写体数字识别方法及系统 | |
CN103310205B (zh) | 一种手写体数字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |