CN103235947A - 一种手写体数字识别方法及装置 - Google Patents

一种手写体数字识别方法及装置 Download PDF

Info

Publication number
CN103235947A
CN103235947A CN2013101524118A CN201310152411A CN103235947A CN 103235947 A CN103235947 A CN 103235947A CN 2013101524118 A CN2013101524118 A CN 2013101524118A CN 201310152411 A CN201310152411 A CN 201310152411A CN 103235947 A CN103235947 A CN 103235947A
Authority
CN
China
Prior art keywords
vector data
vector
data
dimensionality reduction
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101524118A
Other languages
English (en)
Other versions
CN103235947B (zh
Inventor
张莉
冷亦琴
王邦军
何书萍
包兴
杨季文
李凡长
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201310152411.8A priority Critical patent/CN103235947B/zh
Publication of CN103235947A publication Critical patent/CN103235947A/zh
Application granted granted Critical
Publication of CN103235947B publication Critical patent/CN103235947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请公开了一种手写体数字识别方法及装置,所述方法包括获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。通过本申请实施例中正交匹配追踪算法得到的计算解并非全部为0,相对于现有技术能够明显体现出局部稀疏性,且具有稳定性,进而使得最终识别出的数字图像准确率较高。

Description

一种手写体数字识别方法及装置
技术领域
本申请涉及计算机应用技术领域,特别涉及一种手写体数字识别方法及装置。
背景技术
手写体数字识别技术在实际生活中越来越收到重视,手写体数字识别技术是指:对于目标图像中的图像数据进行获取之后,依据获取的图像数据识别出目标图像中与目标数字相同的数字。由于获取到的图像数据均为高维空间数据,因此,在进行目标数字识别之前,首先对其空间进行降维处理。例如,现有的手写体数字识别方案中,通常采用基于最小二乘算法的局部稀疏线性嵌入降维方法对高维图像数据对应的向量数据进行降维,进而对降维后的向量数据采用K近邻方法进行分类,得到降维后的与目标数字相对应的数字图像。
但上述方案中,由于最小二乘方法的计算解均不为0,无法达到有效的稀疏效果,且具有不稳定性,使得降维后的向量数据进行K近邻方法分类时的分类效果较差,进而使得最终识别出的数字图像不准确。
发明内容
本申请所要解决的技术问题是提供一种手写体数字识别方法及装置,用以解决现有数字识别方案中无法达到有效的稀疏效果且不具有不稳定性,使得数字识别的准确率较低的技术问题。
本申请提供了一种手写体数字识别方法,包括:
获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;
利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
上述方法,优选的,所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合,包括:
获取所述向量数据集合中的每个向量数据的K近邻点集,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合。
上述方法,优选的:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合,包括:
对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
上述方法,优选的,所述依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像,包括:
依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
上述方法,优选的,在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后,所述方法还包括:
依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
本申请还提供了一种手写体数字识别装置,包括:
图像数据获取单元,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
向量数据转换单元,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合;
向量数据降维单元,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
数字图像识别单元,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
上述装置,优选的,所述向量数据降维单元包括:
近邻点集获取子单元,用于获取所述向量数据集合中的每个向量数据的K近邻点集,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
加权系数计算子单元,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
降维向量计算子单元,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。
上述装置,优选的:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,所述向量数据转换单元包括:
第一向量转换子单元,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
第二向量转换子单元,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
向量数据组成子单元,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
上述装置,优选的,所述数字图像识别单元包括:
降维向量提取子单元,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
数字图像分类子单元,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中所述目标数字相对应的数字图像。
上述装置,优选的,所述装置还包括:
数字图像显示单元,用于在所述数字图像识别单元识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
由上述方案可知,本申请提供的一种手写体数字识别方法及装置,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种手写体数字识别方法实施例一的流程图;
图2为本申请实施例一的另一部分流程图;
图3为本申请提供的一种手写体数字识别装置实施例二的结构示意图;
图4为本申请实施例二的部分结构示意图;
图5为本申提供的一种手写体数字识别装置实施例三的部分结构示意图;
图6为本申请提供的一种手写体数字识别装置实施例四的部分结构示意图;
图7为本申请提供的一种手写体数字识别装置实施例五的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着科技的发展,手写体数字识别是文字识别中的一个重要研究课题,在实际生活中有深远的应用需求,一直得到广泛的重视。近年来随着计算机技术和数字图像处理技术的飞速发展,数字识别在电子商务、机器自动输入等场合已经获得成功的实际应用,例如,对手写体的邮政编码的扫描识别等应用。对于手写体数字识别,目前已经发展了很多种方法,典型的方法有基于K近邻分类(KNN)的方法、基于神经网络的算法、基于笔划特征的算法、基于遗传算法、基于小波变换算法、基于傅立叶变换算法、基于支持向量机算法和基于模板匹配算法等等。手写体数字识变体极多,对各类字体的数字识别特别是脱机手写数字识别仍然处于在发展阶段,识别效果仍然不够理想。因此,研究简单高效的手写数字识别依然是一个重要的研究方向。
目前,常用的手写体数字识别方法为K近邻分类,它是一种简单直观的识别方法,思想简单并且分类效果好,在类别分类的时候,影响分类的结果只与少量的最相似样本相关,所以,K近邻分类算法可以有效的避免样本分布不平衡带来的影响。但是K近邻分类需要全部样本,计算工作量较大,而且手写体数字是高维数据,如果直接对其识别,不仅时间计算复杂度大,而且不便于可视化观察分析。因而,常将手写体数字进行降维后再识别。能够降维且将数据可视化的方法较多,目前流形学习是非常引人瞩目一类方法,包括局部线性嵌入(LLE)、等距映射(Isomap)、拉普拉斯特征映射(Laplacian Eigenmap)等。局部线性嵌入方法是一种无参数、非迭代的算法,易实现,并且无需求解全局最小值,计算量较小。常用的局部线性嵌入方法中采用了最小二乘方法求解数据的局部线性表示系数。但是最小二乘方法的解是不稳定且不稀疏,所以容易导致降维后数据的分类效果不好。
参考图1,其示出了本申请提供的一种手写体数字识别方法实施例一的流程图,所述方法可以包括以下步骤:
步骤101:获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据。
其中,所述待识别的目标数字包括0至9之间的任意一个或任意组合的数字,如1,或7和3,或8和9等。本申请要实现的目的,即为在目标图像中的高维图像数据中识别出上述目标数字中的各个数字,得到数字图像。
例如,所述目标图像中,m和n分别表示所述目标图像的行像素数值和列像素数值,N为所述目标图像中所有图像数据的总个数,所述图像数据集合可以用{Ii}表示,其中,i>=1,且i<=N。
步骤102:对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合。
例如,对所述图像数据集合{Ii}中每个图像数据Ii进行向量转换,得到每个所述图像数据对应的向量数据Xi,所有所述向量数据Xi组成所述图像数据集合的向量数据集合,所述向量数据集合
Figure BDA00003118355300074
中包括N个向量数据。
其中,每个所述向量数据Xi可以通过对所述图像数据Ii行进行拉伸获得。
步骤103:利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合。
其中,参考图2,其示出了本申请实施例一的另一部分流程图,所述步骤103可以通过以下各个步骤实现:
步骤201:获取所述向量数据集合中的每个向量数据的K近邻点集。
其中,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数。
例如,每个所述向量数据Xi的K近邻点集
Figure BDA00003118355300071
步骤202:利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量。
其中,所述步骤202可以通过以下方式实现:
利用
Figure BDA00003118355300072
及每个所述向量数据的K近邻点集
Figure BDA00003118355300073
中的每个近邻向量数据
Figure BDA00003118355300081
计算每个所述近邻向量数据
Figure BDA00003118355300082
的加权系数
Figure BDA00003118355300083
所有所述加权系数
Figure BDA00003118355300084
在空间上组成整个向量数据集合的加权系数向量W,其中,所述加权系数向量W中第j个元素Wij为:
W ij = w i j , x j &Element; X i 0 , x j &NotElement; X i
步骤203:利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算,得到降维向量数据集合。
其中,所述步骤202中计算的到的所述加权系数向量Wi.用矩阵形式表示可以为:W=[W,W,…,W]。所述步骤203可以通过以下方式具体实现:
构造M=(I-W)T(I-W),其中,I为单位矩阵,M为中间矩阵;
预先设定M中的特征值按照由小到大的顺序排列,对M进行特征值分解,令第j个特征值对应λj和对应的特征向量为vj
提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量,组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1],其中,d为降维后的维数,为预先设置;
所述向量数据矩阵Y=[v2,v3,…,vd+1]即为所述降维向量数据集合,其中,yi是Y的第i行向量,为xi对应的降维向量。
步骤104:依据所述降维向量数据集合,识别得到所述目标图像中与是目标数字相对应的数字图像。
其中,原始的图像数据为高维图像数据,通过上述向量转换及降维操作之后得到的向量数据维数明显低于原始数据,在进行所述步骤104中的分类识别等操作时,所耗费的时间及计算资源明显减少,同时达到识别出用户所需要维数的数字图像。
由上述方案可知,本申请提供的一种手写体数字识别方法实施例一,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。
其中,上述实施例中,所述图像数据集合中包括测试图像数据集合和训练图像数据集合,所述测试图像数据集合中包括至少一个图像数据,,所述训练图像数据集合中包括至少一个图像数据,且所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签。
例如,在所述图像数据集合{Ii}中的前M个图像数据设置有标签,即
Figure BDA00003118355300091
其中,li∈{1,…,c}是Ii的对应标签,c表示所述图像数据集合中所有图像数据的待识别数字的类别数;后N-M个是无标签的,组成所述图像数据集合中的测试图像数据集合则为所述训练图像数据集合。
其中,上述实施例中,所述步骤102可以理解为:
对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
同时,对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
例如,所述图像数据集合{Ii}的向量数据集合中包括训练向量数据集合
Figure BDA00003118355300095
由所述图像数据集合{Ii}中的训练图像数据集合
Figure BDA00003118355300096
进行向量转换得到,所述训练向量数据集合
Figure BDA00003118355300097
中的每个元素设置有与其各自对应的图像数据相对应的标签;所述图像数据集合{Ii}的向量数据集合
Figure BDA00003118355300098
中包括测试向量数据集合
Figure BDA00003118355300099
由所述图像数据集合{Ii}中的测试图像数据集合
Figure BDA000031183553000910
进行向量转换得到。
由于所述向量数据集合包括训练向量数据集合和测试向量数据集合,因此,在对所述向量数据集合依据所述正交匹配追踪算法进行计算最终得到降维向量数据集合后,所述降维向量数据集合中包括与上述训练向量数据集合相对应的降维训练向量数据集合、和与所述测试向量数据集合相对应的降维测试向量数据集合。由上述实施例中描述的,设置有所述标签的降维向量数据为训练图像数据进行向量转换得到的训练向量数据,因此,为了提高降维分类识别的准确率,所述步骤104可以通过以下方式实现:
依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
例如,所述降维向量数据集合{Yi}中包括降维训练向量数据集合
Figure BDA00003118355300101
和降维测试向量数据集合
Figure BDA00003118355300102
由于所述降维训练向量数据集合
Figure BDA00003118355300103
中每个元素均设置有所述标签,由此,提取所述降维向量数据集合{Yi}中没有设置所述标签的元素,即为:提取所述降维测试向量数据集合
Figure BDA00003118355300104
对所述降维测试向量数据集合
Figure BDA00003118355300105
采用K近邻分类方法进行分类识别,得到所述目标图像中与所述目标数字相对应的数字图像。
另外,在对所述目标图像中与所述目标数字相对应的数字图像进行识别获取之后,可以选择对所述数字图像做进一步处理,其中,在所述步骤104之后,所述方法还包括以下步骤:
依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
其中,所述显示设备包括计算机显示器或显示屏幕等显示装置。
需要说明的是,所述数字图像为维数低于所述目标图像的图像,如二维图像或三维图像等,此时,可以依据用户需要将所述数字图像按照其可视化坐标如XY坐标或XYZ坐标显示于计算机屏幕中,提示给用户。
参考图3,其示出了本申请提供的一种手写体数字识别装置实施例二的结构示意图,所述装置包括:
图像数据获取单元301,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据。
其中,所述待识别的目标数字包括0至9之间的任意一个或任意组合的数字,如1,或7和3,或8和9等。本申请要实现的目的,即为在目标图像中的高维图像数据中识别出上述目标数字中的各个数字,得到数字图像。
例如,所述目标图像中,m和n分别表示所述目标图像的行像素数值和列像素数值,N为所述目标图像中所有图像数据的总个数,所述图像数据集合可以用{Ii}表示,其中,i>=1,且i<=N。
向量数据转换单元302,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合。
需要说明的是,所述向量数据转换单元302与所述图像数据获取单元301相连接。
例如,对所述图像数据集合{Ii}中每个图像数据Ii进行向量转换,得到每个所述图像数据对应的向量数据Xi,所有所述向量数据Xi组成所述图像数据集合的向量数据集合,所述向量数据集合中包括N个向量数据。
其中,每个所述向量数据Xi可以通过对所述图像数据Ii行进行拉伸获得。
向量数据降维单元303,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合。
需要说明的是,所述向量数据降维单元303与所述向量数据转换单元302相连接。
参考图4,其示出了本申请实施例二的部分结构示意图,所述向量数据降维单元303包括:
近邻点集获取子单元331,用于获取所述向量数据集合中的每个向量数据的K近邻点集。
其中,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数。
例如,每个所述向量数据Xi的K近邻点集
加权系数计算子单元332,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量。
需要说明的是,所述加权系数计算子单元332与所述近邻点集获取子单元331相连接。
其中,所述加权系数计算子单元332可以通过以下方式实现其功能:
利用
Figure BDA00003118355300122
及每个所述向量数据的K近邻点集
Figure BDA00003118355300123
中的每个近邻向量数据计算每个所述近邻向量数据
Figure BDA00003118355300125
的加权系数
Figure BDA00003118355300126
所有所述加权系数
Figure BDA00003118355300127
在空间上组成整个向量数据集合的加权系数向量W,其中,所述加权系数向量W中第j个元素Wij为: W ij = w i j , x j &Element; X i 0 , x j &NotElement; X i
降维向量计算子单元333,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。
需要说明的是,所述降维向量计算子单元333与所述加权系数计算子单元332相连接。
其中,所述加权系数计算子单元332中计算的到的所述加权系数向量W用矩阵形式表示可以为:W=[W,W,…,W]。所述步骤降维向量计算子单元333可以通过以下方式具体实现其功能:
构造M=(I-W)T(I-W),其中,I为单位矩阵,M为中间矩阵;
预先设定M中的特征值按照由小到大的顺序排列,对M进行特征值分解,令第j个特征值对应λj和对应的特征向量为vj
提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量,组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1],其中,d为降维后的维数,为预先设置;
所述向量数据矩阵Y=[v2,v3,…,vd+1]即为所述降维向量数据集合,其中,yi是Y的第i行向量,为xi对应的降维向量。
数字图像识别单元304,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
需要说明的是,所述数字图像识别单元与所述向量数据降维单元303相连接。
其中,原始的图像数据为高维图像数据,通过上述向量转换及降维操作之后得到的向量数据维数明显低于原始数据,在所述数字图像识别单元304进行分类识别等操作时,所耗费的时间及计算资源明显减少,同时达到识别出用户所需要维数的数字图像。
由上述方案可知,本申请提供的一种手写体数字识别装置实施例二,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。
其中,上述实施例中,所述图像数据集合中包括测试图像数据集合和训练图像数据集合,所述测试图像数据集合中包括至少一个图像数据,,所述训练图像数据集合中包括至少一个图像数据,且所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签。
例如,在所述图像数据集合{Ii}中的前M个图像数据设置有标签,即
Figure BDA00003118355300131
其中,li∈{1,…,c}是Ii的对应标签,c表示所述图像数据集合中所有图像数据的待识别数字的类别数;后N-M个是无标签的,组成所述图像数据集合中的测试图像数据集合
Figure BDA00003118355300132
Figure BDA00003118355300133
则为所述训练图像数据集合。
其中,参考图5,其示出了本申提供的一种手写体数字识别装置实施例三的部分结构示意图,其中,所述向量数据转换单元302包括:
第一向量转换子单元321,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合。
第二向量转换子单元322,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合。
向量数据组成子单元323,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
其中,所述向量数据组成子单元323分别与所述第一相连转换子单元321和所述第二向量转换子单元322相连接。
例如,所述图像数据集合{Ii}的向量数据集合中包括训练向量数据集合
Figure BDA00003118355300142
由所述图像数据集合{Ii}中的训练图像数据集合
Figure BDA00003118355300143
进行向量转换得到,所述训练向量数据集合中的每个元素设置有与其各自对应的图像数据相对应的标签;所述图像数据集合{Ii}的向量数据集合中包括测试向量数据集合由所述图像数据集合{Ii}中的测试图像数据集合
Figure BDA00003118355300147
进行向量转换得到。
由于所述向量数据集合包括训练向量数据集合和测试向量数据集合,因此,在对所述向量数据集合依据所述正交匹配追踪算法进行计算最终得到降维向量数据集合后,所述降维向量数据集合中包括与上述训练向量数据集合相对应的降维训练向量数据集合、和与所述测试向量数据集合相对应的降维测试向量数据集合。由上述实施例中描述的,设置有所述标签的降维向量数据为训练图像数据进行向量转换得到的训练向量数据,因此,为了提高降维分类识别的准确率,参考图6,其示出了本申请提供的一种手写体数字识别装置实施例四的部分结构示意图,其中,所述数字图像识别单元304可以包括:
降维向量提取子单元341,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合。
数字图像分类子单元342,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
其中,所述数字图像分类子单元342与所述降维向量提取子单元341相连接。
需要说明的是,所述数字图像分类子单元342中可以采用K近邻分类器对所述降维测试向量数据集合进行分类。
例如,所述降维向量数据集合{Yi}中包括降维训练向量数据集合
Figure BDA00003118355300151
和降维测试向量数据集合由于所述降维训练向量数据集合
Figure BDA00003118355300153
中每个元素均设置有所述标签,由此,提取所述降维向量数据集合{Yi}中没有设置所述标签的元素,即为:提取所述降维测试向量数据集合对所述降维测试向量数据集合
Figure BDA00003118355300155
采用K近邻分类方法进行分类识别,得到所述目标图像中与所述目标数字相对应的数字图像。
另外,在对所述目标图像中与所述目标数字相对应的数字图像进行识别获取之后,可以选择对所述数字图像做进一步处理,其中,参考图7,其示出了本申请提供的一种手写体数字识别装置实施例五的结构示意图,所述装置还包括:
数字图像显示单元305,用于在所述数字图像识别单元304识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
需要说明的是,图7中所示的实施例为基于如图3所示的装置,本申请实施例五中所述数字图像显示单元305同样适用于本申请中其他的装置实施例中。
其中,所述显示设备包括计算机显示器或显示屏幕等显示装置。
需要说明的是,所述数字图像为维数低于所述目标图像的图像,如二维图像或三维图像等,此时,可以依据用户需要将所述数字图像按照其可视化坐标如XY坐标或XYZ坐标显示于计算机屏幕中,提示给用户。
以下对本申请实施例应用于实际实验或应用进行有益效果说明:
本申请应用于MATLAB软件中进行实验,以MNIST手写体数据集为例来阐述本本申请。MNIST手写体数据集为包括0到9十个手写体数字。在本例中,选择相似形状的数字“1”、“3”、“7”、“8”、“9”进行实验,即目标数字为“1”、“3”、“7”、“8”和“9”。
应用本申请对目标图像中的图像数据进行获取,进行向量转换及降维操作,得到三维向量数据,再用K近邻分类器对三维测试向量数据进行分类,得到实验结果:实验中训练集每类个数200,测试集每类个数500.由于样本个数较多,K近邻分类器所应用算法中的参数为11,稀疏度为2。具体的实现流程如下:
1、输入图像数据集合{Ii},其中Ii∈Rm×n是第i个图像数据,m和n表示图像数据的行像素和列像素值,N表示图像数据的总个数。在{Ii}中,前M个是有标签的,即
Figure BDA00003118355300161
li∈{1,…,c}是Ii的标签,c表示所述目标图像中所有图像数据中的类别数;后N-M个是无标签的,称为是测试图像数据集合
Figure BDA00003118355300162
Figure BDA00003118355300163
是训练图像数据集合。
在本实施例中,m=n=28,M=1000,N=3500,c=5。
2、转换所述图像数据集合{Ii}为向量数据集合
Figure BDA00003118355300164
其中xi∈Rmn是对图像数据Ii行拉伸获得的。相对应的,获得训练向量数据集
Figure BDA00003118355300165
和测试向量数据集
Figure BDA00003118355300166
3、对所述向量数据集合X中的每个元素xi获取各自的K近邻点集 X i = { X i 1 , X i 2 , &CenterDot; &CenterDot; &CenterDot; X i K } , 在本实施例中,K=11。
用近邻点集Xi来局部稀疏线性表示xi,即
Figure BDA00003118355300168
其中
Figure BDA000031183553001610
的加权系数,其值用正交匹配追踪算法来求解,所以
Figure BDA000031183553001611
也有可能为零,从而获得局部稀疏性。获得对xi在整个样本集合上的加权系数向量W,其第j个元素为:
W ij = w i j , x j &Element; X i 0 , x j &NotElement; X i
由此,得到加权系数矩阵W=[W,W,…,W]。
4、构造M=(I-W)T(I-W),其中I是单位矩阵,M为中间矩阵,对M进行特征值分解,预设特征值是按照从小到大的顺序排列,令其第j个特征值λj和对应的特征向量为vj。取第2个到第d+1个所对应的特征向量组成降维后的向量数据矩阵Y=[v2,v3,…,vd+1]。xi对应的降维为yi是Y的第i行向量。
在本实施例中,d=3。
5、把降维后的向量数据集合分为降维训练向量数据集合
Figure BDA00003118355300172
和降维测试向量数据集合
Figure BDA00003118355300173
6、对获得的降维测试向量数据集Ytest用K近邻方法分类并将可视化坐标集输出于计算机屏幕上。
本申请的有益效果效果可以通过如下实验验证:
实验中,采用三种方案进行手写体识别率对比,包括原空间(不降维)方案,现有基于最小二乘方法的局部线性嵌入降维方案和本申请方案,分类器均采用K近邻算法。
如下表1中所示,实验给出“1”,“3”,“7”,“8”,“9”这五个手写体数字测试集上的各自的识别率和平均识别率,及运行时间的比较。运行时间即本发明算法时间加K近邻方法分类时间、LLE算法时间加K近邻方法分类时间和原数据K近邻方法分类时间。实验重复二十次,取平均值,实验结果见表1所示。
表1示例实验结果
Figure BDA00003118355300174
通过表1,可以看出本申请可视化后识别率比基于最小二乘方法的局部线性嵌入降维方案可视化后的识别率高,运行时间也比基于最小二乘方法的局部线性嵌入降维方案快。分类速度比原空间方案分类速度快得多,且对手写体“8”的识别率高于原空间中“8”的识别率,“3”的识别率(三维可视化)等于原空间中“3”的识别率。5个数字上的平均识别率稍低于原空间的平均识别率。本实验明显证明本申请有更好的实用价值。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种手写体数字识别方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种手写体数字识别方法,其特征在于,包括:
获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;
利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
2.根据权利要求1所述的方法,其特征在于,所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合,包括:
获取所述向量数据集合中的每个向量数据的K近邻点集,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合。
3.根据权利要求2所述的方法,其特征在于:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合,包括:
对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
4.根据权利要求3所述的方法,其特征在于,所述依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像,包括:
依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
5.根据权利要求1至4任意一项所述的方法,其特征在于,在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后,所述方法还包括:
依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
6.一种手写体数字识别装置,其特征在于,包括:
图像数据获取单元,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;
向量数据转换单元,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合;
向量数据降维单元,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;
数字图像识别单元,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
7.根据权利要求6所述的装置,其特征在于,所述向量数据降维单元包括:
近邻点集获取子单元,用于获取所述向量数据集合中的每个向量数据的K近邻点集,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;
加权系数计算子单元,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;
降维向量计算子单元,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。
8.根据权利要求7所述的装置,其特征在于:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;
其中,所述向量数据转换单元包括:
第一向量转换子单元,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;
第二向量转换子单元,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;
向量数据组成子单元,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
9.根据权利要求8所述的装置,其特征在于,所述数字图像识别单元包括:
降维向量提取子单元,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;
数字图像分类子单元,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中所述目标数字相对应的数字图像。
10.根据权利要求6至9任意一项所述的装置,其特征在于,所述装置还包括:
数字图像显示单元,用于在所述数字图像识别单元识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
CN201310152411.8A 2013-04-27 2013-04-27 一种手写体数字识别方法及装置 Active CN103235947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310152411.8A CN103235947B (zh) 2013-04-27 2013-04-27 一种手写体数字识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310152411.8A CN103235947B (zh) 2013-04-27 2013-04-27 一种手写体数字识别方法及装置

Publications (2)

Publication Number Publication Date
CN103235947A true CN103235947A (zh) 2013-08-07
CN103235947B CN103235947B (zh) 2016-12-07

Family

ID=48883986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310152411.8A Active CN103235947B (zh) 2013-04-27 2013-04-27 一种手写体数字识别方法及装置

Country Status (1)

Country Link
CN (1) CN103235947B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400161A (zh) * 2013-07-18 2013-11-20 苏州大学 一种手写体数字识别方法及系统
CN103440506A (zh) * 2013-08-27 2013-12-11 苏州大学 基于有监督稀疏线性嵌入的手写体数字可视化方法及系统
CN103679207A (zh) * 2014-01-02 2014-03-26 苏州大学 一种手写体数字识别方法及系统
CN105095174A (zh) * 2014-05-14 2015-11-25 联想移动通信软件(武汉)有限公司 一种信息处理方法、装置及终端
CN105740784A (zh) * 2016-01-25 2016-07-06 山东毅康科技股份有限公司 一种基于距离优化降维的手写字体识别系统
CN106216279A (zh) * 2016-08-03 2016-12-14 南京键通电子商务有限公司 一种密码覆膜卡刮卡及信息识别系统
CN108304357A (zh) * 2018-01-31 2018-07-20 北京大学 一种基于字体流形的中文字库自动生成方法
CN109033415A (zh) * 2018-08-06 2018-12-18 浙江大学 一种基于拉普拉斯特征映射的多维神经信号的降维和可视化方法
CN113903043A (zh) * 2021-12-11 2022-01-07 绵阳职业技术学院 一种基于孪生度量模型的印刷汉字字体识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520847A (zh) * 2008-02-29 2009-09-02 富士通株式会社 模式识别装置和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520847A (zh) * 2008-02-29 2009-09-02 富士通株式会社 模式识别装置和方法
JP2009211693A (ja) * 2008-02-29 2009-09-17 Fujitsu Ltd パターン識別装置およびパターン識別方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨晓敏 等: "一种基于流形学习的手写体数字识别", 《光电子激光》 *
蔡体健 等: "基于稀疏表示的高噪声人脸识别及算法优化", 《计算机应用》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400161A (zh) * 2013-07-18 2013-11-20 苏州大学 一种手写体数字识别方法及系统
CN103440506A (zh) * 2013-08-27 2013-12-11 苏州大学 基于有监督稀疏线性嵌入的手写体数字可视化方法及系统
CN103679207A (zh) * 2014-01-02 2014-03-26 苏州大学 一种手写体数字识别方法及系统
CN105095174A (zh) * 2014-05-14 2015-11-25 联想移动通信软件(武汉)有限公司 一种信息处理方法、装置及终端
CN105740784A (zh) * 2016-01-25 2016-07-06 山东毅康科技股份有限公司 一种基于距离优化降维的手写字体识别系统
CN105740784B (zh) * 2016-01-25 2019-01-08 毅康科技有限公司 一种基于距离优化降维的手写字体识别系统
CN106216279A (zh) * 2016-08-03 2016-12-14 南京键通电子商务有限公司 一种密码覆膜卡刮卡及信息识别系统
CN108304357A (zh) * 2018-01-31 2018-07-20 北京大学 一种基于字体流形的中文字库自动生成方法
CN108304357B (zh) * 2018-01-31 2020-09-08 北京大学 一种基于字体流形的中文字库自动生成方法
CN109033415A (zh) * 2018-08-06 2018-12-18 浙江大学 一种基于拉普拉斯特征映射的多维神经信号的降维和可视化方法
CN113903043A (zh) * 2021-12-11 2022-01-07 绵阳职业技术学院 一种基于孪生度量模型的印刷汉字字体识别方法

Also Published As

Publication number Publication date
CN103235947B (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN103235947A (zh) 一种手写体数字识别方法及装置
Zhang et al. A review of deep learning-based semantic segmentation for point cloud
Bell et al. Material recognition in the wild with the materials in context database
CN109993748B (zh) 一种基于点云处理网络的三维网格物体分割方法
CN110738207A (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN105608454B (zh) 基于文字结构部件检测神经网络的文字检测方法及系统
CN105069811B (zh) 一种多时相遥感图像变化检测方法
CN107256246A (zh) 基于卷积神经网络的印花织物图像检索方法
CN113239954B (zh) 基于注意力机制的图像语义分割特征融合方法
CN107169485A (zh) 一种数学公式识别方法和装置
CN108830312B (zh) 一种基于样本自适应扩充的集成学习方法
Cheng et al. Supermatching: Feature matching using supersymmetric geometric constraints
CN106257496B (zh) 海量网络文本与非文本图像分类方法
CN109409384A (zh) 基于细粒度图像的图像识别方法、装置、介质及设备
CN105354593B (zh) 一种基于nmf的三维模型分类方法
CN108268527B (zh) 一种检测土地利用类型变化的方法
CN104778476A (zh) 一种图像分类方法
CN103106265A (zh) 相似图像分类方法及系统
CN103646256A (zh) 一种基于图像特征稀疏重构的图像分类方法
CN106650811A (zh) 一种基于近邻协同增强的高光谱混合像元分类方法
CN105718934A (zh) 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法
CN103226825A (zh) 基于低秩稀疏模型的遥感图像变化检测方法
CN103235945A (zh) 一种基于Android系统的手写数学公式识别及生成MathML的方法
CN105069133B (zh) 一种基于未标记数据的数字图像分类方法
CN103258211A (zh) 一种手写体数字识别方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant