CN103235947A

CN103235947A - 一种手写体数字识别方法及装置

Info

Publication number: CN103235947A
Application number: CN2013101524118A
Authority: CN
Inventors: 张莉; 冷亦琴; 王邦军; 何书萍; 包兴; 杨季文; 李凡长
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2013-04-27
Filing date: 2013-04-27
Publication date: 2013-08-07
Anticipated expiration: 2033-04-27
Also published as: CN103235947B

Abstract

本申请公开了一种手写体数字识别方法及装置，所述方法包括获取待识别的目标数字和目标图像中的图像数据集合，所述图像数据集合中包括至少一个图像数据；对所述图像数据集合中的每个图像数据进行向量转换，得到每个所述图像数据对应的向量数据，所有所述向量数据组成向量数据集合；利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合；依据所述降维向量数据集合，识别得到所述目标图像中与所述目标数字相对应的数字图像。通过本申请实施例中正交匹配追踪算法得到的计算解并非全部为0，相对于现有技术能够明显体现出局部稀疏性，且具有稳定性，进而使得最终识别出的数字图像准确率较高。

Description

一种手写体数字识别方法及装置

技术领域

本申请涉及计算机应用技术领域，特别涉及一种手写体数字识别方法及装置。

背景技术

手写体数字识别技术在实际生活中越来越收到重视，手写体数字识别技术是指：对于目标图像中的图像数据进行获取之后，依据获取的图像数据识别出目标图像中与目标数字相同的数字。由于获取到的图像数据均为高维空间数据，因此，在进行目标数字识别之前，首先对其空间进行降维处理。例如，现有的手写体数字识别方案中，通常采用基于最小二乘算法的局部稀疏线性嵌入降维方法对高维图像数据对应的向量数据进行降维，进而对降维后的向量数据采用K近邻方法进行分类，得到降维后的与目标数字相对应的数字图像。

但上述方案中，由于最小二乘方法的计算解均不为0，无法达到有效的稀疏效果，且具有不稳定性，使得降维后的向量数据进行K近邻方法分类时的分类效果较差，进而使得最终识别出的数字图像不准确。

发明内容

本申请所要解决的技术问题是提供一种手写体数字识别方法及装置，用以解决现有数字识别方案中无法达到有效的稀疏效果且不具有不稳定性，使得数字识别的准确率较低的技术问题。

本申请提供了一种手写体数字识别方法，包括：

获取待识别的目标数字和目标图像中的图像数据集合，所述图像数据集合中包括至少一个图像数据；

对所述图像数据集合中的每个图像数据进行向量转换，得到每个所述图像数据对应的向量数据，所有所述向量数据组成向量数据集合；

利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合；

依据所述降维向量数据集合，识别得到所述目标图像中与所述目标数字相对应的数字图像。

上述方法，优选的，所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合，包括：

获取所述向量数据集合中的每个向量数据的K近邻点集，每个所述K近邻点集中包括K个近邻向量数据，每个所述近邻向量数据与其所属向量数据在空间位置上相邻，K大于或等于1，且K小于所述向量数据集合中向量数据的总数；

利用正交匹配追踪算法对每个所述K近邻点集进行计算，得到所述向量数据集合的加权系数向量；

利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合。

上述方法，优选的：

所述图像数据集合包括测试图像数据集合和训练图像数据集合，所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签；

其中，对所述图像数据集合中的每个图像数据进行向量转换，得到每个所述图像数据对应的向量数据，每个所述向量数据组成向量数据集合，包括：

对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换，得到每个所述测试图像数据对应的测试向量数据，组成测试向量数据集合；

并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换，得到每个所述训练图像数据对应的训练向量数据，组成训练向量数据集合；

所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。

上述方法，优选的，所述依据所述降维向量数据集合，识别得到所述目标图像中与所述目标数字相对应的数字图像，包括：

依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则，提取所述降维向量数据集合中的降维测试向量数据集合；

对所述降维测试向量数据集合采用K近邻分类方法进行分类，识别得到所述目标图像中与所述目标数字相对应的数字图像。

上述方法，优选的，在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后，所述方法还包括：

依据所述数字图像的可视化坐标，将所述数字图像显示于显示设备上。

本申请还提供了一种手写体数字识别装置，包括：

图像数据获取单元，用于获取待识别的目标数字和目标图像中的图像数据集合，所述图像数据集合中包括至少一个图像数据；

向量数据转换单元，用于对所述图像数据集合中的每个所述图像数据进行向量转换，得到每个所述图像数据对应的向量数据，每个所述向量数据组成向量数据集合；

向量数据降维单元，用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合；

数字图像识别单元，用于依据所述降维向量数据集合，识别得到所述目标图像中与所述目标数字相对应的数字图像。

上述装置，优选的，所述向量数据降维单元包括：

近邻点集获取子单元，用于获取所述向量数据集合中的每个向量数据的K近邻点集，所述K近邻点集中包括K个近邻向量数据，每个所述近邻向量数据与所述向量数据在空间位置上相邻，K大于或等于1，且K小于所述向量数据集合中向量数据的总数；

加权系数计算子单元，用于利用正交匹配追踪算法对每个所述K近邻点集进行计算，得到所述向量数据集合的加权系数向量；

降维向量计算子单元，用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。

上述装置，优选的：

其中，所述向量数据转换单元包括：

第一向量转换子单元，用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换，得到每个所述测试图像数据对应的测试向量数据，组成测试向量数据集合；

第二向量转换子单元，用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换，得到每个所述训练图像数据对应的训练向量数据，组成训练向量数据集合；

向量数据组成子单元，用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。

上述装置，优选的，所述数字图像识别单元包括：

降维向量提取子单元，用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则，提取所述降维向量数据集合中的降维测试向量数据集合；

数字图像分类子单元，用于对所述降维测试向量数据集合采用K近邻分类方法进行分类，识别得到所述目标图像中所述目标数字相对应的数字图像。

上述装置，优选的，所述装置还包括：

数字图像显示单元，用于在所述数字图像识别单元识别得到数字图像之后，依据所述数字图像的可视化坐标，将所述数字图像显示于显示设备上。

由上述方案可知，本申请提供的一种手写体数字识别方法及装置，通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作，得到降维向量数据，进而对降维向量数据集合进行识别，得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中，由于正交匹配追踪算法得到的计算解并非全部为0，因此，使得本申请得到的计算解能够明显体现出局部稀疏性，且基于正交匹配追踪算法的计算解具有稳定性，使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法，进而使得最终识别出的数字图像准确率较高。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的一种手写体数字识别方法实施例一的流程图；

图2为本申请实施例一的另一部分流程图；

图3为本申请提供的一种手写体数字识别装置实施例二的结构示意图；

图4为本申请实施例二的部分结构示意图;

图5为本申提供的一种手写体数字识别装置实施例三的部分结构示意图；

图6为本申请提供的一种手写体数字识别装置实施例四的部分结构示意图；

图7为本申请提供的一种手写体数字识别装置实施例五的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着科技的发展，手写体数字识别是文字识别中的一个重要研究课题，在实际生活中有深远的应用需求，一直得到广泛的重视。近年来随着计算机技术和数字图像处理技术的飞速发展，数字识别在电子商务、机器自动输入等场合已经获得成功的实际应用，例如，对手写体的邮政编码的扫描识别等应用。对于手写体数字识别，目前已经发展了很多种方法，典型的方法有基于K近邻分类（KNN）的方法、基于神经网络的算法、基于笔划特征的算法、基于遗传算法、基于小波变换算法、基于傅立叶变换算法、基于支持向量机算法和基于模板匹配算法等等。手写体数字识变体极多，对各类字体的数字识别特别是脱机手写数字识别仍然处于在发展阶段，识别效果仍然不够理想。因此，研究简单高效的手写数字识别依然是一个重要的研究方向。

目前，常用的手写体数字识别方法为K近邻分类，它是一种简单直观的识别方法，思想简单并且分类效果好，在类别分类的时候，影响分类的结果只与少量的最相似样本相关，所以，K近邻分类算法可以有效的避免样本分布不平衡带来的影响。但是K近邻分类需要全部样本，计算工作量较大，而且手写体数字是高维数据，如果直接对其识别，不仅时间计算复杂度大，而且不便于可视化观察分析。因而，常将手写体数字进行降维后再识别。能够降维且将数据可视化的方法较多，目前流形学习是非常引人瞩目一类方法，包括局部线性嵌入(LLE)、等距映射(Isomap)、拉普拉斯特征映射(Laplacian Eigenmap)等。局部线性嵌入方法是一种无参数、非迭代的算法，易实现，并且无需求解全局最小值，计算量较小。常用的局部线性嵌入方法中采用了最小二乘方法求解数据的局部线性表示系数。但是最小二乘方法的解是不稳定且不稀疏，所以容易导致降维后数据的分类效果不好。

参考图1，其示出了本申请提供的一种手写体数字识别方法实施例一的流程图，所述方法可以包括以下步骤：

步骤101：获取待识别的目标数字和目标图像中的图像数据集合，所述图像数据集合中包括至少一个图像数据。

其中，所述待识别的目标数字包括0至9之间的任意一个或任意组合的数字，如1，或7和3，或8和9等。本申请要实现的目的，即为在目标图像中的高维图像数据中识别出上述目标数字中的各个数字，得到数字图像。

例如，所述目标图像中，m和n分别表示所述目标图像的行像素数值和列像素数值，N为所述目标图像中所有图像数据的总个数，所述图像数据集合可以用{I_i}表示，其中，i>=1，且i<=N。

步骤102：对所述图像数据集合中的每个图像数据进行向量转换，得到每个所述图像数据对应的向量数据，所有所述向量数据组成向量数据集合。

例如，对所述图像数据集合{I_i}中每个图像数据I_i进行向量转换，得到每个所述图像数据对应的向量数据X_i，所有所述向量数据X_i组成所述图像数据集合的向量数据集合，所述向量数据集合

中包括N个向量数据。

其中，每个所述向量数据X_i可以通过对所述图像数据I_i行进行拉伸获得。

步骤103：利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合。

其中，参考图2，其示出了本申请实施例一的另一部分流程图，所述步骤103可以通过以下各个步骤实现：

步骤201：获取所述向量数据集合中的每个向量数据的K近邻点集。

其中，每个所述K近邻点集中包括K个近邻向量数据，每个所述近邻向量数据与其所属向量数据在空间位置上相邻，K大于或等于1，且K小于所述向量数据集合中向量数据的总数。

例如，每个所述向量数据X_i的K近邻点集

步骤202：利用正交匹配追踪算法对每个所述K近邻点集进行计算，得到所述向量数据集合的加权系数向量。

其中，所述步骤202可以通过以下方式实现：

利用

及每个所述向量数据的K近邻点集

中的每个近邻向量数据

计算每个所述近邻向量数据

的加权系数

所有所述加权系数

在空间上组成整个向量数据集合的加权系数向量W_i·,其中，所述加权系数向量W_i·中第j个元素W_ij为：

W_{ij} = \{\begin{matrix} w_{i}^{j}, & x_{j} &Element; X^{i} \\ 0, & x_{j} &NotElement; X^{i} \end{matrix}

步骤203：利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算，得到降维向量数据集合。

其中，所述步骤202中计算的到的所述加权系数向量W_i.用矩阵形式表示可以为：W＝[W_1·,W_2·,…,W_N·]。所述步骤203可以通过以下方式具体实现：

构造M=(I-W)^T(I-W)，其中，I为单位矩阵，M为中间矩阵；

预先设定M中的特征值按照由小到大的顺序排列，对M进行特征值分解，令第j个特征值对应λ_j和对应的特征向量为v_j；

提取所述经过特征值分解的M第2个到第d+1个所对应的特征向量，组成降维后的向量数据矩阵Y=[v₂,v₃,…,v_d+1]，其中，d为降维后的维数，为预先设置；

所述向量数据矩阵Y=[v₂,v₃,…,v_d+1]即为所述降维向量数据集合，其中，y_i是Y的第i行向量，为x_i对应的降维向量。

步骤104：依据所述降维向量数据集合，识别得到所述目标图像中与是目标数字相对应的数字图像。

其中，原始的图像数据为高维图像数据，通过上述向量转换及降维操作之后得到的向量数据维数明显低于原始数据，在进行所述步骤104中的分类识别等操作时，所耗费的时间及计算资源明显减少，同时达到识别出用户所需要维数的数字图像。

由上述方案可知，本申请提供的一种手写体数字识别方法实施例一，通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作，得到降维向量数据，进而对降维向量数据集合进行识别，得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中，由于正交匹配追踪算法得到的计算解并非全部为0，因此，使得本申请得到的计算解能够明显体现出局部稀疏性，且基于正交匹配追踪算法的计算解具有稳定性，使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法，进而使得最终识别出的数字图像准确率较高。

其中，上述实施例中，所述图像数据集合中包括测试图像数据集合和训练图像数据集合，所述测试图像数据集合中包括至少一个图像数据，，所述训练图像数据集合中包括至少一个图像数据，且所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签。

例如，在所述图像数据集合{I_i}中的前M个图像数据设置有标签，即

其中，l_i∈{1,…,c}是I_i的对应标签，c表示所述图像数据集合中所有图像数据的待识别数字的类别数；后N-M个是无标签的，组成所述图像数据集合中的测试图像数据集合而则为所述训练图像数据集合。

其中，上述实施例中，所述步骤102可以理解为：

同时，对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换，得到每个所述训练图像数据对应的训练向量数据，组成训练向量数据集合；

例如，所述图像数据集合{I_i}的向量数据集合中包括训练向量数据集合

由所述图像数据集合{I_i}中的训练图像数据集合

进行向量转换得到，所述训练向量数据集合

中的每个元素设置有与其各自对应的图像数据相对应的标签；所述图像数据集合{I_i}的向量数据集合

中包括测试向量数据集合

由所述图像数据集合{I_i}中的测试图像数据集合

进行向量转换得到。

由于所述向量数据集合包括训练向量数据集合和测试向量数据集合，因此，在对所述向量数据集合依据所述正交匹配追踪算法进行计算最终得到降维向量数据集合后，所述降维向量数据集合中包括与上述训练向量数据集合相对应的降维训练向量数据集合、和与所述测试向量数据集合相对应的降维测试向量数据集合。由上述实施例中描述的，设置有所述标签的降维向量数据为训练图像数据进行向量转换得到的训练向量数据，因此，为了提高降维分类识别的准确率，所述步骤104可以通过以下方式实现：

例如，所述降维向量数据集合{Y_i}中包括降维训练向量数据集合

和降维测试向量数据集合

由于所述降维训练向量数据集合

中每个元素均设置有所述标签，由此，提取所述降维向量数据集合{Y_i}中没有设置所述标签的元素，即为：提取所述降维测试向量数据集合

对所述降维测试向量数据集合

采用K近邻分类方法进行分类识别，得到所述目标图像中与所述目标数字相对应的数字图像。

另外，在对所述目标图像中与所述目标数字相对应的数字图像进行识别获取之后，可以选择对所述数字图像做进一步处理，其中，在所述步骤104之后，所述方法还包括以下步骤：

其中，所述显示设备包括计算机显示器或显示屏幕等显示装置。

需要说明的是，所述数字图像为维数低于所述目标图像的图像，如二维图像或三维图像等，此时，可以依据用户需要将所述数字图像按照其可视化坐标如XY坐标或XYZ坐标显示于计算机屏幕中，提示给用户。

参考图3，其示出了本申请提供的一种手写体数字识别装置实施例二的结构示意图，所述装置包括：

图像数据获取单元301，用于获取待识别的目标数字和目标图像中的图像数据集合，所述图像数据集合中包括至少一个图像数据。

向量数据转换单元302，用于对所述图像数据集合中的每个所述图像数据进行向量转换，得到每个所述图像数据对应的向量数据，每个所述向量数据组成向量数据集合。

需要说明的是，所述向量数据转换单元302与所述图像数据获取单元301相连接。

例如，对所述图像数据集合{I_i}中每个图像数据I_i进行向量转换，得到每个所述图像数据对应的向量数据X_i，所有所述向量数据X_i组成所述图像数据集合的向量数据集合，所述向量数据集合中包括N个向量数据。

向量数据降维单元303，用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合。

需要说明的是，所述向量数据降维单元303与所述向量数据转换单元302相连接。

参考图4，其示出了本申请实施例二的部分结构示意图，所述向量数据降维单元303包括：

近邻点集获取子单元331，用于获取所述向量数据集合中的每个向量数据的K近邻点集。

其中，所述K近邻点集中包括K个近邻向量数据，每个所述近邻向量数据与所述向量数据在空间位置上相邻，K大于或等于1，且K小于所述向量数据集合中向量数据的总数。

例如，每个所述向量数据X_i的K近邻点集

加权系数计算子单元332，用于利用正交匹配追踪算法对每个所述K近邻点集进行计算，得到所述向量数据集合的加权系数向量。

需要说明的是，所述加权系数计算子单元332与所述近邻点集获取子单元331相连接。

其中，所述加权系数计算子单元332可以通过以下方式实现其功能：

利用

及每个所述向量数据的K近邻点集

中的每个近邻向量数据计算每个所述近邻向量数据

的加权系数

所有所述加权系数

W_{ij} = \{\begin{matrix} w_{i}^{j}, & x_{j} &Element; X^{i} \\ 0, & x_{j} &NotElement; X^{i} \end{matrix}

降维向量计算子单元333，用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。

需要说明的是，所述降维向量计算子单元333与所述加权系数计算子单元332相连接。

其中，所述加权系数计算子单元332中计算的到的所述加权系数向量W_i·用矩阵形式表示可以为：W=[W_1·,W_2·,…,W_N·]。所述步骤降维向量计算子单元333可以通过以下方式具体实现其功能：

构造M=(I-W)^T(I-W)，其中，I为单位矩阵，M为中间矩阵；

数字图像识别单元304，用于依据所述降维向量数据集合，识别得到所述目标图像中与所述目标数字相对应的数字图像。

需要说明的是，所述数字图像识别单元与所述向量数据降维单元303相连接。

其中，原始的图像数据为高维图像数据，通过上述向量转换及降维操作之后得到的向量数据维数明显低于原始数据，在所述数字图像识别单元304进行分类识别等操作时，所耗费的时间及计算资源明显减少，同时达到识别出用户所需要维数的数字图像。

由上述方案可知，本申请提供的一种手写体数字识别装置实施例二，通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作，得到降维向量数据，进而对降维向量数据集合进行识别，得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中，由于正交匹配追踪算法得到的计算解并非全部为0，因此，使得本申请得到的计算解能够明显体现出局部稀疏性，且基于正交匹配追踪算法的计算解具有稳定性，使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法，进而使得最终识别出的数字图像准确率较高。

其中，l_i∈{1,…,c}是I_i的对应标签，c表示所述图像数据集合中所有图像数据的待识别数字的类别数；后N-M个是无标签的，组成所述图像数据集合中的测试图像数据集合

而

则为所述训练图像数据集合。

其中，参考图5，其示出了本申提供的一种手写体数字识别装置实施例三的部分结构示意图，其中，所述向量数据转换单元302包括：

第一向量转换子单元321，用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换，得到每个所述测试图像数据对应的测试向量数据，组成测试向量数据集合。

第二向量转换子单元322，用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换，得到每个所述训练图像数据对应的训练向量数据，组成训练向量数据集合。

向量数据组成子单元323，用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。

其中，所述向量数据组成子单元323分别与所述第一相连转换子单元321和所述第二向量转换子单元322相连接。

由所述图像数据集合{I_i}中的训练图像数据集合

进行向量转换得到，所述训练向量数据集合中的每个元素设置有与其各自对应的图像数据相对应的标签；所述图像数据集合{I_i}的向量数据集合中包括测试向量数据集合由所述图像数据集合{I_i}中的测试图像数据集合

进行向量转换得到。

由于所述向量数据集合包括训练向量数据集合和测试向量数据集合，因此，在对所述向量数据集合依据所述正交匹配追踪算法进行计算最终得到降维向量数据集合后，所述降维向量数据集合中包括与上述训练向量数据集合相对应的降维训练向量数据集合、和与所述测试向量数据集合相对应的降维测试向量数据集合。由上述实施例中描述的，设置有所述标签的降维向量数据为训练图像数据进行向量转换得到的训练向量数据，因此，为了提高降维分类识别的准确率，参考图6，其示出了本申请提供的一种手写体数字识别装置实施例四的部分结构示意图，其中，所述数字图像识别单元304可以包括：

降维向量提取子单元341，用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则，提取所述降维向量数据集合中的降维测试向量数据集合。

数字图像分类子单元342，用于对所述降维测试向量数据集合采用K近邻分类方法进行分类，识别得到所述目标图像中与所述目标数字相对应的数字图像。

其中，所述数字图像分类子单元342与所述降维向量提取子单元341相连接。

需要说明的是，所述数字图像分类子单元342中可以采用K近邻分类器对所述降维测试向量数据集合进行分类。

和降维测试向量数据集合由于所述降维训练向量数据集合

中每个元素均设置有所述标签，由此，提取所述降维向量数据集合{Y_i}中没有设置所述标签的元素，即为：提取所述降维测试向量数据集合对所述降维测试向量数据集合

另外，在对所述目标图像中与所述目标数字相对应的数字图像进行识别获取之后，可以选择对所述数字图像做进一步处理，其中，参考图7，其示出了本申请提供的一种手写体数字识别装置实施例五的结构示意图，所述装置还包括：

数字图像显示单元305，用于在所述数字图像识别单元304识别得到数字图像之后，依据所述数字图像的可视化坐标，将所述数字图像显示于显示设备上。

需要说明的是，图7中所示的实施例为基于如图3所示的装置，本申请实施例五中所述数字图像显示单元305同样适用于本申请中其他的装置实施例中。

以下对本申请实施例应用于实际实验或应用进行有益效果说明：

本申请应用于MATLAB软件中进行实验，以MNIST手写体数据集为例来阐述本本申请。MNIST手写体数据集为包括0到9十个手写体数字。在本例中，选择相似形状的数字“1”、“3”、“7”、“8”、“9”进行实验，即目标数字为“1”、“3”、“7”、“8”和“9”。

应用本申请对目标图像中的图像数据进行获取，进行向量转换及降维操作，得到三维向量数据，再用K近邻分类器对三维测试向量数据进行分类，得到实验结果：实验中训练集每类个数200，测试集每类个数500.由于样本个数较多，K近邻分类器所应用算法中的参数为11，稀疏度为2。具体的实现流程如下：

1、输入图像数据集合{I_i}，其中I_i∈R^m×n是第i个图像数据，m和n表示图像数据的行像素和列像素值，N表示图像数据的总个数。在{I_i}中，前M个是有标签的，即

l_i∈{1,…,c}是I_i的标签，c表示所述目标图像中所有图像数据中的类别数；后N-M个是无标签的，称为是测试图像数据集合

而

是训练图像数据集合。

在本实施例中，m＝n＝28，M＝1000，N＝3500，c＝5。

2、转换所述图像数据集合{I_i}为向量数据集合

其中x_i∈R^mn是对图像数据I_i行拉伸获得的。相对应的，获得训练向量数据集

和测试向量数据集

3、对所述向量数据集合X中的每个元素x_i获取各自的K近邻点集

X^{i} = {X_{i}^{1}, X_{i}^{2}, \cdot \cdot \cdot X_{i}^{K}},

在本实施例中，K＝11。

用近邻点集Xⁱ来局部稀疏线性表示x_i，即

其中是

的加权系数，其值用正交匹配追踪算法来求解，所以

也有可能为零，从而获得局部稀疏性。获得对x_i在整个样本集合上的加权系数向量W_i·，其第j个元素为：

W_{ij} = \{\begin{matrix} w_{i}^{j}, & x_{j} &Element; X^{i} \\ 0, & x_{j} &NotElement; X^{i} \end{matrix}

由此，得到加权系数矩阵W＝[W_1·,W_2·,…,W_N·]。

4、构造M＝(I-W)^T(I-W)，其中I是单位矩阵，M为中间矩阵，对M进行特征值分解，预设特征值是按照从小到大的顺序排列，令其第j个特征值λ_j和对应的特征向量为v_j。取第2个到第d+1个所对应的特征向量组成降维后的向量数据矩阵Y＝[v₂,v₃,…,v_d+1]。x_i对应的降维为y_i是Y的第i行向量。

在本实施例中，d＝3。

5、把降维后的向量数据集合分为降维训练向量数据集合

和降维测试向量数据集合

6、对获得的降维测试向量数据集Y_test用K近邻方法分类并将可视化坐标集输出于计算机屏幕上。

本申请的有益效果效果可以通过如下实验验证：

实验中，采用三种方案进行手写体识别率对比，包括原空间(不降维)方案，现有基于最小二乘方法的局部线性嵌入降维方案和本申请方案,分类器均采用K近邻算法。

如下表1中所示，实验给出“1”，“3”，“7”，“8”，“9”这五个手写体数字测试集上的各自的识别率和平均识别率，及运行时间的比较。运行时间即本发明算法时间加K近邻方法分类时间、LLE算法时间加K近邻方法分类时间和原数据K近邻方法分类时间。实验重复二十次，取平均值，实验结果见表1所示。

表1示例实验结果

通过表1，可以看出本申请可视化后识别率比基于最小二乘方法的局部线性嵌入降维方案可视化后的识别率高，运行时间也比基于最小二乘方法的局部线性嵌入降维方案快。分类速度比原空间方案分类速度快得多，且对手写体“8”的识别率高于原空间中“8”的识别率，“3”的识别率（三维可视化）等于原空间中“3”的识别率。5个数字上的平均识别率稍低于原空间的平均识别率。本实验明显证明本申请有更好的实用价值。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种手写体数字识别方法及装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种手写体数字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作，得到降维向量数据集合，包括：

3.根据权利要求2所述的方法，其特征在于：

4.根据权利要求3所述的方法，其特征在于，所述依据所述降维向量数据集合，识别得到所述目标图像中与所述目标数字相对应的数字图像，包括：

5.根据权利要求1至4任意一项所述的方法，其特征在于，在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后，所述方法还包括：

6.一种手写体数字识别装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述向量数据降维单元包括：

8.根据权利要求7所述的装置，其特征在于：

其中，所述向量数据转换单元包括：

9.根据权利要求8所述的装置，其特征在于，所述数字图像识别单元包括：

10.根据权利要求6至9任意一项所述的装置，其特征在于，所述装置还包括：