CN101458767A

CN101458767A - 试卷卷面手写体分数识别方法

Info

Publication number: CN101458767A
Application number: CNA2009100448248A
Authority: CN
Inventors: 冯运亮; 薛雷; 罗珍茜; 彭之威; 孙峰杰
Original assignee: University of Shanghai for Science and Technology
Current assignee: Haian Su Fu Technology Transfer Center Co., Ltd.
Priority date: 2009-01-04
Filing date: 2009-01-04
Publication date: 2009-06-17
Anticipated expiration: 2029-01-04
Also published as: CN101458767B

Abstract

本发明涉及一种试卷卷面手写体分数识别方法。本发明的方法是通过摄像头获取实时试卷卷面图象，经过预处理后，提取出卷面中手写体数字的骨架结构特征，然后结合手写体数字端点的位置关系进行手写体数字识别。本发明的试卷卷面手写体分数识别方法，利用了数字骨架的结构特征，并在识别过程中有效地结合了几何和结构的知识，使得该方法在识别过程中不需要大量的训练样本，识别速度快，可靠性好，识别率高。本发明的方法易于实现，能对试卷卷面手写体分数进行准确、高效的识别，满足实际运用的要求。

Description

试卷卷面手写体分数识别方法

技术领域：

本发明涉及的是一种手写体数字识别的方法，具体是一种识别试卷卷面手写体分数的方法。

背景技术：

在教学过程中，试卷作为一种重要的教学评估手段广泛的应用于各类学校中，然而教师需要花费大量的时间对试卷卷面分数进行处理和统计。如何对如此大量的试卷中的手写体分数进行自动识别和统计处理，是目前面临的难题。因此，试卷卷面手写体数字的识别具有很大的研究价值和应用前景。

经过对现有技术的总结发现，手写体数字的识别的方法主要有两种：基于结构特征的方法和基于统计特征的方法。前者是利用手写数字骨架的结构特征如：圈、端点、交叉点、轮廓进行识别，该方法能够精确的描述数字的结构特征，对书写较规范的数字有较高的识别率，但是该方法比较复杂；后者利用手写数字的统计特征如：密度、矩、特征区域进行识别，该方法中的手写数字的统计特征比较容易获得，能够准确的描述一类模式的结构特征，但由于手写数字的任意性，变化多样，只有在样本的一致性较好的情况下，才能获得较高的识别率。

发明内容：

本发明的目的在于克服现有技术的不足，提供一种识别率高、易于实现的试卷卷面手写体分数识别方法，满足教学的需要。

为了达到上述目的，本发明的构思是：

利用手写数字的端点和交叉点的个数对手写数字进行初次分类；经过上述分类的数字，再结合手写数字的端点位置关系进行判别，最终达到识别的目的。

本发明运用图像处理算法对试卷卷面手写分数进行识别，利用了手写数字骨架的结构特征的同时，结合了几何和结构的知识，有效的减少了算法的复杂度，并且在识别过程中不需要大量的训练样本。这样使得该方法容易实现，并具有较高的可靠性和识别率。

根据上述的发明构思，本发明是采用以下技术方案来实现的：

一种试卷卷面手写体分数识别方法，其特征在于通过摄像头获取实时试卷卷面图像，经过预处理后，提取出试卷卷面中手写数字的骨架结构特征，然后结合手写体数字端点的位置关系对手写数字进行识别，其识别是通过数字骨架特征的提取和骨架位置关系的判定来实现；其具体操作步骤如下：

(1)数字骨架特征提取的步骤

①输入样本：将试卷卷面图象由摄像头和图象采集卡经模数转换后输入计算机；

②预处理：计算机对得到的实时试卷图象进行灰度化、二值化、平滑去噪、字符分割、归一化、倾斜校正、重排、数字骨架细化等处理；

③数字骨架特征提取：对试卷卷面图象中的分数进行特征提取，提取出手写数字的端点和交叉点两个特征，并记录下端点和交叉点的个数，同时保存端点的坐标；

(2)骨架位置关系判断的步骤

①主要位置关系计算：计算骨架端点的连线在水平坐标轴上倾斜角度的三角正切值；

②次要位置关系计算：计算端点间的距离与整个数字高度的比值；

③根据上述两种位置关系的计算结合数字骨架的特征来识别手写数字。

在数字骨架特征提取阶段，在待识别数字的特定区域中，采用模板匹配法在区域内进行搜索，最终提取出数字骨架的端点和交叉点数目，同时记录下端点在识别区域中的坐标位置。根据提取出的骨架特征，对数字进行分类，对于分类的结果，然后再根据端点位置关系来判别。最后分析前面两个阶段的结果，最终达到手写数字识别的目的。

以下对本发明的方法作进一步的说明：

所述的试卷卷面图象，是利用摄像头实时采集的，因此图象受到噪声和外界因素的影响，在进行骨架特征提取前，一般来说要对图象进行预处理。对试卷卷面图象的预处理包括以下过程：灰度化、二值化、平滑去噪、归一化、数字分割、倾斜校正和骨架细化。由于本方法要对数字骨架的特征进行特征提取，因此骨架细化的很必要的，在本方法中采用的是并行细化算法，该细化方法具有很好的实用性，获取的图像骨架避免了过度腐蚀，并且还具有良好的连通性。同时，还对细化后的图象进行了骨架优化，本发明采用3×3的模板对细化后的图象枝头进行了一个象素级的删除，进行了短枝处理。这样优化了数字骨架图象的质量，为下一步的骨架特征提取打下了良好的基础。

所述的手写数字骨架特征提取，本发明采用的是局部特征提取方法：在特定的识别区域内，运用符合特征的模板进行搜索，最终提取出数字骨架的特征。为了取得更好的运算效率，在本发明中，提取的是数字骨架的特征有：端点和交叉点。

所述的数字骨架的端点位置关系，对提取出来的端点特征，需要对其位置关系进行定义。在本发明中根据端点的不同位置我们把端点分为两种不同的位置关系。定义为：

(1)两个端点的连线在水平坐标轴上倾斜角度的三角正切值，称为主要端点位置关系，简称主要关系。

(2)两个端点间的距离与整个数字高度的比值，称为次要端点位置关系，简称次要关系。

像素点在图像中坐标为(x，y)。两个端点的连线用数学斜率正切公式可以表示为：

tan a＝(y₁-y₂)/(x₁-x₂) (1)

其中，tan a为斜率，即两个端点的连线在水平坐标轴上倾斜角度；(x₁，y₁)，(x₂，y₂)分别为两个端点在图像中的坐标位置。按式(1)进行计算即可获得主要端点位置关系。

对于次要端点位置关系可以利用式(2)进行计算获得。

h₁＝(y₂-y₁)/(MAX_width-MIN_width) (2)

其中，h₁为次要端点位置关系；y₂，y₁分别为端点的纵坐标，设y₁<y₂；MAX_width，MIN_width分别为数字的最高点和最低点的纵坐标。

当待识别数字仅有一个端点时，端点的位置关系可以利用式(3)进行计算获得。

h₂＝(y₁-MIN_width)/(MAX_width-MIN_width) (3)

其中，h₂为端点位置关系，y₁为该图像唯一端点的纵坐标，MAX_width，MIN_width分别为数字的最高点和最低点的纵坐标。由于端点的坐标在端点特征提取的时候已经得到，因此可以直接使用，不需要进行重复计算。这样再通过端点和交叉点的个数进行初步分类后，再通过端点的位置关系就能够很好的实现手写数字识别的目的。

本发明的方法利用了数字骨架的结构特征，并在识别过程中有效地结合了几何和结构的知识，并且在此基础上发明了一种快速的算法，大大较少了计算量。大量的实验证明，该方法可靠性好，识别率高，有广阔的应用前景。

本发明与现有的技术相比较，具有如下显而易见的突出实质性特点和显著优点：该方法方法对细化后的骨架进行了优化，使得骨架特征的提取更加准确，并且采用了模板搜索的方法，能够快速的提取出数字骨架的端点和交叉点个数。从而避免了传统的基于结构特征的方法实现复杂的缺点。同时，本方法在在结构特征的基础上利用端点的位置关系进行进一步的识别，因此使得该方法对数字的一致性要求不高。同时，该方法对数字的大小等信息不是很敏感，在识别过程中不需要大量的训练样本，识别速度快，能够实现实时的手写数字自动识别。

附图说明：

图1为学号图像图。

图2为分数图像图。

图3为短枝处理的单元模板图。

图4为骨架优化效果图，图中(a)为短枝处理前的数字图像图，图(b)为短枝处理后的数字图像图。

图5为端点、交叉点、一般连线组成图。

图6为端点模板图。

图7为识别结果显示数字图。

具体实践方式：

为了更好的理解本发明的技术方案，结合附图中的图表就具体实施进行进一步详细描述。

(1)数字骨架特征提取

①输入样本

通过摄像头获得试卷卷面实时图象，其中学号部分和分数部分图象如图1，图2所示。

②预处理

在预处理阶段，我们采用3×3的模板T对细化后的图象进行优化，以数字7为例。首先选择图3所示的模板，处理后的图象如附图图4所示。

③在骨架特征提取阶段

在本发明中需要提取出数字骨架的端点和交叉点。在微观角度来说，端点和交叉点的组成如图5所示。端点是指骨架枝头的那个像素点，即端点是数字中连笔笔画的起点和终点。如图5(a)所示，当某个黑像素点p的周围八个邻近像素点中有且只有一个黑像素点时，该黑像素点为端点。那么可以把端点用如图6所示的一个T模板来定义。

T模板中各个位置上的取值取决于模板所对应图像中不同像素位置，如果T模板某一个位置上所对应的像素值为黑，则模板上该位置赋为1，否则赋0；定义变量Num。那么，我们把Num定义为：

Num＝T[0][0]+T[0][1]+T[0][2]+T[1][0]+T[1][2]+T[2][0]+T[2][1]+T[2][2]；

如果满足条件：(1)Num＝1；(2)T[1][1]＝1，则该点就是一个端点。

同样，如果满足满足条件：(1)Num＝3或4；(2)T[1][1]＝1，则该点就是一个三或四交叉点。在待识别数字区域内，运用上述模板T进行搜索匹配，能够很方便的得到端点、三或四交叉点的个数。经过特征提取后，对几种经常出现的手写数字进行分类的结果如表1。

表1 数字骨架特征

数字图像	/	2	3	4	4	5	5	6
数字图像	/	2	3	4	4	5	5	6	端点数目	2	2或3	2或3	4	2	4	3	1
三叉点数目	0	0或1	0或1	0	0	0	1	1	端点数目	2	2或3	2或3	4	2	4	3	1
三叉点数目	0	0或1	0或1	0	0	0	1	1	四叉点数目	0	0	0	1	1	0	0	0
数字图像	6	7	8	8	9	9	0		四叉点数目	0	0	0	1	1	0	0	0
数字图像	6	7	8	8	9	9	0		端点数目	2	2	0	2	1	2	0
三叉点数目	0	0	0	0	1	0	0		端点数目	2	2	0	2	1	2	0
三叉点数目	0	0	0	0	1	0	0		四叉点数目	1	0	1	1	0	1	0

对表1进行分析，可以发现端点数目和交叉点数目完全相同的数字并不多，根据端点和交叉点数目完全相同进行分类，可以得到：

第一类：P＝2，T＝0，F＝0，可能的数字为1，2，3，7；

第二类：P＝3，T＝1，F＝0，可能的数字为2，3；

第三类：P＝4，T＝0，F＝1，可能的数字为4；

第四类：P＝2，T＝0，F＝1，可能的数字为4，6，8，9；

第五类：P＝4，T＝0，F＝0，可能的数字为5；

第六类：P＝3，T＝1，F＝0，可能的数字为5；

第七类：P＝1，T＝1，F＝0，可能的数字为6，9；

第八类：P＝0，T＝0，F＝1，可能的数字为8；

第九类：P＝0，T＝0，F＝0，可能的数字为0；

其中P为端点数目，T为三叉点数目，F为四叉点数目。

(2)在端点位置判别阶段

端点位置判别阶段主要是针对上述第一类和第四类进行判定。当某一类中可能的数字只有一个时，那么可以直接进行识别，不需要再对端点位置关系特征进行判断；下面以第一类中的1和7为例进行说明，下图中被圈中的，即为端点位置。

①主要位置关系计算

我们根据上述主要关系进行计算，并通过大量的实验得出。1的主要关系变化域为：(1，+∞)，7的则为(-10，-3)，这样根据端点所述变化域的范围不同就可以把同一类的手写数字进行快速的区分，从而达到识别的目的。经过大量的实验统计，同一类的数字端点位置关系如表2。

表2 同一类端点位置关系域分类

②次要位置关系计算

根据上面的计算大限两个数字的主要位置关系分布区域没有重叠，那么就可以直接识别出。如果发生了区域重叠就要计算次要位置关系来进行识别。

③识别手写数字

运用上述的方法对图1和图2的试卷卷面图象中的手写数字进行识别，识别结果如图7所示。

Claims

1.一种试卷卷面手写体数字识别方法，其特征在于通过摄像头获取实时试卷卷面图象，经过预处理后，提取出试卷卷面中手写体数字的骨架特征，然后结合手写体数字端点的位置关系进行手写体数字识别；其具体操作步骤如下：

a.数字骨架特征的提取：

①输入样本：将试卷卷面图像由摄像头和图象采集卡经模数转换后输入计算机；

②预处理：计算机对得到的实时试卷图像进行灰度化、二值化、平滑去噪声、字符分割、归一化、倾斜校正、重排和数字骨架细化；

③数字骨架特征提取：对试卷卷面图像中的分数进行特征提取，提取出手写体数字的端点和交叉点两个特征，并记录下端点和交叉点的个数，同时保存端点的坐标。

b.骨架位置关系的判断：

①主要位置关系计算：计算骨架端点的连线在水平方向坐标轴上的倾斜角度的三角正切值；

②次要位置关系计算：计算端点间的距离与整个数字高度的比例；