CN101458767A - 试卷卷面手写体分数识别方法 - Google Patents

试卷卷面手写体分数识别方法 Download PDF

Info

Publication number
CN101458767A
CN101458767A CNA2009100448248A CN200910044824A CN101458767A CN 101458767 A CN101458767 A CN 101458767A CN A2009100448248 A CNA2009100448248 A CN A2009100448248A CN 200910044824 A CN200910044824 A CN 200910044824A CN 101458767 A CN101458767 A CN 101458767A
Authority
CN
China
Prior art keywords
end points
digital
numeral
handwriting
skeleton
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100448248A
Other languages
English (en)
Other versions
CN101458767B (zh
Inventor
冯运亮
薛雷
罗珍茜
彭之威
孙峰杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haian Su Fu Technology Transfer Center Co., Ltd.
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN2009100448248A priority Critical patent/CN101458767B/zh
Publication of CN101458767A publication Critical patent/CN101458767A/zh
Application granted granted Critical
Publication of CN101458767B publication Critical patent/CN101458767B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种试卷卷面手写体分数识别方法。本发明的方法是通过摄像头获取实时试卷卷面图象,经过预处理后,提取出卷面中手写体数字的骨架结构特征,然后结合手写体数字端点的位置关系进行手写体数字识别。本发明的试卷卷面手写体分数识别方法,利用了数字骨架的结构特征,并在识别过程中有效地结合了几何和结构的知识,使得该方法在识别过程中不需要大量的训练样本,识别速度快,可靠性好,识别率高。本发明的方法易于实现,能对试卷卷面手写体分数进行准确、高效的识别,满足实际运用的要求。

Description

试卷卷面手写体分数识别方法
技术领域:
本发明涉及的是一种手写体数字识别的方法,具体是一种识别试卷卷面手写体分数的方法。
背景技术:
在教学过程中,试卷作为一种重要的教学评估手段广泛的应用于各类学校中,然而教师需要花费大量的时间对试卷卷面分数进行处理和统计。如何对如此大量的试卷中的手写体分数进行自动识别和统计处理,是目前面临的难题。因此,试卷卷面手写体数字的识别具有很大的研究价值和应用前景。
经过对现有技术的总结发现,手写体数字的识别的方法主要有两种:基于结构特征的方法和基于统计特征的方法。前者是利用手写数字骨架的结构特征如:圈、端点、交叉点、轮廓进行识别,该方法能够精确的描述数字的结构特征,对书写较规范的数字有较高的识别率,但是该方法比较复杂;后者利用手写数字的统计特征如:密度、矩、特征区域进行识别,该方法中的手写数字的统计特征比较容易获得,能够准确的描述一类模式的结构特征,但由于手写数字的任意性,变化多样,只有在样本的一致性较好的情况下,才能获得较高的识别率。
发明内容:
本发明的目的在于克服现有技术的不足,提供一种识别率高、易于实现的试卷卷面手写体分数识别方法,满足教学的需要。
为了达到上述目的,本发明的构思是:
利用手写数字的端点和交叉点的个数对手写数字进行初次分类;经过上述分类的数字,再结合手写数字的端点位置关系进行判别,最终达到识别的目的。
本发明运用图像处理算法对试卷卷面手写分数进行识别,利用了手写数字骨架的结构特征的同时,结合了几何和结构的知识,有效的减少了算法的复杂度,并且在识别过程中不需要大量的训练样本。这样使得该方法容易实现,并具有较高的可靠性和识别率。
根据上述的发明构思,本发明是采用以下技术方案来实现的:
一种试卷卷面手写体分数识别方法,其特征在于通过摄像头获取实时试卷卷面图像,经过预处理后,提取出试卷卷面中手写数字的骨架结构特征,然后结合手写体数字端点的位置关系对手写数字进行识别,其识别是通过数字骨架特征的提取和骨架位置关系的判定来实现;其具体操作步骤如下:
(1)数字骨架特征提取的步骤
①输入样本:将试卷卷面图象由摄像头和图象采集卡经模数转换后输入计算机;
②预处理:计算机对得到的实时试卷图象进行灰度化、二值化、平滑去噪、字符分割、归一化、倾斜校正、重排、数字骨架细化等处理;
③数字骨架特征提取:对试卷卷面图象中的分数进行特征提取,提取出手写数字的端点和交叉点两个特征,并记录下端点和交叉点的个数,同时保存端点的坐标;
(2)骨架位置关系判断的步骤
①主要位置关系计算:计算骨架端点的连线在水平坐标轴上倾斜角度的三角正切值;
②次要位置关系计算:计算端点间的距离与整个数字高度的比值;
③根据上述两种位置关系的计算结合数字骨架的特征来识别手写数字。
在数字骨架特征提取阶段,在待识别数字的特定区域中,采用模板匹配法在区域内进行搜索,最终提取出数字骨架的端点和交叉点数目,同时记录下端点在识别区域中的坐标位置。根据提取出的骨架特征,对数字进行分类,对于分类的结果,然后再根据端点位置关系来判别。最后分析前面两个阶段的结果,最终达到手写数字识别的目的。
以下对本发明的方法作进一步的说明:
所述的试卷卷面图象,是利用摄像头实时采集的,因此图象受到噪声和外界因素的影响,在进行骨架特征提取前,一般来说要对图象进行预处理。对试卷卷面图象的预处理包括以下过程:灰度化、二值化、平滑去噪、归一化、数字分割、倾斜校正和骨架细化。由于本方法要对数字骨架的特征进行特征提取,因此骨架细化的很必要的,在本方法中采用的是并行细化算法,该细化方法具有很好的实用性,获取的图像骨架避免了过度腐蚀,并且还具有良好的连通性。同时,还对细化后的图象进行了骨架优化,本发明采用3×3的模板对细化后的图象枝头进行了一个象素级的删除,进行了短枝处理。这样优化了数字骨架图象的质量,为下一步的骨架特征提取打下了良好的基础。
所述的手写数字骨架特征提取,本发明采用的是局部特征提取方法:在特定的识别区域内,运用符合特征的模板进行搜索,最终提取出数字骨架的特征。为了取得更好的运算效率,在本发明中,提取的是数字骨架的特征有:端点和交叉点。
所述的数字骨架的端点位置关系,对提取出来的端点特征,需要对其位置关系进行定义。在本发明中根据端点的不同位置我们把端点分为两种不同的位置关系。定义为:
(1)两个端点的连线在水平坐标轴上倾斜角度的三角正切值,称为主要端点位置关系,简称主要关系。
(2)两个端点间的距离与整个数字高度的比值,称为次要端点位置关系,简称次要关系。
像素点在图像中坐标为(x,y)。两个端点的连线用数学斜率正切公式可以表示为:
tan a=(y1-y2)/(x1-x2)       (1)
其中,tan a为斜率,即两个端点的连线在水平坐标轴上倾斜角度;(x1,y1),(x2,y2)分别为两个端点在图像中的坐标位置。按式(1)进行计算即可获得主要端点位置关系。
对于次要端点位置关系可以利用式(2)进行计算获得。
h1=(y2-y1)/(MAXwidth-MINwidth)      (2)
其中,h1为次要端点位置关系;y2,y1分别为端点的纵坐标,设y1<y2;MAXwidth,MINwidth分别为数字的最高点和最低点的纵坐标。
当待识别数字仅有一个端点时,端点的位置关系可以利用式(3)进行计算获得。
h2=(y1-MINwidth)/(MAXwidth-MINwidth)   (3)
其中,h2为端点位置关系,y1为该图像唯一端点的纵坐标,MAXwidth,MINwidth分别为数字的最高点和最低点的纵坐标。由于端点的坐标在端点特征提取的时候已经得到,因此可以直接使用,不需要进行重复计算。这样再通过端点和交叉点的个数进行初步分类后,再通过端点的位置关系就能够很好的实现手写数字识别的目的。
本发明的方法利用了数字骨架的结构特征,并在识别过程中有效地结合了几何和结构的知识,并且在此基础上发明了一种快速的算法,大大较少了计算量。大量的实验证明,该方法可靠性好,识别率高,有广阔的应用前景。
本发明与现有的技术相比较,具有如下显而易见的突出实质性特点和显著优点:该方法方法对细化后的骨架进行了优化,使得骨架特征的提取更加准确,并且采用了模板搜索的方法,能够快速的提取出数字骨架的端点和交叉点个数。从而避免了传统的基于结构特征的方法实现复杂的缺点。同时,本方法在在结构特征的基础上利用端点的位置关系进行进一步的识别,因此使得该方法对数字的一致性要求不高。同时,该方法对数字的大小等信息不是很敏感,在识别过程中不需要大量的训练样本,识别速度快,能够实现实时的手写数字自动识别。
附图说明:
图1为学号图像图。
图2为分数图像图。
图3为短枝处理的单元模板图。
图4为骨架优化效果图,图中(a)为短枝处理前的数字图像图,图(b)为短枝处理后的数字图像图。
图5为端点、交叉点、一般连线组成图。
图6为端点模板图。
图7为识别结果显示数字图。
具体实践方式:
为了更好的理解本发明的技术方案,结合附图中的图表就具体实施进行进一步详细描述。
(1)数字骨架特征提取
①输入样本
通过摄像头获得试卷卷面实时图象,其中学号部分和分数部分图象如图1,图2所示。
②预处理
在预处理阶段,我们采用3×3的模板T对细化后的图象进行优化,以数字7为例。首先选择图3所示的模板,处理后的图象如附图图4所示。
③在骨架特征提取阶段
在本发明中需要提取出数字骨架的端点和交叉点。在微观角度来说,端点和交叉点的组成如图5所示。端点是指骨架枝头的那个像素点,即端点是数字中连笔笔画的起点和终点。如图5(a)所示,当某个黑像素点p的周围八个邻近像素点中有且只有一个黑像素点时,该黑像素点为端点。那么可以把端点用如图6所示的一个T模板来定义。
T模板中各个位置上的取值取决于模板所对应图像中不同像素位置,如果T模板某一个位置上所对应的像素值为黑,则模板上该位置赋为1,否则赋0;定义变量Num。那么,我们把Num定义为:
Num=T[0][0]+T[0][1]+T[0][2]+T[1][0]+T[1][2]+T[2][0]+T[2][1]+T[2][2];
如果满足条件:(1)Num=1;(2)T[1][1]=1,则该点就是一个端点。
同样,如果满足满足条件:(1)Num=3或4;(2)T[1][1]=1,则该点就是一个三或四交叉点。在待识别数字区域内,运用上述模板T进行搜索匹配,能够很方便的得到端点、三或四交叉点的个数。经过特征提取后,对几种经常出现的手写数字进行分类的结果如表1。
表1  数字骨架特征
 
数字图像 / 2 3 4 4 5 5 6
端点数目 2 2或3 2或3 4 2 4 3 1
三叉点数目 0 0或1 0或1 0 0 0 1 1
四叉点数目 0 0 0 1 1 0 0 0
数字图像 6 7 8 8 9 9 0
端点数目 2 2 0 2 1 2 0
三叉点数目 0 0 0 0 1 0 0
四叉点数目 1 0 1 1 0 1 0
对表1进行分析,可以发现端点数目和交叉点数目完全相同的数字并不多,根据端点和交叉点数目完全相同进行分类,可以得到:
第一类:P=2,T=0,F=0,可能的数字为1,2,3,7;
第二类:P=3,T=1,F=0,可能的数字为2,3;
第三类:P=4,T=0,F=1,可能的数字为4;
第四类:P=2,T=0,F=1,可能的数字为4,6,8,9;
第五类:P=4,T=0,F=0,可能的数字为5;
第六类:P=3,T=1,F=0,可能的数字为5;
第七类:P=1,T=1,F=0,可能的数字为6,9;
第八类:P=0,T=0,F=1,可能的数字为8;
第九类:P=0,T=0,F=0,可能的数字为0;
其中P为端点数目,T为三叉点数目,F为四叉点数目。
(2)在端点位置判别阶段
端点位置判别阶段主要是针对上述第一类和第四类进行判定。当某一类中可能的数字只有一个时,那么可以直接进行识别,不需要再对端点位置关系特征进行判断;下面以第一类中的1和7为例进行说明,下图中被圈中的,即为端点位置。
Figure A200910044824D00081
①主要位置关系计算
我们根据上述主要关系进行计算,并通过大量的实验得出。1的主要关系变化域为:(1,+∞),7的则为(-10,-3),这样根据端点所述变化域的范围不同就可以把同一类的手写数字进行快速的区分,从而达到识别的目的。经过大量的实验统计,同一类的数字端点位置关系如表2。
表2  同一类端点位置关系域分类
Figure A200910044824D00082
②次要位置关系计算
根据上面的计算大限两个数字的主要位置关系分布区域没有重叠,那么就可以直接识别出。如果发生了区域重叠就要计算次要位置关系来进行识别。
③识别手写数字
运用上述的方法对图1和图2的试卷卷面图象中的手写数字进行识别,识别结果如图7所示。

Claims (1)

1.一种试卷卷面手写体数字识别方法,其特征在于通过摄像头获取实时试卷卷面图象,经过预处理后,提取出试卷卷面中手写体数字的骨架特征,然后结合手写体数字端点的位置关系进行手写体数字识别;其具体操作步骤如下:
a.数字骨架特征的提取:
①输入样本:将试卷卷面图像由摄像头和图象采集卡经模数转换后输入计算机;
②预处理:计算机对得到的实时试卷图像进行灰度化、二值化、平滑去噪声、字符分割、归一化、倾斜校正、重排和数字骨架细化;
③数字骨架特征提取:对试卷卷面图像中的分数进行特征提取,提取出手写体数字的端点和交叉点两个特征,并记录下端点和交叉点的个数,同时保存端点的坐标。
b.骨架位置关系的判断:
①主要位置关系计算:计算骨架端点的连线在水平方向坐标轴上的倾斜角度的三角正切值;
②次要位置关系计算:计算端点间的距离与整个数字高度的比例;
③根据上述两种位置关系的计算结合数字骨架的特征来识别手写数字。
CN2009100448248A 2009-01-04 2009-01-04 试卷卷面手写体数字识别方法 Expired - Fee Related CN101458767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100448248A CN101458767B (zh) 2009-01-04 2009-01-04 试卷卷面手写体数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100448248A CN101458767B (zh) 2009-01-04 2009-01-04 试卷卷面手写体数字识别方法

Publications (2)

Publication Number Publication Date
CN101458767A true CN101458767A (zh) 2009-06-17
CN101458767B CN101458767B (zh) 2010-11-17

Family

ID=40769616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100448248A Expired - Fee Related CN101458767B (zh) 2009-01-04 2009-01-04 试卷卷面手写体数字识别方法

Country Status (1)

Country Link
CN (1) CN101458767B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102974089A (zh) * 2012-11-09 2013-03-20 沈豪杰 竞赛快速校对计分系统
CN103279788A (zh) * 2013-04-28 2013-09-04 广东欧珀移动通信有限公司 一种自动识别数字的计数方法及移动终端
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法
CN103632465A (zh) * 2013-11-04 2014-03-12 广东汇卡商务服务有限公司 一种pos机自动同步收银系统
CN104536999A (zh) * 2014-09-15 2015-04-22 湖南千码防伪科技有限公司 基于图像处理的随机纤维码防伪数据库构建方法
CN109109527A (zh) * 2018-08-11 2019-01-01 马慧芳 多功能擦黑板装置
CN109871908A (zh) * 2019-04-11 2019-06-11 上海电机学院 基于智能手机的试卷分数统计系统及其使用方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102974089A (zh) * 2012-11-09 2013-03-20 沈豪杰 竞赛快速校对计分系统
CN103279788A (zh) * 2013-04-28 2013-09-04 广东欧珀移动通信有限公司 一种自动识别数字的计数方法及移动终端
CN103279788B (zh) * 2013-04-28 2016-07-06 广东欧珀移动通信有限公司 一种自动识别数字的计数方法及移动终端
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法
CN103632465A (zh) * 2013-11-04 2014-03-12 广东汇卡商务服务有限公司 一种pos机自动同步收银系统
CN103632465B (zh) * 2013-11-04 2016-01-20 广东汇卡商务服务有限公司 一种pos机自动同步收银系统
CN104536999A (zh) * 2014-09-15 2015-04-22 湖南千码防伪科技有限公司 基于图像处理的随机纤维码防伪数据库构建方法
CN109109527A (zh) * 2018-08-11 2019-01-01 马慧芳 多功能擦黑板装置
CN109871908A (zh) * 2019-04-11 2019-06-11 上海电机学院 基于智能手机的试卷分数统计系统及其使用方法

Also Published As

Publication number Publication date
CN101458767B (zh) 2010-11-17

Similar Documents

Publication Publication Date Title
CN101458767B (zh) 试卷卷面手写体数字识别方法
CN107392141B (zh) 一种基于显著性检测和lsd直线检测的机场提取方法
CN102629322B (zh) 一种基于边界点笔画形状的字符特征提取方法及应用
CN104408449B (zh) 智能移动终端场景文字处理方法
CN108960198A (zh) 一种基于残差ssd模型的交通标志检测与识别方法
CN101763505B (zh) 基于投影对称性的车牌字符特征提取及分类方法
CN102750556A (zh) 一种脱机手写体汉字识别方法
CN106446952A (zh) 一种乐谱图像识别方法及装置
CN107563379B (zh) 用于对自然场景图像中文本的定位方法
CN105913093A (zh) 一种用于文字识别处理的模板匹配方法
CN102663454B (zh) 一种字符书写规范度评测的方法和装置
CN102750531B (zh) 用于票据文档定位格的手写体标记符号检测方法
CN103258201A (zh) 一种融合全局和局部信息的表格线提取方法
CN105046252A (zh) 一种人民币冠字码识别方法
CN103295009B (zh) 基于笔画分解的车牌字符识别方法
CN110555382A (zh) 一种基于深度学习和Wasserstein距离度量的指静脉识别方法
CN104268598A (zh) 一种基于二维扫描激光的人腿检测方法
CN109829924A (zh) 一种基于主体特征分析的图像质量评价方法
CN103440035A (zh) 一种三维空间中的手势识别系统及其识别方法
CN101315668A (zh) 试卷卷面表格自动检测方法
CN110335280A (zh) 一种基于移动端的金融单据图像分割与矫正方法
CN103699876B (zh) 一种基于线阵ccd图像识别车号的方法及装置
CN105447506A (zh) 一种基于区间分布概率特征的手势识别方法
CN105447457A (zh) 一种基于自适应特征的车牌字符识别方法
CN107609482B (zh) 一种基于汉字笔画特征的中文文本图像倒置判别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HAIAN SUSHI TECHNOLOGY TRANSFORMATION CENTER CO.,

Free format text: FORMER OWNER: SHANGHAI UNIVERSITY

Effective date: 20140512

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 200444 BAOSHAN, SHANGHAI TO: 226600 NANTONG, JIANGSU PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20140512

Address after: 226600 Yingbin Road 8, Haian Town Development Zone, Jiangsu, Nantong

Patentee after: Haian Su Fu Technology Transfer Center Co., Ltd.

Address before: 200444 Baoshan District Road, Shanghai, No. 99

Patentee before: Shanghai University

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101117

Termination date: 20210104