CN104463157A - 手写字符的电子识别方法 - Google Patents

手写字符的电子识别方法 Download PDF

Info

Publication number
CN104463157A
CN104463157A CN201410632470.XA CN201410632470A CN104463157A CN 104463157 A CN104463157 A CN 104463157A CN 201410632470 A CN201410632470 A CN 201410632470A CN 104463157 A CN104463157 A CN 104463157A
Authority
CN
China
Prior art keywords
character
line
identification
hand
identification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410632470.XA
Other languages
English (en)
Other versions
CN104463157B (zh
Inventor
邓振宇
邓雨婷
邓天泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410632470.XA priority Critical patent/CN104463157B/zh
Publication of CN104463157A publication Critical patent/CN104463157A/zh
Application granted granted Critical
Publication of CN104463157B publication Critical patent/CN104463157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

一种手写字符的电子识别方法,包括如下步骤:S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;S12,对所述图像信息进行几何矫正,得到矫正字符;S13,根据所述矫正字符的特征进行匹配识别。本发明应用到答题卡识别领域能够准确的分割手写英文字符及阿拉伯数字,避免了手写分割的难点,使得脱机手写识别的应用成为了可能,本发明简单快速的字符的特征提取方法能够快速的提取英文字符的特征,使得此类方法能够应用到一些计算能力有限的设备,极大的提高了手写识别的应用范围。

Description

手写字符的电子识别方法
技术领域
本发明涉及答题卡图像识别处理的技术领域,具体涉及一种手写字符的电子识别方法。
背景技术
现有技术中答题卡可以识别2B铅笔填涂的图形,而不能够识别手写内容,然而现有技术中能够识别个别内容也是基于规范性书写或者特殊训练的书写形式;由于每个人的书写习惯不同导致英文字符的分割成为手写识别中的难点,现有的方法尚不能准确的分割不同情况的英文及字母等字符图形,目前的英文字符特征提取方法主要提取字符的几何信息或者几何特征,然后对这些特征进行分类处理,但由于每个人的习惯的不同导致这些方法需要训练每个人的手写字体,并不能保证良好的适用性,故此无法应用到答题卡领域中,无法在答题评分方面的手写识别方面应用。
发明内容
本发明的目的是提供一种手写字符的电子识别方法,以克服现有技术存在的上述不足。
本发明的目的是通过以下技术方案来实现的:
一种手写字符的电子识别方法,包括如下步骤:
S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;
S12,对所述图像信息进行几何矫正,得到矫正字符;
S13,根据所述矫正字符的特征进行匹配识别。
优选的,S11中,预设的所述分割线答题卡具体为手写区域内设有单个字符的制定字符框;所述制定字符框内设有横向辅助分割线;所述字符框为实体线框或电子虚拟线框;所述横向辅助分割线为实体线段或虚拟线段。
更加优选的,获取所述图像信息的具体方法为:
S31,通过相机获取写有字符的所述分割线答题卡图案;
S32,提取所述制定字符框内的字符信息,得到所述图像信息。
更加优选的,对所述图像信息进行几何矫正,得到矫正字符的方法具体为:
S41,基于所述制定字符框内设有横向辅助分割线,将所述图像信息进行去边框、方向矫正处理;
S42,根据预设定的字符模板对所述图像信息进行对比处理,得到矫正字符。
更加优选的,根据所述矫正字符的特征进行匹配识别的方法具体为:
S61,提取所述矫正字符在所述制定字符框内的位置,作为第一特征;所述位置具体为所述制定字符框内被两条以上所述横向辅助分割线划分的区域;
S62,在所述制定字符框内设有中心垂直识别线和水平识别线;提取所述矫正字符与所述垂直识别线的交点个数,作为垂直交点数;所述矫正字符与所述水平识别线的交点个数,作为水平交点数;所述垂直交点数和所述水平交点数作为第二特征;
S63,基于所述第一特征和所述第二特征与预设定的字符进行匹配,得到识别字符。
根据权利要求4所述的手写字符的电子识别方法,其特征在于,
S62中,所述垂直识别线为三条以上;所述水平识别线为三条以上。
更加优选的,当所述横向辅助分割线为两条时,
所述第一特征分为如下六类;所述六类的判断具体为:
只占中间一格的作为第一类,包括:小写字母中的a、c、e、m、n、o、r、s、u、v、w、x和z;
占上两格的作为第二类;包括小写字母中的b、d、h、i、k、l和t;大写字母中的A-Z;
占下两格的作为第三类;包括小写字母中的g、p、q和y,符号中的冒号和分号;
占三格的作为第四类;包括小写字母中的f和j;阿拉伯数字中的0-9;标点符号中的问号和感叹号;
只占下面一格作为第五类;包括符号中的逗号和句号;
只占上面一格作为第六类;包括符号中的双引号和单引号。
更加优选的,S63,基于所述第一特征和所述第二特征与预设定的英文字母、阿拉伯数字或标点符号进行匹配,得到识别字符的方法具体为:
S81,按照从左边到右边的书写上、下、左、右的顺序进行所述第一特征和所述第二特征的识别;
S82,按照所述第一特征识别字符的分类;
S83,根据字符的分类,在字母所占区域上、中、下位置,在所占区域的宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线;
S84,通过三条横向识别线、三条纵向识别线与字符书写轨迹的交点数量及所述交点的次序与预设定的字符进行匹配,得到识别字符。
更加优选的,当所述字符为第一类、第五类或第六类时,所述垂直识别线为三条;所述水平识别线为三条;
当所述字符为第二类或第三类时,所述垂直识别线为三条;所述水平识别线为六条;
当所述字符为第四类时,所述垂直识别线为三条;所述水平识别线为九条;
更加优选的,所述辅助分割线为两条以上。
本发明的有益效果为:
本发明应用到答题卡识别领域能够准确的分割手写英文字符及阿拉伯数字,避免了手写分割的难点,使得脱机手写识别的应用成为了可能,本发明简单快速的字符的特征提取方法能够快速的提取英文字符的特征,使得此类方法能够应用到一些计算能力有限的设备,极大的提高了手写识别的应用范围。
附图说明
图1是本发明的手写字符的电子识别方法的流程示意图;
图2为本发明预设的分割线答题卡结构示意图;
图3为本发明填写有手写字符的分割线答题卡结构示意图;
图中:1-第一水平识别线,2-第二水平识别线,3-第二水平识别线,4-辅助分割线,5-垂直识别线。
具体实施方式
如图1所示,本发明是所要解决的技术问题是提出了手写字符的电子识别方法,为了克服脱机手写识别中字符分割的难点,本发明预设了分割线答题卡;
本发明公开的手写字符的电子识别方法,包括如下步骤:
步骤1:设计标准的英文书写模板,并根据模板来设计字符分割算法。
步骤2:对分割出的字符进行几何矫正,得到标准方向和大小的字符。
步骤3:针对英文字符书写的规则,设计了一种基于分割投影的字符特征提取方法,该方法从垂直方向和竖直方向提取英文字符与分割线的交点个数作为字符的特征,最后对提取出的特征进行分类识别。
其中步骤1中所述标准的分割线答题卡如图2所示,传统手写识别方法中一大难题在于手写字母的不规范性和连笔书写,本设计基于英文或阿拉伯数字的“四线三格”基本书写规范,设计分割式书写区域,确保识别的可分割性。
其中步骤1中所述的字符分割算法具体为首先对由于拍摄而产生的答题卡及文字的变形进行矫正,然后提取制定区域的字符文字,这样能够保证准确的将书写的英文字符进行分割,避免了因书写习惯不同而导致的字符分割难的问题。
其中步骤2中所述的几何矫正是针对分割出来的字符进行一些去边框和旋转等操作。
其中步骤3中所述的英文字符判断和识别流程如下。传统手写英文字母的识别方式多集中在对字母书写笔画走势的判别上,本设计基于字母书写所处区域以及“交点”理论,通过判定字母书写在设计模板中的位置,以及书写区域内“识别线”与字母书写轨迹的“交点”个数实现对字母的识别判定。
首先,提取英文字符在3行中占的格子数,作为字符的第一类特征。针对书写规范可以分为只占中间一格的字母包括a、c、e、m、n、o、r、s、u、v、w、x和z,占上两格的字母包括b、d、h、i、k、l和t,占下两格的字母包括g、p、q和y,占三格的字母包括f和j;另外,识别线区分不出字母的,如b和d,单靠交点个数无法判定字母的,通过交点的先后位置判断,上格交点位置在左侧的,为b,交点在右侧的,为d;
其次,提取垂直方向和水平方向识别线与英文字符的交点数作为特征。默认字母书写上下左右最边缘像素为起止点,在字母宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线,通过识别线与字母书写轨迹的交点,判定字母,以字母C为例,如图3所示:
横向设置三条识别线,纵向设置一条识别线,若三条横线与字母轨迹交点均为2个,则可判定字母为O,若识别横线1、3与字母轨迹交点为2,识别横线2与字母轨迹交点为1,则判定字母为C。
以字母w为例:若字母书写只占中间一格,取横线识别线后,1/2识别线与字母轨迹有四个横向交点,则判定字母为w。
以上通过具体的和优选的实施例详细的描述了本发明,但本领域技术人员应该明白,本发明并不局限于以上所述实施例,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种手写字符的电子识别方法,其特征在于,包括如下步骤:
S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;
S12,对所述图像信息进行几何矫正,得到矫正字符;
S13,根据所述矫正字符的特征进行匹配识别。
2.根据权利要求1所述的手写字符的电子识别方法,其特征在于:
S11中,预设的所述分割线答题卡具体为手写区域内设有单个字符的制定字符框;所述制定字符框内设有横向辅助分割线;所述字符框为实体线框或电子虚拟线框;所述横向辅助分割线为实体线段或虚拟线段。
3.根据权利要求2所述的手写字符的电子识别方法,其特征在于,
获取所述图像信息的具体方法为:
S31,通过相机获取写有字符的所述分割线答题卡图案;
S32,提取所述制定字符框内的字符信息,得到所述图像信息。
4.根据权利要求3所述的手写字符的电子识别方法,其特征在于,
对所述图像信息进行几何矫正,得到矫正字符的方法具体为:
S41,基于所述制定字符框内设有横向辅助分割线,将所述图像信息进行去边框、方向矫正处理;
S42,根据预设定的字符模板对所述图像信息进行对比处理,得到矫正字符。
5.根据权利要求4所述的手写字符的电子识别方法,其特征在于,
根据所述矫正字符的特征进行匹配识别的方法具体为:
S61,提取所述矫正字符在所述制定字符框内的位置,作为第一特征;所述位置具体为所述制定字符框内被两条以上所述横向辅助分割线划分的区域;
S62,在所述制定字符框内设有中心垂直识别线和水平识别线;提取所述矫正字符与所述垂直识别线的交点个数,作为垂直交点数;所述矫正字符与所述水平识别线的交点个数,作为水平交点数;所述垂直交点数和所述水平交点数作为第二特征;
S63,基于所述第一特征和所述第二特征与预设定的字符进行匹配,得到识别字符。
6.根据权利要求4所述的手写字符的电子识别方法,其特征在于,
S62中,所述垂直识别线为三条以上;所述水平识别线为三条以上。
7.根据权利要求6所述的手写字符的电子识别方法,其特征在于,当所述横向辅助分割线为两条时,
所述第一特征分为如下六类;所述六类的判断具体为:
只占中间一格的作为第一类,包括:小写字母中的a、c、e、m、n、o、r、s、u、v、w、x和z;
占上两格的作为第二类;包括小写字母中的b、d、h、i、k、l和t;大写字母中的A-Z;
占下两格的作为第三类;包括小写字母中的g、p、q和y,符号中的冒号和分号;
占三格的作为第四类;包括小写字母中的f和j;阿拉伯数字中的0-9;标点符号中的问号和感叹号;
只占下面一格作为第五类;包括符号中的逗号和句号;
只占上面一格作为第六类;包括符号中的双引号和单引号。
8.根据权利要求7所述的手写字符的电子识别方法,其特征在于,
S63,基于所述第一特征和所述第二特征与预设定的英文字母、阿拉伯数字或标点符号进行匹配,得到识别字符的方法具体为:
S81,按照从左边到右边的书写上、下、左、右的顺序进行所述第一特征和所述第二特征的识别;
S82,按照所述第一特征识别字符的分类;
S83,根据字符的分类,在字母所占区域上、中、下位置,在所占区域的宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线;
S84,通过三条横向识别线、三条纵向识别线与字符书写轨迹的交点数量及所述交点的次序与预设定的字符进行匹配,得到识别字符。
9.根据权利要求8所述的手写字符的电子识别方法,其特征在于,
当所述字符为第一类、第五类或第六类时,所述垂直识别线为三条;所述水平识别线为三条;
当所述字符为第二类或第三类时,所述垂直识别线为三条;所述水平识别线为六条;
当所述字符为第四类时,所述垂直识别线为三条;所述水平识别线为九条;
10.根据权利要求3或4所述的手写字符的电子识别方法,其特征在于,
所述辅助分割线为两条以上。
CN201410632470.XA 2014-11-07 2014-11-07 手写字符的电子识别方法 Active CN104463157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410632470.XA CN104463157B (zh) 2014-11-07 2014-11-07 手写字符的电子识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410632470.XA CN104463157B (zh) 2014-11-07 2014-11-07 手写字符的电子识别方法

Publications (2)

Publication Number Publication Date
CN104463157A true CN104463157A (zh) 2015-03-25
CN104463157B CN104463157B (zh) 2019-03-12

Family

ID=52909173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410632470.XA Active CN104463157B (zh) 2014-11-07 2014-11-07 手写字符的电子识别方法

Country Status (1)

Country Link
CN (1) CN104463157B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574531A (zh) * 2015-12-11 2016-05-11 中国电力科学研究院 一种基于交点特征提取的数字识别方法
CN106709484A (zh) * 2015-11-13 2017-05-24 国网吉林省电力有限公司检修公司 数字式仪表的数字识别方法
CN108805129A (zh) * 2017-08-24 2018-11-13 贵州省烟草公司贵阳市公司 烟草激光码辅助识别方法、装置及烟草激光码识别设备
CN109871910A (zh) * 2019-03-12 2019-06-11 成都工业学院 一种手写字符识别方法及装置
CN113179356A (zh) * 2020-01-27 2021-07-27 夏普株式会社 信息处理装置、控制方法以及记录介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851730A (zh) * 2006-05-25 2006-10-25 无敌科技(西安)有限公司 一种文字识别的方法及其系统
CN101097600A (zh) * 2006-06-29 2008-01-02 北大方正集团有限公司 一种字体识别方法及系统
CN102208039A (zh) * 2011-06-01 2011-10-05 汉王科技股份有限公司 一种多语言混合手写文本行的识别方法及装置
CN102314252A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 一种手写字符串的字符切分方法和装置
CN102663378A (zh) * 2012-03-22 2012-09-12 杭州新锐信息技术有限公司 连笔手写字符的识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851730A (zh) * 2006-05-25 2006-10-25 无敌科技(西安)有限公司 一种文字识别的方法及其系统
CN101097600A (zh) * 2006-06-29 2008-01-02 北大方正集团有限公司 一种字体识别方法及系统
CN102314252A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 一种手写字符串的字符切分方法和装置
CN102208039A (zh) * 2011-06-01 2011-10-05 汉王科技股份有限公司 一种多语言混合手写文本行的识别方法及装置
CN102663378A (zh) * 2012-03-22 2012-09-12 杭州新锐信息技术有限公司 连笔手写字符的识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘刚等: "多知识综合判决的字符切分算法", 《计算机工程与应用》 *
王恺等: "中英文混合文章识别问题", 《软件学报》 *
赵晓娟: "手写体数字及英文字符的识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709484A (zh) * 2015-11-13 2017-05-24 国网吉林省电力有限公司检修公司 数字式仪表的数字识别方法
CN105574531A (zh) * 2015-12-11 2016-05-11 中国电力科学研究院 一种基于交点特征提取的数字识别方法
CN108805129A (zh) * 2017-08-24 2018-11-13 贵州省烟草公司贵阳市公司 烟草激光码辅助识别方法、装置及烟草激光码识别设备
CN109871910A (zh) * 2019-03-12 2019-06-11 成都工业学院 一种手写字符识别方法及装置
CN109871910B (zh) * 2019-03-12 2021-06-22 成都工业学院 一种手写字符识别方法及装置
CN113179356A (zh) * 2020-01-27 2021-07-27 夏普株式会社 信息处理装置、控制方法以及记录介质
CN113179356B (zh) * 2020-01-27 2023-05-12 夏普株式会社 信息处理装置、控制方法以及记录介质

Also Published As

Publication number Publication date
CN104463157B (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN111401371B (zh) 一种文本检测识别方法、系统及计算机设备
CN106156761B (zh) 面向移动终端拍摄的图像表格检测与识别方法
Lawgali et al. HACDB: Handwritten Arabic characters database for automatic character recognition
CN105488544A (zh) 一种描红临摹笔迹识别的方法及系统
CN104463157A (zh) 手写字符的电子识别方法
CN105787522B (zh) 基于手写笔迹的书写态度评价方法及系统
CN108830270B (zh) 对满文单词正确分割各识别的满文单词中轴线的定位方法
CN110619326B (zh) 一种基于扫描的英语试卷作文检测识别系统及方法
CN104484643A (zh) 一种手写表格的智能识别方法及系统
CN111242024A (zh) 基于机器学习识别图纸内图例及文字的方法及系统
CN105117741A (zh) 一种书法字风格的识别方法
CN101339703A (zh) 基于计算机的练习文字书写的方法
Garg et al. An algorithm for text line segmentation in handwritten skewed and overlapped Devanagari script
CN113191309A (zh) 一种手写汉字的识别、评分、纠错方法及系统
CN102314252B (zh) 一种手写字符串的字符切分方法和装置
CN103257810A (zh) 手写数学公式识别方法及装置
CN113903045A (zh) 一种手写汉字图像的笔顺识别方法及系统
CN115841671B (zh) 一种书法字骨架矫正方法、系统及存储介质
Silva et al. Segmenting sinhala handwritten characters
CN116758786A (zh) 书法测评方法、装置、计算机设备及介质
CN108062548B (zh) 一种盲文方自适应定位方法及系统
CN110516674A (zh) 一种文本图像的手写汉字分割方法及系统
Dongre et al. Segmentation of printed Devnagari documents
CN112016419A (zh) 一种智能手写汉字平测算法
CN106648171A (zh) 一种基于书写笔的交互系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant