CN104463157B - 手写字符的电子识别方法 - Google Patents
手写字符的电子识别方法 Download PDFInfo
- Publication number
- CN104463157B CN104463157B CN201410632470.XA CN201410632470A CN104463157B CN 104463157 B CN104463157 B CN 104463157B CN 201410632470 A CN201410632470 A CN 201410632470A CN 104463157 B CN104463157 B CN 104463157B
- Authority
- CN
- China
- Prior art keywords
- character
- identification
- line
- hand
- written
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
一种手写字符的电子识别方法,包括如下步骤:S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;S12,对所述图像信息进行几何矫正,得到矫正字符;S13,根据所述矫正字符的特征进行匹配识别。本发明应用到答题卡识别领域能够准确的分割手写英文字符及阿拉伯数字,避免了手写分割的难点,使得脱机手写识别的应用成为了可能,本发明简单快速的字符的特征提取方法能够快速的提取英文字符的特征,使得此类方法能够应用到一些计算能力有限的设备,极大的提高了手写识别的应用范围。
Description
技术领域
本发明涉及答题卡图像识别处理的技术领域,具体涉及一种手写字符的电子识别方法。
背景技术
现有技术中答题卡可以识别2B铅笔填涂的图形,而不能够识别手写内容,然而现有技术中能够识别个别内容也是基于规范性书写或者特殊训练的书写形式;由于每个人的书写习惯不同导致英文字符的分割成为手写识别中的难点,现有的方法尚不能准确的分割不同情况的英文及字母等字符图形,目前的英文字符特征提取方法主要提取字符的几何信息或者几何特征,然后对这些特征进行分类处理,但由于每个人的习惯的不同导致这些方法需要训练每个人的手写字体,并不能保证良好的适用性,故此无法应用到答题卡领域中,无法在答题评分方面的手写识别方面应用。
发明内容
本发明的目的是提供一种手写字符的电子识别方法,以克服现有技术存在的上述不足。
本发明的目的是通过以下技术方案来实现的:
一种手写字符的电子识别方法,包括如下步骤:
S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;
S12,对所述图像信息进行几何矫正,得到矫正字符;
S13,根据所述矫正字符的特征进行匹配识别。
优选的,S11中,预设的所述分割线答题卡具体为手写区域内设有单个字符的制定字符框;所述制定字符框内设有横向辅助分割线;所述字符框为实体线框或电子虚拟线框;所述横向辅助分割线为实体线段或虚拟线段。
更加优选的,获取所述图像信息的具体方法为:
S31,通过相机获取写有字符的所述分割线答题卡图案;
S32,提取所述制定字符框内的字符信息,得到所述图像信息。
更加优选的,对所述图像信息进行几何矫正,得到矫正字符的方法具体为:
S41,基于所述制定字符框内设有横向辅助分割线,将所述图像信息进行去边框、方向矫正处理;
S42,根据预设定的字符模板对所述图像信息进行对比处理,得到矫正字符。
更加优选的,根据所述矫正字符的特征进行匹配识别的方法具体为:
S61,提取所述矫正字符在所述制定字符框内的位置,作为第一特征;所述位置具体为所述制定字符框内被两条以上所述横向辅助分割线划分的区域;
S62,在所述制定字符框内设有中心垂直识别线和水平识别线;提取所述矫正字符与所述垂直识别线的交点个数,作为垂直交点数;所述矫正字符与所述水平识别线的交点个数,作为水平交点数;所述垂直交点数和所述水平交点数作为第二特征;
S63,基于所述第一特征和所述第二特征与预设定的字符进行匹配,得到识别字符。
更加优选的,
S62中,所述垂直识别线为三条以上;所述水平识别线为三条以上。
更加优选的,当所述横向辅助分割线为两条时,
所述第一特征分为如下六类;所述六类的判断具体为:
只占中间一格的作为第一类,包括:小写字母中的a、c、e、m、n、o、r、s、u、v、w、x和z;
占上两格的作为第二类;包括小写字母中的b、d、h、i、k、l和t;大写字母中的A-Z;
占下两格的作为第三类;包括小写字母中的g、p、q和y,符号中的冒号和分号;
占三格的作为第四类;包括小写字母中的f和j;阿拉伯数字中的0-9;标点符号中的问号和感叹号;
只占下面一格作为第五类;包括符号中的逗号和句号;
只占上面一格作为第六类;包括符号中的双引号和单引号。
更加优选的,S63,基于所述第一特征和所述第二特征与预设定的英文字母、阿拉伯数字或标点符号进行匹配,得到识别字符的方法具体为:
S81,按照从左边到右边的书写上、下、左、右的顺序进行所述第一特征和所述第二特征的识别;
S82,按照所述第一特征识别字符的分类;
S83,根据字符的分类,在字母所占区域上、中、下位置,在所占区域的宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线;
S84,通过三条横向识别线、三条纵向识别线与字符书写轨迹的交点数量及所述交点的次序与预设定的字符进行匹配,得到识别字符。
更加优选的,当所述字符为第一类、第五类或第六类时,所述垂直识别线为三条;所述水平识别线为三条;
当所述字符为第二类或第三类时,所述垂直识别线为三条;所述水平识别线为六条;
当所述字符为第四类时,所述垂直识别线为三条;所述水平识别线为九条;
更加优选的,所述辅助分割线为两条以上。
本发明的有益效果为:
本发明应用到答题卡识别领域能够准确的分割手写英文字符及阿拉伯数字,避免了手写分割的难点,使得脱机手写识别的应用成为了可能,本发明简单快速的字符的特征提取方法能够快速的提取英文字符的特征,使得此类方法能够应用到一些计算能力有限的设备,极大的提高了手写识别的应用范围。
附图说明
图1是本发明的手写字符的电子识别方法的流程示意图;
图2为本发明预设的分割线答题卡结构示意图;
图3为本发明填写有手写字符的分割线答题卡结构示意图;
图中:1-第一水平识别线,2-第二水平识别线,3-第三水平识别线,4-辅助分割线,5-垂直识别线。
具体实施方式
如图1所示,本发明是所要解决的技术问题是提出了手写字符的电子识别方法,为了克服脱机手写识别中字符分割的难点,本发明预设了分割线答题卡;
本发明公开的手写字符的电子识别方法,包括如下步骤:
步骤1:设计标准的英文书写模板,并根据模板来设计字符分割算法。
步骤2:对分割出的字符进行几何矫正,得到标准方向和大小的字符。
步骤3:针对英文字符书写的规则,设计了一种基于分割投影的字符特征提取方法,该方法从垂直方向和竖直方向提取英文字符与分割线的交点个数作为字符的特征,最后对提取出的特征进行分类识别。
其中步骤1中所述标准的分割线答题卡如图2所示,传统手写识别方法中一大难题在于手写字母的不规范性和连笔书写,本设计基于英文或阿拉伯数字的“四线三格”基本书写规范,设计分割式书写区域,确保识别的可分割性。
其中步骤1中所述的字符分割算法具体为首先对由于拍摄而产生的答题卡及文字的变形进行矫正,然后提取制定区域的字符文字,这样能够保证准确的将书写的英文字符进行分割,避免了因书写习惯不同而导致的字符分割难的问题。
其中步骤2中所述的几何矫正是针对分割出来的字符进行一些去边框和旋转等操作。
其中步骤3中所述的英文字符判断和识别流程如下。传统手写英文字母的识别方式多集中在对字母书写笔画走势的判别上,本设计基于字母书写所处区域以及“交点”理论,通过判定字母书写在设计模板中的位置,以及书写区域内“识别线”与字母书写轨迹的“交点”个数实现对字母的识别判定。
首先,提取英文字符在3行中占的格子数,作为字符的第一类特征。针对书写规范可以分为只占中间一格的字母包括a、c、e、m、n、o、r、s、u、v、w、x和z,占上两格的字母包括b、d、h、i、k、l和t,占下两格的字母包括g、p、q和y,占三格的字母包括f和j;另外,识别线区分不出字母的,如b和d,单靠交点个数无法判定字母的,通过交点的先后位置判断,上格交点位置在左侧的,为b,交点在右侧的,为d;
其次,提取垂直方向和水平方向识别线与英文字符的交点数作为特征。默认字母书写上下左右最边缘像素为起止点,在字母宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线,通过识别线与字母书写轨迹的交点,判定字母,以字母C为例,如图3所示:
横向设置三条识别线,纵向设置一条识别线,若三条横线与字母轨迹交点均为2个,则可判定字母为O,若识别横线1、3与字母轨迹交点为2,识别横线2与字母轨迹交点为1,则判定字母为C。
以字母w为例:若字母书写只占中间一格,取横线识别线后,1/2识别线与字母轨迹有四个横向交点,则判定字母为w。
以上通过具体的和优选的实施例详细的描述了本发明,但本领域技术人员应该明白,本发明并不局限于以上所述实施例,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种手写字符的电子识别方法,其特征在于,包括如下步骤:
S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;
S12,对所述图像信息进行几何矫正,得到矫正字符;
S13,根据所述矫正字符的特征进行匹配识别;
S11中,预设的所述分割线答题卡具体为手写区域内设有单个字符的制定字符框;所述制定字符框内设有横向辅助分割线;所述字符框为实体线框或电子虚拟线框;所述横向辅助分割线为实体线段或虚拟线段;
获取所述图像信息的具体方法为:
S31,通过相机获取写有字符的所述分割线答题卡图案;
S32,提取所述制定字符框内的字符信息,得到所述图像信息;
对所述图像信息进行几何矫正,得到矫正字符的方法具体为:
S41,基于所述制定字符框内设有横向辅助分割线,将所述图像信息进行去边框、方向矫正处理;
S42,根据预设定的字符模板对所述图像信息进行对比处理,得到矫正字符;
根据所述矫正字符的特征进行匹配识别的方法具体为:
S61,提取所述矫正字符在所述制定字符框内的位置,作为第一特征;所述位置具体为所述制定字符框内被两条以上所述横向辅助分割线划分的区域;
S62,在所述制定字符框内设有中心垂直识别线和水平识别线;提取所述矫正字符与所述垂直识别线的交点个数,作为垂直交点数;所述矫正字符与所述水平识别线的交点个数,作为水平交点数;所述垂直交点数和所述水平交点数作为第二特征;
S63,基于所述第一特征和所述第二特征与预设定的字符进行匹配,得到识别字符。
2.根据权利要求1所述的手写字符的电子识别方法,其特征在于,
S62中,所述垂直识别线为三条以上;所述水平识别线为三条以上。
3.根据权利要求2所述的手写字符的电子识别方法,其特征在于,当所述横向辅助分割线为两条时,
所述第一特征分为如下六类;所述六类的判断具体为:
只占中间一格的作为第一类,包括:小写字母中的a、c、e、m、n、o、r、s、u、v、w、x和z;
占上两格的作为第二类;包括小写字母中的b、d、h、i、k、l和t;大写字母中的A-Z;
占下两格的作为第三类;包括小写字母中的g、p、q和y,符号中的冒号和分号;
占三格的作为第四类;包括小写字母中的f和j;阿拉伯数字中的0-9;标点符号中的问号和感叹号;
只占下面一格作为第五类;包括符号中的逗号和句号;
只占上面一格作为第六类;包括符号中的双引号和单引号。
4.根据权利要求3所述的手写字符的电子识别方法,其特征在于,
S63,基于所述第一特征和所述第二特征与预设定的英文字母、阿拉伯数字或标点符号进行匹配,得到识别字符的方法具体为:
S81,按照从左至右和从上至下的书写顺序进行所述第一特征和所述第二特征的识别;
S82,按照所述第一特征识别字符的分类;
S83,根据字符的分类,以及根据所述制定字符框内被两条所述横向辅助分割线划分的区域,在字符所占的各个区域的宽度和高度的1/3、1/2、2/3处平均取三条水平识别线、三条垂直识别线;
S84,通过三条水平识别线、三条垂直识别线与字符书写轨迹的交点数量及所述交点的次序与预设定的字符进行匹配,得到识别字符。
5.根据权利要求4所述的手写字符的电子识别方法,其特征在于,
当所述字符为第一类、第五类或第六类时,所述垂直识别线为三条,所述水平识别线为三条;
当所述字符为第二类或第三类时,所述垂直识别线为三条,所述水平识别线为六条;
当所述字符为第四类时,所述垂直识别线为三条,所述水平识别线为九条。
6.根据权利要求1所述的手写字符的电子识别方法,其特征在于,
所述横向辅助分割线为两条以上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410632470.XA CN104463157B (zh) | 2014-11-07 | 2014-11-07 | 手写字符的电子识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410632470.XA CN104463157B (zh) | 2014-11-07 | 2014-11-07 | 手写字符的电子识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104463157A CN104463157A (zh) | 2015-03-25 |
CN104463157B true CN104463157B (zh) | 2019-03-12 |
Family
ID=52909173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410632470.XA Active CN104463157B (zh) | 2014-11-07 | 2014-11-07 | 手写字符的电子识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104463157B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709484B (zh) * | 2015-11-13 | 2022-02-22 | 国网吉林省电力有限公司检修公司 | 数字式仪表的数字识别方法 |
CN105574531A (zh) * | 2015-12-11 | 2016-05-11 | 中国电力科学研究院 | 一种基于交点特征提取的数字识别方法 |
CN108805129B (zh) * | 2017-08-24 | 2020-03-13 | 贵州省烟草公司贵阳市公司 | 烟草激光码辅助识别方法、装置及烟草激光码识别设备 |
CN109871910B (zh) * | 2019-03-12 | 2021-06-22 | 成都工业学院 | 一种手写字符识别方法及装置 |
JP7414554B2 (ja) * | 2020-01-27 | 2024-01-16 | シャープ株式会社 | 情報処理装置、制御方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851730A (zh) * | 2006-05-25 | 2006-10-25 | 无敌科技(西安)有限公司 | 一种文字识别的方法及其系统 |
CN101097600A (zh) * | 2006-06-29 | 2008-01-02 | 北大方正集团有限公司 | 一种字体识别方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314252B (zh) * | 2010-06-30 | 2013-09-11 | 汉王科技股份有限公司 | 一种手写字符串的字符切分方法和装置 |
CN102208039B (zh) * | 2011-06-01 | 2013-02-20 | 汉王科技股份有限公司 | 一种多语言混合手写文本行的识别方法及装置 |
CN102663378B (zh) * | 2012-03-22 | 2013-12-11 | 杭州新锐信息技术有限公司 | 连笔手写字符的识别方法 |
-
2014
- 2014-11-07 CN CN201410632470.XA patent/CN104463157B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851730A (zh) * | 2006-05-25 | 2006-10-25 | 无敌科技(西安)有限公司 | 一种文字识别的方法及其系统 |
CN101097600A (zh) * | 2006-06-29 | 2008-01-02 | 北大方正集团有限公司 | 一种字体识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
中英文混合文章识别问题;王恺等;《软件学报》;20050531;第16卷(第5期);全文 |
多知识综合判决的字符切分算法;刘刚等;《计算机工程与应用》;20020611(第17期);第59-61页 |
Also Published As
Publication number | Publication date |
---|---|
CN104463157A (zh) | 2015-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104463157B (zh) | 手写字符的电子识别方法 | |
CN106156761B (zh) | 面向移动终端拍摄的图像表格检测与识别方法 | |
CN110766014B (zh) | 票据信息定位方法、系统及计算机可读存储介质 | |
Nicolaou et al. | Handwritten text line segmentation by shredding text into its lines | |
CN111881310B (zh) | 一种汉字硬笔书写智能指导和评分方法及指导评分系统 | |
JP5522408B2 (ja) | パターン認識装置 | |
CN107944451B (zh) | 一种藏文古籍文档的行切分方法及系统 | |
CN105787522B (zh) | 基于手写笔迹的书写态度评价方法及系统 | |
CN104809446B (zh) | 基于校正手掌方向的掌纹感兴趣区域快速提取方法 | |
CN111401371A (zh) | 一种文本检测识别方法、系统及计算机设备 | |
CN104966096A (zh) | 一种基于重要书写特征标注的手写汉字工整性评价方法 | |
CN105488544A (zh) | 一种描红临摹笔迹识别的方法及系统 | |
CN104809481A (zh) | 一种基于自适应色彩聚类的自然场景文本检测的方法 | |
CN104376318A (zh) | 在保留交叉字符笔划的同时去除文档图像中的下划线和表格线 | |
CN111242024A (zh) | 基于机器学习识别图纸内图例及文字的方法及系统 | |
CN110516554A (zh) | 一种多场景多字体中文文字检测识别方法 | |
CN106980857B (zh) | 一种基于碑帖的毛笔字分割识别方法 | |
CN104239910B (zh) | 一种联机手写汉字笔画续笔的识别方法 | |
US20200126274A1 (en) | Chinese character information recording method | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN102073862B (zh) | 一种快速的文档图像版面结构计算方法 | |
CN109508716B (zh) | 一种图像文字的定位方法及装置 | |
Zhou et al. | A novel text line segmentation method based on contour curve tracking for Tibetan historical documents | |
Jindal et al. | Line segmentation of handwritten Gurmukhi manuscripts | |
Li | An effective approach to offline arabic handwriting recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |