CN102663378B - 连笔手写字符的识别方法 - Google Patents

连笔手写字符的识别方法 Download PDF

Info

Publication number
CN102663378B
CN102663378B CN2012100769575A CN201210076957A CN102663378B CN 102663378 B CN102663378 B CN 102663378B CN 2012100769575 A CN2012100769575 A CN 2012100769575A CN 201210076957 A CN201210076957 A CN 201210076957A CN 102663378 B CN102663378 B CN 102663378B
Authority
CN
China
Prior art keywords
cut
image
character
described step
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2012100769575A
Other languages
English (en)
Other versions
CN102663378A (zh
Inventor
金炎军
区嘉亮
蒋树峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU SUNRAY INFORMATION TECHNOLOGY CO LTD
Original Assignee
HANGZHOU SUNRAY INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU SUNRAY INFORMATION TECHNOLOGY CO LTD filed Critical HANGZHOU SUNRAY INFORMATION TECHNOLOGY CO LTD
Priority to CN2012100769575A priority Critical patent/CN102663378B/zh
Publication of CN102663378A publication Critical patent/CN102663378A/zh
Application granted granted Critical
Publication of CN102663378B publication Critical patent/CN102663378B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明涉及一种连笔手写字符的识别方法,包括下述步骤:(1)对输入图像进行降噪处理,消除数字噪声;(2)通过基于边缘的字数估计算法计算字数;(3)通过最小代价切分算法计算最佳字符分割方案;(4)通过基于笔画的笔迹跟踪算法确定是否存在需要再切分的块,如果存在需要再切分的块,则返回步骤(2)重新计算、分割;如果不存在,则进行下一步骤;(5)对分割后的字符图像进行OCR识别,转化为计算机文字。本发明采用基于边缘的字数估计算法、最小代价切分算法和基于笔画的笔迹跟踪算法,连笔手写字符图像通过三个算法的循环处理,确定最佳切分方案,实现连笔字符的精准分割,从而提高了识别的正确率。

Description

连笔手写字符的识别方法
技术领域
本发明涉及一种连笔手写字符的识别方法。
背景技术
随着信息技术和计算机技术的日益普及,人类社会已进入信息时代,把各类载体上的原始信息转化为计算机可处理和传输的电子比特信息已成为要解决的重要问题。光学字符识别(OCR)技术成为有效解决手工输入文字信息的重要工具,在各领域被广泛应用,并产生了巨大的社会效益和经济效益。
    一个OCR识别系统,其目的很简单,是要把影像作一个转换,使影像内的图形继续保存,有表格则表格内资料及影像内的文字一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。
识别结果决定因素:1.图片的质量;2.颜色,一般对彩色识别很差,黑白的图片较高;3.最重要的就是字体,如果是手写体,那么识别率就很低。
    中国专利CN1652138A公开了一种基于脱机识别方法和联机识别方法集成的手写文字的识别方法,其脱机识别方法主要包括对汉字笔画轮廓方向角特征的弹性网格特征提取技术以及线性判别分析(LDA)对高维特征降维;联机识别方法主要包括对汉字笔画方向特征进行模糊提取以及一种可变性较强的笔画模板弹性匹配方法;本发明大大提高了对连笔草书汉字的识别效果,不仅能识别规范书写的汉字,也能够对连笔草书汉字进行识别,故而可以让用户无限制地自由书写汉字,还可以提高手写输入时用户书写汉字的速度。 
中国专利101160592A公开了一种手写字符识别方法,按每个笔画用参数表现来捕获输入的手写字符,并按每个笔画进行折线近似,将该折线近似的各折线作为从始点起到终点的向量求出,将成为基准的轴与各折线所成的角度作为折线角序列求出,并求出所得到的折线角的顶点的外角序列,将外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列,分层且分割地提取该求出的各序列的全局特征、及根据涡旋夹角序列进行了分割的各曲线部分中的局部特征、次局部特征,通过将该提取结果与预先准备的识别对象字符的模板进行比较,进行字符识别。 
    目前,OCR技术在手写体自动识别能力上不断提升,但大多数OCR是基于对单个字符的逐个识别,连笔手写字符的切分是影响OCR系统识别的关键因素之一,它直接影响到识别的正确率。
发明内容
本发明所要解决的技术问题是提供一种对连笔手写字符的正确切分率和识别率高的识别方法。
本发明提供的技术方案是:一种连笔手写字符的识别方法,包括下述步骤:
(1)对输入图像进行降噪处理,消除数字噪声;
(2)通过基于边缘的字数估计算法计算字数;
(3)通过最小代价切分算法计算最佳字符分割方案;
(4)通过基于笔画的笔迹跟踪算法确定是否存在需要再切分的块,如果存在需要再切分的块,则返回步骤(2)重新计算、分割;如果不存在,则进行下一步骤;
(5)对分割后的字符图像进行OCR识别,转化为计算机文字。
优选地,所述的步骤(1)包括:将彩色图像灰度化,再对灰度图像二值化,然后对二值化图像进行去孤立点操作,最后去除图像四个边缘的空白区域,留下中间包含黑色点部分的方块区域。
优选地,所述步骤(1)中采用加权平均法进行彩色图像灰度化,按下式对RGB三分量进行加权平均得到灰度图像:
   f(i,j)=0.30R(i,j)+0.50G(i,j)+0.20B(i,j))         (1)
  设w为图像的宽度像素数,h为图像的高度像素数,整数i取值为1~w,整数j取值为1~h。
优选地,所述步骤(1)中根据一个特定的阈值C1,整数C1取值为0~255,对每个点进行二值化;当某个点的灰度值大于C1时,将该点设为白色,否则设为黑色。
优选地,所述步骤(1)中采用八邻域清除孤立点法去除孤立点:在3*3的图像块中,如果当前处理像素f(i,j)为黑色,而其相邻的像素f(i,j+1),f(i,j-1),f(i-1,j),f(i+1,j),f(i-1,j-1),f(i+1,j-1),f(i-1,j+1),f(i+1,j+1)均为白色时,当前处理像素f(i,j)设为白色。
 优选地,所述的步骤(2)按下述方法进行:
 按行扫描,记录每一列的底部到这一列最近的黑点的高度,得到一个个数为w的数组Heights[w],w为图片宽度像素数;
  从左向右扫描数组Heights[w],计算得到底部峰谷趋势数组HeightTendency[w]:右边高度大于当前点高度,标记为向上趋势1;右边高度小于当前点高度,标记为向下趋势-1;否则标记为0;
  然后从左到右扫描底部峰谷趋势数组HeightTendency[w],得到字数估计:趋势数组HeightTendency中,当前点为向上趋势1并且下一个点的值为0时,标记为一个底部切分点,底部切分点的数目即为字数估计值。
优选地,所述的步骤(3)按下述方法进行:
从底部的每个切分点,向上遍历查找每两个字符之间的最小f(x,y)路线:
  f(x,y)=a*p+b*c,其中,a=0.45,b=0.5;       (2)
  p为路径代价,p=abs(x-OrigX) * d + y,OrigX 表示底部切分点的横坐标;x表示像素点横坐标,y表示像素点纵坐标,x取值范围为1~w,y取值范围为1~Heights[OrigX];d=3;
   c=abs(x-OrigX2),当x<OrigX 时,OrigX2表示当前切分点左边最邻近的底部切分点的横坐标;当x>OrigX时,OrigX2表示当前切分点右边最邻近的底部切分点的横坐标;当x=OrigX或者当前切分点为最左边或最右边切分点时,OrigX2=0。
优选地,所述的步骤(4)按下述方法进行:从左到右扫描横向笔迹,并把横向笔迹的纵向点也根据步骤(3)中的公式(2),加入到广度优先搜索算法中进行最小代价切分的计算,根据计算结果来决定是否再分割。
步骤(5)可采用本领域技术人员熟知的OCR认别方法。优选地,所述的步骤(5)中,对分割后的字符图像采用通用的神经网络识别算法进行识别。
     本发明采用基于边缘的字数估计算法、最小代价切分算法和基于笔画的笔迹跟踪算法,连笔手写字符图像通过三个算法的循环处理,确定最佳切分方案,实现连笔字符的精准分割,从而提高了识别的正确率。
附图说明
图1是本发明连笔手写字符的识别方法的流程图。
图2是实施例中待识别的原始图片。
图3是实施例中灰度化和二值化后的图片。
图4是实施例中去孤立点后的图片。
图5是实施例中计算得到的底部高度曲线。
图6是实施例中底部切分点示意图。
图7是实施例中最终确定分割方案后的字符图。
具体实施方式
   下面结合实施例和附图对本发明做进一步的详细描述,但是本发明的保护范围并不限于此。
参见图1,一种连笔手写字符的识别方法,包括下述步骤:
(1)将彩色图像灰度化,再对灰度图像二值化,然后对二值化图像进行去孤立点操作,最后去除图像四个边缘的空白区域,留下中间包含黑色点部分的方块区域。图2的原始图片,经灰度化和二值化后得到图3,再经去孤立点后得到图4。
所述步骤(1)中采用加权平均法进行彩色图像灰度化,按下式对RGB三分量进行加权平均得到灰度图像:
f(i,j)=0.30R(i,j)+0.50G(i,j)+0.20B(i,j))         (1)
设w为图像的宽度像素数,h为图像的高度像素数,整数i取值为1~w,整数j取值为1~h。
所述步骤(1)中根据一个特定的阈值C1,整数C1取值为0~255,如C1设有150,对每个点进行二值化;当某个点的灰度值大于C1时,将该点设为白色,否则设为黑色。
所述步骤(1)中采用八邻域清除孤立点法去除孤立点:在3*3的图像块中,如果当前处理像素f(i,j)为黑色,而其相邻的像素f(i,j+1),f(i,j-1),f(i-1,j),f(i+1,j),f(i-1,j-1),f(i+1,j-1),f(i-1,j+1),f(i+1,j+1)均为白色时,当前处理像素f(i,j)设为白色。
(2) 按行扫描,记录每一列的底部到这一列最近的黑点的高度,得到一个个数为w的数组Heights[w],w为图片宽度像素数;该数组构成的底部高度曲线如图5所示。
  从左向右扫描数组Heights[w],计算得到底部峰谷趋势数组HeightTendency[w]:右边高度大于当前点高度,标记为向上趋势1;右边高度小于当前点高度,标记为向下趋势-1;否则标记为0;
然后从左到右扫描底部峰谷趋势数组HeightTendency[w],得到字数估计:趋势数组HeightTendency中,当前点为向上趋势1并且下一个点的值为0时,标记为一个底部切分点,底部切分点的数目即为字数估计值。  经计算后的底部切分点示意图如图6所示。
(3)从底部的每个切分点,向上遍历查找每两个字符之间的最小f(x,y)路线:
  f(x,y)=a*p+b*c,其中,a=0.45,b=0.5;       (2)
  p为路径代价,p=abs(x-OrigX) * d + y,OrigX 表示底部切分点的横坐标;x表示像素点横坐标,y表示像素点纵坐标,x取值范围为1~w,y取值范围为1~Heights[OrigX];d=3;
   c=abs(x-OrigX2),当x<OrigX 时,OrigX2表示当前切分点左边最邻近的底部切分点的横坐标;当x>OrigX时,OrigX2表示当前切分点右边最邻近的底部切分点的横坐标;当x=OrigX或者当前切分点为最左边或最右边切分点时,OrigX2=0。
最终确定的字符分割方案如图7所示。
(4)从左到右扫描横向笔迹,并把横向笔迹的纵向点也根据步骤(3)中的公式(2),加入到广度优先搜索算法中进行最小代价切分的计算,根据计算结果来决定是否再分割;如果存在需要再切分的块,则返回步骤(2)重新计算、分割;如果不存在,则进行下一步骤; 
    本实施例中提供的图片经计算后不需要再分割,故直接进行下一步。
(5)对分割后的字符图像采用通用的神经网络识别算法进行识别,转化为计算机文字。

Claims (7)

1.一种连笔手写字符的识别方法,其特征在于包括下述步骤:
(1)对输入图像进行降噪处理,消除数字噪声;
(2)通过基于边缘的字数估计算法计算字数;
所述的步骤(2)按下述方法进行:
按行扫描,记录每一列的底部到这一列最近的黑点的高度,得到一个个数为w的数组Heights[w],w为图像宽度像素数;
从左向右扫描数组Heights[w],计算得到底部峰谷趋势数组HeightTendency[w]:右边高度大于当前点高度,标记为向上趋势1;右边高度小于当前点高度,标记为向下趋势-1;否则标记为0;
然后从左到右扫描底部峰谷趋势数组HeightTendency[w],得到字数估计:底部峰谷趋势数组HeightTendency[w]中,当前点为向上趋势1并且下一个点的值为0时,标记为一个底部切分点,底部切分点的数目即为字数估计值;
(3)通过最小代价切分算法计算最佳字符分割方案;
所述的步骤(3)按下述方法进行:
从底部的每个切分点,向上遍历查找每两个字符之间的最小f(x,y)路线:
    f(x,y)=a*p+b*c,其中,a=0.45,b=0.5;       (2)
    p为路径代价,p=abs(x-OrigX) * d + y,OrigX 表示底部切分点的横坐标;x表示像素点横坐标,y表示像素点纵坐标,x取值范围为1~w,y取值范围为1~Heights[OrigX];d=3;
    c=abs(x-OrigX2),当x<OrigX 时,OrigX2表示当前切分点左边最邻近的底部切分点的横坐标;当x>OrigX时,OrigX2表示当前切分点右边最邻近的底部切分点的横坐标;当x=OrigX或者当前切分点为最左边或最右边切分点时,OrigX2=0;
(4)通过基于笔画的笔迹跟踪算法确定是否存在需要再切分的块,如果存在需要再切分的块,则返回步骤(2)重新计算、分割;如果不存在,则进行下一步骤;
(5)对分割后的字符图像进行OCR识别,转化为计算机文字。
2.根据权利要求1所述的连笔手写字符的识别方法,其特征在于:所述的步骤(1)包括:将彩色图像灰度化,再对灰度图像二值化,然后对二值化图像进行去孤立点操作,最后去除图像四个边缘的空白区域,留下中间包含黑色点部分的方块区域。
3.根据权利要求2所述的连笔手写字符的识别方法,其特征在于:所述步骤(1)中采用加权平均法进行彩色图像灰度化,按下式对RGB三分量进行加权平均得到灰度图像:
 f(i,j)=0.30R(i,j)+0.50G(i,j)+0.20B(i,j))           (1)
设w为图像的宽度像素数,h为图像的高度像素数,整数i取值为1~w,整数j取值为1~h。
4.根据权利要求2所述的连笔手写字符的识别方法,其特征在于:所述步骤(1)中根据一个特定的阈值C1,整数C1取值为0~255,对每个点进行二值化;当某个点的灰度值大于C1时,将该点设为白色,否则设为黑色。
5.根据权利要求2所述的连笔手写字符的识别方法,其特征在于:所述步骤(1)中采用八邻域清除孤立点法去除孤立点:在3*3的图像块中,如果当前处理像素f(i,j)为黑色,而其相邻的像素f(i,j+1),f(i,j-1),f(i-1,j),f(i+1,j),f(i-1,j-1),f(i+1,j-1),f(i-1,j+1),f(i+1,j+1)均为白色时,当前处理像素f(i,j)设为白色。
6.根据权利要求1所述的连笔手写字符的识别方法,其特征在于:所述的步骤(4)按下述方法进行:从左到右扫描横向笔迹,并把横向笔迹的纵向点也根据步骤(3)中的公式(2),加入到广度优先搜索算法中进行最小代价切分的计算,根据计算结果来决定是否再分割。
7.根据权利要求1所述的连笔手写字符的识别方法,其特征在于:所述的步骤(5)中,对分割后的字符图像采用通用的神经网络识别算法进行识别。
CN2012100769575A 2012-03-22 2012-03-22 连笔手写字符的识别方法 Expired - Fee Related CN102663378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100769575A CN102663378B (zh) 2012-03-22 2012-03-22 连笔手写字符的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100769575A CN102663378B (zh) 2012-03-22 2012-03-22 连笔手写字符的识别方法

Publications (2)

Publication Number Publication Date
CN102663378A CN102663378A (zh) 2012-09-12
CN102663378B true CN102663378B (zh) 2013-12-11

Family

ID=46772862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100769575A Expired - Fee Related CN102663378B (zh) 2012-03-22 2012-03-22 连笔手写字符的识别方法

Country Status (1)

Country Link
CN (1) CN102663378B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292255A (zh) * 2017-06-13 2017-10-24 浙江大学 基于特征矩阵相似度分析的手写数字识别方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463157B (zh) * 2014-11-07 2019-03-12 李宇 手写字符的电子识别方法
CN104504385B (zh) * 2014-12-10 2017-12-22 上海大学 手写粘连数字串的识别方法
CN107341429B (zh) * 2016-04-28 2020-09-01 富士通株式会社 手写粘连字符串的切分方法、切分装置和电子设备
CN108171231A (zh) * 2016-12-07 2018-06-15 中兴通讯股份有限公司 一种基于图像识别的通信方法和装置
CN106682671A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 图像文字识别系统
CN107256389A (zh) * 2017-05-26 2017-10-17 山西农业大学 基于笔迹特征识别的认证及加密方法
CN108717544B (zh) * 2018-05-21 2022-11-25 天津科技大学 一种基于智能图像分析的报纸样稿文字自动检测方法
CN108805894A (zh) * 2018-06-19 2018-11-13 合肥凌极西雅电子科技有限公司 图像分析方法及其系统
CN111435407A (zh) * 2019-01-10 2020-07-21 北京字节跳动网络技术有限公司 错别字的纠正方法、装置、设备及存储介质
CN109871910B (zh) * 2019-03-12 2021-06-22 成都工业学院 一种手写字符识别方法及装置
CN110942004A (zh) * 2019-11-20 2020-03-31 深圳追一科技有限公司 基于神经网络模型的手写识别方法、装置及电子设备
CN111931672A (zh) * 2020-08-17 2020-11-13 珠海大横琴科技发展有限公司 字迹识别方法、装置、计算机设备及存储介质
CN115393861B (zh) * 2022-10-31 2023-01-31 蓝舰信息科技南京有限公司 一种手写体文本精准分割方法
CN116343242B (zh) * 2023-05-30 2023-08-11 山东一品文化传媒有限公司 基于图像数据的试题实时批阅方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0580152A3 (en) * 1992-07-22 1994-10-19 Eastman Kodak Co Method and device for segmenting and classifying handwritten characters without constraint.
CN1275193C (zh) * 2002-12-04 2006-09-13 北京邮电大学 非限制自由手写数字串的模具切分装置及其方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292255A (zh) * 2017-06-13 2017-10-24 浙江大学 基于特征矩阵相似度分析的手写数字识别方法
CN107292255B (zh) * 2017-06-13 2020-07-28 浙江大学 基于特征矩阵相似度分析的手写数字识别方法

Also Published As

Publication number Publication date
CN102663378A (zh) 2012-09-12

Similar Documents

Publication Publication Date Title
CN102663378B (zh) 连笔手写字符的识别方法
CN103258198B (zh) 一种表格文档图像中字符提取方法
CN104298982B (zh) 一种文字识别方法及装置
Kumar et al. Segmentation of isolated and touching characters in offline handwritten Gurmukhi script recognition
Dongre et al. Devnagari document segmentation using histogram approach
Gatos et al. ICFHR 2010 handwriting segmentation contest
CN112818951B (zh) 一种票证识别的方法
CN105426890B (zh) 一种字符扭曲粘连的图形验证码识别方法
CN103310211B (zh) 一种基于图像处理的填注标记识别方法
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
WO2017016448A1 (zh) 一种qr码特征检测方法及系统
Vijaya Kumar et al. Classification and recognition of handwritten digits by using mathematical morphology
CN109086772A (zh) 一种扭曲粘连字符图片验证码的识别方法及系统
CN111091124A (zh) 一种书脊文字识别方法
Bijalwan et al. Automatic text recognition in natural scene and its translation into user defined language
CN107730511B (zh) 一种基于基线估计的藏文历史文献文本行切分方法
CN109241975B (zh) 一种基于字符中心点定位的车牌字符分割方法
CN104834926B (zh) 一种字符区域提取方法及系统
CN112270704B (zh) 一种基于数据链表结构的星点质心提取方法
CN103902100A (zh) 用于智能手绘输入的基于速度特征的笔划分割方法
CN104504385B (zh) 手写粘连数字串的识别方法
CN105160300B (zh) 一种基于水平集分割的文本抽取方法
CN109460763B (zh) 一种基于多层次文本组件定位与生长的文本区域提取方法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
Rajithkumar et al. Template matching method for recognition of stone inscripted Kannada characters of different time frames based on correlation analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131211

Termination date: 20200322

CF01 Termination of patent right due to non-payment of annual fee