CN101561866A - 基于sift特征与灰度差值直方图特征的文字识别方法 - Google Patents

基于sift特征与灰度差值直方图特征的文字识别方法 Download PDF

Info

Publication number
CN101561866A
CN101561866A CNA2009100521417A CN200910052141A CN101561866A CN 101561866 A CN101561866 A CN 101561866A CN A2009100521417 A CNA2009100521417 A CN A2009100521417A CN 200910052141 A CN200910052141 A CN 200910052141A CN 101561866 A CN101561866 A CN 101561866A
Authority
CN
China
Prior art keywords
chinese character
template
unique point
picture
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100521417A
Other languages
English (en)
Other versions
CN101561866B (zh
Inventor
陈凯
管海兵
金贞
武桐
郑琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN2009100521417A priority Critical patent/CN101561866B/zh
Publication of CN101561866A publication Critical patent/CN101561866A/zh
Application granted granted Critical
Publication of CN101561866B publication Critical patent/CN101561866B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及的是一种图像文字识别技术领域的基于SIFT特征与灰度差值直方图特征的文字识别方法。本发明包括以下步骤:1.构建汉字模板图库,其中存储了各种复杂背景下字体类别、文字大小、方向均不相同的图片。2.对模板图库中的图片进行特征提取。3.计算待识别汉字的特征向量。4.寻找模板库中与待识别汉字最相近的汉字。本发明提出的识别方法无需对图片做任何预处理,无需对海量的文字特征做大规模的机器学习,创新性地借助局部特征的优势,巧妙地结合区域内的灰度统计信息来描述、匹配文字,实验结果表明文字识别效果较好,并对同一个字的不同类型字体也能做出很好地辨识。

Description

基于SIFT特征与灰度差值直方图特征的文字识别方法
技术领域
本发明涉及的是一种图像文字识别技术领域的方法,具体是一种基于SIFT特征与灰度差值直方图特征的文字识别方法。
背景技术
目前,图像文字识别技术的应用十分广泛,该技术就是从一幅图像中识别出所包含的文字信息。其实,西方国家在文本识别技术领域已取得了不少研究成果,但是他们的研究对象大多局限于英文字母。由于中文具有复杂的笔画结构、庞大的汉字库、各种不同类型的字体,使得汉字识别技术成为一个研究难点。
传统的文本识别技术一般包括文本定位、文本增强以及成熟的OCR技术。对于基于OCR技术的文本识别方法而言,其识别性能与文本定位的准确率和文本增强后的图像质量有很大关系。而文本定位的准确率又取决于所选文字特征的描述能力。传统的文字特征描绘子大致可以概括为基于结构信息与基于统计信息两大类。基于结构信息的方法来描述汉字字形在理论上比较恰当,但是,在实际应用中,面临的主要问题是抗干扰能力差,例如图像中文字的倾斜、扭曲、断裂、粘连、对比度差等等,而这些因素直接影响到结构基元的提取。基于统计信息的描述方法,主要是提取待识别模式的一组统计特征,然后按照一定准则确定决策。例如,几何矩(geometricmoment)特征:m.k.hu提出利用矩不变量作为特征的想法,所涉及到的几何矩均在线性变换下保持不变。但在实际环境中,很难保证线性变换这一前提条件;傅立叶描绘子:利用傅立叶函数模拟封闭的轮廓线,将傅立叶函数的各个系数作为特征的,对于轮廓线不封闭的字符图像不适用,因此很难用于笔划断裂的字符的识别。
经对现有技术文献的检索发现:《基于笔划的手写体汉字方向分解特征提取方法》(载华南理工大学学报:自然科学版),提出了一种利用笔划密度特征识别文字的方法,文字以固定扫描次数沿水平、垂直或对角线方向扫描时的穿透次数。这种特征描述了汉字的各部分笔划的疏密程度,提供了比较完整的信息。在图像质量可以保证的情况下,这种特征相当稳定,但是在字符内部笔划粘连时误差较大。在实际运用中,上述特征的描述能力受背景复杂度、光照强度、文字字体、文字倾斜程度、文字尺寸等情况的影响。
发明内容
本发明的目的在于克服现有技术中的不足,提出一种基于SIFT特征与灰度差值直方图特征的文字识别方法,本发明利用文字关键区域的局部特征及灰度对比度统计特征来描述文字,并利用该信息来识别复杂背景下的文字。
本发明是通过以下技术方案实现的,本发明包括以下步骤:
(1)建立汉字模板图库,每张模板图片只含单个汉字。每个模板汉字涵盖不同字形的一号字体;
(2)提取待识别汉字图片的特征点,记录每个特征点的相关信息,即位置信息、邻域尺度信息、主方向,并计算出SIFT特征点的128维向量;其中,这些待识别图片上汉字的字体、字号、旋转度、拉伸度、在图片中所处的位置、所处背景的复杂程度都可以有所不同;
(3)利用步骤(2)中得到的每个特征点的相关信息,计算两倍邻域尺度范围内灰度差值统计直方图,得到特征点的120维向量;
(4)将步骤(2)和步骤(3)中计算得到的特征点的128维向量和120维向量合并在一起,归并成总的特征向量,得到待识别汉字图片的特征向量;
(5)计算模板图库中模板文字进行特征向量的计算,并存于汉字模板图库中;
(6)将待识别汉字图片的特征向量与模板图库中模板文字图片的特征向量相匹配:从得到的模板图库中模板文字图片的特征向量集合中,寻找与待识别汉字图片的特征向量相匹配的特征点;
(7)对识别到的汉字图片进行相似度排序,检测识别效果:根据正确匹配点对数的结果以及特征向量间的相似度,将步骤6得到的匹配结果通过加权排序的方法,最终得到模板库中与待识别汉字较匹配的汉字。
与现有技术相比,本发明具有以下有益效果:
本发明利用文字关键区域的局部特征及灰度对比度统计特征来识别复杂背景下的文字,解决了复杂背景、倾斜、形变、光线变换等不同质量的图像上的文字识别问题,无需定位图像中的文字区域,即无需离线地做大量文字统计特征的机器学习工作;无需对文字进行前期增强处理;无需对图像中的汉字进行倾斜矫正、尺度缩放、位置平移等处理;可以部分匹配不同字体的汉字,大大提高了文字识别率。
附图说明
图1是本发明的流程。
图2是同种字体的文字匹配效果。
图3是同种文字不同字体的匹配效果。
具体实施方式
下面结合附图对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例包括以下步骤:
(1)输入待识别的汉字图片,待检测图片上的汉字的字形、字号、文字在图像中所处位置、旋转度、拉伸度、背景复杂度都可以有所不同。
(2)进行SIFT特征点检测:运用SIFT算法进行SIFT特征点向量描述,提取待识别汉字图片的特征点,记录每个特征点的相关信息,即位置信息、邻域尺度信息、主方向,并计算出SIFT特征点的128维向量。
(3)灰度差值直方图描述:利用步骤(2)中得到的关于每个特征点的相关信息,计算两倍邻域尺度范围内灰度差值统计直方图,得到120维向量:
3.1)以步骤(2)检测到的特征点为中心,以步骤(2)得到的尺度(scale)的两倍为半径确定统计灰度差值的邻域范围;
3.2)将该邻域旋转一个角度,使得步骤(2)得到的主方向与坐标系X轴正方向的夹角为0;
3.3)将半径量化为5级,将360度等分成12级,建立对数极坐标,从而将邻域划分成60个子区域;
3.4)计算中心特征点与各个子邻域内其他像素点的差值,若得到的差值大于0,则将正差值的像素个数累加1,若得到的差值小于0,则将负差值的像素个数累加1,最终每个区域会形成2维的统计直方图;
3.5)循环步骤3.4),直至计算完所有的子区域,得到60个子区域对应的120维向量。
(4)将步骤(2)和步骤(3)中计算得到的两种向量合并在一起,归并成总的特征向量,得到待识别汉字图片的特征向量。
(5)计算模板图库中模板文字图片的特征向量,并存于数据库中。
(6)将待识别汉字图片的特征向量与模板图库中模板文字图片的特征向量进行匹配,寻找与待识别汉字图片的特征向量相匹配的特征点。其中,每张模板图片只含有单个汉字,且涵盖了不同字形的一号字体。
针对两幅图片的特征点对集,遍历模板图库中模板文字图片的每个特征点,计算每个特征点对应的特征向量与待识别汉字图片所有特征向量的欧式距离,若最近邻距离与次近邻距离之比在阈值范围之内,则认为该特征点与最近邻向量所对应的特征点是匹配点对。
(7)对检测到的汉字图片进行相似度排序,检测识别效果:根据正确匹配点对数的统计结果以及特征向量间的相似度,将步骤(6)得到的结果通过一个加权排序的方法,最终得到模板库中与待识别汉字较匹配的汉字。所示图2是同种字体的文字匹配效果,分别为黑体常规的“舟”和黑体加粗的“舟”。图3是同种文字不同字体的匹配效果,分别是隶书倾斜字体的“名”与黑体常规字体的“名”。第一列图是本专利提出的算法得到的效果图,第二列图是SIFT算法得到的效果图。连线表示正确匹配上的点对。
本实施例利用文字关键区域的局部特征及灰度对比度统计特征来识别复杂背景下的文字,解决了复杂背景、倾斜、形变、光线变换等不同质量的图像上的文字识别问题,减少了大量文字统计特征的机器学习工作;可以部分匹配不同字体的汉字,大大提高了文字识别率。

Claims (4)

1、一种基于SIFT特征与灰度差值直方图特征的文字识别方法,其特征在于,包括以下步骤:
(1)建立汉字模板图库;
(2)提取待识别汉字图片的特征点,记录每个特征点的位置信息、邻域尺度信息、主方向信息,并计算出SIFT特征点的128维向量;
(3)利用步骤(2)中得到的每个特征点的位置信息、邻域尺度信息、主方向信息,计算两倍邻域尺度范围内灰度差值统计直方图,得到120维向量;
(4)将特征点的128维向量和120维向量合并在一起,归并成总的特征向量,得到待识别汉字图片的特征向量;
(5)计算模板图库中模板文字进行特征向量的计算,并存于数据库中;
(6)待识别汉字图片的特征向量与模板图库中模板文字图片的特征向量进行匹配,寻找与待识别汉字图片的特征向量相匹配的特征点;
(7)对识别到的汉字图像进行相似度排序,检测识别效果。
2、根据权利要求1所述的文字识别方法,其特征是,所述计算两倍邻域尺度范围内灰度差值统计直方图,是指:
1)以步骤(2)检测到的特征点为中心特征点,以邻域尺度的两倍大小为半径确定统计灰度差值的邻域范围;
2)将邻域范围旋转一个角度,使主方向与坐标系X轴正方向的夹角为0;
3)将半径量化为5级,将360度等分成12级,从而将邻域划分成60个子区域;
4)计算中心特征点与各个子邻域内其他像素点的差值,若得到的差值大于0,则将正差值的像素个数累加1,若得到的差值小于0,则将负差值的像素个数累加1,形成2维的统计直方图;
5)循环步骤4),直至计算完所有的子区域,得到60个子区域对应的120维向量。
3、根据权利要求1所述的基于SIFT特征与灰度差值直方图特征的文字识别方法,其特征是,所述的待识别汉字图片的特征向量与模板图库中模板文字图片的特征向量进行匹配,是指,遍历模板图库中模板文字图片的每个特征点,计算每个特征点对应的特征向量与待识别汉字图片所有特征向量的欧式距离,若最近邻距离与次近邻距离之比在阈值范围之内,则认为该特征点与最近邻向量所对应的特征点是匹配点对。
4、根据权利要求1所述的基于SIFT特征与灰度差值直方图特征的文字识别方法,其特征是,步骤(7)所述检测,是指,根据正确匹配点对数的统计结果以及特征向量间的相似度,将步骤(6)得到的结果通过加权排序的方法,得到模板图中与待识别汉字相匹配的汉字。
CN2009100521417A 2009-05-27 2009-05-27 基于sift特征与灰度差值直方图特征的文字识别方法 Expired - Fee Related CN101561866B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100521417A CN101561866B (zh) 2009-05-27 2009-05-27 基于sift特征与灰度差值直方图特征的文字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100521417A CN101561866B (zh) 2009-05-27 2009-05-27 基于sift特征与灰度差值直方图特征的文字识别方法

Publications (2)

Publication Number Publication Date
CN101561866A true CN101561866A (zh) 2009-10-21
CN101561866B CN101561866B (zh) 2011-04-20

Family

ID=41220663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100521417A Expired - Fee Related CN101561866B (zh) 2009-05-27 2009-05-27 基于sift特征与灰度差值直方图特征的文字识别方法

Country Status (1)

Country Link
CN (1) CN101561866B (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782969A (zh) * 2010-02-26 2010-07-21 浙江大学 一种基于物理定位信息的图像特征可靠匹配的方法
CN101957919A (zh) * 2010-09-22 2011-01-26 上海交通大学 基于图像局部特征检索的文字识别方法
CN103049750A (zh) * 2013-01-11 2013-04-17 广州广电运通金融电子股份有限公司 字符识别方法
CN104537376A (zh) * 2014-11-25 2015-04-22 深圳创维数字技术有限公司 一种识别台标的方法及相关设备、系统
WO2015085757A1 (zh) * 2013-12-14 2015-06-18 复旦大学 一种用于图像匹配、识别、检索的频域形状描述方法
CN105528610A (zh) * 2014-09-30 2016-04-27 阿里巴巴集团控股有限公司 文字识别方法和装置
CN104464079B (zh) * 2014-12-29 2016-10-05 北京邮电大学 基于模板特征点及其拓扑结构的多币种面值识别方法
CN106340138A (zh) * 2016-08-23 2017-01-18 深圳怡化电脑股份有限公司 一种交易行为检测方法及装置
CN106682666A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 用于非常见字体ocr识别的特征模板制备方法
CN107392215A (zh) * 2017-08-02 2017-11-24 焦点科技股份有限公司 一种基于sift算法的重图检测方法
CN108244205A (zh) * 2018-01-15 2018-07-06 王晓茗 一种书法饼干及其制作方法
CN109472249A (zh) * 2018-11-22 2019-03-15 京东方科技集团股份有限公司 一种确定书写体优劣等级的方法及装置
CN109583438A (zh) * 2018-10-17 2019-04-05 龙马智芯(珠海横琴)科技有限公司 电子图像的文字的识别方法及图像处理装置
CN109753967A (zh) * 2018-12-29 2019-05-14 北京师范大学 一种图片文字识别方法
CN110827229A (zh) * 2019-11-01 2020-02-21 中国科学院长春光学精密机械与物理研究所 一种基于纹理加权直方图均衡化的红外图像增强方法
CN110909823A (zh) * 2019-12-03 2020-03-24 携程计算机技术(上海)有限公司 图片特征点提取及相似度的判断方法、系统、设备和介质
CN112699794A (zh) * 2020-12-29 2021-04-23 哈尔滨市科佳通用机电股份有限公司 一种铁路货车轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法
CN112784932A (zh) * 2021-03-01 2021-05-11 北京百炼智能科技有限公司 一种字体识别方法、装置和存储介质
CN113221752A (zh) * 2021-05-13 2021-08-06 北京惠朗时代科技有限公司 一种基于多模板匹配的多尺度文字精准识别方法
CN113420767A (zh) * 2021-07-22 2021-09-21 凌云光技术股份有限公司 一种用于字体分类的特征提取方法、系统和装置
CN116703899B (zh) * 2023-08-03 2023-10-24 青岛义龙包装机械有限公司 基于图像数据的袋式包装机产品质量检测方法
CN112784932B (zh) * 2021-03-01 2024-06-07 北京百炼智能科技有限公司 一种字体识别方法、装置和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106402B (zh) * 2013-03-07 2016-04-13 成都威路特软件科技有限公司 一种基于重建的车牌汉字识别方法

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782969A (zh) * 2010-02-26 2010-07-21 浙江大学 一种基于物理定位信息的图像特征可靠匹配的方法
CN101957919A (zh) * 2010-09-22 2011-01-26 上海交通大学 基于图像局部特征检索的文字识别方法
CN101957919B (zh) * 2010-09-22 2012-10-10 上海交通大学 基于图像局部特征检索的文字识别方法
CN103049750A (zh) * 2013-01-11 2013-04-17 广州广电运通金融电子股份有限公司 字符识别方法
CN103049750B (zh) * 2013-01-11 2016-06-15 广州广电运通金融电子股份有限公司 字符识别方法
US9519838B2 (en) 2013-01-11 2016-12-13 Grg Banking Equipment Co., Ltd. Character recognition method
WO2015085757A1 (zh) * 2013-12-14 2015-06-18 复旦大学 一种用于图像匹配、识别、检索的频域形状描述方法
CN105528610A (zh) * 2014-09-30 2016-04-27 阿里巴巴集团控股有限公司 文字识别方法和装置
CN105528610B (zh) * 2014-09-30 2019-05-07 阿里巴巴集团控股有限公司 文字识别方法和装置
CN104537376B (zh) * 2014-11-25 2018-04-27 深圳创维数字技术有限公司 一种识别台标的方法及相关设备、系统
CN104537376A (zh) * 2014-11-25 2015-04-22 深圳创维数字技术有限公司 一种识别台标的方法及相关设备、系统
CN104464079B (zh) * 2014-12-29 2016-10-05 北京邮电大学 基于模板特征点及其拓扑结构的多币种面值识别方法
CN106340138A (zh) * 2016-08-23 2017-01-18 深圳怡化电脑股份有限公司 一种交易行为检测方法及装置
CN106682666A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 用于非常见字体ocr识别的特征模板制备方法
CN107392215A (zh) * 2017-08-02 2017-11-24 焦点科技股份有限公司 一种基于sift算法的重图检测方法
CN108244205A (zh) * 2018-01-15 2018-07-06 王晓茗 一种书法饼干及其制作方法
CN109583438A (zh) * 2018-10-17 2019-04-05 龙马智芯(珠海横琴)科技有限公司 电子图像的文字的识别方法及图像处理装置
CN109583438B (zh) * 2018-10-17 2019-11-08 龙马智芯(珠海横琴)科技有限公司 电子图像的文字的识别方法及图像处理装置
US10902283B2 (en) 2018-11-22 2021-01-26 Boe Technology Group Co., Ltd. Method and device for determining handwriting similarity
CN109472249A (zh) * 2018-11-22 2019-03-15 京东方科技集团股份有限公司 一种确定书写体优劣等级的方法及装置
CN109753967A (zh) * 2018-12-29 2019-05-14 北京师范大学 一种图片文字识别方法
CN110827229B (zh) * 2019-11-01 2023-05-02 中国科学院长春光学精密机械与物理研究所 一种基于纹理加权直方图均衡化的红外图像增强方法
CN110827229A (zh) * 2019-11-01 2020-02-21 中国科学院长春光学精密机械与物理研究所 一种基于纹理加权直方图均衡化的红外图像增强方法
CN110909823A (zh) * 2019-12-03 2020-03-24 携程计算机技术(上海)有限公司 图片特征点提取及相似度的判断方法、系统、设备和介质
CN110909823B (zh) * 2019-12-03 2024-03-26 携程计算机技术(上海)有限公司 图片特征点提取及相似度的判断方法、系统、设备和介质
CN112699794A (zh) * 2020-12-29 2021-04-23 哈尔滨市科佳通用机电股份有限公司 一种铁路货车轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法
CN112784932A (zh) * 2021-03-01 2021-05-11 北京百炼智能科技有限公司 一种字体识别方法、装置和存储介质
CN112784932B (zh) * 2021-03-01 2024-06-07 北京百炼智能科技有限公司 一种字体识别方法、装置和存储介质
CN113221752A (zh) * 2021-05-13 2021-08-06 北京惠朗时代科技有限公司 一种基于多模板匹配的多尺度文字精准识别方法
CN113420767A (zh) * 2021-07-22 2021-09-21 凌云光技术股份有限公司 一种用于字体分类的特征提取方法、系统和装置
CN113420767B (zh) * 2021-07-22 2024-04-26 凌云光技术股份有限公司 一种用于字体分类的特征提取方法、系统和装置
CN116703899B (zh) * 2023-08-03 2023-10-24 青岛义龙包装机械有限公司 基于图像数据的袋式包装机产品质量检测方法

Also Published As

Publication number Publication date
CN101561866B (zh) 2011-04-20

Similar Documents

Publication Publication Date Title
CN101561866B (zh) 基于sift特征与灰度差值直方图特征的文字识别方法
Farooq et al. Pre-processing methods for handwritten Arabic documents
CN101957919A (zh) 基于图像局部特征检索的文字识别方法
CN103310211A (zh) 一种基于图像处理的填注标记识别方法
CN113537227B (zh) 一种结构化文本识别方法及系统
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
Alrehali et al. Historical Arabic manuscripts text recognition using convolutional neural network
Dhanikonda et al. An efficient deep learning model with interrelated tagging prototype with segmentation for telugu optical character recognition
Pham et al. Offline handwritten signature verification using local and global features
Bashir et al. Identification of Kashmiri script in a bilingual document image
Ali et al. An efficient character segmentation algorithm for recognition of Arabic handwritten script
Bing et al. Frame detection and text line segmentation for early japanese books understanding
Ntzios et al. An old greek handwritten OCR system based on an efficient segmentation-free approach
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Xue Optical character recognition
Madushanka et al. Sinhala handwritten character recognition by using enhanced thinning and curvature histogram based method
Shakunthala et al. Enhanced text line segmentation and skew estimation for handwritten Kannada document
Huang et al. Scene character detection and recognition based on multiple hypotheses framework
Bhowmik et al. Character segmentation for handwritten Bangla words using artificial neural network
Liu et al. A prototype system of courtesy amount recognition for Chinese Bank checks
Jia et al. Grayscale-projection based optimal character segmentation for camera-captured faint text recognition
Oladayo Yorùbá language and numerals’ offline interpreter using morphological and template matching
CN115995080B (zh) 基于ocr识别的档案智能管理系统
CN111553336B (zh) 基于连体段的印刷体维吾尔文文档图像识别系统及方法
Nobile et al. Digit/symbol pruning and verification for Arabic handwritten digit/symbol spotting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110420

Termination date: 20180527

CF01 Termination of patent right due to non-payment of annual fee