CN102254157A - 一种寻找左右字符的字符切分位置评价方法 - Google Patents
一种寻找左右字符的字符切分位置评价方法 Download PDFInfo
- Publication number
- CN102254157A CN102254157A CN2011101886726A CN201110188672A CN102254157A CN 102254157 A CN102254157 A CN 102254157A CN 2011101886726 A CN2011101886726 A CN 2011101886726A CN 201110188672 A CN201110188672 A CN 201110188672A CN 102254157 A CN102254157 A CN 102254157A
- Authority
- CN
- China
- Prior art keywords
- character
- cutting
- characters
- cutting position
- segmenting position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
一种寻找左右字符的字符切分位置评价方法属于字符识别领域。其解决整串字符识别过程中如何确定正确的字符之间切分位置的问题,可以通用于印刷体、脱机手写、联机手写字符识别领域。其主要技术特征在于:对某个切分位置评价时,穷举找到这个切分位置两边所有可能切分出来的字的位置,并根据这两个字组合的大小、位置、间距关系,以及字的识别结果对切分位置进行评价,选取评价结果最优的组合作为对该切分位置的评价。
Description
技术领域
本发明属于字符识别领域。字符识别分联机和脱机两类,联机字符识别是对采集得到的书写笔经过的轨迹点进行识别;脱机字符识别是通过扫描仪或照相的方式得到字符图像来识别。本发明对联机和脱机字符识别都适用。对于一串脱机字符图像或联机笔迹序列进行识别时需要把这串文字中的每个字符分割出来。本发明涉及一种判断每个可分割的位置是否应该分开的方法,以本发明为基础可以实现字符分割和识别系统,该系统与已有的字符分割和识别系统有很大不同。
背景技术
目前,对于整串字符进行识别系统的系统一般需要利用字符分割方法,有些系统先分割后识别,另一些系统把识别和分割结合在一起。先切分后识别的系统,由于分割时不利用识别信息,分割错误较多,目前已比较少采用。
切分和识别结合的方法,其主流的做法是先进行过切分,即设法根据一些规则获得所有可能的切分位置,为了尽量减少漏掉真正的切分位置的情况,通常获取的切分位置远多于真正正确的切分位置,因此叫过切分。切分位置可以通过投影分析、连通域分析、轮廓分析等方法获得。过切分以后,认为所有可能切点的集合的任何一个子集都决定了一种切分结果,通过对每一种切分结果进行评价,选取在该评价准则下最优的切分结果作为最终结果。评价准则一般是计算每个切分出来的字符的大小分布、识别可信度和与利用语言模型计算出来的概率。参考:
【1】Yi Lu,Machine printed character segmentation-An overview,Pattern RecognitionVolume 28,Issue 1,January 1995,Pages 67-80
【2】C.-L.Liu,M.Koga,H.Fujisawa,Lexicon-driven segmentation and recognition ofhandwritten character strings for Japanese address reading,IEEE Trans.Pattern Analysis andMachine Intelligence,Volume 24,Issue 11,2002,Pages 1425-1437
这种基于全局最优的切分识别方法的问题主要有:
1.计算量大,如果过切分得到的切点数是N个,则所有可能的切分结果有2的N次方种。虽然可以采用动态规划等方法减少计算量,但有可能找不到最优解,且计算量仍然非常大。
2.评价准则难以确定,现有的评价准则都还不够令人满意。
3.误差扩散,某一个局部的错误会影响周围较大范围。
为了解决这些问题,可以把全局评价最优的方法等价为对每一个可能的切分点进行评价的问题,通过选取评价指标比较好的切点,获得最终的识别结果。
现有切分点评价方法一般在切点左右各取固定范围的图形,计算其形状和位置特征,设计分类器判断是否是正确的切分点。这些方法不能充分利用字符识别结果和字符之间的约束关系信息。
发明内容
为了解决现有切分点评价方法不能充分利用字符识别和字符之间关系信息的问题,本发明提出了一种新方法。本发明在过切分后,对某个切分位置评价时,穷举找到这个切分位置两边所有可能切分出来的字的位置,并根据这两个字组合的大小、位置、间距,以及字的识别结果对切分位置进行评价。以便找到最佳的切分位置。
本发明需要利用已有字符识别器,字符识别器对输入图像块或笔划轨迹点进行识别后得到M个候选识别结果,M的数值由字符识别器决定,一般取10。
为了说明方便,我们假设待识别的文字串是横方向书写的。(对于竖方向书写的情况,把左右位置关系用上下代替,本发明中的方法也可以适用。)
如附图1所示,0-9是所有预先获得的过切分点,其中有些是正确的切分点,有些是非正确的切分点。我们需要对每个点进行评价,以便找到其中正确的切分点。假设A是一个待评价的切分位置,A左边的过切分位置从近到远分别是A-1、A-2、A-3...A-N,A右边的过切分位置从近到远分别是A+1、A+2、A+3...A+N。N是一个经验参数,相当于一个字符内部最多可能包含的候选切分位置数,一般不会超过5。
如果A是一个正确的切分位置,则A左边必然存在一个切分位置A-x,A与A-x之间的图像或笔划组成一个字符L,且A右边必然存在另一个切分位置A+y,A与A+y之间的图像或笔划组成另一个字符R,x与y都是1到N之间的正整数。
本发明中x,y用如下方法确定:
任取一个x属于从1到N,任取一个y属于从1到N,得到对应的左字符候选L和右字符候选R,并利用字符识别器分别对L、R进行识别,识别结果分别为CL和CR,CL和CR都是有M个候选字的集合。
本发明需要设计一个对(L,R,CL,CR)是一组正确切分识别结果的评价公式,公式的形式可以有不同,根据使用的分类器的特性以及识别的语言不同特点来设计,设计原则是使正确的结果评价分数高。利用该评价公式对每一个不同的x与y产生的(L,R,CL,CR)组合进行评价,取其中最高的评价分数作为切分位置A的评价分数,该分数与左右两个切分位置A-x及A+y一起作为切点A的评价信息。
评价公式通常需要利用相邻两个字符之间大小、距离和位置关系的一致性约束关系,识别器给出的可信度信息,以及左右两个字符在二元语言模型中的转移概率。
字符之间大小一致性约束关系是指左右两个字的大、小、瘦长或扁平情况,在形状上能够通过与另一个字的对比体现出来,例如汉字里“一”与其它字比扁平;排列的一致性是指左右字符之间的位置排列有一定关系,如有些字或标点符号偏上排列,有些居中排列,有些偏下排列。
对于能够输出M个候选字的识别器,L的候选识别结果为CL1、CL2、...CLM,CL分别取其中的任意一个,R的候选识别结果为CR1、CR2、...CRM,CR分别取其中的任意一个。对每一组可选的CL与CR,分别用上文同样的公式对(L,R,CL,CR)进行评价,取分数最高的作为x,y组合的评价。
对每个切分位置的评价可以保留最优、次优、第三优等多个组合。
本发明的优点有:
a.形式简洁。
b.具有通用性,对于印刷、手写、联机、脱机字符的切分问题都适用,对于多种语言都适用。
c.有效利用了字符之间的大小、排列一致性信息。
d.有效利用了字符识别器给出的信息。
e.能够利用语言模型的信息。
f.能够确定每个切分位置的左右切分位置,为字符切分算法提供更多信息。
附图说明
图1一组候选切分点的例子
具体实施方式
以一串印刷体字符为例,说明利用本发明实现的一个完整的字符切分识别方法。
1)获取候选过切分点
根据输入行图像的竖直投影值确定候选切分点的位置。候选切分点分为两类:第一类是竖直投影值为零的点;第二类是竖直投影值的局部极小值点。
如图1的图像,得到候选切分点0-9。
2)切分结果的评价公式
大小一致性评价:用已知CL与CR条件下,左右两字宽度比的出现概率PCL,CR(WL/WR)、左右两字高度比的出现概率PCL,CR(HL/HR)来描述,概率分布函数可以预先统计得到。
识别可信度评价:由识别器给出,左边字符的可信度表示为ECL,右边字符为ECR
语言模型评价:二元字符转移概率,表示为SCL,CR
其中δ、γ、β、α是常数,表示各部分信息关注程度的权重,可根据实际情况设定。
3)确定最佳切分路径包含的切分点
首先利用本发明的评价方法获得每个候选切分位置的评价分数以及对应的左右切分位置组合。
方法1:
直接设定阈值,评价分数大于阈值的当作判定的切分位置。
方法2:
A.选择得分最高的候选切分位置作为起始位置。
B.起始位置切分位置组合的左侧切分位置作为新的起始切分位置,不断重复直到找到左边界。
C.起始位置切分位置组合的右侧切分位置作为新的起始切分位置,不断重复直到找到右边界。所有经过的切分位置构成整个字符串的切分。
其它方法:
也可以设计更复杂的方法和策略,基本原则是用评价分数高的切分组合优先的策略挑选其它切分组合,并保持所有挑选出切分组合互相衔接,不产生矛盾。
Claims (3)
1.一种寻找左右字符的字符切分位置评价方法,其输入为一串印刷体、脱机手写或联机手写字符以及字符间所有可能的切分位置,输出为每一个切分位置正确性的评价,属于字符识别领域,其特征在于:为每个切分位置寻找该位置两边的另外两个切分位置,待评价的切分位置与其每边的切分位置之间的笔画分别构成了两个可能的字符,通过对每种可能的双字符组合评分,并选取最好的评分作为给切分点的评价。
2.如权利说明书1所述的位置评价方法,其特征在于评分方法是针对这两个可能的字符风格的一致程度和对这两个字符识别得到的可信程度,用来评价这3个位置构成的切分组合的好坏。
3.如权利说明书2所述的风格一致程度的评分,其特征在于:两个可能字符的大小、排列位置关系出现的概率越大则评分越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101886726A CN102254157A (zh) | 2011-07-07 | 2011-07-07 | 一种寻找左右字符的字符切分位置评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101886726A CN102254157A (zh) | 2011-07-07 | 2011-07-07 | 一种寻找左右字符的字符切分位置评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102254157A true CN102254157A (zh) | 2011-11-23 |
Family
ID=44981411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101886726A Pending CN102254157A (zh) | 2011-07-07 | 2011-07-07 | 一种寻找左右字符的字符切分位置评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102254157A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN102982329A (zh) * | 2012-11-02 | 2013-03-20 | 华南理工大学 | 移动设备中融合切分识别和语义分析的翻译方法 |
CN103116752A (zh) * | 2013-02-25 | 2013-05-22 | 新浪网技术(中国)有限公司 | 图片审核方法和系统 |
WO2017148265A1 (zh) * | 2016-02-29 | 2017-09-08 | 阿里巴巴集团控股有限公司 | 一种单词的分割方法和装置 |
CN108108734A (zh) * | 2016-11-24 | 2018-06-01 | 杭州海康威视数字技术股份有限公司 | 一种车牌识别方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0459226A (ja) * | 1990-06-27 | 1992-02-26 | Kanzaki Paper Mfg Co Ltd | エンボス加工装置 |
JPH09259226A (ja) * | 1996-03-19 | 1997-10-03 | Sanyo Electric Co Ltd | 認識結果の評価方法および認識装置 |
CN1719454A (zh) * | 2005-07-15 | 2006-01-11 | 清华大学 | 几何代价和语义-识别代价融合的脱机手写汉字切分方法 |
JP2006338224A (ja) * | 2005-06-01 | 2006-12-14 | Hitachi Ltd | 文字認識方法 |
CN101251892A (zh) * | 2008-03-07 | 2008-08-27 | 北大方正集团有限公司 | 一种字符切分方法和装置 |
-
2011
- 2011-07-07 CN CN2011101886726A patent/CN102254157A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0459226A (ja) * | 1990-06-27 | 1992-02-26 | Kanzaki Paper Mfg Co Ltd | エンボス加工装置 |
JPH09259226A (ja) * | 1996-03-19 | 1997-10-03 | Sanyo Electric Co Ltd | 認識結果の評価方法および認識装置 |
JP2006338224A (ja) * | 2005-06-01 | 2006-12-14 | Hitachi Ltd | 文字認識方法 |
CN1719454A (zh) * | 2005-07-15 | 2006-01-11 | 清华大学 | 几何代价和语义-识别代价融合的脱机手写汉字切分方法 |
CN101251892A (zh) * | 2008-03-07 | 2008-08-27 | 北大方正集团有限公司 | 一种字符切分方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982329A (zh) * | 2012-11-02 | 2013-03-20 | 华南理工大学 | 移动设备中融合切分识别和语义分析的翻译方法 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN102982330B (zh) * | 2012-11-21 | 2016-12-21 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN103116752A (zh) * | 2013-02-25 | 2013-05-22 | 新浪网技术(中国)有限公司 | 图片审核方法和系统 |
WO2017148265A1 (zh) * | 2016-02-29 | 2017-09-08 | 阿里巴巴集团控股有限公司 | 一种单词的分割方法和装置 |
US10817741B2 (en) | 2016-02-29 | 2020-10-27 | Alibaba Group Holding Limited | Word segmentation system, method and device |
CN108108734A (zh) * | 2016-11-24 | 2018-06-01 | 杭州海康威视数字技术股份有限公司 | 一种车牌识别方法及装置 |
CN108108734B (zh) * | 2016-11-24 | 2021-09-24 | 杭州海康威视数字技术股份有限公司 | 一种车牌识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308476B (zh) | 票据信息处理方法、系统及计算机可读存储介质 | |
CN112818813B (zh) | 图像中表格信息的识别方法、装置、电子设备及存储介质 | |
JP5071914B2 (ja) | 認識グラフ | |
Tripathy et al. | Handwriting segmentation of unconstrained Oriya text | |
CN101655837B (zh) | 一种对语音识别后文本进行检错并纠错的方法 | |
JP4787275B2 (ja) | セグメント化ベースの認識 | |
US7792369B2 (en) | Form processing method, form processing device, and computer product | |
US8559723B2 (en) | Letter model and character bigram based language model for handwriting recognition | |
CN113537227B (zh) | 一种结构化文本识别方法及系统 | |
CN102254157A (zh) | 一种寻找左右字符的字符切分位置评价方法 | |
CN113762269B (zh) | 基于神经网络的中文字符ocr识别方法、系统及介质 | |
CN105653517A (zh) | 一种识别率确定方法及装置 | |
CN101329731A (zh) | 图像中数学公式的自动识别方法 | |
CN103154974A (zh) | 字符识别装置、字符识别方法、字符识别系统以及字符识别程序 | |
CN109389050B (zh) | 一种流程图连接关系识别方法 | |
CN103902993A (zh) | 文档图像识别方法和设备 | |
CN106339481A (zh) | 基于最大置信度的中文复合新词发现方法 | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
CN110135407B (zh) | 样本标注方法及计算机存储介质 | |
CN113095267A (zh) | 统计图的数据提取方法、电子设备和存储介质 | |
Sahoo et al. | Handwritten Bangla word recognition using negative refraction based shape transformation | |
CN114581932A (zh) | 一种图片表格线提取模型构建方法及图片表格提取方法 | |
CN101452368B (zh) | 一种手写文字输入方法 | |
CN101901333B (zh) | 文本图像中切分词的方法及使用该方法的识别装置 | |
CN117496521A (zh) | 一种表格关键信息抽取方法、系统、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20111123 |