CN1235319A - 对被显示的一个项目上的模式进行识别的设备和方法 - Google Patents

对被显示的一个项目上的模式进行识别的设备和方法 Download PDF

Info

Publication number
CN1235319A
CN1235319A CN99104810A CN99104810A CN1235319A CN 1235319 A CN1235319 A CN 1235319A CN 99104810 A CN99104810 A CN 99104810A CN 99104810 A CN99104810 A CN 99104810A CN 1235319 A CN1235319 A CN 1235319A
Authority
CN
China
Prior art keywords
character
identification
pattern
identification component
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99104810A
Other languages
English (en)
Other versions
CN1163847C (zh
Inventor
U·梅尔
W·鲁珀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1235319A publication Critical patent/CN1235319A/zh
Application granted granted Critical
Publication of CN1163847C publication Critical patent/CN1163847C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

一种新的对被显示项目上的模式进行识别的系统。一公知的识别系统被一链接至初级识别的补充识别扩展。未被确定地识别的初级识别结果被送至补充识别,并且未由补充识别确实地识别的任何字符又被送至一校正系统。在这里,操作人员分类这些未识别字符,这些未识别字符然后被用于教导该补充识别部件。因此,该校正系统的被分类数据提供了用于继续的训练处理的训练数据,该训练处理与该校正系统耦合。

Description

对被显示的一个项目上的模式进行识别的设备和方法
本发明一般涉及用于对被显示的一个项目上的模式进行识别的处理。特别地,本发明涉及任何这种包括连续模式适应处理的处理。本发明还涉及执行这种处理的设备。
在现代商业领域,对被显示项目上的字符模式或字符的识别呈现出日益增长的重要性。特别在银行领域和其它金融活动中,采用具有字符识别部件的数据处理设备,为的是在没有手工协助的情况下,便于传送指令的处理、预打印支票以及其它凭证。这种识别部件还用于自动信件分类中。
为此,人们采用一指定的标识符集,例如包括某些专用字符的字母数字集字符。识别处理被用于将赋予最大可能的可靠性的识别分配给用于识别的字符。
为了实现这一点,对于待识别的项目在一分类器的最初阶段中的主题数据详细予处理后,称作可靠性因子的数值估计被估算用于考虑到的一个或一些标识符,这些标识符在其后的级中被用作关于对一标识符的项目分配的判定基础。
这些分配判定受残留错误的支配,所述残留错误通过拒绝和接收不准确的标识符(替换)产生。对于最小可能的拒绝并且同时最小替换的比率的需求包括了自动识别处理的矛盾需求。
为了提高模式识别的可靠性,已经进行的实验采用了所谓的“多表决”处理,在其中,来自一些模式识别部件的对同一字符的阅读结果被送到一所谓的“收缩部件”(narrowing unit),该收缩部件比较这些结果并且根据下列规则选择总的结果:
a)如果所有的识别部件产生相同结果,则总的结果能够随意地从任一识别部件中选择;
b)如果这些识别部件中没有一个能够提供可靠的结果,则总的结果是“拒识”(不可识别);
c)如果所有这些识别部件的结果是相同的,但是在这些结果之间至少有一个具有大于预定阈值(例如50%)的可靠性因子,则最可靠的值被选择为总的结果;
d)如果所有这些识别部件的结果是不可比较的,则总的结果为“拒识”(不可识别)。
从DE4133590A1中我们可以看到一种用于这种信号的分类的处理,在所有情况下的分类代表这些信号的一些可能幅度值的其中之一。在该处理中,下列工作级在一个或多个通道中并行发生:
ⅰ)在所有情况下从一些扫描值中形成样值;
ⅱ)从每个样值中提取至少一个特征;
ⅲ)从每个样值中提取的这个或这些特征被用作地址,使得能够从表中读出存储在其中的发生可能性。
为了进一步的估计,根据所有样值的发生可能性计算一判定尺度,并且将其与一预定阈值比较。
DE 2112919B2提出了另一种采用多表决处理的字符识别装置。该装置含有一初始字符处理路径,该路径具有一收集阵列、一处理阵列和一判定阵列,其中的收集阵列获取来自字符的信息,其中的处理阵列接收用于处理的来自该收集阵列的信号,其中的判定阵列接收来自该处理阵列的信号并且在该判定阵列中一字符是可识别的,产生一判定信号到达其输出端。另外,采用了第二字符处理路径,一方面,该第二路径包括另一收集阵列和/或另一处理阵列以及已经存在的判定阵列,或者另一方面,在所有情况下包括第二收集、处理和判定阵列。第二字符处理路径的三个阵列中至少有一个根据与第一字符处理路径的相应阵列不同的原理工作,并且,在第二字符处理路径的输出端,一判定信号与来自第一字符处理路径的一判定信号一起被馈送至一比较阵列中,该比较阵列在二者匹配时产生一识别信号。
该多表决处理还需要采用至少两个识别部件,其中每个部件采用不同的识别算法。但是与先前的处理相比,这仅仅稍微改进了识别处理的可靠性。
从DE 4407998C2中我们看到一种用于对凭证的模式识别的过程,其中至少两个不同的模式识别部件用于识别所述模式。还提供了一装置,用于确定一可靠性因子,该因子由用于由所述模式识别部件识别的每个模式的一模糊变量表示,还提供了另一装置,用于估计通过特定的可靠性因子识别的模式。
DE 4436408C1描述了一种模式识别处理,其中,在一训练阶段中产生用于一些值的校准规范,这些值用于由一分类器提出的可能的标识符,并且在其识别过程中,由该分类器估计的值由采用该校准规范的不同值替换。
最后,JP-A-8235304描述了一种具有第一和第二识别部件的字符识别装置,在其中,第二识别部件具有一辅助词典以及一监视部件。根据由用户预定义的校正字符,所提取的特征被馈送至该词典,并且再次执行字符识别。一旦完成第二次字符识别,该辅助词典就被初始化。
除了用于光图象记录的设备和现行的识别部件外,在大多数情况下,当今的模式识别系统都包含一校正站,用于邮政应用的这种站可以是一视频编码系统,拒识显示在该系统上并且由人员手工校正,所述人员被专门培训以进行该工作。在这种情况下,被校正的数据,即未被识别或未充分识别的字符的视频图象(非编码信息,NCI),与相关的手工输入的校正字符(编码信息,CI)一起不再用于识别的目的,而是仅用于校正的目的。
在模式识别系统的开发中,大量的字符模式被收集在训练数据库中。它们必须代表所提出的识别任务的特征。在下一级中,字符被采用光学扫描仪数字化(NCI数据)并且全部被分配至所需的字符类别,例如字母、数字乃至特殊字符,该阶段也称作训练处理。字符识别的质量在很大程度上依赖于该训练数据库。如果数据
0是不可表示的
0在字符形状类别方面是不完善的
0在字符形状的分布方面与实际不一致
0在新字体和时髦的手写体方面是过时的
0是从不同的光记录系统中获得,
则这将产生不满意的识别结果,尽管该训练处理已经正确地执行。
这些训练处理是昂贵的,由于需要许多步骤来保证它们,例如
0模式收集
0评定它们的代表性
0将模式扫描进去
0将字符手工分配至字符类别
0测试新的分类器。
因此,它们被尽可能少地执行。可以认为在识别软件的两个版本之间将有大约一年或以上的时间。而且,由于真正的数据经常是保密的或者私人的,例如在信件的情况中,因此所需数据的收集是一个问题。
因此,本发明的一个目的是提供一种用于字符识别的方法,该方法允许实现一改进的识别率。
本发明的另一目的是提供一种识别方法,该方法允许相关的识别系统被学习。
本发明的再一个目的是提供一种允许实现上述方法的装置。
这些以及其它的目的通过根据权利要求1的装置和根据权利要求5的方法来实现。
本发明的其它有益的实施例被描述在从属权利要求中。
此后利用附图给出本发明的进一步细节。
图1示出了根据本发明的整个识别系统;
图2示出了根据本发明的训练处理的原理;以及
图3示出了在一矩阵中字符的形状类别的例子。
图1示出了根据本发明的整个识别系统的结构。它包括至少两个识别子系统,它们被称作初级识别1和接在其后的部件3,部件3被训练用来特别识别那些该初级识别没有识别或非常拙劣地识别的字符。该后续部件使用一作为对该初级识别的补充的字符集。因此它被称作补充识别。另外,它必须包含具有形状类别的矩阵,以便能够识别例如出现的新潮的字符形状。图1仅仅示出了两个识别子系统1和3。但是,本领域的技术人员还可能实现的是,将另外的这种子系统插入到该初级识别和补充识别之间,或者接在该补充识别之后。
该初级识别具有一普通识别系统的所有性能,在一普通识别系统中,用于各个文本的分类器被一模式适应处理确定。这些分类器包含不同书写类型的特征,这些不同类型的书写在所述识别处理中被识别。因此,该初级识别包括
0识别算法以及
0分类器。
分类器对识别结果具有很大的影响。当该初级识别被使用时,它提供一可靠指数,该指数用于一字符与来自模式适应处理的一字符模式相比的相似程度。如果用于一建议字符的可靠指数较高,则替换的风险就较低。如果该可靠指数下降,则就有上升的字符将被错误地识别的风险。现在,所有的具有低于预定阈值的可靠指数的初级识别1的被分类字符送到该补充识别3。
该补充识别仍然未识别或者仅仅错误地识别(拒识)的字符然后被送到一校正系统5,例如一视频编码系统。在该校正系统中被手工校正的这些拒识现在正常地形成字符识别的最终结果(图1中的箭头6)。
现在,根据本发明的识别系统有一辅助模式适应系统7,该系统7接在校正系统5之后并且位于该校正系统和补充识别3之间,使得能够在后来的过程中采用来自校正系统5的输入用于补充识别3的进一步训练(教导)。因此,该辅助模式适应或者训练处理被来自校正系统的输入、即被用来启动后来的适应处理的在校正系统中校正和识别的字符所影响,即,在这种情况下,在校正系统中识别的字符不输出作为最终的结果,而是送到该模式适应系统(参见图1的箭头8)。因此,在实际的识别处理中和在校正系统中需要校正工作时,该模式适应处理可以联机执行。在该训练处理之前,每个字符被手工给出所谓的“校正识别”,该校正识别在校正站中联机产生。该训练处理需要这种识别,以便能够计算分类器并且在后面测试识别率,即拒识、替换和命中。这样展现的主要优点是,从校正站中直接传送训练数据。因为该数据已经由适当的扫描仪读入并且给出识别,使得它是表示的。
因此,供给“校正识别”的手工过程产生于校正站半身。这样优于一分离(脱机)的训练处理,因为它耗时较少并且较便宜。如果满足下列条件,则所提出的联机模式适应处理自动开始:
0已经收集了足够数量的被分类的字符
0用于触发该处理的特定时刻被确定(例如,在雇员换班时)。
该模式适应处理根据被分类的字符产生分类符。此后,由新产生的分类符实现的识别结果在一测试运行中被再次验证。如果该结果达到某一特定的质量,则旧的补充识别被当前新的所替换。
因此,根据该联机模式适应处理的结果,后来的补充识别3能够致力于初级识别1的弱点并且还增大了被拒识字符的可靠指数。一字符由此被转换为一被识别的字符(命中)。这些被拙劣地识别的字符的联机连续收集以及在训练处理或模式适应过程中进一步的处理导致了收集消耗的降低和识别质量的提高。
下面采用图2作为一个例子给出模式适应处理(训练处理)的更详细的说明。
初级识别1具有一分类器,该分类器与识别算法一起构成一识别部件。因此,该初级识别的识别性能通过软件修改确定并且只能通过软件修改校正。但是如上已经指出,由于费用的原因,很少提供分类器的修改。因此,对例如用户的文本仅存在很小的适应可能性,并且在很长时期内,某些字符的识别弱点必须经常由用户认可。
但是,对于补充识别3,其分类器与各个算法分离,因为它们在被利用来自校正站的新分类的字符计算时总是采用相同的训练算法。因此,分类器通过模式适应处理被连续不断地改进,从而新的分类器和现存的识别算法每次产生新的补充识别。该分类器能够被自动地联机替换。
该补充识别系统主要致力于初级识别1的弱点,而其分类器也被适当地训练。
在图2的例子中,由初级识别1拒绝的字符(拒识)被送到补充识别3。字符“4”的可靠指数是“29”,由于它低于预定阈值(在本例中是“30”),因此导致该字符被送到补充识别3。补充识别3的第一次分类尝试仍然导致拒识该字符,因为可能导致该字符分类为“4”的可靠指数太接近为“9”的可靠指数(应该指出的是,各个阈值和两个字符由于其可靠指数相互之间太接近而被拒识的范围二者都可根据需要确定)。因此,补充识别3仍然决定拒识该字符。被拒识的字符所在的字段,即在当前例子中的分段字符(NCI),根据一标准(刻度)的字符框的该分段字符可以被直接送到模式适应处理,现在该分段字符被送到校正系统5。这里该字符被给出一主识别(所需的识别)。因此,在控制系统处的人员清楚地表示该字符的特征(在该例中为“9”)。现在它被作为一具有附加属性的图象存储在一数据库中,该数据库包含用于辅助模式适应或训练处理的选择物。这些附加属性的例子可以是:
0主识别
0扫描仪的分辨率
0字符框的宽度和高度
0用于识别-ID(Reco-ID)的字段。
现在,该联机训练处理(重新训练)保证补充识别3的进一步分类产生用于分类为“9”的足够高的可靠指数(参见下面)。因此,该字符不再被送到校正系统,而是被正确地识别。
补充识别3的分类器联机调整文本(在实际工作场所进行训练),因此提高了整个系统的识别质量。
来自拒识字符的数据库的分类字符被给出一在相关字符类别中的格式类别。对于每一字符类别存在相应的一些格式类别,从而覆盖字符的偏差,以便用于训练处理。
图3示出了用于字符类别“4”的格式类别原理。
对于在一字符类别范围内的每个格式类别,来自其它字符类别的相关格式类别被用来在训练过程中自动地计算分类器。最好是采用处理过程,在该过程中,区域特性和反一特性被用于识别(参见EP-B-0 632404)。该过程具有的优点是,在校正系统中,在字符分类后,在训练处理(模式适应处理)中不需要其它的手工维护。
可以分级实现该模式适应处理。在第一级中,来自校正系统的被校正字符被存储一特定时期。该数据然后在训练处理中处理,在识别软件的制造商的生产车间实现该训练过程是可能的。作为该训练过程的结果,分类器被获得,该分类器被加载到该补充识别。该补充识别现在作为一后续的识别部件并且将拒识传送至校正系统。但是,在该第一级中,用于该第一识别系统的起动的后来的过程脱机执行。这里,该校正站仅用于收集初始训练数据。字符被分类并且字符外形被存储。数据的处理(训练处理)脱机进行。然后,来自第一训练处理的分类器仅被加载一次,例如在用户的房屋里,整个系统就被投入运行。
在第二阶段,训练处理然后被合并到补充识别中,使得该训练处理然后被联机启动(请进一步详细说明)并且能够从一由校正系统构造的字符数据库中读其数据。
在此提出的系统的主要优点是,它经常提比初级识别系统更好的结果。即使一具有新的优良结果的新识别系统被投入市场,它也将能提供比这里描述的系统更好的结果。本系统将仅在产生拒识时,即当可能通过补充识别改进时才开始工作。
这样就能够提供一种自教学识别系统,与现存系统相比,该系统大大增加了识别率。

Claims (10)

1.对一个被显示项目上的模式进行识别的装置,具有至少两个模式识别部件(1、3)和一个或多个校正系统(5),该校正系统跟随在这些识别部件之后,并且在该装置中,该两个模式识别部件的最小量包括一初级模式识别部件(1),并且至少一个初级识别部件位于第二识别部件(3)之后,其特征在于
一个后续识别部件(3)的最小量被给出一模式适应系统(7),能够以模式的被校正字符形式读入到其中,该模式从位于第二识别部件(3)和模式适应系统(7)之间的校正系统(5)识别,其中的校正字符被用于第二识别部件(3)。
2.根据权利要求1的装置,其特征在于这些被校正字符具有特定的识别。
3.根据权利要求1或2的装置,其特征在于,第二识别部件采用一对初级识别补充的字符库。
4.根据前述任一权利要求的装置,其特征在于,仅仅由该初级识别或第二识别部件未正确识别的字符被送至该校正系统。
5.对一个被显示项目上的模式进行识别的方法,包括下列步骤:
a)记录被显示项目上的模式,
b)传送所记录模式至一初级识别部件(1),
c)传送该第一识别部件(1)未正确识别的字符至第二识别部件
(3),
d)传送该第二识别部件(3)未正确识别的字符至一校正系统
(5),
e)在该校正系统中正确识别该字符;以及
f)传送被正确识别的该字符至一模式适应处理,以便教导该第二
识别部件(3)。
6.根据权利要求5的方法,其特征在于,该模式适应处理联机执行。
7.根据权利要求5或6的方法,其特征在于,第二识别部件未正确识别的字符在该校正系统中被给予一所需的识别符。
8.根据权利要求7的方法,其特征在于,给予了所需识别符的字符被存储在用于模式适应处理的数据库中。
9.根据权利要求5-8的其中之一的方法,其特征在于,该模式适应处理分两级执行。
10.根据权利要求5-9的其中之一的方法,其特征在于,该模式适应处理给出在第二识别部件中未正确识别的字符的明确分类。
CNB991048105A 1998-05-07 1999-04-05 对被显示的一个项目上的模式进行识别的设备和方法 Expired - Fee Related CN1163847C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19820353A DE19820353C2 (de) 1998-05-07 1998-05-07 Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
DE19820353.5 1998-05-07

Publications (2)

Publication Number Publication Date
CN1235319A true CN1235319A (zh) 1999-11-17
CN1163847C CN1163847C (zh) 2004-08-25

Family

ID=7866933

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991048105A Expired - Fee Related CN1163847C (zh) 1998-05-07 1999-04-05 对被显示的一个项目上的模式进行识别的设备和方法

Country Status (5)

Country Link
US (1) US6373982B1 (zh)
EP (1) EP0955600B1 (zh)
JP (1) JPH11345283A (zh)
CN (1) CN1163847C (zh)
DE (2) DE19820353C2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592121A (zh) * 2011-12-28 2012-07-18 方正国际软件有限公司 一种ocr漏识判断方法及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004030415A1 (de) * 2004-06-24 2006-01-19 Siemens Ag Verfahren zur automatischen Ermittlung operativer Leistungsdaten von Lesesystemen
DE102006050347A1 (de) * 2006-10-25 2008-04-30 Siemens Ag Verfahren zum Prüfen eines Aufdrucks und Aufdruckprüfvorrichtung
US10019000B2 (en) 2012-07-17 2018-07-10 Elwha Llc Unmanned device utilization methods and systems
US20140025230A1 (en) 2012-07-17 2014-01-23 Elwha LLC, a limited liability company of the State of Delaware Unmanned device interaction methods and systems

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7004381A (zh) * 1970-03-26 1971-09-28
JPS6142083A (ja) 1984-08-03 1986-02-28 Fujitsu Ltd 文字認識装置
JPS6227874A (ja) 1985-07-30 1987-02-05 Toshiba Corp 文字認識装置
JPS62103784A (ja) 1985-10-31 1987-05-14 Toshiba Corp 文字読取装置
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure
JPH04302073A (ja) 1991-03-29 1992-10-26 Meidensha Corp 文字認識装置
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置
DE4133590A1 (de) * 1991-07-03 1993-01-14 Bosch Gmbh Robert Verfahren zur klassifikation von signalen
US5251268A (en) * 1991-08-09 1993-10-05 Electric Power Research Institute, Inc. Integrated method and apparatus for character and symbol recognition
DE69315990T2 (de) * 1993-07-01 1998-07-02 Ibm Mustererkennung durch Erzeugung und Benutzung zonenweiser Merkmale und Anti-Merkmale
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
DE4436408C1 (de) * 1994-10-12 1995-12-07 Daimler Benz Ag Mustererkennungsverfahren
JPH08235304A (ja) * 1995-02-24 1996-09-13 Oki Electric Ind Co Ltd 文字認識装置
DE19624977A1 (de) * 1996-06-22 1998-01-02 Siemens Ag Verfahren zur Verarbeitung von Postsachen
US5881172A (en) * 1996-12-09 1999-03-09 Mitek Systems, Inc. Hierarchical character recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592121A (zh) * 2011-12-28 2012-07-18 方正国际软件有限公司 一种ocr漏识判断方法及系统

Also Published As

Publication number Publication date
DE19820353C2 (de) 2001-06-13
EP0955600A3 (en) 2002-06-12
JPH11345283A (ja) 1999-12-14
DE19820353A1 (de) 1999-11-11
DE69928320T2 (de) 2006-07-27
DE69928320D1 (de) 2005-12-22
US6373982B1 (en) 2002-04-16
CN1163847C (zh) 2004-08-25
EP0955600B1 (en) 2005-11-16
EP0955600A2 (en) 1999-11-10

Similar Documents

Publication Publication Date Title
Fiel et al. Writer retrieval and writer identification using local features
US6104833A (en) Pattern recognizing apparatus and method
US6291785B1 (en) Address reader, sorting machine such as a mail thing and character string recognition method
US6442555B1 (en) Automatic categorization of documents using document signatures
KR100249055B1 (ko) 문자인식장치및방법
US7283669B2 (en) Fine segmentation refinement for an optical character recognition system
US20080159589A1 (en) Method of optically recognizing postal articles using a plurality of images
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
CN1243462A (zh) 识别分配信息的方法和装置
Plessis et al. A multi-classifier combination strategy for the recognition of handwritten cursive words
CN110781898A (zh) 一种中文ocr后处理的无监督学习方法
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
Hull et al. A blackboard-based approach to handwritten ZIP code recognition.
CN1235319A (zh) 对被显示的一个项目上的模式进行识别的设备和方法
JPH0957204A (ja) 郵便物の宛先自動読取システム
KR100655916B1 (ko) 방대한 데이터의 디지털화를 위한 문서영상처리 및검증시스템 및 그 방법
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
US20040024716A1 (en) Mail sorting processes and systems
US20040114803A1 (en) Method of stricken-out character recognition in handwritten text
Srihari From pixels to paragraphs: the use of contextual models in text recognition
Ghilas et al. Arabic word spotting based on key-points features
Madhvanath et al. Empirical design of a multi-classifier thresholding/control strategy for recognition of handwritten street names
JPH08272902A (ja) 異字体異品質文字の認識方法
CN109409358B (zh) 一种基于纵横直方图的残缺汉字识别方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040825

Termination date: 20120405