CN1156791C - 模式识别设备与方法 - Google Patents
模式识别设备与方法 Download PDFInfo
- Publication number
- CN1156791C CN1156791C CNB971020116A CN97102011A CN1156791C CN 1156791 C CN1156791 C CN 1156791C CN B971020116 A CNB971020116 A CN B971020116A CN 97102011 A CN97102011 A CN 97102011A CN 1156791 C CN1156791 C CN 1156791C
- Authority
- CN
- China
- Prior art keywords
- character
- pattern
- frame
- strikethrough
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
一种环境识别装置从一个输入图象中抽取第一个至第N个状态,并且从第一个至第N个模式识别装置中,调用相应于第一个至第N个状态的数据,以执行一个识别过程。
Description
技术领域
本发明涉及一种设备与方法,用于识别一种模式,并且当与一种打印字符识别设备和一种图形识别设备以及一种手写字符识别设备一起使用时,根据各种输入图象状态,正确地识别诸字符、图形和符号。
背景技术
象光学字符阅读器(OCR)之类的常规手写字符识别设备被设计成能自动地阅读那些写在会计表等上的字符,并且自动地输入这些字符,从而不必手工地找出写于会计表等上的字符,也不必用键盘输入字符。
图1是一个方块图,说明常规手写字符识别设备的结构。
在图1中,用一个扫描仪阅读一个表格/文件311,以得到一个表格/文件311的多值图象。
一个预处理单元312对多值图象进行二值化、去除干扰和修改表格/文件311的位置。
然后,一个字符检测单元313根据关于预先定义的分格线(ruled Line)的信息和关于字符的位置信息,检测每个字符。
一个字符识别单元314识别每个字符,并且输出字符代码。通过将字符检测单元313检测的未知字符模式的每个特征与预先输入识别字典315中的每个字符种类的特征进行比较,来识别字符。
例如,通过把一个二维字符模式变换成一个代表字符特征的特征空间中的特征向量,作为一种在未知字符模式与预先输入识别字典315中的字符种类之间的相似性,可计算在特征空间中诸特征向量之间的距离。当在未知字符模式的特征向量与预先输入识别字典315的字符种类的特征向量之间,得到最短的距离时,就识别出相当于该未知字符模式的字符种类。
为两个特征向量之间的距离设置一个阈值,以避免把诸如删除线、干扰、符号等等非字符错误地识别成字符,和避免输出一个非字符的字符代码。如果两个特征向量之间的距离大于阈值,就通过确定:未知的字符模式在识别字典315中没有预先输入的相应字符种类,或确定未知的字符模式涉及一个非字符,来输出一个拒收码。
识别字典315还载有高质量的字符、模糊的字符和变形的字符的字符种类的特征。高质量字符识别字典315是用于高质量字符的。模糊字符识别字典315是用于模糊字符的。变形字符识别字典315是用于变形字符的。这就能够相应地处理表格/文件311中字符质量上的差别。
图2示出用于识别一个具有删除线的字符的字符识别设备的配置。
图2所示的字符识别设备包括一个图象输入单元491,用于输入一个含有字符的原始图象,和检测或预处理一个来自该输入图象的字符;和一个标识单元492,用于通过抽取该字符的特征和把所抽取的特征同储存在识别字典中的标准模式的特征作比较,来识别一个字符。
当用删除线除去一个被错误地输入到一个表格中的字符时,把例如6条或多条水平线输入到字符上。可以确定,带有6条或多条水平线的字符不能被识别,并且该字符被标识单元492拒收,因为它同储存在识别字典中的任何标准模式都不匹配。
然而,图1所示的手写字符识别设备也使用同一个识别字典315,同等地处理模糊字符、变形字符、和高质量字符中的一个被检测的字符。
因此,一直存在一个问题:关于一个输入到识别字典315中的模糊字符的信息,对高质量字符的识别处理有不良的影响,并且输入到识别字典315中的该模糊字符,使高质量的字符不能被成功地阅读。
除了模糊和变形情况之外,还存在各式各样的字符环境。例如,一个字符可能接触它的字符框。当把一个单独的识别字典315用于各式各样的环境中时,它们互相影响,从而产生一个问题:不能够用提高的精度执行识别过程。
当图2所示的字符识别设备识别一个字符时,需要6条或多条水平线才能删除一个使用一个删除线输入的字符。这对用户是一个大的负担,从而不能完全被遵守。结果,使具有一条明显删除线的字符与储存在识别字典中的标准模式的距离小,从而不能清楚地把它和一个没有删除线的字符区分开。这样,要删除的字符不能被拒收,并被错误地阅读。
例如,如图3中示出的(A)所示,要删除的‘0’不被拒收,而被识别成‘8’。如图3中示出的(B)所示,要删除的‘1’不被拒收,而被识别成‘8’。如图3中示出的(C)所示,要删除的‘7’不被拒收,而被识别成‘4’。如图3中示出的(D)所示,要删除的‘6’不被拒收,而被识别成‘6’。
发明内容
本发明提供了一种模式识别设备包括:布局分析装置,用于分析一个输入图象的布局,其中分格线、字符框和黑字符框接触字符被提取;质量分析装置,用于分析该输入图象的质量,其中由全局质量分析和局部质量分析来检测模糊字符;校正分析装置,用于分析该输入图象的校正状态,其中删除线被从图象中提取;模式识别装置,用于对该输入图象的一个处理对象的每个状态执行一个模式识别过程,所述模式识别装置包括一个为字符的每种质量提供的识别字典,并且通过根据由所述质量分析装置分析的质量适当地利用多个识别字典来识别字符,所述识别字典包括标准字典,模糊字符字典,变形字符字典,画面白色字符(framed-white-character)字典和纹理背景字符(taxture-background-character)字典中的至少一个,其中基本字符识别过程、字符串识别过程、框接触字符识别过程、模糊字符识别过程和变形字符识别过程的字符识别过程以及删除线识别过程和噪声识别过程的非字符识别过程被执行;以及环境识别装置,用于通过根据布局、质量或校正状态抽取该输入图象的处理对象的状态,和通过选择将为该处理对象的每个状态执行的一个或多个模式识别过程,来执行一个识别过程。
本发明提供了一种模式识别设备,包括:状态抽取装置,用于从一个输入图象抽取一个处理对象的状态;所述状态抽取装置包括:字符抽取装置,用于从输入图象中抽取一个具有预定面积的链接模式作为一个字符的候选者;字符串抽取装置,用于从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;分格线抽取装置,用于从输入图象中抽取一些分格线;字符框抽取装置,用于抽取四条分格线的一个模式,以用作为包围一个区的字符框;所述字符框抽取装置包括:属性指定装置,用于根据分格线的链接状态和字符框的尺寸,给字符框指定一个单字符框、块字符框、自由间距字符框、规则表和不规则表中的一个属性;接触字符抽取装置,用于抽取一个接触字符框的字符;模糊字符分析装置,用于分析输入图象的一个模糊状态;变形字符分析装置,用于分析输入图象的一个变形状态;和校正特征抽取装置,用于抽取输入图象的一个校正状态;模式识别装置,用于执行一个关于处理对象的每个状态的模式识别过程;和识别过程控制装置,通过为由所述状态抽取装置所抽取的处理对象的每个状态调用一个或多个模式识别过程,使识别过程得以执行。
本发明提供了一种模式识别装置,包括:状态抽取装置,用于从一个输入图象抽取一个处理对象的状态;所述状态抽取装置包括:字符抽取装置,用于从输入图象中抽取一个具有预定面积的链接模式作为一个字符的候选者;字符串抽取装置,用于从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;分格线抽取装置,用于从输入图象中抽取一些分格线;字符框抽取装置,用于抽取四条分格线的一个模式,以用作为包围一个区的字符框;接触字符抽取装置,用于抽取一个接触字符框的字符;模糊字符分析装置,用于分析输入图象的一个模糊状态;变形字符分析装置,用于分析输入图象的一个变形状态;和校正特征抽取装置,用于抽取输入图象的一个校正状态;所述校正特征抽取装置包括:线密度计算装置,用于在一个指定方向上扫描一个矩形区中的图象时,通过对一个白象元变黑或一个黑色元变白的次数进行计数,来计算该指定方向上的线密度;欧拉数计算装置,用于通过从图象中链接元素的数目减去图象中所含孔的数目,计算欧拉数;黑象元密度计算装置,用于通过计算一个目标图象的面积与一个外接该目标图象的矩形的面积的比值,来计算一个黑象元密度;线密度确定装置,用于当线密度超过某一预定值时,确定由矩形外接的图象为用于一个校正字符的候选者;欧拉数确定装置,用于当欧拉数为负值并且其绝对值大于某一预定值时,确定该图象为用于一个校正字符的候选者;和黑象元密度确定装置,用于当黑象元密度超过某一预定值时,确定该图象为一个校正字符的候选者;模式识别装置,用于执行一个关于处理对象的每个状态的模式识别过程;和识别过程控制装置,通过为由所述状态抽取装置所抽取的处理对象的每个状态调用一个或多个模式识别过程,使识别过程得以执行。
本发明提供了一种模式识别设备,包括:字符抽取装置,用于从一个输入图象抽取一个字符;非字符抽取装置,用于从一个输入图象抽取一个非字符;字符识别装置,用于识别一个字符;非字符识别装置,用于识别一个非字符;和环境识别装置,用于当所述字符抽取装置抽取一个字符时,指令所述字符识别装置执行一个识别过程,和用于当所述非字符抽取装置抽取一个非字符时,指令所述非字符识别装置执行一个识别过程;其中所述环境识别装置计算可靠性,该可靠性指示关于在所述字符抽取装置抽取一个字符时从所述字符识别装置得到的识别结果的确定性;并且在关于从所述字符识别装置得到的识别结果的可靠性小于某一预定值时,指令所述非字符识别装置执行一个识别过程,其中由所述字符抽取装置抽取的字符被当作一个非字符。
本发明提供了一种模式识别设备,包括;第一模式识别装置,用于识别一个处于第一状态的处理对象的模式;第二模式识别装置,用于识别一个处于第二状态的处理对象的模式;和环境识别装置,用于从一个输入图象中抽取处理对象的一个状态,指令所述的第一模式识别装置对一个处于第一状态的处理对象执行一个识别过程,并且指令所述的第二模式识别装置对一个处于第二状态的处理对象执行一个识别过程,其中;所述第一和第二模式识别包括一个为字符的每种质量提供的识别字典,并且通过根据输入图象的质量适当地利用多个识别字典来识别字符,所述识别字典包括标准字典,模糊字符字典,变形字符字典,画面白色字符字典和纹理背景字符字典中的至少一个,其中基本字符识别过程、字符串识别过程、框接触字符识别过程、模糊字符识别过程和变形字符识别过程的字符识别过程以及删除线识别过程和噪声识别过程的非字符识别过程被执行。
本发明提供了一种图象识别设备,包括:图象输入装置,用于输入一个图象,从该输入图象中检测一个图象区域,和执行一个预处理,所述的图象区域包含不带删除线图象的字符模式或带有删除线图象的字符模式;删除线字符判别装置,用于判别一个字符模式是否是下列至少之一:一个没有删除线图象的正常字符,一个带有包括指示一个字符的删除的水平线图象的简单删除线图象的字符模式,以及一个带有呈复杂形式的复杂删除线的字符模式;和标识装置,用于标识一个字符。
本发明提供了一种模式识别设备,包括:特征抽取装置,用于从一个输入模式中抽取一个第一预定持征;和模式识别装置,用于通过从一个尚未从其中抽取第一预定特征的输入模式中抽取一个第二预定特征,来识别该输入模式。
本发明提供了一种模式识别设备,包括:特征抽取装置,用于从一个输入模式中抽取一个第一预定特征;去除装置,用于从一个已经从其中抽取第一预定特征的输入模式中,去除对第一预定特征作出贡献的部分;和模式识别装置,用于根据一个已经从其中去除了对第一预定特征有贡献的部分的模式来识别该输入模式。
本发明提供了一种模式识别设备,包括:模式抽取装置,用于从一个输入图象中抽取一个第一模式;模式生成装置,用于生成一个第二模式,该第二模式通过去掉一个存在于第一模式中的第三模式而得到;模式识别装置,用于对第二模式执行一个识别过程;和确定装置,用于当所述模式识别装置拒绝第二模式时,把第三模式当作第一模式的一个组件。
本发明提供了一种模式识别方法,包括下列步骤:从一个输入图象中抽取一个处理对象的一个状态,其中所述抽取步骤还包括下列步骤:从输入图象中抽取一个具有预定面积的链接模式作为一个字符的候选者;从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;抽取四条分格线的一个模式,以用作为包围一个区的字符框;其中所述抽取步骤还包括:根据分格线的链接状态和字符框的尺寸,给字符框指定一个单字符框、块字符框、自由间距字符框、规则表和不规则表中的一个属性;抽取一个接触字符框的字符;分析输入图象的一个模糊状态;分析输入图象的一个变形状态;和抽取输入图象的一个校正状态;通过为该处理对象选择适合于该状态的识别过程来识别一个模式。
本发明提供了一种图象识别方法,包括下列步骤:输入一个图象;从该输入图象中检测一个图象区域,该图象区域包含不带删除线图象的字符模式或带有删除线图象的字符模式;执行一个预处理;对一个所检测或预处理的字符模式,判别一个字符模式是一个没有删除线图象的正常字符模式,还是一个有删除线图象的字符,判别具有删除线图象的字符是一个包含一个指示字符删除的水平线的简单删除线图象,还是一些呈复杂形式的复杂删除线图象;和标识一个没有删除线的正常字符。
本发明提供了一种图象识别方法,包括下列步骤:输入一个图象;从该输入图象中检测一个图象区域,该图象区域包含不带删除线图象的字符模式或带有删除线图象的字符模式;执行一个预处理;对一个所检测或预处理的字符模式,判别一个字符模式是否带有一个复杂删除线图象;当判别该字符不是带有复杂删除线图象的字符时,就判别该字符是一个没有删除线图象的正常字符模式,还是一个带有一个只包含一个指示字符删除的水平线图象的简单删除线图象的字符;和标识这个没有删除线图象的正常字符。
本发明提供了一种模式识别方法,包括下列步骤:输入一个图象,从该输入图象中检测一个字符模式并执行一个预处理;对一个所检测或预处理的字符模式,判别一个字符模式是否带有一个复杂删除线图象字符;当该字符模式不是带有一个复杂删除线图象的字符时,对所检测或预处理的字符模式用一种水平方向相连投影计算一个象元数直方图,在所述投影中,在一个对象水平扫描线上和在对象水平扫描线上方和下方附近的预定范围内的一条线上把黑象元相加;根据象元直方图,确定一个有简单删除线图象的字符模式的候选者;当从其中去掉删除线图象的有简单删除线图象的字符模式的候选者能够被标识为一个字符时,定义一个有简单删除线图象的字符模式,并且当该候选者不能够被标识为一个字符时,定义一个正常字符;和为所定义的正常字符标识字符。
本发明提供了一种模式识别方法,包括下列步骤:从一个输入图象中抽取一个处理对象的一个状态,其中所述抽取步骤还包括下列步骤:从输入图象中抽取一个具有预定面积的链接模式作为一个字符的候选者;从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;从输入图象中抽取一些分格线;抽取四条分格线的一个模式,以用作包围一个区的字符框;其中所述抽取步骤还包括:根据分格线的链接状态和字符框的尺寸,给字符框指定一个单字符框、块字符框、自由间距字符框、规则表和不规则表中的一个属性;抽取一个接触字符框的字符;分析输入图象的一个模糊状态;分析输入图象的一个变形状态;抽取输入图象的一个校正状态;对处于第一状态的处理对象,执行一个专门针对第一状态的模式识别过程;和对处于第二状态的处理对象,执行一个专门针对第二状态的模式识别过程。
本发明旨在提供一种能够根据字符环境以高精度合理地识别一个字符的模式识别设备与方法。
根据本发明的特征,通过从一个输入模式中抽取第一预定特征,和从这个已经抽取第一特征的输入模式中抽取第二预定特征,来识别这个输入模式。
结果,能够根据一个字符的各种环境,执行识别过程。
根据本发明的其他特征,通过从一个输入图象抽取一个处理对象的状态,和选择一个适合于每个处理对象状态的识别过程,来识别一种模式。
这样,就能够对具有各种状态的输入图象的每个状态,合理地进行一种模式识别过程,从而实现高精度的识别过程。
根据本发明的其他特征,从一个输入图象抽取一个处理对象的状态,和对处于第一状态的处理对象进行专门用于第一状态的一种模式识别过程,并且对处于第二状态的处理对象执行专门用于第二状态的一种模式识别过程。
这样,对处于第一状态的处理对象的识别过程和对处于第二状态的处理对象的识别过程相互作用,从而成功地执行高精度的识别过程。
根据本发明的其他特征,为一个处于各种状态的输入图象适当地选择一些识别字典。
例如,虽然在该输入图象中混有模糊字符、变形字符和高质量字符,但能通过使用一个用于模糊字符的模糊字符识别字典、一个用于变形字符的变形字符识别字典和一个用于高质量字符的高质量字符识别字典,以高精度执行识别过程。
根据本发明的其他特征,为一个处于各种状态的输入图象适当地选择一些标识功能。
能够以高精度进行识别处理,其方法例如是:使用一个写于单字符框中的字符上的城市街区距离来识别一个字符,并且考虑到字符检测可靠性,使用一个写于自由间距框中的字符的判别函数来识别一个字符。
根据本发明的其他特征,为一个处于各种状态的输入图象适当地选择知识。
能够以高精度进行识别过程,其方法例如是:当一个未知的字符是明显变形的,并且与识别字典中所储存的字符种类不一致时,通过把一个字符分成几个字符分段,设置未知字符与字符种类之间的对应关系;当从一个字符串检测一个字符时,使用根据一种学习模式产生的判别式函数,计算检测的可靠性;和当识别框-接触字符时,使用通过学习模式得到的可靠性,估计对该框-接触字符的识别可靠性。
根据本发明的其他特征,当对一个指定的处理对象调用多个识别过程时,就按优先级进行识别过程,直至识别过程的可靠性达到某一预定值为止。
这样,能够提高识别过程的可靠性,并且能够成功地改进过程的精度。
根据本发明的其他特征,从一个输入图象抽取一个非字符,并且对该抽取的非字符分别进行字符识别过程与非字符识别过程。
结果,能以高精度进行识别过程,把字符误认为非字符的情况减少,并且把非字符误认为字符的情况也减少。
根据本发明的其他方面,从一个输入模式抽取第一预定特征,并且通过从尚未抽取其第一预定特征的输入模式中抽取第二预定特征,识别该输入模式。
这样,能够把具有一个删除线的字符与不具有删除线的字符区别开,并且只有那种不具有删除线的字符才能被识别。因此,有可能防止具有删除线的字符,被错误地识别成任何其他的字符。
根据本发明的其他特征,从一个输入模式抽取第一预定特征;能够从已抽取其第一预定特征的输入模式中除去对第一预定特征做出贡献的部分;和根据已从其中除去对第一预定特征做出贡献的部分的模式,识别该输入模式。
因此,当识别字符时,能从带有删除线的字符中去除删除线,从而改进识别字符方面的精度。
附图说明
图1是一个方块图,说明常规的字符识别设备的结构;
图2是一个方块图,说明常规的字符识别设备的结构;
图3示出对带有删除线的字符进行识别的实例;
图4是一个方块图,说明根据本发明的第一实施例的模式识别设备的结构;
图5是一个方块图,说明根据本发明的第二实施例的模式识别设备的功能;
图6是一个方块图,说明图5所示环境识别单元的实际结构的实施例;
图7是一个方块图,说明图5所示模式识别设备的实际结构的实施例;
图8是一个流程图,说明图1所示环境识别系统的整个操作的实施例;
图9是一个流程图,说明图8所示预处理单元的操作的实施例;
图10是一个流程图,说明图8所示格式分析单元的操作的实施例;
图11是一个流程图,说明图8所示质量分析单元的操作的实施例;
图12是一个流程图,说明图8所示校正分析单元的操作的实施例;
图13是一个流程图,说明图8所示的用于控制字符/非字符识别处理的控制单元的操作实施例;
图14是一个方块图,说明根据本发明一个实施例的模式识别设备的结构;
图15是一个方块图,说明根据本发明一个实施例的模式识别设备的实际结构;
图16是根据本发明一个实施例的模式识别设备的标号处理的实例;
图17根据本发明一个实施例,说明压缩该模式识别设备的标号处理的表示;
图18根据本发明的一个实施例,说明模式识别设备的文本抽取处理的实例;
图19根据本发明的一个实施例,说明模式识别设备的文本抽取处理的部分区域的实例;
图20根据本发明的一个实施例,说明在模式识别设备的分格线抽取处理中的相连投影方法;
图21根据本发明的一个实施例,说明在模式识别设备的分格线抽取处理中的模式投影结果;
图22是一个流程图,根据本发明的一个实施例说明模式识别设备的分格线抽取处理;
图23根据本发明的一个实施例,说明模式识别设备的分格线抽取处理;
图24根据本发明的一个实施例,说明在模式识别设备的分格线抽取处理中完成一个模糊分格线的方法;
图25是一个流程图,根据本发明一个实施例说明完成模式识别设备的模糊分格线的方法;
图26根据本发明一个实施例,说明在用模式识别设备完成一个模糊规分格线时的查找方向;
图27是一个流程图,根据本发明一个实施例说明模式识别设备的单字符框抽取处理;
图28是一个流程图,根据本发明一个实施例说明模式识别设备的块字符框抽取处理;
图29根据本发明一个实施例,说明在模式识别设备中使用的框与表的类型;
图30是一个流程图,根据本发明一个实施例说明模式识别设备的图象缩小处理;
图31根据本发明一个实施例,说明模式识别设备的框-接触状态确定处理;
图32是一个流程图根据本发明一个实施例,说明模式识别设备的框-接触状态确定处理;
图33根据本发明一个实施例,说明用于模式识别设备的删除线的类型;
图34根据本发明一个实施例,说明计算用于模式识别投备的一个校正字符的特征的方法;
图35是一个方块图,说明图7所示基本字符识别单元结构的实例;
图36说明计算图7所示基本字符识别单元中一个特征向量的方向实例;
图37说明对图7所示基本字符识别单元中诸特征向量之间的距离进行计算的方法实例;
图38通过与图7所示基本字符识别单元一起使用的详细标识方法,说明抽取字符分段的方法;
图39说明在与图7所示基本字符识别单元一起使用的详细标识方法中,检测一个终点的方法;
图40说明在与图7所示基本字符识别单元一起使用的详细标识方法中,检测一个角度变化的方法;
图41说明在与图7所示基本字符识别单元一起使用的详细标识方法中在诸字符分段之间的对应关系;
图42是一个流程图,说明与图7所示基本字符识别单元一起使用的详细标识方法的处理;
图43示出由图7所示的框-接触字符识别单元完成一个字符的方法;
图44示出由图7所示的框-接触字符识别单元重新完成的方法;
图45示出由图7中框-接触字符识别单元完成误读字符的实例;
图46是一个方块图,说明由图7中框-接触字符识别单元学习一个字符的方法实例;
图47示出由图7所示框-接触字符识别单元生成一个框接触字符的方法;
图48示出由图7所示框-接触字符识别单元生成一个框接触字符的实例;
图49示出供图7所示框-接触字符识别单元使用的知识表的实例;
图50示出在供图7所示框-接触字符识别单元使用的知识表中输入的更改类型和数量的实例;
图51示出由图7所示框-接触字符识别单元强调的重新识别区的实例;
图52示出由图7所示框-接触字符识别单元使用一个强调区的重新识别方法;
图53是一个流程图,说明由图7所示框接触字符识别单元使用一个强调区的重新识别处理;
图54是一个方块图,说明供图7所示框接触字符识别单元使用的字符重新识别方法的实例;
图55是一个方块图,说明供图7所示框接触字符识别单元使用的字符重新识别处理;
图56说明在由图7所示字符串识别单元进行的统计处理中一个参数的图形意义;
图57是一个流程图,说明由图7所示字符串识别单元进行的统计处理;
图58说明在由图7所示字符串识别单元进行的定界字符处理中一个参数的图形意义;
图59是一个流程图,说明由图7所示字符串识别单元进行的定界字符处理;
图60说明在由图7所示字符串识别单元进行的上标笔画处理中一个参数的图形意义;
图61是一个流程图,说明由图7所示字符串识别单元进行的上标笔画处理;
图62是一个流程图,说明对图7所示字符串识别单元的字符检测概率数据进行计算的处理;
图63说明对图7所示字符串识别单元的字符检测可靠性进行量化的方法;
图64说明生成图7所示字符串识别单元的频率分布的方法;
图65是一个流程图,说明对图7所示字符串识别单元的字符检测可靠性进行计算的方法;
图66说明在用图7所示字符串识别单元进行的字符检测中,关于成功与失败的直方图分布的实例;
图67说明在用图7所示字符串识别单元进行的字符检测中,计算成功与失败的重叠区的方法;
图68示出用图7所示字符串识别单元检测一个字符的处理流程;
图69示出在用图7所示字符串识别单元进行的非统计过程中,检测一个字符的处理流程;
图70是一个方块图,说明图7所示模糊字符识别单元的结构的实例;
图71示出由图7所示删除线识别单元执行的处理的实例;
图72示出由图7所示唯一字符分析单元执行聚类处理的流程;
图73是一个流程图,说明由图7所示唯一字符分析单元进行的聚类处理;
图74说明由图7所示唯一字符分析单元进行的字符种类确定结果校正处理的流程;
图75是一个流程图,说明由图7所示唯一字符分析单元进行的字符种类确定结果校正过程;
图76根据本发明说明一个将被模式识别设备处理的列表的实例;
图77根据本发明一个实施例,说明供模式识别设备使用的中间处理结果表的实例;
图78根据本发明一个实施例,说明供模式识别设备使用的处理顺序表的实例;
图79根据本发明一个实施例,说明供模式识别设备使用的中间处理结果表的实例;
图80根据本发明一个实施例,说明供模式识别设备使用的中间处理结果表的实例;
图81根据本发明一个实施例,说明供模式识别设备使用的中间处理结果表的实例;
图82根据本发明一个实施例,说明供模式识别设备使用的中间处理结果表的实例;
图83是一个方块图,说明根据本发明第三实施例的模式识别设备的功能;
图84是一个方块图,说明根据本发明第四实施例的模式识别设备的功能;
图85是一个方块图,说明根据本发明第五实施例的模式识别设备的功能;
图86是一个方块图,说明根据本发明第六实施例的模式识别设备的功能;
图87是一个方块图,说明根据本发明第七实施例的模式识别设备的功能;
图88是一个流程图,说明根据本发明第八实施例的模式识别设备执行的操作;
图89是一个流程图,说明根据本发明第九实施例的模式识别设备执行的操作;
图90是一个流程图,说明根据本发明第十实施例的模式识别设备执行的操作;
图91是一个流程图,说明根据本发明第十一实施例的模式识别设备执行的操作;
图92是一个方块图,说明根据本发明第十二实施例的模式识别设备的功能;
图93说明根据本发明一个实施例的模式识别设备的复杂性数量;
图94是一个流程图,说明图92所示模式识别设备的操作;和
图95是一个流程图,说明图92所示模式识别设备的操作。
具体实施方式
下面参照附图,描述根据本发明第一实施例的模式识别设备。
图4是一个方块图,根据本发明第一实施例说明模式识别设备的功能。
在图4中,特征抽取单元1000从一个输入模式中抽取第一预定特征。模式识别单元1001,通过从己由特征抽取单元1000抽取其中第一特征的输入模式中抽取其第二预定特征,来识别该输入模式。
这样,模式识别单元1001就能识别一个具有第一预定特征的唯一的输入模式,并且能够对输入模式的每个环境进行识别处理,从而提高识别过程的精度。
模式识别单元1001还能够,通过从尚未由特征抽取单元1000抽取其中第一特征的输入模式中抽取其第二特征,来识别该输入模式。
模式识别单元1001能够从一个处理对象中除去具有第一预定特征的输入模式,并且只有一个适当的处理对象能被选择和识别,从而提高识别过程的精度。
下面参照附图,根据本发明第二实施例描述模式识别设备。
图5是一个方块图,根据本发明第二实施例说明模式识别设备的功能。
在图5中,环境识别单元1从一个输入图像中抽取第一个至第N个状态。从输入图像抽取的状态涉及例如象单字符框、自由间距框、表等之类的书写字符的格式;涉及字符与其框之间的关系;字符的模糊程度;字符的变形;使用一个删除线的字符删除等。
第一模式识别单元2专门识别一种处于第一状态的处理对象的模式。第二模式识别单元4专门识别一种处于第二状态的处理对象的模式。第N个模式识别单元6专门识别处于第N个状态的处理对象的模式。
第一个到第N个模式识别单元2、4和6分别包含可靠性计算单元3、5和7,并且计算由第一个到第N个模式识别单元2、4和6得到的识别结果的可靠性。
环境识别单元1调用相应于第一个到第N个状态的第一个到第N个模式识别单元2、4和6中的任何一个单元,以进行一个识别过程。
例如,当环境识别单元1从输入图象中抽取第一状态时,就为处于第一状态的处理对象调用一个要由第一模式识别单元2进行的模式识别过程。当从输入图象中抽取第二状态时,就为处于第二状态的处理对象调用一个要由第二模式识别单元4进行的模式识别过程。当从输入图象中抽取第N个状态时,就为处于第N个状态的处理对象调用一个要由第N个模式识别单元6进行的模式识别过程。
当环境识别单元1例如为一个单处理对象而抽取第一和第二状态时,就为该处理对象调用要分别由第一模式识别单元2和第二模式识别单元4进行的模式识别过程。
假定第一状态是指其中字符是写入单字符框中的状态,第二状态是指其中字符是写入自由间距字符框中的状态,第三状态是指其中一个字符是接触它的字符框的状态,第四状态是指其中一个字符是模糊的状态,第五状态是指其中一个字符是变形的状态和第六状态是指其中一个字符是用一些删除线校正的。在上面定义的上述状态情况下,第一模式识别单元2识别写入一个单字符框中的字符,第二模式识别单元4识别写入一个自由间距框中的字符串,第三模式识别单元识别框-接触的字符,第四模式识别单元识别模糊的字符,第五模式识别单元识别变形的字符,和第六模式识别单元识别校正的字符。
当环境识别单元1从输入图象中抽取一个单字符框时,第一模式识别单元2对写入该单字符框中的字符执行识别过程。当环境识别单元1从输入图象中抽取一个自由间距框时,第二模式识别单元4对写入该自由间距框中的字符执行识别过程。当环境识别单元1从输入图象中抽取一个框-接触字符时,第三模式识别单元对该框接触字符执行识别过程。当环境识别单元1从输入图象中抽取一个模糊字符时,第四模式识别单元对该模糊字符执行识别过程。当环境识别单元1从输入图象中抽取一个变形字符时,第五模式识别单元对该变形字符执行识别过程。当环境识别单元1从输入图象中抽取一个用于校正字符的候选字符时,第六模式识别单元对该校正字符的候选字符执行识别过程。
例如,当环境识别单元1从输入图象中抽取一个接触自由间距框的框-接触字符时,模式识别单元2和模式识别单元3就对该接触自由间距框的框-接触字符,执行识别过程。当环境识别单元1从输入图象中抽取一个接触自由间距框的具有一些删除线的框-接触字符时,第二模式识别单元4、第三模式识别单元和第六模式识别单元就对这个接触自由间距框的具有一些删除线的框-接触字符,执行识别过程。
当从一个单处理对象中抽取多个状态,并且调用多个模式识别单元2、4和6时,就根据一个储存有多个模式识别单元2、4和6的调用顺序的处理顺序表,确定要由多个模式识别单元2、4和6执行的识别过程的顺序。这样,按照所述调用顺序相继地执行那些要由多个模式识别单元2、4和6执行的识别过程,一直到在由模式识别单元2、4和6执行的识别过程中,能够用可靠性计算单元3、5和7得到大于某一预定阈值的可靠性为止。
例如,当环境识别单元1从一个输入图象中抽取一个接触一自由间距框的框-接触字符时,就对这个接触一自由间距框的框接触字符,先由第三模式识别单元执行识别过程,然后由第二模式识别单元执行识别过程。当环境识别单元1从一个输入图象中抽取接触一自由间距框的具有一些删除线的框-接触字符时,就对这个接触一自由间距框的具有一些删除线的框-接触字符,先由第三模式识别单元执行识别过程,再由第六模式识别单元执行识别过程,然后由第二模式识别单元4执行识别过程。
图6是一个方块图,说明图5所示环境识别单元1的实施例的结构。
在图6中,一个状态抽取单元1a从一个输入图象中抽取第一到第N个状态。
一个识别过程控制单元1b调用一个或多个相应于状态抽取单元1a所抽取的第一到第N个状态的、图5所示的第一到第N个模式识别单元2、4和6,供一个识别过程之用。
一个处理顺序表1f存储处理顺序,以便当从第一到第N个模式识别单元2、4和6之中调用多个模式识别单元时,对第一到第N个模式识别单元2、4和6的处理顺序,进行指示。
一个处理顺序控制规则存储单元1d存储调用程序,以便根据状态抽取单元1a所抽取的第一到第N个状态,对要从第一到第N个模式识别单元2、4和6之中调用的识别单元,进行指示。
一个中间处理结果表生成单元1c生成一个中间处理结果表,以便根据储存于处理顺序控制规则存储单元1d中的调用程序和储存于处理顺序表1f中的处理顺序,对第一到第N个模式识别单元2、4和6的处理顺序,进行指示。
一个过程执行规则存储单元1e储存一种程序,它根据输入到中间处理结果表中的识别过程的结果,指示下一个要执行的过程。
如上所述,图5所示模式识别设备从一个输入图象中抽取一个处理对象的状态;为每个处理对象选择适合其状态的识别过程,以便能够对具有各种状态的输入图象,为每个状态执行一个适当的模式识别过程;从而以高精度执行识别过程。因为是在抽取状态时和在对处理对象执行识别过程时,评价处理对象故可进一步提高识别过程的精度。
例如,通过从输入图象抽取处理对象的状态、对具有第一状态的处理对象执行专门用于第一状态的模式识别过程、和对具有第二状态的处理对象执行专门用于第二状态的模式识别过程,就能够抑制在对有第一状态的处理对象执行的识别过程与对有第二状态的处理对象执行的识别过程之间的相互影响,从而实现有高精度的一种识别过程。
此外,通过对一个单处理对象执行多个识别过程,一直到识别过程的可靠性达到某一预定值为止,可用提高的精度改进识别过程的可靠性。
图7是一个方块图,根据本发明一个实施例说明模式识别设备的实际结构。
在图7中,一个环境识别系统11抽取输入图象的状态,并且根据所抽取的状态调用字符识别单元12中的一个或多个识别单元:一个基本字符识别单元17、一个字符串识别单元15、一个框-接触字符识别单元13、一个模糊字符识别单元19、和一个变形字符识别单元21;和调用非字符识别单元25中的一个删除线识别单元26和一个干扰识别单元28。
字符识别单元12为一个输入图象的每个状态都执行一个字符识别过程,并且包括:一个基本字符识别单元17,用于识别一个字符;一个字符串识别单元15,用于对一个字符串执行一个字符识别过程B和一个字符检测过程B;一个框-接触字符识别单元13,用于对一个框-接触字符执行一个字符识别过程A和一个字符检测过程A;一个模糊字符识别单元19,用于对一个模糊字符执行一个字符识别过程C和一个字符检测过程C;一个变形字符识别单元21,用于对一个变形字符执行一个字符识别过程D和一个字符检测过程D;和一个独特字符识别单元23,用于对一个独特字符执行一个独特字符识别过程E和一个独特字符检测过程E。
基本字符识别单元17、字符串识别单元15、框接触字符识别单元13、模糊字符识别单元19、变形字符识别单元21和独特字符识别单元23分别包括知识表14、16、18、20、22和24,用于储存字符识别方法的知识。知识表14储存识别过程的框-接触状态和可靠性的知识与重叠部分模式方法的知识。知识表16储存例如,检测过程的可靠性的知识,和把检测过程同识别过程结合起来的方法的知识。知识表18储存例如,关于详细识别方法的知识。
在上述结构情况下,能通过选择和参阅适用于每个状态的知识,对一个有着各种状态的输入图象执行一个识别过程,从而提高识别过程的精度。
此外,能通过选择和参阅适用于每个状态的识别字典,对一个有着各种状态的输入图象执行一个识别过程,从而提高识别过程的精度。
此外,还能通过选择一个适用于每个状态的标识函数,对一个有着各种状态的输入图象执行一个识别过程,从而提高识别过程的精度。
非字符识别单元25为一个输入图象的每个状态执行一个非字符识别过程,并且包括:一个删除线识别单元26,用于对一个有删除线的字符执行一个非字符识别过程F和一个非字符检测过程F;和一个干扰识别单元28,用于对一个干扰执行一个非字符识别过程G和一个非字符检测过程G。
删除线识别单元26和干扰识别单元28分别包括知识表27和29,用于储存非字符识别方法的知识。
这样,通过分别对字符和非字符执行识别过程,能够减小把字符误认为非字符情况和减小把非字符误认为字符的情况,同时能以高精度执行识别过程。
图8是一个流程图,说明环境识别系统11的整个过程的实例。
在图8中,在步骤S1预处理一个输入图象。通过对一个用传真机、扫描仪等进行二进制化的输入图象加标号,执行输入图象的预处理,并且储存该输入图象和有标号的图象。输入图象和标号图象的存储方式要使它们能够在随后处理中任何时间被访问。
图9是一个流程图,说明图8所示输入图象的预处理。
在图9中,在步骤S11对一个二进制化的输入图象进行标记,以便能够抽取和标记一个链接模式,并且存储所抽取和标记的图象及输入图象。通过用放大或缩小其外切矩形的方法来压缩所标记的链接模式,能够节省存储容量。通过压缩所标记的链接模式,能够在几百个千字节范围内表示一个A4尺寸(约3000×4000)个象素的文件表格,这是以例如400dpi的高分辨率用一个扫描仪输入的。
其后,在图8所示的步骤S2分析一种布局(layout)。根据所标记的链接模式的尺寸、方案等,用下述方法执行一种布局分析:识别一个文本,抽取一个分格线,抽取一个字符框,确定框与表的类型,确定框-接触字符的存在,和识别一个图。
图10是一个流程图,说明图8所示的布局分析。
在图10中,在步骤S21,识别一个文本。在这种文本识别中,分析所标记的链接模式的尺寸,抽取一个尺寸相对较小的链接模式,并把它定义为一个字符的候选者。然后,通过把这个候选者同相邻字符候选者结合起来,抽取一个文本。
然后,在步骤S22,抽取一个分格线。通过查找在垂直或水平方向上指示较大的直方图值的模式,能够抽取该分格线,供在步骤S21未作为文本来识别的链接模式之用。
其后,在步骤S23抽取一个字符框。从在步骤S22中抽取的分格线中,通过检测相当于4个框边的分格线,抽取该字符框。
然后,在步骤S24判别框与表的类型。通过判别框与表的类型,判别在步骤S23抽取的字符框的类型,并且指定该字符框类型的属性。字符框类型的属性可以是一个单字符框,一个块字符框,一个自由间距框,一个表等。
在步骤S25,确定是否存在一个框接触字符。通过在沿字符框线寻找字符框时检测一个交叉模式,执行框-接触字符的确定。如果存在一个交叉模式,就确定字符是接触字符框的。在相邻字符框中的另一字符可能部分地越出它的框,并且进入本框。因此,在这种情况下,部分地越出它自己的框并且进入本框的字符,不应视为属于本字符框的框接触字符。
其后,在步骤S26识别一个图。在图的识别中,一个尚未指定其属性(例如一个文本、字符框、表等)的较大尺寸的链接模式,分配为该图的属性。
在图8所示的步骤S3中分析质量。在质量分析中,如果在输入图象中有模糊、变形等中任何一项的话,就检测之。分析可以是一种全局质量分析和一种局部质量分析。
在这种质量分析中,如果把(其区尺寸、长度和宽度都分别小于其预定阈值的链接区数)除以(在预定区中全部链接区数)而得出的值大于某一预定值,就确定在预定区中检测到一个模糊字符。
此外,根据其中部分地并入一个在抽取分格线中生成的模糊分格线的信息,如果把(在完成模糊分格线时的完成部分的总长度)除以(每个分格线的总长度)而得出的值大于某一预定值,就确定在预定区中检测到一个模糊。
此外,如果把(指示黑象元密度大于某一预定阈值的链接区数)除以(在预定区中链接区总数,而得出的值大于某一预定值,就确定在预定区中检测到一个变形。
图11是一个流程图,说明图8所示的质量分析。
在图11中,在步骤S31执行全局质量分析。对整个文件/格式执行全局质量分析,并且确定在使输入图象二进制化中使用的阈值是否合适,在通过传真发送以后伴有干扰的文件/格式的质量是否可以接受,和是否已产生模糊或变形。
其后,在步骤S32执行局部质量分析。执行局部质量分析的方法是:在布局分析中指定单字符框、文本、自由间距字符框、表等属性的每个区中,检查是否已产生模糊或变形,或者是否已产生干扰。
其后,在图8所示的步骤S4执行一个校正分析。在校正分析中,从一个输入图象中抽取一个删除线,并且对用删除线校正的字符,可省略字符识别过程。
图12是一个流程图,说明图8所示的校正分析。
在图12中,在步骤S41抽取一个校正特征。在这个校正特征抽取中,抽取一个校正字符的特征。这个校正字符可以是下述4种字符之一:变形字符、用双线去除的字符,用对角线去除的字符,和用符号×去除的字符。通过计算其黑象元密度、线密度、欧拉数、直方图数等,能够抽取每个校正字符的特征。
其后,在步骤S42执行一个校正字符候选者抽取过程。根据在表示校正字符特征的特征空间中校正字符与不校正的正常字符之间的差异,抽取一个用于校正字符的候选者。
其后,在图8所示的步骤S5,执行一种字符/非字符识别控制。在字符/非字符识别控制中,根据在图8所示的步骤S2到S4中抽取的输入图象的状态,确定要从下述的识别单元中调用哪一个单元:字符识别单元12的基本字符识别单元17,字符串识别单元15,框接触字符识别单元13,模糊字符识别单元19和变形字符识别单元21;非字符识别单元25的删除线识别单元26和干扰识别单元28。在这种控制中,阅读中间处理结果表,遵循和终止处理顺序控制规则,并按照过程执行规则执行该过程。
处理顺序控制规则说明调用的过程,即根据环境识别系统11所抽取的状态应从下述识别单元中调用哪一个:字符识别单元12的基本字符识别单元17,字符串识别单元15,框-接触字符识别单元13,模糊字符识别单元19和变形字符识别单元21;非字符识别单元25的删除线识别单元26和干扰识别单元28。
过程执行规则指示,其后要根据按处理顺序控制规则调用的识别过程的结果,去执行的过程的程序。
中间处理结果表包括在图8所示的步骤S2到S4中通过布局分析,对指定单字符框、文本、自由间距字符框、表等属性的每个区,抽取的输入图象的状态。在中间处理结果表上,把按照输入处理顺序控制规则调用的过程,输入存储于处理顺序表中的处理顺序中。
例如,当环境识别系统11抽取一个字符时,就调用基本字符识别单元17,去执行一个关于字符的识别过程。当环境识别系统11在图10所示的步骤S21中抽取一个文本时,就调用字符串识别单元15,去执行一个关于文本的识别过程。当环境识别系统11在图10所示的步骤S25抽取一个框接触字符时,就调用框接触字符识别单元13,去执行一个关于框接触字符的识别过程。当环境识别系统11在步骤S32确定,把(其区尺寸、长度和宽度分别小于预定阈值的链接区的数目)除以(在预定区中全部链接区的数目)所得到的数值大于某一预定值时,就调用模糊字符识别单元19,去执行一个关于这个区中字符的识别过程。当环境识别系统11在步骤S32确定,把(指示黑象元密度大于预定阈值的链接区的数目)除以(在预定区中链接区的总数)而得出的数值大于某一预定值时,就调用变形字符识别单元21,去执行一个关于这个区中字符的识别过程。当环境识别系统11在图12所示的步骤S42中抽取一个用于校正字符的候选者时,就调用删除线识别单元26,去执行一个关于校正字符的候选者的识别过程。当环境识别系统11在图11所示的步骤S32中检测到一个干扰时,就调用干扰识别单元28,去执行一个关于干扰的识别过程。
图13是一个流程图,说明图8所示的字符识别过程/非字符识别过程的控制。
在图13中,在步骤S51阅读中间处理结果表,并且执行处理顺序控制规则。
然后在步骤S52确定,是否已完成该过程。当根据处理顺序控制规则完成对中间处理结果表的全部处理,并且在中间处理结果表上的全部处理指令栏包含完成项目时,就确定已完成该过程。如果确定尚未完成该过程,该控制就转到步骤S53,在根据过程执行规则执行该过程以后返至步骤S51,并且重复上述过程,直至在步骤S52确定,已完成该过程为止。
图14是一个方块图,根据本发明一个实施例说明模式识别设备的结构。
在图14中,一个图象存储单元41存储一个表格图象。一个处理条件存储单元42存储象表格布局结构之类的定义,和阅读字符信息,例如字符框的位置、类型和尺寸,字符的类型,字符的数目等。一个标号图象存储单元43存储经过压缩和标记的图象。
一个环境识别系统30包括一个布局分析单元31和一个校正分析单元32。一个环境识别系统38包括一个独特字符分析单元39和一个完成确定单元40。一个字符识别系统/非字符识别系统33包括一个基本字符识别单元34,一个黑字符框-接触字符识别单元35,一个自由间距字符串识别单元36,和一个删除线识别单元37。
布局分析单元31涉及存储于处理条件存储单元42中的定义,供存储于标号图象存储单元43中标号图象之用;并且抽取分格线,字符框,和黑-字符-框接触字符。在例如资料Tokclkaisho 62-21288和Tokukaihei 3-126186中,公开了一种方法,用于预先存储关于字符框位置与尺寸的格式信息和关于按列表数据提供数据框的信息,和用于根据列表数据抽取分格线和字符框。
象在例如资料Tokukaihei 6-309498和Tokukaihei 7-28937中所描述的一样,能够抽取分格线和字符框,而不用输入格式信息,例如字符框的位置和尺寸。
校正分析单元32为删除线抽取一个候选者。独特字符分析单元39分析一种具有个人手写特征的独特字符。完成确定单元40确定一个字符识别过程的完成,并且当确定已完成该过程时输出一个字符识别结果。
基本字符识别单元34逐个地识别所检测的各个字符。黑字符-框接触字符识别单元35从一个黑-字符-框接触字符取出一个字符框,通过取出这个字符框完成一个模糊字符,然后识别该字符。自由间距字符串识别单元36在从字符串检测一个字符时,考虑到检测可靠性,识别一个字符串中的一个字符。删除线识别单元37根据校正字符的黑象元密度、线密度、欧拉数、直方图等,识别一个删除线。
中间处理结果表44根据环境识别系统30和38抽取的状态,存储处理顺序和处理结果,其中处理顺序表要由字符识别系统或非字符识别系统33来执行哪一个过程。
图15是一个方块图,说明采用图5至7所示模式识别设备的字符识别系统的实际结构。
在图15中,一个中央处理单元(CPU)51执行各种处理。一个程序存储器50存储一个要由CPU51执行的程序。一个图象存储器52以一种位图格式存储图象数据。一个工作存储器53用于处理图象。一个扫描仪59光学地阅读图象,一个存储器58暂时存储由扫描仪59阅读的信息。一个字典文件60存储每个字符图象的特征。一个显示器56显示识别结果。一个打印机57打印识别结果。一个接口电路55用于显示器56和打印机57的操作。总线54连接CPU51、程序存储器50、图象存储器52、工作存储器53,存储器58、字典文件60和接口电路55。
字符识别系统把由扫描仪59阅读的图象数据暂时存储在存储器58中,并且把该图象数据以位图格式展开存入图象存储器52中。其后,对从图象存储器52复制到工作存储器53中的二进制图象数据,执行一个模式抽取过程。根据其结果,从扫描仪59阅读的图象数据中检测一个字符图象。把受检测的字符图象的特征同存储于字典文件60中的特征数据进行比较,以识别一个字符。其后,把识别结果输出到显示器56或打印机57中。
用这个字符识别系统能够实现图5至图7所示的模式识别设备,它能够使CPU51按照程序存储器50所存储的程序执行该过程。
下面从实际出发,描述图7所示的环境识别系统11、字符识别单元12和非字符识别单元25的结构。
图16说明在图9所示的步骤S11中执行的标号过程。
如图16所示,当把一个包含‘0’和‘1’的二进制映象输入到一个标号单元70时,标号单元70就从输入的二进制映象中抽取一个包含一些链接图元的链接模式,生成一个给每个链接模式指定一个标号的标号映象,并把该映象存储于一个标号映象存储单元71中。例如,当输入一个包含‘0’和‘1’的二进制映象72时,就用赋予每个链接模式的标号‘1’、‘2’和‘3’生成一个标号映象73 。
如果一个单映象包含255个链接模式,就需要总共255个标号。因为一个象元需要8位,故标号映象存储单元71的存储容量等于整个映象的象元数的8倍,从而需要大的存储容量去存储标号映象。
图17示出一种方法,用于通过压缩图16所示的标号映象73,减小标号映象存储单元71所需的存储容量。
在图17中,把标号‘1’和‘2’分别赋予图17中由(A)示出的链接模式A1和A2,如图17中(B)所示矩形B1确定链接模式A1的界线,且矩形B2确定链接模式A2的界线,如图17中由(C)所示。外接矩形B1和B2,能够用图17中(D)图所示的外接矩形B1和B2的左上顶点的坐标(X1,Y1)和右下顶点的坐标(X2,Y2)来规定。
然后确定,外接链接模式A1的矩形B1是否重叠于外接链接模式A2的矩形B2。如果外接连接模A1的矩形B1不重叠于外接链接模式A2的矩形B2就分别存储外接矩形B1和B2的左上顶点的坐标(X1,Y1)和右下顶点的坐标(X2,Y2)。
另一方面,如果外接链接模式A1的矩形B1重叠于外接链接模式A2的矩形B2,就把外接矩形B1和B2划分成较小的矩形区,使这些外接矩形不再与另一个外接矩形重叠。然后确定,每个划分后的矩形区属于哪一个原始外接矩形B1和B2。用象加减等算术运算来表示链接模式A1和A2。
例如,在图17所示的(C)图中,能够用下述方程所示的矩形区(1-1)与矩形区(1-2)之间的差值,表示链接模式A1,式中(1-1)表示属于连接模式A1的最大矩形区,且(1-2)表示含于矩形区(1-1)中的一些矩形区。
A1=(1-1)-(1-2)
同样,能够用下述方程所示的矩形区(2-1)与矩形区(2-2)之间的差值,加上矩形区(2-3)表示链接模式A2,式中(2-1)表示属于链接模式A2的最大矩形区,(2-2)表示含于矩形区(2-1)中的矩形区,且(2-3)表示含于矩形区(2-2)中的一些矩形区。
A2=(2-1)-(2-2)+(2-3)
这样,由于通过用一个外接一系列象元的矩形表示链接模式而减少表示诸链接模式的信息量,就能够减少存储诸标号映象所需的存储容量。
在资料ToKukaihei 8-55219中公开压缩标号图象的方法。
图18是一个流程图,说明图10所示步骤S21中文本识别过程的一个实施例。
如图18所示,在步骤S61,用一个扫描仪。阅读一个资料,并把阅读资料的图象数据存入存储器中。
然后在步骤S62,只在步骤S61阅读的图象数据中观察水平方向的规定条形段,并且对这个观察段执行标号过程,从而获得一个黑连接象元的外接矩形。
例如,如果多个资料A、B和C作为处理对象而处理,并且在图19所示的(A)图中的资料A的字符串81区是,处于由图19中所示的(D)图指示的段A范围之内的,由图19中所示的(B)图指示的资料B的字符串82中的区是,处于由图19所示的(D)图指示的段A范围之内的,和由图19中所示的(C)图指示的资料C的字符串中的区是,处于由图19中所示的(D)图指示的段B范围之内的;那么只观察在段A和B中的部分,并且只在得到一个外接连接黑象元的矩形的条形部分中执行标号过程。
然后在步骤S63,只抽取一个外接矩形,该矩形指示在步骤S62中所得高度与一预定高度ylen之间的差值小于其阈值thy,并且指示在步骤S62中所得宽度与预先得出的宽度xlen之间的差值小于其阈值thx。然后得出在y方向(垂直方向)的外接矩形坐标,并把它存入存储器中。
然后在步骤S64,用一个等于图象宽度的在步骤S62中抽取的矩形宽度,观察一个宽阔的区,该区是具有用作沿步骤S63中所得Y方向上一个中心点的坐标的。
在步骤S65,通过对在步骤S64中所得宽区进行标记,得到一个链接的黑象元的外接矩形。
其后,在步骤S66,只抽取一个外接矩形,该矩形指示在步骤S65所得高度与一预定高度ylen之间的差值小于其阈值thy,并且指示在步骤S65所得宽度与预先所得宽度xlen之间的差值小于其阈值thx。把所抽取的外接矩形存入存储器中。
其后,在步骤S67,根据X坐标把步骤S66中所抽取的诸矩形进行分类。根据所抽取矩形的中心线的间隔计算其间距。当指示所计算间距与一预先所得间距之间的差值小于预定阈值thpitch的预定数目th的或多个矩形,按水平方向排列时,就把它们作为文本输出。
这种文本抽取方法描述于例如资料ToKuKaihei 8-171609中。
下面描述一个在图10所示步骤S22中的
分格线抽取过程的实施例。
在分格线抽取过程中,把标号过程中得到的链接模式分成水平方向和垂直方向的多个分段。在水平地和垂直地划分的每个模式分段的范围内,计算链接模式的相连投影值。这样通过用一个矩形的近似检测预定线长度的部分,抽取分格线。
在这个实例中的相邻投影涉及目标行或列的投影值的总和,和周围行或列的投影值。通过计算行或列中黑象元的总数,得到目标行或列的投影值。
图20说明相邻投影过程。
在图20中,行i中的投影值是P(i),并且能用下述方程(1)计算相邻的投影值P(i)。
P(i)=P(i-j)+…+P(i)+…+P(i+j) (1)
在图20所示的实例中,方程(1)中j=1 。
图21示出一个部分模式的投影值的实例。
假定在图21中具有长度Ly和宽度Lx的矩形84中,在水平方向j的投影值Ph(i)是HP(i),且在垂直方向i的投影值PV(j)是VP(j),HP(1)=HP(n)=m,HP(2)~HP(n-1)=2,VP(1)=VP(m)=n,VP(2)~VP(m-1)=2。
如果存在矩形84的直线形成部分,则投影值是大的。因此,能够抽取分格线的直线形成部分。
例如,能够用下述方法抽取分格线的直线形成部分的候选者:检测一个部分模式,该模式指示一个相邻投影值对每个垂直分段和水平分段的长度的比值,等于或小于某一预定阈值。
图22是一个流程图,说明分格线抽取过程。
在图22中,在步骤S601确定,一个相邻投影值对每个垂直分段和水平分段的长度的比值,是否等于或大于某一预定的阈值。如果它不等于或大于该预定阈值,则控制转入步骤S602,并且假定不存在分格线的线形成部分。
如果在步骤S601确定,一个相邻投影值对每个垂直分段和水平分段的长度的比值等于或大于某一预定的阈值,则控制转入步骤S603,并且假定存在分格线的线形成部分。
在步骤S604确定,在步骤S603被认为是一线的模式,是否接触一个在模式之上或之下的线。如果确定该模式不接触一个在模式之上或之下的线,则控制转入步骤S605,并且把该模式定义为一个矩形的线形成部分。
如果在步骤S604确定,在步骤S603被认为是一线的模式接触-在模式之上和之下的线,则控制转入步骤S606,并且把该模式并入在模式之上和之下的线。在步骤S607,把在步骤S606并入的诸线当作矩形线来检测。例如,并入如图23中(A)所示的三个矩形线85,并且得到在图23中用(B)指示的一个矩形线86。然后,通过搜索在步骤S605或S607中得到的矩形线,抽取分格线。
在资料Tokukaihei 6-309498中描述上述的分格线抽取过程。
图24示出在图10所示步骤S22中分格线抽取过程中,完成模糊分格线时执行的搜索方法。
遵循完成模糊分格线的方法,去搜索一个形成直线的模式。即使在搜索方向上存在一个没有模式的区,也假定在一个其所含象元数小于预定值的空白区中存在一个模式。
例如,如图24所示,当从直线91检索一个构成部分直线91的象元92时,就用假定存在的象元92去搜一个其所含象元数小于预定值的空白区93。
图25是一个流程图,说明在分格线抽取过程中完成一个模糊分格线的方法。
在图25中,在步骤S71,计算预定矩形范围内的模式的最细部分的X坐标。
在步骤S72中,以步骤S71中算出的X坐标计算模式的一个中心点。在步骤S73中,把步骤S72中算出的模式的中心点设置成一个搜索起始点。在模式的最细部分设置搜索起始点,因为最细部分是一个字符的可能性较小,并且能以更大的可能性去检测字符框的直线形成部分。
在步骤S74,把直线的搜索方向设置到‘右’。
然后在步骤S75,把变量K的初始值设置到O,以计数空白区的长度。
在步骤S76,把步骤S73中得到的起始点设置成模式搜索的当前位置。
在步骤S77,确定步骤S76中设置的当前搜索位置是否处于步骤S71中识别的矩形范围之内。如果当前的搜索位置不处于步骤S71中观察的矩形范围内,则控制转入步骤S86中。
如果在步骤S77确定,当前的搜索位置处于步骤S71中观察的矩形范围内,则控制转入步骤S78中,并且确定是否一个模式被定位于靠近搜索方向上的当前搜索位置。如图26所示,一个紧挨着搜索方向上当前搜索位置定位的模式,涉及一个紧挨着模式101右侧的模式102,如果确定模式102是紧挨着搜索方向上当前搜索位置而定位的,则控制转到步骤S81,并且把紧挨着搜索方向上当前位置的模式102设置成当前位置。
如果在步骤S78确定,一个模式没有紧挨着搜索方向上当前位置而定位,控制就转到步骤S79,并且确定一个模式是否是在搜索方向上当前位置之上或之下对角线地定位的。
一个在搜索方向上当前位置之上或之下对角线地定位的模式,涉及一个在一个模式103之上或之下对角线地定位的模式104a或模式104b,如图26所示。如果确定模式104a和104b是在搜索方向上当前位置之上或之下对角线地定位的,控制就转到步骤S83,并且把在当前位置之上或之下对角线地定位的模式104a和104b定义为当前位置。如果存在两个在搜索方向上当前位置之上或之下对角线地定位的模式104a和104b,就把模式104a和104b中之一设置成当前搜索位置。
如果在步骤S79确定,模式104a和104b没有在搜索方向上当前位置之上或之下对角线地定位,则控制转到步骤S80,并且确定用于计数空白区长度的变量K是否等于或小于预定的阈值。如果用于计数空白区长度的变量K等于或小于预定值,则控制转到步骤S84,并且把在搜索方向上不是模式的构成部分的邻接象元定义为当前位置。例如,假设存在一种图24所示的用于具有预定数目的或少个象元的空白区93的模式,并且执行一个搜索过程。
在步骤S85,用于计数空白区长度的变量K增加一个点,并且控制回到步骤S77。
如果在步骤S80确定,用于计数空白区长度的变量K不等于或小于某一预定阈值,则控制转到步骤S86,并且确定是否把搜索方向设置到右。如果不把它设置到‘右’,就终止该过程。
当在步骤S86把搜索方向设置到‘右’时,则控制转到步骤S87,并且把搜索方向设置到‘左’。然后象在把搜索方向设置到‘右’时执行的那样,同样地重复在步骤S75到S85中的过程。
当用一个被设置到‘左’的搜索方向执行一个过程时,一个紧挨着搜索方向上当前搜索位置定位的模式涉及,一个紧挨着一个模式105左侧的模式106,如图26所示。一个在搜索方向上当前位置之上或之下对角线地定位的模式涉及,一个在模式107之上或之下对角线地定位的模式108a或模式108b,如图26所示。
下面描述步骤S23中的字符框抽取过程。
图27是一个流程图,说明一个单字符框抽取过程的实施例。
如图27所示,在步骤S91,对用作一个矩形线的在图22所示过程中检测的模式,执行一个搜索过程。在这时,假设存在一个如图25的流程图中所示的模式,并且能够解决模糊问题,就对一个预定长度的空白区执行一个搜索过程。
其后,在步骤S92确定,在步骤S91中的搜索之后是否把一个模式以某一预定的长度断开。如果不以预定长度断开它,则控制转到图28中所示的块字符框抽取过程。如果以预定长度断开该模式,则控制转到步骤S93,并且把一些搜索线组合成一个直线。
其后,在步骤S94中,从步骤S93检测的诸直线中抽取构成一个矩形的诸直线。
在步骤S95确定,由4条直线包围的一个区段的尺寸是否,属于一个图象中一个单字符框的预定范围之内。如果确定由4条直线包围的区段的尺寸是属于一个图象中单字符框的预定范围之内,则控制转到步骤S96,并且把由4条直线包围的区段看成是一个单字符框。如果确定由4条直线包围的区段的尺寸不属于图象中单字符框的预定范围之内,则控制转到步骤S97,并且不把由4条直线包围的区段看成是一个单字符框。
图28是一个流程图,说明一个块字符框抽取过程的实施例。
如图28所示,在步骤S101确定,搜索过程中检测的一个水平线是否大于某一预定值。如果搜索过程中检测的水平线小于预定值,则控制转到步骤S102,并且不把该水平线认为是字符框的一个水平线构成部分。如果确定在搜索过程中检测的水平线等于或大于预定值,则控制转到步骤S102,并且把搜索过程中检侧的水平线认为是字符框的一个水平线构成部分。
如步骤S104所示,从在步骤S103抽取的诸水平线中,抽取两个相邻的字符框水平线构成部分。
然后在步骤S105,把在步骤S104抽取的两个字符框水平线构成部分所包围的区域,看成是用于一行的块字符框。
在步骤S106,通过抽取形成图22所示的过程检测的矩形的诸线,来检测这些垂线。
然后在步骤S107,搜索在步骤S106中检测的诸垂线。在步骤S108确定,诸垂线是否已到达那些构成字符框一部分的并且在步骤S104检测的水平线。如果诸垂线尚未到达字符框的水平线构成部分,则控制转到步骤S109,从用于诸垂线的候选者中去除诸垂线。当诸垂线接触字符框的上和下边时,控制就转到步骤S110,并且把诸垂线认为是用于字符框垂线构成部分的候选者。
在步骤S111,确定一个处理对象是一个规则表—格式的块字符框,还是一个不规则表—格式的字符框。如果该处理对象是一个规则表—格式的块字符框,则控制转到步骤S112;在步骤S110计算在被视为字符线垂线构成部分候选者的诸垂直之间的间隔,并且计算一个指示所算垂线间隔与垂线频率之间关系的直方图。
在步骤S113,在两个构成字符框一部分的相邻水平线包围的一个区域内,从构成部分字符框的垂线的诸候选者中,去除那些使一些间隔不同于另一些间隔的垂线。把剩下的垂线看成是形成部分字符框的垂线,从而终止该过程
如果在步骤S111确定,处理对象是一个不规则表-格式块字符框,就把在步骤S110确定的用于垂线的全部候选者都看成是构成部分字符框的垂线,从而终止该过程。
下面描述在图10所示步骤S24中的字符-框类型/表判别过程。
图29示出一个字符框和表的实例,这是在图10所示步骤S23中的字符框抽取过程中抽取的。
在图29中,图29的(A)图表示一个单字符框。图29的(B)图表示一个自由间距字符框。图29的(C)图表示一个块字符框。图29的(D)图表示一个规则表。图29的(E)图表示一个不规则表。赋予单字符框一个单字符框属性。赋予自由间距框一个自由间距框属性。赋予块字符框一个块字符框属性。赋予表一个表属性。
在资料ToKuKaihei 7-28937中描述,字符框抽取过程和字符-框类型/表判别过程。
下面描述在图10所示步骤S25中,对接解触一个字符框的字符的存在进行确定的过程。在这一过程中,使用OR过程中的l/n缩小率来缩小原始的输入图象,然后执行对一个框-接触字符的存在进行确定的过程。设置相当于该图象每个象元的坐标。沿图象的水平方向设置X坐标。沿图象的垂直方向设置Y坐标。X坐标在右向增加,且Y坐标向下增加。
图30是一个流程图,说明缩小输入图象的一个实施例。
在图30中,在步骤S121输入一个原始图象。
然后在步骤S122设置从原始图象的左顶点(左顶点坐标(1,1),右底点坐标(x,y)起的,n个水平象元×n个垂直象元的区域。
在步骤S123确定,在原始图象的确定区域中是否存在黑象元。如果在原始图象的确定区域中存在黑象元,则控制转到步骤S124,并且把处于缩小图象的坐标(x/n,y/n)的象元定义为黑象元。如果在原始图象的确定区域中不存在黑象元,则控制转到步骤S125,并且把处在缩小图象的坐标(x/n,y/n)的象元定义为白象元。
然后在步骤S126确定,是否该过程已被执行到原始图象的右底点。如果过程尚未执行到原始图象的右底点,则控制转到步骤S127,并且确定,是否过程已被执行到最右段。
如果过程尚未被执行到最右段,就把一个n个水平象元×n个垂直象元的区域(左顶坐标(x,y),右底坐标(x,y))设置到所处理区域的右边。如果过程已被执行到最右段,就把一个n个水平象元×n个垂直象元的区域(左顶会标(x,y),右底坐标(x,y))设置成在所处理区域之下,并设置到原始图象的右边。然后控制转到步骤S123,并且重复上述的过程,直至已对原始图象的全部区域完成缩小处理为止。
通过对在输入图象缩小过程中沿构成部分字符框的诸线且在诸线之内处理的压缩图象数据,执行一个搜索过程,确定一个字符是否接触一个字符框。在接触字符的外侧用一个预定的距离放大一个矩形区域。把放大后矩形区域的坐标转换成原始图象数据的坐标。
例如,如图31中(A)图所示,假设抽取一个用于压缩图象数据的字符框的区域110,在由该字符框包围的矩形区域中存在一个‘4’字符112,并且‘4’字符112接触该字符框的下边111。
如图31中(B)图所示,一直沿字符框内侧执行一个搜索过程。如果搜索线穿过任一模式,就假设在字符框附近存在一个字符,该字符可能接触字符框,并且由字符框包围的矩形区中的‘4’字符112接触字符框。在这个实例中,假定‘4’字符112接触字符框的下边111。
其后,沿字符框的111边的内侧执行搜索过程。当认为字符112接触字符框的边111时,就从接触字符112的字符框的边111向外放大由字符框诸边包围的矩形区,如图31中(C)图所示。把放大的矩形区113定义为一个含有字符112的字符区域。如果假定该字符不接触字符框的边,就假定由该字符框包围的区段是一个字符区域。
其后,把在图31中由(C)图表示的矩形区113的坐标转换成原始图象数据形式的坐标,以便从压缩图象数据形式的字符区得到原始图象数据形式的字符区。这样,能够以原始图象数据形式得到一个矩形区116,如图31示出的(D)图所示。
在矩形区116中字符框的边114上执行一个投影过程,从其原始图象数据计算边114的坐标。在这时,用一个预定长度的条形式的矩形表示字符框的边114。如图31中(E)图所示,传送矩形区116中的模式,以便用一个字符完成过程中进行处理;并且根据按原始图象数据计算的字符框的边114的坐标,对接触字符框的边114的字符115执行一个完成过程。
图32是一个流程图,说明对接触一个字符框的字符的存在进行确定的过程的实施例。
在图32中,例如在图30所示过程中,在步骤S131用压缩图象数据表示一个矩形。
在步骤S132抽取一个由4个垂直线和水平线包围的矩形部分。
其后,在步骤S133计算那些指示矩形内左上角和右下角的坐标。
在步骤S134,沿字符框内矩形的4条边(上水平边、下水平边、右垂直边和左垂直边),搜索压缩的图象。
在步骤S135,如果在搜索过程中,4条边之一穿过图象模式,则假定一个字符接触当前正在搜索的边。
在步骤S136,把字符框内矩形的坐标转换成原始图象数据形式的坐标,以便能够根据压缩图象数据形式的矩形区,计算原始图象数据形式的一个矩形区。
在步骤S137,把在步骤S136计算的矩形区定义为原始图象数据形式的一个字符区。
在步骤S138确定,一个字符是否接触在步骤S135的过程中的字符框。当一个字符接触该字符框时,就在步骤S139至S143执行一个框接触字符区域获得过程。
在框接触字符区域获得过程中,在步骤S139从接触一个字符的边向外放大字符区,并且把一个在步骤S137计算的字符区位置之外某一预定距离处的位置,定义为字符区的结束处。
在步骤S140,根据压缩图象数据形式的字符框的边位置的坐标,通过把在步骤S139中计算的字符区中容纳的字符框的边位置的坐标转换成原始图象中的坐标,来计算原始图象数据形式的字符框的边位置的坐标。
在步骤S141,对根据在步骤S140中计算的原始图象数据形式的字符框位置坐标而得到的原始图象数据形式的字符框区,在水平边的水平方向和垂直边的垂直方向上,执行一个投影过程。
然后在步骤S142,假设指示投影值大于预定值的区,涉及原始图象中字符框的坐标。
然后在步骤S143,把原始图象中字符区的计算坐标和指示字符区中字符框位置的坐标,传送到字符完成过程。
在步骤S144,把原始图象中字符区的计算坐标定义为一个字符区。
下面描述图12所示步骤S41中的校正特征抽取过程和步骤S42中的校正字符候选者抽取过程。
图33示出一个校正字符的实施例。
在图33中,用删除线校正字符。如(A)图所示,能够用‘X’按图33中所示删除字符;如(B)图所示,能够用双水平线删除字符;如(C)图所示,能够用对角线删除字符;如(D)图所示,能够用随机线删除字符;和如(E)图所示,能够用涂黑删除字符。
能够从上述删除字符抽取删除字符的特征。这些特征可以是在预定方向的线密度,欧拉数,和黑象元的密度。
当在一个预定的方向上扫描矩形区中一个图象时,通过对从白象元到黑象元(或从黑象元到白象元)的变化进行计数,来得到在预定方向的线密度。预定方向涉及与按删除线预测的线垂直的方向。
例如,图34中(A)示出一个对关于在垂直方向的字符‘6’的最大线密度进行计数的实例。在这个实例中,在垂直方向的最大线密度是3。
与一个正常字符的‘在预定方向的线密度’相比,一个被删除字符的‘在预定方向的线密度’倾向于增加。在预定方向‘计算线密度’可以提取一个删除字符的候选者。
通过从在图象中链接的象元的数目C中减去在图象中孔洞的数目H’得出欧拉数‘E’。
例如,图34中(B)示出一个实例,其中在一个图象中链接两个象元,并且在这个图象中只有一个孔洞。这个实例中欧拉数E是E=C-H=2-1=1。
一个校正字符的欧拉数倾向于成为一个指示一个大绝对数的负数,而一个正常字符的欧拉数倾向于成为一个指示一个小绝对数的数(2~-1)。因此,计算欧拉数,可抽取一个删除字符的候选者。
黑象元的密度D涉及一个目标图象的区B(黑象元数)对外接目标图象的矩形的区S的比率。
例如,在图34中(C)示出一个事例实例,其中计算关于字符‘4’的黑象元密度D。假设S表示外接字符‘4’的矩形面积,且B表示字符‘4’的面积就可得到表达式D=B/S。
一个删除字符的‘黑象元密度’倾向于高于一个删除字符的‘黑象元密度’。计算其‘黑象元密度’,可抽取一个删除字符的候选者。
下面具体地描述图7所示的基本字符识别单元17。
图35是一个方块图,说明基本字符识别单元17的结构的一个实施例。
在图35中,一个特征抽取单元121从一个未知的输入字符模式抽取一个字符的诸特征,并且用一些特征向量表示所抽取的诸特征。另一方面,一个基本字典122存储每个字符种类的诸特征向量。
一个整理单元123,对特征抽取单元121使用存储于基本字典122中每个字符种类的特征向量抽取的未知字符模式的特征向量,进行整理,并且对在特征空间中诸特征向量之间的距离Dij(i)表示未知字符的特征向量,j表示基本字典122的种类的特征向量),进行计算。结果,种类j按照一个未知字符i,表示诸特征向量之间的最短距离Dij。
能够使用一个欧几里德距离∑(i-j)2,一个城市街区距离∑|i-j|,或者一个象判别式函数之类的标识函数,来计算特征空间中诸特征向量之间的距离Dij。
假设离开第一种类的距离为Dij1,且离开第二种类的距离为Dij2,则使用第一种类j1,第二种类j2,距离(Dij2-Dij1),和诸种类之间的可靠性,可预先地生成一个表1。此外,还使用离开第一种类的距离Dij1,第一种类j1,和可靠性,生成一个第二表2。把从表1或2得到的较小的可靠性存储到中间处理结果表中。
图36示出一个计算特征向量的实例。
在这个实例中,在20个字块(垂直方向5个和水平方向4个)的一列中写入字符‘2’。涂黑的字块表示‘1’,和涂白的字块表示‘0’。从左顶字块到右底字块相继地检验字块。把字符‘1’或‘0’重新整理为特征向量。
例如,用向量A=(1.1.1.1.0.0.0.1.1.1.1.1.1.0.0.0.1.1.1.1.)代表由图36中B图指示的特征向量A。用向量B=(0.1.1.1.0.0.0.1.1.1.1.1.1.0.0.0.1.1.1.1.)代表由图36中(C)图指示的特征向量B。用向量C=(1.1.1.1.0.0.0.1.0.1.1.0.1.0.0.0.1.1.1.1.)代表由图36中(D)图指示的特征向量。
图37说明一个用城市街区距离d(i,j)计算诸特征向量之间距离Dij的实例。
假设N表示特征向量的维数,且i表示特征向量数,则在城市街区距离d(i,j)中第i个特征向量Xi被表达成xi=(Xi1,Xi2,Xi3’……,XiN),且第j个特征向量被表达成Xj=(Xj1,Xj2,Xj3,……,XjN)。在第i个特征向量Xi和第j个特征向量Xj之间的城市街区距离d(i,j)被定义如下。
d(i,j)=|Xi-Xj|……(2)
例如,在图37中,基本字典122中载有字符种类‘1’,‘2’,‘3’,和‘4’的特征向量。字符种类‘1’的特征向量1被表达成向量1=(0.1.1.0.0.1.1.0.0.1.1.0.0.1.1.0.0.1.1.0.)。字符种类‘2’的特征向量2被表达成向量2=(1.1.1.1.0.0.0.1.1.1.1.1.1.0.0.0.1.1.1.1.)。字符种类‘3’的特征向量3被表达成向量3=(1.1.1.1.0.0.0.1.1.1.1.1.0.0.0.1.1.1.1.1.)。字符种类‘4’的特征向量4被表达成向量4=(1.0.1.0.1.0.1.0.1.1.1.1.0.0.1.0.0.0.1.0.)。
如果输入一个其特征向量为向量=(0.1.1.1.0.0.0.1.1.1.1.1.1.0.0.0.1.1.1.1.)的未知字符,就用上述方程(2)计算该特征向量与用基本字典122输入的下列各个向量之间的城市街区距离d(i,j):字符种类‘1’的,特征向量1,字符种类‘2’的特征向量2,字符种类‘3’的特征向量3,和字符种类‘4’的特征向量4。
这就是说,在未知字符向量与字符种类‘1’的特征向量1之间的城市街区距离dij被表达成d(i,j)=|向量-向量1|=|0-0|+|1-1|+|1-1|+|1-0|+|0-0|+|0-1|0-1|+|1-0|+|1-0|+|1-1|+|1-1|+|1-0|+|1-0|+|0-1|+|0-1|+|0-0|+|1-0|+|1-1|+|1-1|+|1-0|=11.
同样,在未知字符向量与字符种类‘2’的特征向量2之间的城市街区距离d(i,j)被表达成d(i,j)=|向量-向量2|=1。在未知字符向量与字符种类‘3’的特征向量向量3之间的城市街区距离d(i,j)被表达成d(i,j)=|向量-向量3|=3。在未知字符向量与字符种类‘4’的特征向量向量4之间的城市街区距离dij被表达成d(i,j)=|向量-向量4|=11。
在该特征向量与各个字符种类‘1’特征向量1、字符种类‘2’特征向量2、字符种类‘3’特征向量3和字符种类‘4’特征向量4之间的诸城市街区距离d(i,j)之中,在该特征向量与字符种类‘2’特征向量2之间的城市街区距离d(i,j)表明有最小值。
因此,确定一个其特征向量=(0.1.1.1.0.0.0.1.1.1.1.1.1.0.0.0.1.1.1.1.)的未知字符属于字符种类‘2’。
下面描述一种识别细目的方法,这些细目是存储在图7所示基本字符识别单元17的知识表18中的。在这种识别细目的方法中,抽取一个局部部分模式作一个字符段,并且把一个未知字符的字符段的位置与角度的变化,同一个预先存储于分段字典中的字符段的位置与角度的变化进行比较。这样,通过使该未知字符与字符种类对应,能够识别该字符。
图38示出抽取一个字符段的方法。
图38中(A)图表示一个关于字符‘2’的二进制映象模式,并且具有对角线的部分涉及一个用黑象元表示的字符。
图38中(B)图表示一个从图38中(A)图所示二进制映象模式中抽取的字符外形。虚线部分表示其原始二进制映象模式。
图38中(C)图说明把图38中(B)图所示外形表达成字符段S1和S2和端部T1和T2。端部T1和T2相当于图38中(A)图所示字符‘2’的开始和结束。
图39示出检测一个端点的方法。
在图39中,按照一个其外形斜率显示突变的分段来检测端点。实际上,对外形S以预定的间隔设置三个点A,B和C。把一个在点B与C之间的在外形上的点A使角度θ小于预定值区,检测成一个端部。
例如,当通过在端部划分一个字符的外形而从一个二进制映象模式抽取一个字符段时,就对该字符段以预定的间隔设置代表点X,Y,和Z。得出在相邻的代表点X,Y和Z产生的诸角,并且作为在代表点X,Y和Z的特征,得出字符段上从第一代表点到每个其他代表点的角度变化的累积值。
图40示出检测角度变化的方法。
在图40中,以预定的间隔对外形线S设置代表点X,Y和Z。生成从代表点X到代表点Y的向量XY和从代表点Y到代表点Z的向量YZ。把在向量XY与向量YZ之间的角θ定义为在代表点Y的角度变化。
以在外形线S上代表点X的角度变化作为角度变化的初始值,它涉及从一个字符的重力G的中心到代表点X的向量GX与向量XY形成的角度θ1。
通过从具有角度变化初始值的代表点X到各个代表点Y和Z的角度变化的累积值,表示在各个代表点X,Y和Z的特征。例如,在代表点Y的特征被表达成θ1+θ2。
在得到一个未知字符的字符段上的代表点的角度变化累积值以后,使未知字符的符段的代表点相当于在分段字典中存储的字符段上的代表点。即,计算在未知字符的字符段上代表点的角度变化累积值与分段字典中存储的字符段上代表点的角度变化累积值之间的距离。使指示其最短距离的在分段字典中的字符段上的代表点,相当于未知字符的字符段的代表点。
图41中(A)图说明,在一个未知字符上字符段的代表点与分段字典的字符段上的代表点之间的一致性。
在图41的(A)图中,代表点a1至a8涉及一个未知字符的字符段上的代表点。代表点b1至b8涉及在分段字典中存储的字符段上的代表点。未知字符的字符段上a1至a8中的每一个代表点。都对应分段字典中存储的字符段上b1至b8中的一个代表点。
当得到在一个未知字符的字符段上的代表点与分段字典的字符段上的代表点之间的一致性以后,就把对应于分段字典中存储的字符段上参照点的,未知字符的字符段上的代表点设置成一个检验点。
图41中(B)图说明在参照点与检验点之间的一致性。
在图41所示(B)图中,存储于分段字典中的字符段的参照点d1和d2,分别相当于该未知字符的字符段的检验点C1和C2。
当得到在参照点与检验点之间的一致性以后,就计算关于该未知字符的字符段的检验点C1和C2的检验信息。
举例来说,检验信息可以是:在整个字符图象中存在检测点的场合下关于各个检验点的绝对位置信息;关于指示两个检验点之间距离、方向等的两个检验点的相对位置信息;和关于在诸检验点之间角度、线性等变化的两个或多个检验点的信息。
如果在计算关于检验点的检验信息以后满足一些预定的条件,就把满足该条件且存储于分段字典中的字符段的字符种类,作为未知字符的识别结果而输出。
例如,如果利用从字符段上检验点C1沿字符段到图41所示(B)图表示的检验点C2的角度变化,作为在预定条件下的检验信息,则当一个指示60度或60度以上角度变化的字符段的字符图象,属于与字符段相应地存储的分段字典中的‘2’字符种类时,通过计算从字符段上检验点C1沿字符段到图41所示(B)图表示的检验点C2的角度变化,就能够把图38所示(A)图表示的字符模式识别成属于字符种类‘2’。
图42是一个流程图,用细目识别方法说明字符识别过程。
在图42中,在步骤S150,举例来说,用一个扫描仪扫描要进行字符识别的一个列表,并且把读出的字符图象二进制化成一个二进制的单色图象。
然后在步骤S151,从步骤S150所得的二进制图象中,抽取一个字符段。
在步骤S152,从多个存储于分段字典中的字符段中检测一个不涉及未知字符的字符段的字符段。
在步骤S153,从涉及未知字符的字符段的分段字典中检索该字符段。
在步骤S154,从未知字符的字符段上的代表点选择一个检验点,并且计算关于该检验点的检验信息。
在步骤S155,根据在步骤S154计算的检验信息,把从分段字典检索的字符段同未知字符的字符段进行比较;并且通过确定关于从分段字典检索的字符段的检验信息是否同关于未知字符的字符段的检验信息相匹配,确定一个相当于未知字符的字符候选者。
然后在步骤S156,当在确定一个未知字符候选者的过程中确定一个字符候选者时,就把一个相当于步骤S153中检索的字符段的字符种类作为识别结果而输出。如果未确定一个字符候选者,则控制转到步骤S157,并且确定是否存在一个不涉及未知字符的字符段的未处理字符段。如果在分段字典中存在一个未处理的字符段,则控制回到步骤S152,并且重复上述的过程。
如果在分段字典中不存在一个未处理的字符段,它是不涉及未知字符的字符段的,就确定:不能够识别所输入的未知字符,并且把‘未识别的’作为识别结果而输出。
在资料Tokukaihei 6-309501中透露细目识别方法。
下面描述图9所示框-接触字符识别单元13的一个实施例。
图43说明由框-接触字符识别单元13执行的字符完成过程。
在这个字符完成过程中,从框-接触字符的二进制映象中只抽取一个字符框。在这时,接触框-接触字符的字符框的,字符笔画的框接触部分变模糊,并且字符笔画被分成多个部分。因此,评价字符的被分部分的标号字符笔画的几何结构,例如距离、方向等,并且完成该字符。
例如,如图43所示的(A)图所说明,把标号1赋予代表‘3’的字符模式131和接触字符的字符框132的二进制映象。然后,通过从图43中(A)图所示的二进制映象中抽取字符框132,并且去掉字符框132,把指示‘3’的字符模式131分成3个部分,如图43中(B)图所示。这样,用赋予的标号1,2,和3生成三个字符笔画。
评价赋予标号1,2,和3的三个标号字符笔画的几何结构,例如距离、方向等,并且完成该字符。这样,把三个赋予标号1,2,和3的字符笔画连接起来,并且生成一个用标号1指示‘3’的字符完成模式132,如图43中(C)图所示。
对在字符完成过程中作为要识别字符候选者而恢复的字符,执行一个识别过程。在这个识别过程中,用输入字符种类字典中的标准模式整理该字符,并且输出一个指示最小差异的字符种类的代码。
图44说明一个由框-接触字符识别单元13执行的重新完成过程。
在这个重新完成过程中,如果平行于字符框的字符笔画接触字符框,并且在去掉字符框时被去掉,就要插入该字符笔画。根据其连接使用标号抽取框-接触字符,并且通过检测在由字符完成过程完成的完成字符模式与框-接触字符之间的连接上的匹配,能够插入一个平行于字符框的字符笔画。
例如,如图44中(A)图所示,把指示‘7’接触字符框142的字符模式141的二进制映象赋予标号1。从图44中(A)图所示的二进制映象中抽取字符框142,并且去掉该字符框142。如图44中(B)图所示,把指示‘7’的字符模式141分成3个部分,并且用赋予的标号1,2,和3生成三个字符笔画。
评价赋予标号1,2,和3的三个标号字符笔画的几何结构,例如距离、方向等,并且完成该字符。这样,把赋予标号1和2的三个字符笔画连接起来,并且如图44中(C)图所示,生成一个字符完成模式142,这是由带有标号1和2的两个字符笔画组成的。
在字符完成过程中,只在赋予标号1的部分与赋予标号2的部分之间完成如图44中(B)图所示的字符。然而,在赋予标号1的部分和赋予标号3的部分之间未完成如图44中(B)图所示的字符。在赋予标号1的部分与赋予标号3的部分之间的重新完成过程中完成如图44的(B)图所示的字符。
在重新完成过程中,通过根据使用标号的连接,预先抽取框-接触字符,和通过检测在图44中(C)图所示的模式与框-接触字符之间连接上的匹配,可插入平行于字符框的字符笔画。即,在去掉图44中(A)图所示的字符框之前,已连接图44所示(C)图所示的赋予标号1和2的模式。因此,使用平行于字符框的字符笔画,连接图44中(C)图所示的赋予标号1和2的模式。
这样,能够完成如图44中(C)图所示的被分成两个赋予标号1和2的字符笔画的二进制映象‘7’,并且如图44中(D)图所示,生成一个用标号1指示‘7’的一个重新完成模式143。对一个在字符完成过程中作为要识别字符候选者恢复的字符,执行识别过程。在这个识别过程中,用输入字符种类字典中的标准模式整理该模式,并且输出一个指示最小差异的字符种类的代码。
即,在图44所示的实例中,把图44中(C)图所示的字符完成模式142识别成属于字符种类‘リ’。而把图44中(D)图所示的字符完成模式143识别成属于字符种类‘7’。当确定‘7’指示小于‘リ’的差异时,最后把该字符识别成‘7’,并且输出该字符代码。
下面描述一个事例:图7所示框-接触字符识别单元13参照知识表14执行识别过程。
图45通过学习一对字符及其误读字符和把它输入知识表14中,说明一个识别一个框-接触字符的实例。
在这个实例中,如图45中(A)图所示,把标号1分配到一个代表‘2’的字符模式151和接触该字符的字符框152的二进制映象。其后,通过从图45中(A)图所示的二进制映象中抽取字符框152,和通过去掉该字符框152,把指示‘2’的字符模式151分成两个有标号1和2的部分模式,如图45中(B)图所示。
如图45中(C)图所示,把图45中(B)图所示的具有标号1和2的两个部分模式链接起来,并且在字符完成过程中生成一个字符完成模式153 。
在这种情况下,指示‘2’的字符模式151的较下笔画接触字符框152的较下边,并且字符的接触部分几乎完全重叠该字符框152。因此,甚至重新完成过程,也不能够完成这个指示‘2’的字符模式151的较下笔画,并且存在一种大的可能性:字符‘2’可能误读成‘7’。
这样,框-接触字符不应部分地写到字符框的外面,而且不应完全与字符框重叠。因此,如果它可能被误读成任何其他字符,则应当通过学习成对的字符及其误读字符而输入它,正确地识别框-接触字符。
下面描述通过输入成对的字符及其误读字符来识别一个框-接触字符的方法。
图46是一个方块图,说明在图7所示的框-接触字符识别单元13中学习成对的字符及其误读字符的结构。
一个自动框-接触字符生成单元161,通过使一个字符框重叠于一个按照不接触字符框而输入的学习字符,生成一个框接触字符。使用相对于字符框而改变学习字符的方法,能够为一个单独的学习字符生成多个框接触字符。在图46中,把一个指示‘2’的学习字符168输入自动框-接触字符生成单元161中,并且用字符“2”的较下笔划重叠于字符框的较下边的方法,生成一个框-接触字符169。把由自动框-接触字符生成单元161生成的信息输入一个知识表167中。
在一个学习字符与它的字符框重叠的情况下,可能存在两种字符变化,即,一个字符相对于它的字符框的变化,和字符框的变化。字符相对于字符框的变化可能是,例如位移、尺寸变化、姿态变化等。字符框的变化可能是,例如姿态变化、字符框宽度变化、尺寸变化、字符框的凸凹等。
下述参数表示上述各个变化的变化量。x轴表示垂直方向,y轴表示水平轴。
1.一个字符相对于其字符框的变量。
位移:dx,dy
在此dx(在图47中用黑点表示的位置)和dy(在图47中用x表示的位置)分别表示在x方向和y方向之间在字符与字符框的重力中心位置上的差别。
尺寸变量:dsx,dsy
在此dsx和dsy分别表示在x方向和y方向上字符的尺寸。
姿态变量:dα
在此dα表示字符对垂直线的姿态角。
2.字符框变量
姿态变量:fα
在此fα表示字符框对垂直线的姿态角。
字符框宽度变量:ω
在此ω表示字符框的宽度。
尺寸变量:fsx,fsy
在此fsx和fsy分别表示在x方向和y方向上的字符尺寸。
字符框的凸凹性:fδ
在此fδ是在考虑一个传真上打印字符框的质量变坏等情况下,用于控制例如字符框凸凹性的一个参数。假设用L表示字符框的周线长度,则按照尺寸L用数组fδ〔L〕表示fδ。在这个数组中,每个数组元素fδ〔i〕(i=1,2,3,…)都是一个由一个随机数确定的-β~+β的范围内的整数。
根据上述的变量类型和数量,通过提供一个学习字符和一个运算F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ),生成一个框接触字符。
图47说明一个实例:通过把一个字符框172分配到一个指示‘7’的学习字符171,生成一个框-接触字符。
如图47中(A)图所示,通过对指示‘7’的学习字符171提供一个变换运算F(dx,dy,dsx,dsy,dα,ω,fsx,fsy,fα,fδ),生成一个如图47中(B)图所示的接触字符框172的框-接触字符‘7’。
这就是说,通过对学习字符171和字符框172执行变换运算F(dx,dy,dsx,dsy,dα,w,fsx,fsy,fα,fδ),使学习字符171和字符框172互相重叠,能够生成一个框-接触字符。在这时,例如在固定字符框172的重力中心位置的同时,执行变换运算F(dx,dy,dsx,dsy,dα,ω,fsx,fsy,fα,fδ)。
图48示出各种框-接触字符的实例,这些字符是在x方向上的尺寸变量fsx和在y方向上的尺寸变量fsy被固定和字符框尺寸被固定的情况下为学习字符‘3’而生成的。
图48中(A)图表示变量‘位移’类型的实例,其中变化量是dx=0,和dy>0。在这种情况下,字符‘3’是部分地在字符框下边的外面的(下位移)。
图48中(B)图表示变量‘位移’类型的实例,其中变化量是dsx=fsx,和dsy=fsy。在这种情况下,字符‘3’接触字符框‘3’的上、下、左和右边。外接矩形‘3’等于字符框。
图48中(C)图表示‘字符姿态变量’类型的实例,其中变化量是dα=10度。
图48中(D)图表示‘字符框姿态变化’类型的实例,其中变化量是fα=-10度。
图48中(E)图表示‘字符框宽度变化’类型的实例,其中变化量是ω=5。
图48中(F)图表示‘字符框凸凹性变化’类型的实例,其中变化量是fδ(L)的每个元素fδ(i)是受控制的。
其次,一个图46中所示的字符框去除单元162,从自动框接触字符生成单元161生成的框-接触字符中,只抽取字符框,并且把关于通过去除字符框得到的模糊字符的图象数据,输出到一个字符完成单元163中。
字符完成单元163,根据已从其中用字符框去除单元162去除字符框的图象数据,评价和完成标号字符笔画的几何结构,例如距离、方向等。图46示出生成一个字符完成模式170的一个实例,该模式是在从自动框接触字符生成单元161生成的框接触字符169去除字符框以后,用字符完成单元163完成一个框接触字符而生成的。
一个重新完成单元164,在一个字符完成单元163尚未完成其图象数据的区中,根据使用标号的链接,预先抽取框-接触字符;并且通过检测在字符完成单元163完成的模式与框-接触字符之间在链接上的匹配,完成一个平行于字符框的字符笔画。
由字符完成单元163完成的字符完成模式和由重新完成单元164完成的重新完成模式,被输入到一个基本字符识别单元165。
基本字符识别单元165,对由字符完成单元163的字符完成模式和由重新完成单元164重新完成的重新完成模式,执行一个字符识别过程。其后,基本字符识别单元165把关于各个学习字符的识别结果,输出到一个字符框接触状态与识别知识获取单元166。
字符框接触状态与识别知识获取单元166用预先提供的解答数据,比较一个从基本字符识别单元165输出的识别结果;并且得到用于整个样品数据的识别率。其后,字符框接触状态与识别知识获取单元166把这个识别率作为可靠性,和把误读(误识别)字符与校正字符的结合作为一对字符和它们误读字符,而输入知识表167中。例如用字符代码输入上述的一对字符及其误读字符。字符框接触状态与识别知识获取单元166还抽取一个指示一个字符和一个接触该字符的字符框的状态特征的参数,并且把该特征输入知识表167中。
这样,知识表167载有识别率,用于各种字符种类;同时载有成对的字符及其误读字符,用于字符与字符框之间各种接触状态的字符。
图49示出一个知识表167的实例,该表是通过学习一个字符而生成的。
在图49中,知识表167载有例如字符及其误读字符(2和7),77%的可靠性,以及在‘较下位置位移’的变化量dy=5和ω=5等。如果框-接触字符‘2’指示‘在较下位置位移’中的变化量dy=5和ω=5,则基本字符识别单元165可能以23%的概率把‘2’误识别成‘7’。即使基本字符识别单元165在这种情况下把‘2’误读成‘7’,也可通过参照知识表167确定,可靠性是77%,并且仍有该字符实际是‘2’的23%的概率。
同样,字符框接触状态与识别知识获取单元166,把‘变化量’、‘字符框诸边的宽度’、一个‘字符及其误读字符’和一个可靠性,输入知识表167中。
字符及其误读字符对(L1,L2)表示,可能真的把字符‘L1’误识别成‘L2’。为相应的字符‘L1’和‘L2’而输入用于字符‘L1’和‘L2’的字符代码。
除了图49所示的在较下位置的在位移上的变化量dy=5和ω=5之外,知识表167还输入图47所示的各种变量,例如用于图50所示的各种字符种类的‘字符相对于它的字符框的姿态上的变化’(在这种情况下,在左边接触)。
如图50所示,为‘在较下位置位移’的变化而输入dx=‘-3’~‘+3’,dy=5,w=5,dsy=1,dα=‘-10’~‘+10’,fα=‘-10’~‘+10’。这样,作为‘在较下位置位移’而输入知识表167中的变化量可能是,在x方向上的位移dx,在y方向上的位移,和其他值。同样,为一个‘字符接触字符框左边的姿态变化’而输入dx=‘-3’~‘+3’,dy=‘-3’~‘+3’,w=5,dsy=1,dα=‘-20’~‘+20’,fα=‘-10’~‘+10’。
对其可靠性等于或小于某一预定阈值(例如90%)的一对(L1,L2)字符及其误读字符,按照一种可靠性等于或大于该预定阈值的方式,采用一种字符识别方法。把这种学习字符识别方法输入知识表167中。
例如,在具有dy=5和w=5的‘在较下位置位移’的状态中的框-接触字符‘2’的字符识别可靠性是77%,如图49中所示。因为存在一种该字符被误读成‘7’的高几率,故由字符完成单元163完成的字符完成模式和由重新完成单元164重新完成的字符重新完成模式,在学会例如能通过再一次识别这种强调一个指定区的模式而改善其识别率以后,被输入知识表167中。
参照图51,描述为一对(2和7)字符及其误读字符而强调一个指定区的方法。
首先,如图51(A)图所示,一个外接矩形180围绕由字符完成单元163完成的字符完成模式和由再完成单元164再完成的再完成模式,把这个矩形分成m列×n行的m×n个分区。其后,如图51中有对角线的(B)图所示,强调外接矩形180的上半m/2×n区,以再一次识别该字符。
即,抽取m/2×n区的特征参数,并且检验,由字符完成单元163完成的字符完成模式或者由再完成单元164再完成的再完成模式是否是‘2’或‘7’。区强调方法可把识别可靠率提高到95%。图49所示的知识表167在其成对的字符及其误读字符(2,7)一行中载有,用作重新识别方法的‘重点区’,用作重新识别区的‘m/2×n’区,和用作重新识别可靠率的‘95%’。
区强调方法对图52中(A)图所示的框-接触字符也是有效的。图52中所示(A)图是一个指示‘2’的字符模式的下部接触一个字符框182的实例。
在这种情况下,字符完成单元163得到一个类似于图52中(B)图所示的‘7’的字符完成模式183。计算一个相应于字符完成模式183的由图52中(C)图所示的外接矩形184。如果如图51中所示,把该外接矩形184分成m×n个区,并且上半m/2×n部分区185在识别字符时被特别强调,则存在一种大的可能性:能够把字符完成模式183识别成‘2”。即,可以学会,能够以高速率得到一个解答(可靠性),并且把上述区强调方法输入知识表167中,用作一对(2和7)字符及其接触字符框的误读字符的重新识别方法。
图53是一个流程图,说明通过强调一个指定区而重新识别一个字符模式的方法。
在图53中,在步骤S161,从知识表167中检索一种指示较低可靠性的字符及其误读字符对的数据。与字符及其误读字符对的左字符相对应,输入一个用作二进制学习数据的字符模式,和一个由字符完成单元163完成的字符完成模式或一个由再完成单元164再完成的再完成模式。
字符完成模式或再完成模式是由一个输入知识表167中的变化量参数规定的,并且甚至在相同种类情况下也能够由多种形式的模式来代表。
在步骤S162,把在步骤S161输入的用作学习数据的字符模式,和由字符完成单元163完成的字符完成模式或由再完成单元164再完成的再完成模式,分成m×n个区。
在步骤S163,在m×n区中对x×y部分模式执行一个字符识别过程,并且得出其识别率z。
上述x×y部分模式是一个重新识别区,其中x和y分别表示在m×n区中x方向和y方向上的长度,并且x≤m和y≤n。上述识别率表示一个能够在用上述x×y部分模式识别字符的情况下输出一个正确解答的几率。
即,把用作学习数据的字符模式的部分模式的字符识别结果看成是一个解答。关于由字符完成单元163完成的字符完成模式或由再完成单元164再完成的再完成模式,对其多个部分模式得出的字符识别结果,同对用作学习数据的字符模式的部分模式得出的字符识别结果进行比较。结果,得到关于由字符完成单元163完成的字符完成模式或由再完成单元164再完成的再完成的模式的,部分模式的识别率z。
其后,在步骤S164,判别是否识别率z大于其最大识别率max。最大识别率max是一个存储识别率z最大值的变量,它是在一个x×y的部分模式改变时得到的。首先,设置一个初始值(例如,‘0’)。
如果识别率z大于最大识别率max,则控制转到步骤S165,以便用识别率z代替最大识别率max;并且控制转到S166,以便检验长度x和y是否是变化的。如果识别率z在步骤S164是等于或小于最大识别率max,则控制直接转到步骤S166。
改变长度x和y就是改变长度x和y的长度,并且还包括一个在x×y的部分模式的m×n区中的位置变化。
如果在步骤S166判别,长度x和y是变量,则控制回到步骤S163,长度x和y被改变,一个新的x×y部分模式被确定,并且识别部分模式中的字符。
重复步骤S163至S166中的过程,直至在步骤S166确定长度x和y不能被改变为止。如果在步骤S166确定,不能改变长度x和y,就把最大识别率max和已从其中得出最大识别率max的x×y部分模式,分别作为一个重新识别可靠性和一个重新识别区,输入知识表167中。把‘区强调’当作一种重新识别方法而输入知识表167中。
图53示出一个对使用区强调法重新识别一个字符的方法进行学习的实例。还能够用区强调方法之外的任何其他方法来学习字符识别方法。
图54是一个方块图,根据经学习得到的知识表167,说明用来识别一个框-接触字符的结构。
在图54中,一个框-接触检测单元191在输入一个未知的框-接触字符时,检测在一个字符框与一个字符之间的接触状态。这个实例说明一个框-接触字符模式201(‘2’)的下部部分地重叠于字符框下边的情况,如图54中的(A)所示;和一个框-接触字符模式203(‘2’)的下部完全重叠于字符框下边的情况,如图54中的(B)所示。框接触状态检测单元191检测框-接触字符模式201和框-接触字符模式203。
一个字符框去除单元192,从一个由框-接触状态检测单元191检测的框-接触字符模式,去除一个字符框。
一个字符完成单元193,对已从其中用字符框去除单元192去除其字符框的字符模式,评价和完成标号字符笔画的几何结构,例如距离、方向等。
一个再完成单元194,在一个字符完成单元193尚未完成其图象数据的区中,根据使用标号的链接,预先抽取框-接触字符;并且通过在由字符完成单元193完成的模式与框-接触字符之间检测其链接上的匹配,完成平行于字符框的字符笔画。一个再完成模式202说明,对图54中(A)所示的框-接触字符模式201,在由再完成单元194执行的再完成过程中完成的一种模式。一个再完成模式204说明,对图54中(B)所示的框-接触字符模式203,在由再完成单元194的执行的再完成过程中不能完成的一种模式。
基本字符识别单元195,对由字符完成单元193完成的字符完成模式和由再完成单元194再完成的再完成模式,执行一个字符识别过程。结果,为图54中(A)所示的再完成模式202而输出字符代码‘2’,并且为图54中(B)所示的再完成模式204而输出字符代码‘7’。把作为识别结果得出的字符代码输出到一个字符框接触状态与识别知识获取单元196中。
字符框接触状态与识别知识获取单元196,根据单元围绕字符完成单元193所完成的字符完成模式或再完成模式194所再完成的再完成模式的矩形的位置信息,和根据关于从图54中(A)所示的框-接触字符模式201或从图54中(B)所示的框-接触字符模式203,抽取的字符框的位置信息和宽度信息,得出变化的类型。
即,获得一种关于一个字符相对于它的字符框的变化,例如位移、尺寸变化、姿态变化等,如图47所示;和一种关于字符框的变化,例如姿态变化、字符框宽度变化、字符框凸凹性等。对上面得到的各种变量类型进一步计算其变化量dx,dy,dsx,dsy,dα,ω,fsx,fsy,fα或fδ。
其后,使用从基本字符识别单元195输入的作为关键字条目的计算变量类型信息、变化量信息、和一个字符代码,检索知识表167。检验知识表167是否存储一个数据行,其中含有匹配关键字条目的变量类型信息、变化量信息、和一个字符及其误读字符对。
如果存在匹配关键字条目的数据行,就判别在该行存储的可靠度是否等于或大于某一预定的阈值。如果它小于该阈值,就把由字符完成单元193完成的字符完成模式或者由再完成单元194再完成的再完成模式,输出到一个字符再识别单元197中。用输入该数据行中的再识别方法再一次识别该字符。
即,通过一种不同的方法重新识别未知图象数据中的框-接触字符,该方法不同于由基本字符识别单元195使用字符完成单元1 93所完成的字符完成模式,再完成单元194所再完成的再完成模式,或未知字符二进制映象数据的方法。然后,输出在重新识别过程中得到的字符代码。
例如,当基本字符识别单元195输出,作为关于再完成单元194所再完成的再完成模式204的识别结果的字符代码‘7’时,字符框接触状态与识别知识获取单元196,根据关于围绕再完成模式204的矩形的位置信息,和关于从框接触字符模式203抽取的字符框的位置信息与宽度信息,得到变量的类型和变化的数量。结果,‘在较下位置的位移’被当作变量类型而计算。‘dy=5’被当作‘在较下位置的位移’方面的变化量而得到。 w=5被当作字符框宽度而计算。
其后,字符框接触状态与识别知识获取单元196,使用‘在较下位置的位移’作变量类型,‘dy=5’作在较下位置的位移量,‘w=5’作字符的宽度,和从基本字符识别单元195接收的字符代码‘7’作关键字条目,来检索图49所示的知识表167。作为检索结果,相当于关键字条目的诸数据行存储一个字符及其误读字符对(2和7),并且由基本字符识别单元195识别的字符代码‘7’的可靠率是77%,从而涉及以23%的几率把字符‘2’误读为‘7’。
在这种情况下,因为在相当于这些关键字条目的诸数据行中输入的可靠率小于预定的阈值,故字符再识别单元197用一种不同于基本字符识别单元195所遵循方法的方法,重新识别在未知图象数据中所含有的框-接触字符模式203。这时,字符重新识别单元197涉及相当于知识表上关键字条目的用于指定重新识别方法的数据行。
即,字符重新识别单元197获悉用‘区强调方法’作重新识别方法,并且获悉当执行‘区强调过程’时用再完成模式204的一个上半m/2×n区205作一个重新识别区。还获悉重新识别可靠率为95%。
字符重新识别单元197用输入知识表167中的重新识别方法,只再识别再完成模式204的上半区205。字符识别单元197获悉,再完成模式204的上半区205以95%的几率匹配一个相当于字符代码‘2’的字符模式206的部分区207,并且以5%的几率匹配一个相当于字符代码‘7’的字符模式208的部分区209;并且把字符代码‘2’作为一个接触未知字符的框-接触字符模式203的字符框的字符的识别结果而输出。
图55是一个流程图,说明字符框接触状态与识别知识获取单元196的操作。
在图55中,根据从一个未知的框-接触字符模式抽取的字符框和从该框-接触字符模式分离的字符模式,计算一个字符相对于它的字符框而变动的量,并且在步骤S171用该变动量作关键字条目而检索知识表167。然后检验,该知识表167是否存储一个其变动量匹配所计算变化量的数据行。
当以较下位置指示位移的字符‘2’的变动量按照例如dx=5和w=5而得到时,就检测知识表167中的顶行,如图49所示。
如果一个载有匹配变化量的行存在,则控制转到S172,并且确定包含匹配变化量的行是否存有,在其字符及其误读字符对中包含从基本字符识别单元195输入的字符代码(字符识别代码)的行。
用指示在较下位置位移的字符‘2’,检测知识表167中的顶行,如图49所示。
在步骤S173,如果包含匹配变动量的行存有,在其字符及其误读字符对中包含从基本字符识别单元195输入的字符代码的行,就把在知识表167中相应行内输入的重新识别可靠率,同由基本字符识别单元195计算的可靠率进行比较。确定是否在知识表167中相应行内输入的重新识别可靠率,大于由基本字符识别单元195计算的可靠率。
对于在其较下位置移动的字符‘2’,在图49所示知识表167中顶行内输入的重新识别可靠率和由基本字符识别单元195计算的可靠率,分别为‘95%’和‘77%’。这就确定,在知识表167中相应行内输入的重新识别可靠率大于由基本字符识别单元195计算的可靠率。
如果在知识表167中相应行内输入的重新识别可靠率大于由基本字符识别单元195计算的可靠率,则控制转到步骤S174,并且确定是否在知识表167中相应行内输入的重新识别可靠率大于一个预定的阈值th1。如果它大于该阈值th1,则控制转到步骤S175,并且参考在知识表167中相应行内输入的和在步骤S172中检测的重新识别方法和重新识别区。
然后在步骤S176,从字符完成单元193所完成的字符完成模式或再完成单元194所再完成的再完成模式中,检测示于知识表167中的一个重新识别区,并且对该检测区用示于知识表167中的重新识别方法,执行一个字符识别过程。然后输出在该字符识别过程中得到的字符代码。
如果阈值th1小于‘95%’,则对字符‘2’的完成模式使用其上半‘m/2×n’区按照区强调方法执行再识别过程,来最终输出字符代码‘2’;该完成模式是在其下部位置有位移的,并且是由基本字符识别单元195输入的。
下面描述一个图7所示字符串识别单元15的实施例。
字符串识别单元15,在根据用作特征值的参数而集成字符时,不用试探方法确定阈值;该特征值是从一个在图8所示步骤S2的布局分析过程抽取的字符串中,逐一地检测一个字符时使用的。该阈值是作为一个统计合理值而确定的。
实际上,相当于该参数的字符的成功与不成功集成,得出一个参数值和一个统计数据。不单独评价每个参数,但每个参数都作为一个多维空间中的元素而计数,并且用多元分析法获得判别相,以便对下述两种情况判别多维空间中的两个群(情况):成功地执行集成和不成功地执行集成。
即,把包含P个指示模式诸特征的特征值的样品数据分成两群,即一个作为被成功地检索的第一群和一个作为被不成功地检索的第二群。在P维空间中生成第一群与第二群之间的判别相。
例如用判别分析方法可得到判别相。即,当用一个线性判别函数构成该判别相时,就用下式表达该判别函数的系数向量。∑-1(μ1-μ2)……………………………(3)式中:∑表示第一和第二群的方差协方差矩阵;
μ1表示第一群的平均向量;
μ2表示第二群的平均向量。
用一种能够从第一群和第二群的每个重力中心设置相等距离的方法,生成一个具有(3)式中系数向量的判别函数。
还能够根据第一群与第二群之间的群间变量与群内变量的比率能有最大可能性的标准,计算判别函数的系数向量。
通过借助字符模式的外接矩形的位置、尺寸、阵列等集成字符模式的统计过程,和通过旨在正确处理上标笔画、分隔笔画字符等的观察字符模式形状的非统计过程,分别地执行从一个字符串检测一个字符的过程。
在统计过程中,使用一个检测参数。检测参数涉及外接一个模式的矩形的位置和垂直尺寸对水平尺寸的比率,字符尺寸对平均字符尺寸的比率,在模式之间重叠的宽度,字符中的密度等。
下面列出检测参数样品,如图56所示。
1)外接矩形211的右边与外接矩形212的左边之间的距离a;
2)外接矩形211的左边与外接矩形212的右边之间的距离b;
3)外接矩形211的右边与外接矩形212的左边之间的距离a,对外接矩形211的左边与外接矩形212的右边之间的距离b的比率c;
4)外接矩形211的左边与外接矩形212的右边之间的距离b,对外接矩形的平均宽度Mx的比率d;
5)在外接矩形213的底边与一条把外接矩形213底边中点连接到外接矩形214底边中点的线之间,形成的角度e;
6)在外接矩形213的底边与一条把外接矩形213右底顶点连接到外接矩形214的左底顶点的线之间,形成的角度f;
7)当外接矩形215与外接矩形216重叠时,在外接矩形215的右边与外接矩形216的左边之间的距离p,对在外接矩形215的左边与外接矩形216的右边之间的距离q的比率g。
即,
c=a/b…………(4)
d=b/Mx…………(5)
g=p/q…………(6)
下面参照图57所示的流程图,描述统计过程。
在步骤S181,检索围绕链接模式的矩形。
在步骤S182检验,是否存在另一个到步骤S181检索的外接矩形的右边的外接矩形。如果不存在到步骤S181检索的外接矩形右边的外接矩形,则从统计过程的目标中去掉在步骤S181检索的外接矩形。
如果在步骤S182确定,存在另一个到步骤S181检索的外接矩形的右边的外接矩形,则控制转到步骤S184中。
在步骤S183,计算围绕一个字符串的矩形的平均字符尺寸。当计算围绕一个字符串的矩形的尺寸时,因为尚未检测每个字符,故不能立即算出准确的平均字符尺寸。
例如,通过暂时集成围绕一个链接模式的矩形,计算一个暂时平均字符尺寸。当例如所集成的链接模式的垂直水平比率P满足下述方程时,执行一个暂时集成过程。
N(=0.8)<P<M(=1.2)
在暂时集成以后,计算一个平均字符尺寸。还能通过对一个外接矩形的每个尺寸生成一个频率直方图,得出一个围绕一个字符串的矩形的平均字符尺寸。
然后在步骤S184,计算在图56所示的诸参数a至g。
在非统计过程中,在分隔-笔画-字符过程和上标-笔画过程中分别处理一个字符串中的分隔-笔画字符和上标笔画。
在分隔-笔画-字符过程中,使用作为检测参数的有一个模式的姿态与密度,一个通过集成相邻的模式而得的集成模式的尺寸,和诸模式之间的距离。
举例说明,用下述诸值作图58所示的检测参数。
8)在外接矩形221的右边与外接矩形222的左边之间的距离a,对在外接矩形221的左边与外接矩形222的右边之间的距离b的比率p;
9)在外接矩形221的左边与外接矩形222的右边的距离b,对诸外接矩形的平均密度MX的比率q;
10)外接矩形22的面积c与外接矩形22的面积d的乘积,对诸外接矩形的平均宽度MX与诸外接矩形的平均高度MY的乘积的平方的比率r。
即,
p=a/b……………………………(7)
q=b/MX…………………………(8)
r=(c×d)/(MX×MY)2………(9)
下面参照图59所示的流程图,描述分离-笔画-字符过程。这个分离-笔画-字符过程是要用一种由两个或多个分离笔画,例如‘ル’、‘ハ’等,形成的链接模式,检测一个分离-笔画字符。
在步骤S191确定,在链接模式中是否存在一种右-提模式。如果不存在-种右-提模式,就不执行该分离-笔画字符过程。
如果在步骤S191检测到一种右-提模式,则控制转到步骤S192,并且确定是否存在一种邻接于上述右-提模式的右边的左-提模式,即一种例如‘ハ’的模式,或者一种邻接于上述右-提模式的右边的,并且当在垂直方向上检索它时交叉另一模式(正交线密度)两次的模式,即一种例如‘ル’的模式。如果模式不涉及一种‘ハ’或‘ル’形式的模式,则在这种情况下不执行该分离-笔画字符过程。
如果在步骤S192确定,该模式涉及一种‘ハ’或‘ル’形式的模式,则控制转到步骤S194。
除了步骤S191和S192之外,还在步骤S193计算外接矩形中的一个字符串的平均字符尺寸。
在完成上述步骤S192和S193之后,在步骤S194计算图54所示的参数p至r的数值。
在上标-笔画过程中,检验一个具有上标笔画的模式的候选者,以便使用集成的相邻模式的尺寸,和这些模式之间的距离,及诸字符尺寸对平均字符尺寸的比率作检测参数。
即,用下述数值作图60所示的检测参数。
11)在外接矩形231的右边与外接矩形232的左边之间的距离a,对在外接矩形231的左边与外接矩形232的右边之间的距离b的比率p;
12)在外接矩形231的左边与外接矩形232的右边之间的距离b,对诸外接矩形的平均宽度MX的比率q;
13)外接矩形231的面积C与外接矩形232的面积d的乘积,对诸外接矩形的平均宽度Mx与诸外接矩形的平均高度MY的乘积的平方的比率r被用作检测参数。
即,参数p至r能被表达成方程(7)至(9)的形式。
下面参照61所示流程图,描述上标-笔画过程。
首先,在步骤S201,抽取一个用于上标笔画的候选者的模式。例如,当用一个链接模式抽取单元1抽取两个相邻的链接模式时,和当这两个相邻模式的集成模式的尺寸对一个字符串的外接矩形的平均字符尺寸的比率等于或小于某一预定阈值时,即1/4时,就抽取该模式作为一个有上标笔画的模式的候选者。
在步骤S202检验,是否存在一个到一个有上标笔画的字符候选者的模式左边的相邻外接矩形。如果不存在一个到一个有上标笔画的字符候选者的模式左边的相邻外接矩形,就从要在上标-笔画过程内处理的诸目标中,去掉这个有上标笔画的字符的候选者。
如果在步骤S202确定,存在一个到一个有上标笔画的字符候选者的模式左边的相邻外接矩形,则控制转到步骤S204。
在步骤S203,除了上述的步骤S201和S202之外,还计算一个围绕一个字符串的矩形的平均字符尺寸。当完成步骤S202和S203中的处理以后,就在步骤S204计算图60所示的p到r的参数值。
然后设置一个判别相,以用学习数据计算在从一个未知手写字符串检测一个字符时的可靠性。如果参数的数目是n,就在这个n维的空间中生成两个群,以便在每个群中存储成功地和不成功地检测的字符。
图62是一个流程图,说明计算成功和不成功检测数据的方法。
在图62中,在步骤S211,对预先收集的学习数据视觉地确定是否,能把目标外接矩形和相邻外接矩形集成为一个单独的字符。如果能把目标外接矩形和相邻外接矩形集成为一个单独的字符,则控制转到步骤S212。如果不能把目标外接矩形和相邻外接矩形集成为一个单独的字符,则控制转到步骤S213。
在步骤S212,在能把目标外接矩形和相邻外接矩形集成为一个单独的字符时,就记录目标外接矩形和相邻外接矩形的参数值。目标外接矩形和相邻外接矩形的参数可以是统计过程中图52所示的参数a至g,并且可以是非统计过程中图58和60所示的参数p至r。
在步骤S213,当不能把目标外接矩形和相邻外接矩形成功地集成为一个单独的字符时,就记录目标外接矩形和相邻外接矩形的参数值。
然后,对一个未知字符串计算统计过程与非统计过程中检测参数值。对一个由参数值确定的多维空间中的点计算一个离学习数据所得的判别相的距离。把所得的距离量化成检测可靠性。
例如,当特征参数数目为3时,H表示用于判别两个群,即成功地检测的字符和不成功地检测的字符,的判别相;和n表示判别相H的单位标准向量,如图63所示。如果一个参数值等于P的向量值,则在判别相与相当于该参数值的三维空间中的点P之间的距离h能够表达如下:
h=op.n ……………………………………………………(10)
式中op是一个从三维空间中原点O到三维空间中点P的向量。
离判别相的距离h是正值还是负值,确定参数值属于哪一个群,即,是被成功地检测的群还是被不成功地检测的群;并且确定参数值离开判别相H的程度有多大。
如图64所示,根据离开判别相H的距离h,对多维空间中学习数据的全部参数,得出一个成功检测的直方图241和一个不成功检测的直方图242。一般说来,因为直方图分布241和242是正态分布,故直方图分布241和242是以正态分布去逼近的。在这些正态分布中,通常存在一些部分重叠区。
根据本发明,确定是否在对有一个检测参数位于重叠区的相邻模式考虑其检测可靠性时,要集成诸模式。
图65是一个流程图,说明计算检测可靠性的方法的实例。
在图65中,在步骤S221,用上述方程(10)计算从判别相H到一个由多个参数确定的多维空间中的点的距离h。
在步骤S222,用正态分布去逼近由学习数据得出的多个参数值的直方图分布。即,如图66所示,用一个成功检测模式的正态分布25 1去逼近成功检测模式的直方图分布,而用一个不成功检测模式的正态分布252去逼近不成功检测模式的直方图分布。
在步骤S223,计算两个群的重叠区。例如,在成功检测模式正态分布251与不成功检测模式正态分布252之间的重叠区是,作为一个2-群重叠区245计算的,如图62所示。在这时,在成功检测模式正态分布251中一个除了该2-群重叠区254以外的区253,被设置成一个成功检测区。同样,在不成功检测模式正态分布252中一个除了该2-群重叠区254以外的区255,被设置成一个不成功检测区。
在步骤S224确定,为一个直方图分布中的未知字符而输入的参数值的位置。
在步骤S225,如果由于确定为一个直方图分布中的未知字符而输入的参数值的位置的结果,而在2-群重叠区254中包含为该未知字符而输入的参数值,则控制转到步骤S226。其后,根据在2-群重叠区254中为未知字符而输入的参数值,计算检测的可靠率。
如果在步骤S225确定,在2-群重叠区254中不包含为未知字符而输入的参数值,则控制转到步骤S226,并且确定在成功检测区253中是否包含为未知字符而输入的参数值。
如果确定,在成功检测区253中包含为未知字符而输入的参数值,则控制转到步骤S228,并且把检测可靠率设置到‘1’。如果确定,在成功检测区253中不包含为未知字符而输入的参数值,则控制转到步骤S229,并且把检测可靠率设置到‘0’。
例如,如果由于计算从判别相到为未知字符而输入的参数值的距离的结果,而在2-群重叠区254中包含为未知字符而输入的参数值,就根据从判别相到为未知字符而输入的参数值的距离,计算检测可靠率。如果在成功检测区253中包含从判别相到为未知字符而输入的参数值的距离,就把检测可靠率设置到‘1’。如果在不成功检测区255包含从判别相到为未知字符而输入的参数值的距离,就把检测可靠率设置到‘O’。
图67是一个流程图,说明计算2-群重叠区的实例。
如图67所示,在步骤S231,对从学习数据得到的成功检测模式和不成功检测模式的直方图分布,计算直方图261的一个平均值m和一个分布值V。
在步骤S232,对成功检测模式和不成功检测模式的直方图分布,计算关于直方图261的在正态分布曲线262与直方图261之间的均方误差的总和d。
在步骤S233,用下述方程(11)计算其适合度T。
T=d/s………………………………………………………(11)
式中S表示正态分布曲线262的面积。
在步骤S234,用下述方程(12)计算从正态分布曲线262的中心到端点的距离L。
L=K×(1+T)×V1/2………………………………………(12)
式中K表示一个比例常数,和V1/2等于一个标准偏差。
在步骤S235,把从正态分布曲线263的右端267到正态分布曲线264的左端266的区设置成一个2-群重叠区265。
然后确定是否根据在图65所示过程中得到的检测可靠率,执行一个识别过程。在这种情况下,例如,对一个用于一个具有高检测可靠率的检测字符的候选者,不执行该识别过程;而对一个用于一个具有低检测可靠率的检测字符的候选者,则执行该过程。
对多个用于诸检测字符的候选者,根据具检测可靠率以及识别可靠率,选择一个要检测的字符。结果,能够从要检测的诸字符中,去掉部分地呈现一个字符而整个地呈现一个错误字符串的字符候选者。例如,整个检测可靠率R被表达如下。
R=∑(j·αi+βi)…………………………………………(13)
式中αi表示相邻模式或检测确定部分的检测可靠率,βi表示识别可靠率,和j表示一个加权系数。
然后,从用于多个要检测字符的诸候选者中,把一个有较大整体可靠率的字符选为要检测的最终字符。
图68示出一个事例,其中每个字符都是从一个字符串‘グンマ’中检测的。在这种情况下,在检测字符串‘グンマ’之前,用学习数据单独地得出用于统计与非统计过程的判别相,和直方图值的正态分布曲线。
在统计过程中,用图55所示的参数c、e、和f作为用于确定一个字符串的成功或不成功检测的参数。用学习数据得到的判别相被表达如下:
0.84×0+0.43×1+0.33×2-145.25=0 ……………… (14)
指示图67所示学习数据的成功检测的直方图分布的平均值m是128.942。其标准偏差是34.77。根据方程(11),其适合度T是0.12。假定比例常数K是2,则从其分布中心到端点的距离,根据方程(12)是77.8。
指示图67所示学习数据的不成功检测的直方图分布的平均值m是71.129。其标准偏差是36.26。根据方程(11),其适合度T是0.35。假定比例常数K是2,则根据方程(10),从其分布中心到端点的距离是92.2。
在图68中,在步骤S241,从一个输入图象读出一个未知字符的输入模式。
然后在步骤S242,使用诸标号抽取一个链接模式,并且按图68所示,对每个被抽取的链接模式,指定标号<1>至<6>。
在步骤S245,根据在步骤S243的统计过程和在步骤S244的非统计过程,量化其检测可靠率。
在步骤S243的统计过程中,根据从判别相到有参数值c、e和f的三维空间中的点的距离h,对在集成诸相邻链接模式时得到的检测可靠率进行计算。例如,这个检测可靠率α能被表达如下:
α=(h-W1)/(W2-W1)×100……………………………(15)式中:W1表示2-群重叠区的最左位置;
W2表示2-群重叠区的最右位置;
例如,在把赋予标号<1>的模式集成到赋予标号<2>的模式中时得到的检测可靠率是80。在把赋予标号<2>的模式集成到赋予标号<3>的模式中时得到的检测可靠率是12。在把赋予标号<3>的模式集成到赋予标号<4>的模式中时得到的检测可靠率是28。在把赋予标号<4>的模式集成到赋予标号<5>的模式中时得到的检测可靠率是92。在把赋予标号<5>的模式集成到赋予标号<6>的模式中时得到的检测可靠率是5
在步骤S244的非统计过程中,根据从判别相到一个在具有图60所述参数值p至r的三维空间中的点的距离h,对具有上标笔画的模式‘グ’的检测可靠率进行计算。
例如,在把赋予标号<1>的模式集成到一个包含赋予标号<2>和<3>的模式的检测确定段271的上标—字符—模式时得到的检测可靠率是85。
图65示出在步骤S244的非统计过程中计算检测可靠率的方法。
在步骤S251,抽取模式272作上标笔画的候选者。例如,当存在两个相邻的链接模式时,和当所集成的模式的尺寸对围绕字符串的矩形的平均字符尺寸的比率小于某一预定的阈值时,模式272可以成为一个用于上标笔画的候选者。
在步骤S252,确定是否存在一个邻接于作为上标笔画候选者的模式272的左边的外接矩形281。如果确定存在一个邻接于作为上标笔画候选者的模式272的左边的外接矩形281,则控制转到步骤S253,并且输出图50所示的参数p至r的数值。
在图69示所示的实例中,表达下述方程:
p=a/b=0.1………………………………………………(16)
q=b/MX=1.3……………………………………………(17)
r=(c×d)/(MX×MY)2=0.3…………………………(18)式中:a表示在外接矩形281的右边与外接矩形272的左边之间的距离;
b表示在外接矩形281的左边与外接矩形272的右边之间的距离;
c表示外接矩形281的面积;
d表示外接矩形272的面积;
MX表示一个外接矩形的平均宽度;和
MY表示一个外接矩形的平均高度。
在步骤S254,计算从一个判别相293到一个在具有p至r参数值的三维空间中的点的距离。
为了计算从一个判别相293到一个在具有p至r参数值的三维空间中的点的距离,就根据学习模式计算判别相293。根据例如一个指示学习模式的字符串的成功检测的直方图分布292和一个指示学习数据的不成功检测的直方图分布291,能够用方程(3)得到判别相293。用于抽取上标笔画的使用参数p至r的判别相293的方程,可参照三维空间中一个平面,用下列方程来表达:
0.17×x0+0.75×x1+0.64×x2+30.4=0………… (19)
因此,通过用方程(16)至(18)所得数值代替方程(19),可计算离判别相293的距离h如下:
h=0.17×0.1-0.75×1.3+0.64×0.3+30.4=29.6………
………………………………………………………………(20)
指示学习数据的成功检测的直方图分布292的平均值m是38。其标准偏差是25。根据方程(11),其适合度T是0.2。
指示所示学习数据的不成功检测的直方图分布291的平均值m是-34。其标准偏差是28。根据方程(11),其合适度T是0.3。
对指示学习数据的成功检测的直方图分布292的左端W1,在假定比例常数K为2的情况下,用方程(12)计算如下:
W1=38-2×(1+0.2)×25=-22……………………(21)
对指示学习数据的不成功检测的直方图分布291的右端W2,在假定比例常数K为2的情况下,用方程(12)计算如下:
W2=-34+2×(1+0.3)×28=38.8……………………(22)
因此,在离判别相-22至38.8的距离定位一个2-群重叠区294。
然后在步骤S255,计算其检测可靠率α。通过用方程(20)至(22)所得数值代替方程(15),计算其检测可靠率α如下:
α=(29.6-(-22))/(38.8-(-22))×100=85………(23)
这样,通过集成赋予标号<2>和<3>的模式,生成检测确定段271。
在图68所示的步骤S246,合成统计与非统计过程的可靠率。在这时,如果存在任何检测确定段,就使它优先。结果,优先地合成该检测确定段271的可靠率。
因此,通过把赋予标号<1>的模式集成到该检测确定段271的模式中而得到的检测可靠率是85。通过把检测确定段271的模式集成到赋予标号<4>的模式中而得到的检测可靠率是30。通过把赋予标号<4>的模式集成到赋予标号<5>的模式中而得到的检测可靠率是92。通过把赋予标号<5>的模式集成到赋予标号<6>的模式中而得到的检测可靠率是5。
如果其检测可靠率高于预定的阈值(例如,90),或者如果其检测可靠率高于某一预定的阈值(例如,70),并且其可靠率对相邻检测模式的检测可靠率的比值高于某一预定的阈值(例如,5),就集成诸模式。
如果其检测可靠率低于某一预定阈值(例如8),就不集成诸模式。
例如,因为通过把赋予标号<1>的模式集成到一个检测确定段271的模式中而得到的检测可靠率是85,并且该可靠率对赋予标号<4>的相邻模式的检测可靠率的比值是85/30=2.8,故不把赋予标号<1>的模式集成到该检测确定段271的模式中。通过把检测确定段271的模式集成到一个赋予标号<4>的模式中而得到的检测可靠率是30,因此不把检测确定段271的模式集成到赋予标号<4>的模式中。
因为通过把赋予标号<4>的模式集成到一个赋予标号<5>的模式中而得到的检测可靠率是92,故把赋予标号<4>的模式集成到一个赋予标号<5>的模式中。因为通过把赋予标号<5>的模式集成到赋予标号<6>的模式中而得到的检测可靠率是5,故不把赋予标号<5>的模式集成到赋予标号<6>的模式中。
这样,生成一个相当于一个检测确定段273的外接矩形275,该段是通过把赋予标号<4>的模式集成到赋予标号<5>的模式中而得到的;和生成一个相当于赋予标号<6>的模式的外接矩形276。
其后,对在把新生成的检测确定模式273集成到检测确定段271的模式中时得到的检测可靠率进行计算。在图68所示的实例中,检测可靠率是60。
在步骤S247,当根据检测可靠率完全地集成诸模式时,抽取检测候选者1和检测候选者2。然后对检测候选者1和2的每个字符执行一个识别过程。对每个字符都得出在检测候选者1和2中一个字符的检测可靠率α和β,并且把检测可靠率α和β的总和定义为整体可靠率R。
例如,如果按照检测候选者1检测外接矩形275、276和278,则在对外接矩形278中模式执行一个字符识别过程时得到的识别可靠率β是80,在对外接矩形275中模式执行一个字符识别过程时得到的识别可靠率β是90,和在对外接矩形276中模式执行一个字符识别过程时得到的识别可靠率是85。
因为在把赋予标号<1>的模式集成到检测确定段271的模式中时得到的检测可靠率α是85,故在假定加权系数j为1的情况下,用方程(13)得出其整体可靠率R为345。
例如,如果按照检测候选者2检测外接矩形276、281和282,则在对外接矩形281中模式执行一个字符识别过程时得到的识别可靠率β是83,在对外接矩形282中模式执行一个字符识别过程时得到的识别可靠率β是55,和在对外接矩形276中模式执行一个字符识别过程时得到的识别可靠率β是85。
因为在把检测确定段271的模式集成到一个检测确定段273的模式中时检测可靠率α是60,故整体可靠率R是283。
在步骤S248,无论是检测候选者1还是检测候选者2,只要整体可靠率较大,就选为成功检测字符的候选者。结果,能够正确地检测字符串‘グンマ’中每个字符‘グ’、‘ン’、和‘マ’。
下面描述图17中模糊字符识别单元19的操作。
图70是一个方块图,说明模糊字符识别单元19的配置的实施例。
在图70中,一个特征抽取单元301从一个模糊字符抽取字符的特征,并用一个特征向量表示所抽取的特征。一个模糊字符字典302存储每个种类的模糊字符的特征向量。一个整理单元303,对特征抽取单元301所抽取的字符模式的特征向量用存于模糊—字符字典302中的每个种类特征向量进行整理;并且对在特征空间中诸特征向量之间的距离Dij(i表示一个未知字符的特征向量,和j表示一个在模糊—字符字典302中一个种类的特征向量),进行计算。结果,把指示诸特征向量之间最短距离Dij的种类j识别成一个未知字符i。
能够利用例如欧几里德距离∑(i-j)2,城市街区距离∑|i-j|,象判别函数之类的识别函数等,计算特征空间中诸特征向量之间的距离Dij。
利用来自第一种类的距离Dij1和来自第二种类的距离Dij2,预先生成一个表1,表1涉及第一种类j1,第二种类j2,诸种类之间的距离(Dij2-Dij1),和可靠率。同样,预先生成一个表2,表2涉及来自第一种类的距离Dij1,第一种类j1,和可靠率。在一个中间处理结果表中存储在表1和表2中有较低可靠率的数据。
除了变形字符识别单元21使用一个存储每个变形字符种类中特征向量的变形—字符字典之外,能够把图7所示的变形字符识别单元21设计成类似于模糊字符识别单元19。
下面描述图7所示的删除线识别单元26的一个实施例。删除线识别单元26生成,例如一个包含水平方向上全部数目的象元的直方图,用于图8所示步骤S4中校正分析所抽取的校正字符的候选者;并且通过识别在一个其直方图值超过预定值的区中存在的诸水平线,去掉该区中的水平线。
其后,通过完成一个有去除水平线的模糊段,并且用字典整理所完全的模式,来识别一个字符。结果,如果一个模式被识别成某一字符,则一个用于校正字符的候选者被看成是一个有删除线的字符。如果一个模式是被拒绝的,则一个用于校正字符的候选者被看成是一个正常的字符。
例如,在图71中,把一个用于校正字符候选者的字符‘5’,作为用双水平线校正的字符输入。当指示水平直方图值等于或大于阈值N的双水平线被检测,去掉双水平线,和把完成模式识别成种类‘5’以后,就把该输入模式识别成一个校正的字符。假设把一个字符‘5’作为一个校正字符的候选者而输入,并且对指示水平直方图值等于或大于阈值N的一个水平线进行检测。如果从字符‘5’去掉这个水平线,并且拒绝该模式,就不把该模式识别成校正字符。
下面描述图7所示的一个独特—字符分析单元23的实施例。独特—字符分析单元23把一些被识别成属于同一种类的手写字符群集成一些预定数目的群。当一些属于不同种类的群指示互相之间的距离短时,就把包含较少数目的元素的群的字符种类修改成包含较多数目元素的群的字符种类,从而能够正确地阅读一种已被误读成一个错误字符种类的手写字符。
图72利用一种被识别成属于字符种类‘4’的手写字符的特征向量,说明一个群集过程。
图72示出一些手写字符,因为该模式指示,离一个存于识别字典中字符种类‘4’的特征向量的距离较短,故已将它们确定为属于识别结果种类‘4’。在这个识别过程中,手写字符‘2’被误识别成属于识别结果种类‘4’。
在第一群集过程中,被确定为属于字符种类‘4’的手写字符被逐一地看成是一群。在第二群集过程中,对被看成是成群的诸手写字符之间的特征向量的距离进行计算,并且把指示特征向量互相之间距离短的字符集成为一群。结果,群数减1,即从11减至10,如图72所示实例所示。
在第三和随后的群集过程中,通过计算诸群之间特征向量的距离,并且集成最靠近的特征向量,能够减少群数,从而在第十一群集过程中可减至一个群。
当诸群被集成时,按照利用例如城市街区距离的互相之间的距离,比较那些各只含一个元素的群。当诸群包含多个元素时,就利用重力中心方法。在重力中心方法中,当用Xi=(Xi1,Xi2,Xi3,…,XiM)表达含有M个元素的群的第i个元素(i=1,2,3,…,M)的特征向量Xi时,群的代表向量Xm是对诸群元素的特征向量Xi进行平均来表达的:
通过计算诸代表向量Xm之间的城市街区距离,互相比较包含多个元素的诸群。
如果重复群集过程,直至群数减至1为止,则把被误识别成属于字符种类‘4’的手写字符‘2’看成是,属于与被正确地识别成属于字符种类‘4’的手写字符‘4’相同的字符种类。因此,设置一个群集中断条件,以中断群集过程。
在下列情况下能够满足群集中断条件:
(1)群数达到某一预定值(例如3);
(2)诸群之间的距离在集成诸群时超过某一预定阈值;
(3)诸群之间的距离增加率在集成诸群时超过某一预定阈值。
图73是一个流程图,说明群集过程。
如图73所示,在步骤S261,只抽取那种被识别成属于某一指定字符种类的手写字符的特征向量。把每个抽取的手写字符特征向量都看成是一个群。
在步骤S262,设置群集中断条件,以中断群集过程。
在步骤S263,对一个指定字符在全部群中选择两个互相最近的群。
在步骤S264确定,是否满足步骤S262设置的群集中断条件。如果不满足步骤S262设置的群集中断条件,则控制转到S265,集成在步骤S263选择的两个群,控制回到步骤S263,反复地集成诸群。
如果在步骤S264确定,在重复群集成过程之后满足群集中断条件,则控制转到步骤S266,并且确定是否已对全部的字符种类执行过群集过程。如果尚未对全部字符种类执行过全部群集过程,则控制回到步骤S261,并且对未处理的字符种类执行群集过程。
如果在步骤S266确定,已对全部字符种类执行过群集过程,则控制转到步骤S267,并且把群集结果存入存储器中。
其后,根据群集过程所得的群集结果,正确地阅读那种曾被误识别成属于一个不同种类的手写字符。
图74示出把一个手写字符‘2’正确阅读成字符种类‘2’的过程,该字符是被误识别成属于字符种类‘4’的。
图74示出确定为属于识别结果种类‘2’的手写字符,和确定为属于识别结果种类‘4’的手写字符。手写字符‘4’被误识别为属于识别结果种类‘2’,而手写字符‘2’又被误识别为属于识别结果种类‘4’。拒绝手写字符‘4’,因为不属于任何识别结果种类。
通过在一个指定种类中群数达到3时设置群集中断条件,执行群集过程就允许为识别结果种类‘2’生成群a、b和c,并且为识别结果种类‘4’生成群d、e和f。为三个被拒绝的手写字符‘4’生成群g、h和i。
其后,无论是属于识别结果种类‘2’的群a、b和c,还是属于识别结果种类‘4’的群d、e和f,只要含有较少数目的字符,就抽取为误读群的候选者。
计算从误读候选者群a到每个其他群b、c、d、e和f的距离,和从误读候选者群d到每个其他群a、b、c、e和f的距离。抽取群b为最靠近误读候选者群a的群。确定在误读候选者群a与群b之间的距离是否小于预定值。因为在误读候选者群a与群b之间的距离不小于预定值,故拒绝误读候选者群a。
因此,从识别结果种类‘2’中去掉这个被误识别为属于识别结果种类‘2’的手写字符“3”。
抽取群b作为最靠近误读候选者群d的群确定在误读候选者群d与群b之间的距离是否小于预定值。因为在误读候选者群d与群b之间的距离小于预定值,故把误读候选者群d集成到群b中,以生成群j。确定群j属于识别结果种类‘2’,而含有较大数目元素的群b也是属于‘2’的。这样,对已被误读为‘4’并且确定为属于误读候选者群d的手写字符‘2’,能够正确地阅读。
其后,对在因不属于任何识别结果种类而被拒绝的群g、h和i与其他群a至f之间的距离,进行计算。抽取群e,作为最靠近群g的群。确定在群g与群e之间的距离是否小于预定值。因为在群g与群e之间的距离小于预定值,故把群g集成到群e中。
抽取群e,作为最靠近群h的群。确定在群h与群e之间的距离是否小于预定值。因为在群h与群e之间的距离小于预定值,故把群h集成到群e中。在把群g和h集成到群e中以后,生成群K。确定群K属于识别结果种类‘4’,而含有较大数目元素的群e也属于‘4’。因此,对因为不可识别而已被拒绝的手写字符‘4’,能够正确阅读。
抽取群e,作为最靠近群i的群。确定在群i与群e之间的距离是否小于预定值。因为在群i与群e之间的距离不小于预定值,故不把群i集成到群e中。
图75是一个流程图,说明字符种类识别结果修正过程。
在图75中,在步骤S271,从存储器中读出图73所示群集过程所得的群集结果数据。
然后在步骤S272,对在图73所述群集过程所得的全部种类中的全部群,计算和比较在诸群之间的距离。
在步骤S273,确定在诸群之间的距离是否小于预定阈值。如果在任何一些群之间的距离小于预定阈值,则控制转到步骤S274,并且集成诸群。如果在任何一些群之间的距离不小于预定阈值,就拒绝这些群。
假设在群集成中诸群之间距离的阈值是,在例如两个群中一个含有较大数目的元素的群中诸向量之间距离的常数的倍数。即,当把含有m个元素的群A集成到含有N(M>N)个元素的群B中时,则可把群A中诸向量之间的距离dth表达如下:
式中Xai(i=1,2,…,M)表示群A中的特征向量。
因此,集成诸群的条件能表达如下,其中常数为1.5
|Xam-Xbm|<1.5dth
其中,Xam表示群a的代表向量,Xbm表示群B的代表向量。
然后在步骤S275,在步骤S274所集成的全部群中确定字符种类。
在步骤S276,确定是否所集成群的字符种类彼此不同。如果所集成群的字符种类彼此不同,则控制转到步骤S277,并且把包含较少数目元素的字符种类修正成包含较多数目元素的群字符种类。然后控制转到步骤S278。如果群的字符种类匹配,则跳过步骤S277,并且控制转到步骤S278。
然后在步骤S278,为群中字符而输出字符种类。
通过参照一个处理图76所示表格的事例,实际描述根据本发明的模式识别设备的操作。
图76示出一个表格实例,这表格是输入一个根据本发明一个实施例的模式识别设备中的。
图76所示表格包含一个有框号1的自由间距框;一个有框号2、3或4的单字符框;一个有框号5的块字符框;和一个有框号6的不规则表。有框号1的自由间距框包含一个用双水平线校正的框-接触字符‘5’;框-接触字符‘3’和‘2’;框-接触模糊字符‘7’;独特字符‘4’和‘6’;和部分框外独特字符‘4’。
有框号2的单字符框包含‘5’。有框号3的单字符框包含‘3’。有框号4的单字符框包含一个用双水平线校正的部分框外的字符‘8’。在有框号5的块字符框中,有框号5-1的字符框包含一个用双水平线校正的独特字符‘6’,有框号5-2的字符框包含一个框-接触字符‘2’,和有框号5-3的字符框包含一个独特字符‘4’。
在有框号6的不规则表中,有框号6-1-1的字符框包含部分框外字符‘3’、‘2’和‘1’,有框号6-1-2的字符框包含字符6、3和8,和有框号6-1-3、6-1-4-1、6-1-4-2、6-1-4-3、6-2-1、6-2-2、和6-2-3的字符框都保持空白。有字符框号6的整个不规则表是用标记X校正的。
其后,图7所示环境识别系统11执行图9至12所示的过程,借此从图76所示表格中抽取输入图象的状态。
例如,通过执行图10所示的布局分析,从图76所示的表格中抽取有框号1的自由间距字符框,有框号2、3和4的单字符框,有框号5的块字符框,和有框号6的不规则表。此外,从有框号1的自由间距框抽取8个模式作字符的候选者。从有框号2、3和4的每个单字符框都抽取一个模式作字符候选者。从有框号5的块字符框抽取3个模式作字符候选者。从有框号6-1-1的字符框抽取3个模式作字符候选者。从有框号6-1-2的字符框抽取3个模式作字符候选者。从有框号6-1-3、6-1-4-1、6-1-4-2、6-1-4-3、6-4-3、6-2-2和6-2-3的字符框不抽取模式作为字符候选者。
为了从图76所示表格抽取一个字符串,可采用图18和19所示的文本抽取方法。为了从图76所示表格抽取一个分格线,可采用图20和26所示的分格线抽取方法。为了从图76所示表格抽取一个字符框或一个表,可采用图27和28所示的框抽取方法。
从有框号1的自由间距框抽取的第一、第二、第五和第八模式被看成是框-接触字符的候选者。从有框号4的单字符框抽取的模式,从有框号5-2的字符框抽取的模式,从有框号6-1-1的字符框抽取的第一模式也被看成是框-接触字符的候选者。
为了从图76所示表格中抽取一个框-接触字符的候选者,可采用图31和32所示的框-接触字符抽取方法。
通过图11所示的质量分析,可在图76所示表格中检测模糊的、变形的和高质量的字符。在这个实例中,图象的质量是正常的,但未检测模糊、变形或高质量的字符。
通过图12所示的校正分析,从图76所示的列表中抽取一个校正字符的候选者。在这个实例中,从有框号1的自由间距框抽取的第一模式,从有框号2和4的单字符框抽取的模式,从有框号5-1的字符框抽取的模式,和从有框号6的不规则表抽取的模式,都被看成是校正字符的候选者。
为了从图76所示的表格中抽取一个校正字符的候选者,可采用例如图34所示的特征抽取方法。
随后,环境识别系统11,对从输入图象抽取的每个字符候选者,生成一个中间处理结果表,表中载有在图9至12所示过程中从该表格中抽取的状态。
图77说明一个中间处理结果表,表中载有在图9至12所示过程中从该表格中抽取的状态。
在图77中,有框号1的字符框栏载有用于框类型的‘自由间距’和用于字符数的‘8’。有框号1的框中第一模式的栏载有指示一个框-接触字符存在的‘YES’,指示删除线存在的‘YES2’,和指示质量的“NORMAL”。有框号1的框中第二模式的栏载有指示一个框-接触字符存在的‘YES’,指示不存在删除线的‘NO’,和指示质量的‘NORMAL’。有框号1的框中第八模式栏载有指示一个框-接触字符存在的‘YES’,指示不存在删除线的‘NO’,和指示质量的‘NORMAL’。
指示存在删除线的‘YES1’涉及存在一个用于多个字符的删除线的候选者。指示存在删除线的‘YES2’涉及存在一个用于一个单字符的删除线的候选者。
有框号2的字符框栏包含用于框类型的‘ONE-CHARAC-TER’,指示不存在框-接触字符的‘NO’,指示存在删除线的‘YES2’,指示质量的‘NORMAL’,和指示字符数的‘1’。有框号3的字符框栏包含用于框类型的‘ONE-CHARACTER’指示不存在框-接触字符的‘NO’,指示不存在删除线的‘NO’,指示质量的‘NORMAL’,和指示字符数的‘1’。有框号4的字符框栏包含用于框类型的‘ONE-CHARACTER’,指示存在框-接触字符的‘YES’,指示存在删除线的‘YES2’,指示质量的‘NORMAL’,和指示字符数的‘1’。
有框号5的字符框栏包含指示框类型的‘INDIVIDUALCHARACTER BOXES’,和指示字符数的‘3’。有框号5-1的字符框栏包含指示不存在框-接触字符的‘NO’,指示存在删除线的‘YES2’,指示质量的‘NORMAL’,和指示字符数的‘1’。有框号5-2的字符框栏包含指示存在框-接触字符的‘YES’,指示不存在删除线的‘NO’,指示质量的‘NORMAL’,和指示字符数的‘1’。
有框号6的字符框栏包含指示字符框类型的‘TABLE’。有框号6-1-1的字符框栏包含指示字符框类型的‘FREE-PITCH’,指示存在一个框-接触字符的‘YES’,指示存在删除线的‘YES1’,和指示质量的‘NORMAL’。有框号6-2-2的字符框栏包含指示字符框类型的‘FREE-PITCH’,指示不存在框-接触字符的‘NO’,指示存在删除线的‘YES1’,和指示质量的‘NORMAL’。
环境识别系统11,根据在图9至12所示过程中从表格抽取的状态,执行图13所示的过程。
即,环境识别系统11通过参考处理顺序控制规则,由图7所示的字符识别单元12的基本字符识别单元17、字符串识别单元15、框-接触字符识别单元13、模糊字符识别单元19、或变形字符识别单元21执行的过程,或由非字符识别单元25的删除线识别单元26或干扰识别单元28执行的过程,确定要调用哪一个过程。然后,它通过参考处理次序表,确定应按什么次序去执行在图77所示中间处理结果表的‘CALLING PROCESS’栏中输入的过程。在图77所示的中间处理结果表的‘PROCESS ORDER’栏中输入所确定的次序。
能够把处理次序控制规则规定如下。
(A1)如果指示中间处理结果表的状态的一栏包含用于一个特定处理对象的‘YES’,并且尚未执行相当于该状态的过程,就在中间处理结果表的‘CALLING PROCESS’栏中输入相当于该状态的过程。
(A2)如果指示中间处理结果表的状态的全部栏都包含用于一个特定处理对象的‘NO’或‘NORMAL’,并且尚未执行要由基本字符识别单元17执行的过程,就在中间处理结果表的‘CALLINGPROCESS’栏中输入“BASIC”。
(A3)如果对一个处理对象,存在多个相当于在中间处理结果表中输入的状态的过程,就对用于确定多个处理次序的处理次序表进行访问,以重新安排‘CALLING PROCESS’的次序。
(A4)如果已对一个处理对象执行过一个相当于在中间处理结果表中输入的状态的过程,就在‘COMPLETION OF PROCESS’栏中输入这个完成的过程,在中间处理结果表的‘PROCESS IN-STRUCTION’栏中输入关于下一个指令或过程的中止或完成的信息,并且根据该信息重新安排在中间处理结果表的‘CALLINGPROCESS’栏中的次序。
图78示出一个处理次序表的实例。
在图78中,处理次序表存储下列过程。
(B1)如果对一个处理对象,只在中间处理结果表的‘CALLINGPROCESS’栏中输入一个过程,就在中间处理结果表的‘PROCESSORDER’栏中输入该过程。
(B2)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘BLACK-CHARACTER-BOX/FREE-PITCH’,就在中间处理结果表的‘PROCESS ORDER’栏中输入‘BLACK-CHARACTER-BOX→FREE-PITCH’。
(B3)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘DELETION LINES(YES2)/BLACK-CHARACTER-BOX’,就输入BLACK-CHARACTER-BOX→CHARACTER DELETION LINES’。
(B4)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘BLACK-CHARACTER-BOX/FREE-PITCH/DELETION(YES2)’,就在中间处理结果表的‘PROCESSORDER’栏中输入‘BLACK-CHARACTER-BOX→CHARAC-TER DELETION LINES→FREE-PITCH’。
(B5)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘BLACK-CHARACTER-BOX/FREE-PITCH/DELETION(YES1)’,就在中间处理结果表的‘PROCESSORDER’栏中输入用于多个字符的‘DELETION LINES→BLACK-CHARACTER-BOX→FREE-PITCH’。
(B6)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘FREE-PITCH/DELETION(YES1)’,就在中间处理结果表的‘PROCESS ORDER’栏中输入‘PLURAL-CHARACTER DELETION LINES→FREE-PITCH’。
(B7)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘PROCESS A,B,AND C’,在中间处理结果表的‘PROCESS ORDER’栏中输入‘PROCESS B→PROCESS A→PROCESS C’,并且在中间处理结果表的‘COMPLETION OF PRO-CESS’栏中输入‘PROCESS B’,就把中间处理结果表的‘PROCESSORDER’栏更新成‘PROCESS A→PROCESS C’。
(B8)如果对一个处理对象,在中间处理结果表的‘CALUNGPROCESS’栏中输入‘PROCESS A,B,AND C’,在中间处理结果表的‘PROCESS ORDER’栏中输入‘PROCESS B→PROCESS A→PROCESS C’,在中间处理结果表的‘COMPLETION OF PRO-CESS’栏中输入‘PROCESS B’,并且在中间处理结果表的‘PRO-CESS INSTRUCTION’栏中输入‘SKIPPING TO PROCESS C’,就把中间处理结果表的‘PROCESS ORDER’栏更新成‘PROCESS C’。
(B9)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘PROCESS A,B,AND C’,在中间处理结果表的‘PROCESS ORDER’栏中输入‘PROCESS B→PROCESS A→PROCESS C’,在中间处理结果表的‘COMPLETION OF PRO-CESS’栏中输入‘PROCESS B’,并且在中间处理结果表的‘PRO-CESS INSTRUCTION’栏中输入‘INVERTING ORDER BE-TWEEN PROCESS C AND A,就把中间处理结果表的‘PROCESSORDER’栏更新成‘PROCESS C→PROCESS A’。
(B10)如果对一个处理对象,在中间处理结果表的‘CALLINGPROCESS’栏中输入‘PROCESS B,AND A’,在中间处理结果表的‘COMPLETION OF PROCESS’栏中输入‘PROCESS A’,并且在中间处理结果表的‘PROCESS INSTRUCTION’栏中输入‘TERMI-NATION’,就在中间处理结果表的‘PROCESS ORDER’栏中输入‘TERMINATION’。
图79示出一个根据图77所示中间处理结果表中输入的输入图象状态把要调用的过程输入‘CALLING PROCESS’栏中,和把执行在‘CALLING PROCESS’栏中输入的处理次序输入到‘PROCESSORDER’栏中的实例。
在图79中,有框号1的字符框的栏包含用于框类型的‘FREE-PITCH’。有框号1的框中第一模式的栏包含指示存在一个框-接触字符的‘YES’,和指示存在删除线的‘YES2’。因此,根据处理次序控制规划中(A1),把‘BLACK-CHARACTER-BOX/FREE-PITCH/DELETION LINE(YES2)’输入到‘CALLING PROCESS’栏中;根据处理次序控制规则的(A3),参考处理次序表的(B4);并且把‘BLACK-CHARACTER-BOX→ONE-CHARACTER DELE-TION LINE→FREE-PITCH’输入到‘PROCESS ORDER’栏中。
有框号1的框中第二模式的栏包含指示存在一个框-接触字符的“YES”,指示不存在删除线的“NO”,和用作“QUALITY’的‘NORMAL’。因此,根据处理次序控制规则中(A1),把BLACK-CHARACTER-BOX/FREE-PITCH’输入到‘CALLING PRO-CESS’栏中;根据处理次序控制规则的(A3),参考处理次序表的(B2);并且把‘BLACK-CHARACTER-BOX→FREE-PITCH’输入到‘PROCESS ORDER’栏中。
有框号1的框中第八模式的栏包含指示存在一个框-接触字符的‘YES’,指示不存在删除线的‘NO’,和用作‘QUALITY’的‘NORMAL’。因此,根据在处理次序控制规则中(A1),把‘BLACK-CHARACTER-BOX/FREE-PITCH’输入到‘CALL-ING PROCESS’栏中;根据处理次序控制规则中(A3),参考处理次序表的(B2);并且把‘BLACK-CHARACTER-BOX→FREE-PITCH’输入到‘PROCESS ORDER’栏中。
有框号2的字符框的栏包含用于框类型的‘ONE CHARAC-TER’,指示不存在框-接触字符的‘NO’,指示存在删除线的‘YES2’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A1),把‘DELETION LINE(YES2)’输入到‘CALLING PRO-CESS’栏中;并且根据处理次序控制规则中(A1),把‘ONE-CHAR-ACTER DELETION LINE’输入到“PROCESS ORDER’栏中。
有框号3的字符框的栏包含用于框类型的‘ONE CHARAC-TER’,指示不存在框-接触字符的‘NO’,指示不存在删除线的‘NO’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A2),把‘BASIC’输入到‘CALLING PROCESS’栏中;并且根据处理次序控制规则中(A1),把‘BASIC’输入到“PROCESS ORDER’栏中。
有框号4的字符框的栏包含用于框类型的‘ONE CHARAC-TER’,指示存在框-接触字符的‘YES’,指示存在删除线的‘YES2’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A1),把‘BLACK-CHARACTER-BOX/DELETION LINE(YES2)’输入到‘CALLING PROCESS’栏中;参考处理次序表的(B3);和根据处理次序控制规则中(A3),把‘BLACK-CHARAC-TER-BOX→ONE-CHARACTER DELETION LINE’输入到“PROCESS ORDER’栏中。
有框号5的字符框的栏包含用于框类型的‘INDIVIDUALCHARACTER BOX’。有框号5-1的字符框的栏包含指示不存在框-接触字符的‘NO”,指示存在删除线的‘YES2’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A1),把‘DELE-TION LINE(YES2)’输入到‘CALLING PROCESS’栏中;和根据处理次序控制规则中(A1),把‘ONE-CHARACTER DELETIONLINE’输入到“PROCESS ORDER’栏中。
有框号5-2的字符框的栏包含指示存在框-接触字符的‘YES’,指示不存在删除线的‘NO’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A1),把‘BLACK-CHARACTER-BOX’输入到‘CALLING PROCESS’栏中;并且根据处理次序控制规则中(A1),把‘BLACK-CHARACTER-BOX’输入到“PRO-CESS ORDER’栏中。
有框号5-3的字符框的栏包含指示不存在框-接触字符的‘NO’,指示不存在删除线的‘NO’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A2),把‘BASIC’输入到‘CALLINGPROCESS’栏中;并且根据处理次序控制规则中(A1),把‘BASIC’输入到“PROCESS ORDER’栏中。
有框号6的字符框的栏包含指示字符框类型的‘TABLE’。有框号6-1-1的字符框的栏包含指示字符框类型的‘FREE-PITCH”,指示存在框-接触字符的‘YES’,指示存在删除线的‘YES1’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中 (A1),把‘BLACK-CHARACTER-BOX/FREE-PITCH/DELETION LINE(YES1)’输入到‘CALLING PROCESS’栏中;根据处理次序控制规则中(A3),参考处理次序表的(B5);并且把‘PLURAL-CHARACTER DELETION LINE→BLACK-CHAR-ACTER-BOX→FREE-PITCH’输入到“PROCESS ORDER’栏中。
有框号6-2-2的字符框的栏包含指示字符框类型的‘FREE-PITCH’。指示不存在框-接触字符的‘NO’,指示存在删除线的‘YES1’,和指示质量的‘NORMAL’。因此,根据处理次序控制规则中(A1),把‘FREE-PITCH/DELETION LINE(YES1)’输入到‘CALLING PROCESS’栏中;根据处理次序控制规则中(A3),参考处理次序表的(B6);并且把‘PLURAL-CHARACTER DELE-TION LINE→FREE-PITCH’输入到“PROCESS ORDER’栏中。
下面,用输入‘CALLING PROCESS’栏和‘PROCESS ORDER’栏中的数据,根据图79所示的中间处理结果表,参考过程执行规则,执行图78所示的第一识别过程。把完成的识别过程输入到中间处理结果表上的‘COMPLETION OF PROCESS’栏中,并且把识别过程所得的可靠率输入到中间处理结果表上的‘RELIABILITY’栏中。
根据图78示处理次序表上的(B7)至(B9),更新中间处理结果表上的‘PROCESS ORDER’栏。如果根据过程执行规则,规定下一个过程,就把该过程输入到中间处理结果表上的‘PROCESS IN-STRUCTION’栏中。
可把过程执行规则描述如下。
(C1)如果对一个处理对象,存在一个在中间处理结果表上的‘PROCESS ORDER’栏中输入的过程,就执行一个赋予最高优先的过程。如果已完成所执行的过程,就在中间处理结果表上的‘COM-PLETION OF PROCESS栏中输入所完成的过程,并且从中间处理结果表上的‘PROCESS ORDER’栏中删除该过程。如果规定下一个过程,就在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入该过程。
(C2)如果一个过程被执行,并且确定,一个模式是一个字符模式,不是一个非字符模式,并且用等于或大于某一预定值的可靠率计算字符代码;就在中间处理结果表上的‘PROCESS INSTRUC-TION’栏中,输入一个通过‘PERSONAL HANDWRITING FEA-TURES’调用的字符识别过程。
(C3)如果一个过程被执行,并且确定,一个模式是一个删除线,和用等于或大于某一预定值的可靠率计算该删除线,就在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘TERMINA-TION’,并且中断在中间处理结果表上的‘PROCESS ORDER’栏中输入的一些随后的过程,和终止该过程。
(C4)如果在尚未处理‘FREE-PITCH’之前,中间处理结果表上的‘PROCESS ORDER’栏,以条目‘FREE-PITCH’和其他处理对象的相同框号的过程开始,则相同框号的全部处理对象的‘PRO-CESS ORDER’栏以条目‘FREE-PITCH’开始,并且同时执行相同框号的全部处理对象的全部‘FREE-PITCH’过程。
(C5)如果已经完成在中间处理结果表上的‘PROCESS OR-DER’栏中输入的全部过程,并且为全部处理对象而在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’或‘PERSONAL HANDWRITING FEATURES’,就对为之在‘PROCESS INSTRUCTION’栏中输入‘PERSONAL HANDWRIT-ING FEATURES’的处理对象,通过‘PERSONAL HANDWRIT-ING FEATURES’而调用和执行字符识别过程。如果已经通过‘PERSONAL HANDWRITING FEATURES’而执行过字符识别过程,就在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’。
(C6)如果对全部处理对象,在中间处理结果表上的‘PROCESSORDER’栏中输入‘TERMINATION’,就终止全部过程,并且输出识别结果。
图80示出一个实例,其中根据图79所示中间处理结果表,参考过程执行规则,执行一个识别过程;把识别过程中所得的可靠率输入到中间处理结果表上的‘RELIABILITY’栏中;根据过程执行规则,对中间处理结果表上的‘PROCESS ORDER’栏,进行更新;和把数据输入到中间处理结果表上的‘PROCESS INSTRUCTION’栏中。
因为对图79所示中间处理结果表上有框号1的字符框的‘PROCESS ORDER’栏中的第一模式,规定‘BLACK-CHARAC-TER-BOX”,故根据过程执行规则(C1),如图72所示,对从有框号1的自由间距字符框抽取的第一模式,与‘BLACK-CHARAC-TER-BOX’相应地执行图3所示的框-接触字符识别单元13的过程。
框-接触字符识别单元13通过完成或再完成一个模式的字符来识别字符,该模式是去掉它的字符框的,如图43和44所示。如果甚至在字符完成或再完成过程之后还不能够用可接受的可靠率来识别一个模式,就参考知识表14,并且对图46至55所示的学习字符执行一个字符再完成过程,以便成功地识别一个框-接触字符。
如果对图76所示的从有框号1的自由间距框抽取的第一模式的识别可靠率,在由框-接触字符识别单元13执行的字符识别过程中,按20%进行计算;就把图76所示的从有框号1的自由间距框抽取的第一模式看成是一个非字符,并且把‘REJECT’输入到中间处理结果表上的‘CHARACTER CODE’栏中,和把‘20%’输入到中间处理结果表上的‘RELIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BLACK-CHARACTER-BOX’,并且把中间处理结果表上的‘PROCESS ORDER’栏更新为‘ONE-CHARACTER DELETIONLINE→FREE-PITCH’。
其次,因为对图79所示中间处理结果表上有框号1的字符框的‘PROCESS ORDER’栏中的第二模式,规定‘BLACK-CHARAC-TER-BOX’;故根据过程执行规则(C1),对图76所示有标号1的自由间距字符框所抽取的第二模式,与‘BLACK-CHARACTER-BOX”相应地执行图7所示框-接触字符识别单元13的过程,并且对一个框-接触字符执行一个字符识别过程。
在由框-接触字符识别单元13执行的字符识别过程中,把图76所示的有框号1的自由间距框所抽取的第二模式,识别成有60%识别可靠率的字符种类3;然后把‘3’输入中间处理结果表上的‘CHARACTER CODE’栏中,并且把60%输入中间处理结果表上的‘RELIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BLACK-CHARACTER-BOX’,并且把中间处理结果表上的‘PROCESS ORDER’栏更新为‘FREE-PITCH’。
其次,因为对图79所示中间处理结果表上有框号1的字符框的‘PROCESS ORDER’栏中的第八个模式,规定‘BLACK-CHARAC-TER-BOX’,故根据过程执行规则(C1),如图76所示,对从有框号1的自由间距字符框抽取的第八个模式,与‘BLACK-CHARAC-TER-BOX’相应地执行图7所示的框-接触字符识别单元13的过程,并且对一个框-接触字符执行一个字符识别过程。
在由框-接触字符识别单元13执行的字符识别过程中,从图76所示的有框号1的自由间距框抽取的第八个模式,被识别成有95%识别可靠率的字符种类4;然后把‘4’输入到中间处理结果表上的‘CHARACTER CODE’栏中,并且把‘95%’输入到中间处理结果表上的‘RELIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BLACK-CHARACTER-BOX’,并且把中间处理结果表上的‘PROCESS ORDER’栏更新为‘FREE-PITCH’。
其次,因为在图79所示中间处理结果表上有框号2的字符框的‘PROCESS ORDER’栏中,规定‘ONE-CHARACTER-DELE-TION LINE’;故根据过程执行规则(C1),如图76所示,对从有框号2的单字符框中抽取的模式,与‘ONE-CHARACTER DELETIONLINE’相应地执行一个图7所示的删除线识别单元26的过程。
如图71所示,删除线识别单元26从一个作为一个校正字符候选者而抽取的模式中,去掉那些指示直方图值等于或大于预定值的水平线。如果从其中去除水平线的模式被识别为一个字符,则通过所去除水平线识别为删除线,能够把作为校正字符候选者而抽取的模式识别为一个校正字符。如果从其中去除那些指示直方图值等于或大于预定值的水平线的模式是被拒绝的,就不把所去除的水平线看成是删除线,而看成是一个字符的一部分。这样,就把作为一个校正字符候选者而抽取的模式识别为一个正常的字符。
在由删除线识别单元26执行的删除线识别过程中,从图76所示的有框号2的单字符框中抽取的模式的识别可靠率,被计算为10%。因此,对从图76所示的有框号2的单字符框中抽取的模式就不看成是一个校正字符,把‘10%’输入到中间处理结果表上的‘RE-LIABILITY’栏中,并且把‘BASIC’输入到中间处理结果表上的‘PROCESS INSTRUCTION’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘DELETION LINE’,并且在中间处理结果表上的‘PROCESSORDER’栏中输入‘BASIC’。
其后,因为在图79所示的中间处理结果表上有框号3的字符框的‘PROCESS ORDER’栏中规定‘BASIC’,故根据过程执行规则(C1),如图76所示,对从有框号3的单字符框中抽取的模式,与‘BASIC’相应地执行一个图7所示的基本字符识别单元17的过程。
基本字符识别单元17通过抽取图35所示的一个输入的未知字符的特征,用一个特征向量表达该未知字符的特征,和用预先存于基本字典中的每个种类的特征向量来整理该向量,来计算在一个特征空间中诸特征向量之间的距离。这样,就把指示诸特征向量之间最短距离的字符种类识别为一个未知字符。
基本字符识别单元17通过计算未知字符外形上的凸凹量,来计算未知字符的变形。如果未知字符指示大的变形,并且降低其识别率,就参阅知识表18,并且用图37至42所示的细目识别方法执行一个字符识别过程。
在由基本字符识别单元17执行的字符识别过程中,从图76所示的有框号3的单字符框中抽取的模式,被识别成有95%识别可靠率的字符种类3;然后把‘3’输入到中间处理结果表上的‘CHARAC-TER CODE’栏中,并且把‘95%’输入到中间处理结果表上的‘RE-LIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BASIC’,并且在中间处理结果表上空出‘PROCESS ORDER’栏。
其后,因为在图79所示中间处理结果表上有框号4的字符框的‘PROCESS ORDER’栏中,首先规定‘BLACK-CHARACTER-BOX’;故根据过程执行规则(C1),如图76所示,对从有框号4的单字符框中抽取的模式,与‘BLACK-CHARACTER-BOX’相应地执行一个图7所示的框-接触字符识别单元13的过程。然后对一个框-接触字符执行一个字符识别过程。
如果在由框-接触字符识别单元13执行的字符识别过程中,从图76所示的有框号4的单字符框中抽取的模式的识别可靠率,被计算成1 5%;则从图76所示的有框号4的单字符框中抽取的模式被看成是一个非字符,并且把‘REJECT’输入到中间处理结果表上的‘CHARACTER CODE’栏中,和把‘15%’输入到中间处理结果表上的‘RELIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BLACK-CHARACTER-BOX’,并且把中间处理结果表上的‘PROCESS ORDER’栏更新为‘ONE-CHARACTER DELETIONLINE’。
其后,因为在图79所示中间处理结果表上有框号5-1的字符框的‘PROCESS ORDER’栏中,规定‘ONE-CHARACTER DELE-TION LINE’;故根据过程执行规则(C1),如图76所示,对从有框号5-1的单字符框中抽取的模式,与‘ONE-CHARACTER DELE-TION LINE’相应地执行一个图3所示的删除线识别单元26的过程。然后对一个作为校正字符候选者而抽取的模式执行一个识别过程。
在由删除线识别单元26执行的删除线识别过程中,从图76所示的有框号5-1的单字符框中抽取的模式的识别可靠率,被计算成95%。把图76所示的从有框号5-1的框中抽取的模式看成是一个校正字符,把‘95%’输入到中间处理结果表上‘RELIABILITY’栏中,并且把‘DELETION LINE’输入到中间处理结果表上的‘COM-PLETION OF PROCESS’栏中。
在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’,并且在中间处理结果表上把‘PROCESS OR-DER’栏空出来。
其后,因为在图79所示中间处理结果表上有框号5-2的字符框的‘PROCESS ORDER’栏中,规定‘BLACK-CHARACTER-BOX’;故根据过程执行规则(C1),如图76所示,对从有框号5-2的框中抽取的模式,与‘BLACK-CHARACTER-BOX’相应地执行一个图7所示的框-接触字符识别单元13的过程。然后对一个框-接触字符执行一个字符识别过程。
从图76所示的有框号5-2的字符框中抽取的模式的下笔画,是接触字符框的。因为在图43所示的字符完成过程中或在图44所示的字符再完成过程中,不能够用高的可靠率识别该模式,故通过参阅图49所示知识表167而得出一个字符及其误读字符对(2,7),并且用图51所示的区强调方法来重新识别一个字符。
在由框-接触字符识别单元13执行的字符识别过程中,把从图76所示的有框号5-2的框中所抽取的模式,识别成有95%识别可靠率的字符种类2;然后把‘2’输入到中间处理结果表上的‘CHAR-ACTER CODE’栏中,并且把‘95%’输入到中间处理结果表上的‘RELIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BLACK-CHARACTER-BOX’,并且在中间处理结果表上把‘PROCESS ORDER’栏空出来。
其后,因为在图79所示的中间处理结果表上有框号5-3的字符框的‘PROCESS ORDER’栏中,规定‘BASIC’;故根据过程执行规则(C1),如图76所示,对从有框号5-3的单字符框中抽取的模式,与‘BASIC’相应地执行一个图7所示的基本字符识别单元17的过程。然后对一个基本字符执行一个字符识别过程。
在由基本字符识别单元17执行的字符识别过程中,从图76所示的有框号5-3的框中抽取的模式,被识别成有90%识别可靠率的字符种类6;然后把‘6’输入到中间处理结果表上的‘CHARAC-TER CODE’栏中,并且把‘90%’输入到中间处理结果表上的‘RE-LIABILITY’栏中。
在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘BASIC’,并且在中间处理结果表上把‘PROCESS ORDER’栏空出来。
其后,因为在图79所示中间处理结果表上有框号6-1-1的字符框的‘PROCESS ORDER’栏中,首先规定‘PLURAL-CHARAC-TER DELETION LINE’,故根据过程执行规则(C1),与‘PLU-RAL-CHARACTER DELETION LINE’相应地执行一个图7所示的删除线识别单元26的过程。然后,对诸删除线执行一个识别过程。
在由删除线识别单元26执行的删除线识别过程中,从图76所示的有框号6-1-1的表中抽取的删除线的识别可靠率,被计算成98%。因此,把从图76所示的有框号6-1-1的框中抽取的模式看成是一个校正字符,把‘DELETION LINE’输入到‘CHARACTERCODE’栏中,把‘98%’输入到中间处理结果表上的‘RELIABILI-TY’栏中,并且把‘DELETION LINE’输入到中间处理结果表上的‘COMPLETION OF PROCESS’栏中。
根据过程执行规则(C3),把‘TERMINATION’输入到中间处理结果表上的‘PROCESS INSTRUCTION’栏中,并且在中间处理结果表上把‘PROCESS ORDER’栏空出来。
其后,因为在图79所示的中间处理结果表上有框号6-2-2的字符框的‘PROCESS ORDED’栏中,首先规定‘PLURAL-CHAR-ACTER DELETION LINE’,故根据过程执行规则(C1),与‘PLU-RAL-CHARACTER DELETION LINE’相应地执行一个图7所示的删除线识别单元26的过程。然后,对诸删除线执行一个识别过程。
在由删除线识别单元26执行的删除线识别过程中,从图76所示的有框号6-2-2的表中抽取的删除线的识别可靠率,被计算成98%。因此,把从图76所示的有框号6-2-2的框中抽取的模式看成是一个校正字符,把‘DELETION LINE’输入到‘CHARACTERCODE’栏中,把‘98%’输入到中间处理结果表上的‘RELIABILI-TY’栏中,并且把‘DELETION LINE’输入到中间处理结果表上的‘COMPLETION OF PROCESS’栏中。
根据过程执行规则(C3),在中间处理结果表上的‘PROCESSINSTRUCTION’栏中输入‘TERMINATION’,并且在中间处理结果表上把‘PROCESS ORDER’栏空出来。
通过执行上述诸过程,生成一个图80所示的中间处理结果表。因为把要调用的过程输入到图80所示的中间处理结果表上的‘PROCESS ORDER’栏中,故可根据过程执行规则(C1),继续执行诸过程。
图81示出根据图80所示中间处理结果表,继续执行识别过程而得到的结果。
因为在图80所示的中间处理结果表上有框号1的字符框的‘PROCESS ORDER’栏中,为第一模式规定‘ONE-CHARACTERDELETION LINE’;故根据过程执行规则(C1),如图76所示,对从有框号1的自由间距字符框中抽取的第一模式,与‘ONE-CHAR-ACTER DELETION LINE’相应地执行一个图1所示的删除线识别单元26的过程,并且执行该校正字符识别过程。
在由删除线识别单元26执行的删除线识别过程中,从图76所示的有框号1的自由间距字符框中抽取的第一模式的识别可靠率,被计算成96%。因此,把从图76所示的有框号1的自由间距字符框中抽取的第一模式看成是一个校正字符,把‘DELETION LINE’输入到中间处理结果表上的‘CHARACTER CODE’栏中,把‘96%’输入到中间处理结果表上的‘RELIABILITY’栏中,并且把‘BLACK-CHARACTER-BOX/DELETION LINE’输入到中间过程结果表上的‘COMPLETION OF PROCESS’栏中。
随后,在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’并且在中间处理结果表上的‘PROCESSORDED’栏是空白的。
其后,在图79所示的中间处理结果表上有框号1的字符框中第二模式的‘PROCESS ORDER’栏中,规定‘FREE-PITCH’。因此,对从有框号1的自由间距框中抽取的全部模式,与‘FREE-PITCH’相应地执行一个图7所示的字符串识别单元15的过程,以便用根据过程执行规则(C4)考虑的字符检测可靠率来识别字符;这是在从图76所示的有框号1的自由间距框中抽取第二模式以后,和在等待有框号1的字符框中全部其他模式的‘PROCESS ORDER’栏都包含‘FREE-PITCH’以后,在有框号1的字符框中全部模式的‘PROCESS ORDER’栏都包含‘FREE-PITCH’时进行识别的。
下面,在图79所示的中间处理结果表上有框号1的字符框中第八模式的‘PROCESS ORDER’栏中,规定‘FREE-PITCH’。因此,对从有框号1的自由间距框中抽取的全部模式,与‘FREE-PITCH’相应地执行一个图7所示的字符串识别单元15的过程,以便用根据过程执行规则(C4)考虑的字符检测可靠率来识别字符;这是在从图76所示的有框号1的自由间距框中抽取第八个模式以后,和在等待有框号1的字符框中全部其他模式的‘PROCESS OR-DER’栏都包含‘FREE-PITCH’以后,在有框号1的字符框中全部模式的‘FROCESS ORDER’栏都包含‘FREE-PITCH’时进行识别的。
然后,当有框号1的字符框中全部模式的‘FROCESS ORDER’栏都包含‘FREE-PITCH’时,就对从图76所示的有框号1的自由间距框中抽取的全部模式,用字符串识别单元15执行一个字符识别过程。
关于从图76所示的有框号1的字符框中的自由间距框中抽取的第一模式,因为在图81所示的中间过程结果表上有框号1的字符框中的第一模式的‘PROCESS INSTRUCTION’栏中输入‘TERMI-NATION’,而在从字符串识别单元15的诸处理对象中,去掉从图76所示的有框号1的字符框中的自由间距框中抽取的第一模式以后,对从图76所示的有框号1的自由间距框中抽取的第二至第八模式,用字符串识别单元15执行一个识别过程。
字符串识别单元15在按照例如图56至69中所示而检测一个字符时,根据离开判别相的距离,计算其识别可靠率;并且参照一个所检测的字符,确定字符检测可靠率与字符识别可靠率的最大乘积。
在由字符串识别单元15执行的识别过程中,从图76所示的有框号1的自由间距框中抽取的第二模式,被识别成一个有95%识别可靠率的字符种类3。因此,把‘3’输入到中间处理结果表上‘CHARACTER ORDER’栏中,并且把‘95%’输入到中间处理结果表上‘RELIABILITY’栏中。
根据过程执行规则(C1),把‘BLACK-CHARACTER-BOX/FREE-PITCH’输入到中间处理结果表上‘COMPLETION OFPROCESS’栏中,并且中间处理结果表上的‘PROCESS ORDER’栏变成空白。根据过程执行规则(C4),把‘PERSONAL HANDWRIT-ING FEATURES’输入到中间处理结果表上的‘PROCESS IN-STRUCTION’栏中。
从图76所示的有框号1的字符框中的自由间距框中抽取的第八模式,被识别成有98%识别可靠率的字符种类4。把‘4’输入到中间处理结果表上的‘CHARACTER CODE’栏中,并且把‘98%’输入到中间处理结果表上的‘RELIABILITY’栏中。
根据过程执行规则(C1),把‘BLACK-CHARACTER-BOX/FREE-PITCH’输入到中间处理结果表上的‘COMPLETION OFPROCESS’栏中,并且中间处理结果表上的‘PROCESS ORDER’栏变成空白。根据过程执行规则(C4),把‘PERSONAL HANDWRIT-ING FEATURES’输入到中间处理结果表上的‘PROCESS IN-STRUCTION’栏中。
从图76所示的有框号1的字符框中的自由间距框中抽取的第三模式,被识别成一个字符种类‘2’。在由字符串识别单元15执行的识别过程中,把从图76所示的有框号1的字符框中的自由间距框中抽取的第四与第五模式,集成到一个单字符中,并且被识别成一个字符种类‘7’。从图76所示的有框号1的字符框中的自由间距框中抽取的第六模式,被识别成一个字符种类‘4’。从图76所示的有框号1的字符框中的自由间距框中抽取的第七模式,被识别成一个字符种类‘6’。
结果,把‘7’输入到图81所示的中间处理结果表上的‘NUM-BER OF CHARACTER’栏中。
下面,因为在图80所示的中间处理结果表上有框号2的字符框的‘PROCESS ORDER’栏中,输入‘BASIC’;故根据过程执行规则(C1),对从图76所示的有框号2的单字符框中抽取的模式,与‘BA-SIC’相应地执行一个图7所示的基本字符识别单元17的过程。
在由基本字符识别单元17执行的字符识别过程中,从图76所示的有框号2的字符框中的单字符框中抽取的模式,被识别成一个具有97%识别可靠率的字符种类‘5’。把‘5’输入到中间处理结果表上的‘CHARACTER CODE’栏中,并且把‘97%’输入到中间处理结果表上的‘RELIABILITY’栏中。
在中间处理结果表上的‘CALLING PROCESS’栏中,输入‘DELETION LINE(YES2)/BASIC’。在中间处理结果表上的‘COMPLETION OF PROCESS’栏中输入‘DELETION LINE/BA-SIC’。中间处理结果表上的‘PROCESS ORDER’栏变成空白。因此,根据过程执行规则(C4),把‘PERSONAL HANDWRITINGFEATURES’输入到‘PROCESS INSTRUCTION’栏中。
因为图80所示的中间处理结果表上有框号3的字符框的‘PROCESS ORDER’栏变成空白,故根据过程执行规则(C4),在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘PER-SONAL HANDWRITING FEATURES’。
下面,因为在图80所示的中间处理结果表上有框号4的字符框的‘PROCESS ORDER’栏中,输入‘ONE-CHARACTER DELE-TION LINE’;故根据过程执行规则(C1),对从图76所示的有框号4的单字符框中抽取的模式,与‘ONE-CHARACTER DELETIONLINE’相应地执行一个图76所示的删除线识别单元26的过程。这样,对一个作为校正字符候选者而抽取的模式,执行一个识别过程。
如果从图76所示的有框号4的单字符框中抽取的模式的识别可靠率,在由删除线识别单元26执行的删除线识别过程中,被计算成95%;就把从图76所示的有框号4的单字符框中抽取的模式,看成是一个校正字符,并且把‘95%’输入到中间处理结果表上的‘RE-LIABILITY’栏中,和把‘BLACK-CHARACTER-BOX/DELE-TION LINE’输入到中间处理结果表上的‘COMPLETION OFPROCESS’栏中。
在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’,并且在中间处理结果表上把‘PROCESS OR-DER’栏空出来。
因为在图80所示中间处理结果表上有框号5-1的框号的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’,故不对从图76所示的有框号5-1的字符框中抽取的模式执行任何过程。
因为在图80所示的中间处理结果表上有框号5-2的字符框的‘PROCESS ORDER’栏变成空白,故根据过程执行规则(C4),把‘PERSONAL HANDWRITING FEATURES’输入到中间处理结果表上的‘PROCESS INSTRUCTION’栏中。
因为图80所示的中间处理结果表上有框号5-3的字符框的‘PROCESS ORDER’栏变成空白,故根据过程执行规则(C4),在中间处理结果表上的‘PROCESS INSTRUCTION’栏中输入‘PER-SONAL HANDWRITING FEATURES’。
因为在图80所示的中间处理结果表上有框号6-1-1的框号的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’,故不对从图76所示的有框号6-1-1的字符框中抽取的模式执行任何过程。
因为在图80所示的中间处理结果表上有框号6-2-2的框号的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’,故不对从图76所示的有框号6-2-2的字符框中抽取的模式执行任何过程。
通过执行上述诸过程,生成一个图81所示的中间处理结果表。因为在图81所示的中间处理结果表上的‘PROCESS INSTRUC-TION’栏中输入‘PERSONAL HANDWRITING FEATURES’,故根据过程执行规则(C5),继续执行诸过程。
图82示出根据图81所示的中间处理结果表,通过继续执行识别过程而得到的结果。
因为在图80所示的中间处理结果表上有框号1的字符框中第一模式的‘PROCESS INSTRUCTION’栏中,输入‘TERMINA-TION’,故不对从图76所示的有框号1的自由间距框中抽取的第一模式执行任何过程。
因为在图81所示的中间处理结果表上有框号1的字符框中第二模式的‘PROCESS INSTRUCTION’栏中,输入‘PERSONALHANDWRITING FEATURES’;故根据过程执行规则(C5),对从图76所示的有框号1的自由间距框中抽取的第二模式,与‘PERSON-AL HANDWRITING FEATURES’相应地执行一个独特字符分析单元23的过程。
例如,独特字符分析单元23把由同一书写者手写的一些字符,群集成图72至75所示的种类。第二群靠近群集过程所得的手写字符的第一群,属于一个不同于第一群种类的种类,且具有较少数目的元素;把第二群集成到第一群,使属于第二群的手写字符的种类能被修改成第一群的种类。
在由独特字符分析单元23执行的分析过程中,从图76所示的有字符框号1的自由间距框中抽取的第二模式,被识别成一个有97%识别可靠率的字符种类3。把‘3’输入到中间处理结果表上的‘CHARACTER CODE’栏中,并且把‘97%’输入到中间处理结果表上的‘RELIABILITY’栏中。
把‘BLACK-CHARACTER-BOX/FREE-PITCH/PER-SONAL HANDWRITING FEATURES’输入到‘COMPLETIONOF PROCESS’栏中,并且把‘TERMINATION’输入到‘PROCESSINSTRUCTION’栏中。
因为在图79所示的中间处理结果表上有框号1的字符框中第八个模式的‘PROCESS INSTRUCTION’栏中,输入‘PERSONALHANDWRITING FEATURES’;故根据过程执行规则(C5),对从图76所示的有框号1的自由间距框抽取的第八模式,与‘PERSONALHANDWRITING FEATURES’相应地执行一个图7所示的独特字符分析单元23的过程。
在由独特字符分析单元23执行的分析过程中,从图76所示的有字符框号1的自由间距框中抽取的第八个模式,被识别成一个具有98%识别可靠率的字符种类4。把‘4’输入到中间处理结果表上的‘CHARACTER CODE’栏中,并且把‘98%’输入到中间处理结果表上的‘RELIABILITY’栏中。
把‘BLACK-CHARACTER-BOX/FREE-PITCH/PER-SONAL HANDWRITING FEATURES’输入到‘COMPLETIONOF PROCESS’栏中,并且把‘TERMINATION’输入到‘PROCESSINSTRUCTION’栏中。
因为在图81所示的中间处理结果表上有框号2的字符框中的‘PROCESS INSTRUCTION’栏中,输入‘PERSONAL HAND-WRITING FEATURES’;故根据过程执行规则(C5),对从图76所示的有框号2的单字符框中抽取的模式,与‘PERSONAL HAND-WRITING FEATURES’相应地执行一个图7所示的独特字符分析单元23的过程。
在由独特字符分析单元23执行的分析过程中,图76所示的从有字符框号2的单字符框中抽取的模式,被识别成一个具有97%识别可靠率的字符种类5。把‘5’输入到中间处理结果表上的‘CHAR-ACTER CODE’栏中,并且把‘97%’输入到中间处理结果表上的‘RELIABILITY’栏中。
把‘DELETION LINE/BASIC/PERSONAL HANDWRITINGFEATURES’输入到‘COMPLETION OF PROCESS’栏中,并且把‘TERMINATION’输入到‘PROCESS INSTRUCTION’栏中。
因为在图81所示的中间处理结果表上有框号3的字符框中的‘PROCESS INSTRUCTION’栏中,输入‘PERSONAL HAND-WRITING FEATURES’;故根据过程执行规则(C5),对图76所示的从有框号3的单字符框中抽取的模式,与‘PERSONAL HAND-WRITING FEATURES’相应地执行一个图7所示的独特字符分析单元23的过程。
在由独特字符分析单元23执行的分析过程中,图76所示的从有框号3的单字符框中抽取的模式,被识别成一个具有97%识别可靠率的字符种类3。把‘3’输入到中间处理结果表上的‘CHARAC-TER CODE’栏中,并把‘97%’输入到中间处理结果表上的‘RELIA-BILITY’栏中。
把‘BASIC/PERSONAL HANDWRITING FEATURES’输入到‘COMPLETION OF PROCESS’栏中,并把‘TERMINATION’输入到‘PROCESS INSTRUCTION’栏中。
因为在图81所示的中间处理结果表上有框号4的框号的‘PROCESS INSTRUCTION’栏中,输入‘TERMINATION’,故不对图76所示的从有框号4的字符框中抽取的模式执行任何过程。
因为在图81所示的中间处理结果表上有框号5-1的框号的‘PROCESS INSTRUCTION’栏中,输入‘TERMINATION’,故不对图76所示的从有框号5-1的字符框中抽取的模式执行任何过程。
因为在图81所示的中间处理结果表上有框号5-2的字符框中的‘PROCESS INSTRUCTION’栏中,输入‘PERSONAL HAND-WRITING FEATURES’,故根据过程执行规则(C5),对图76所示的从有框号5-2的字符框中抽取的模式,与‘PERSONAL HAND-WRITING FEATURES’相应地执行一个图7所示的独特字符分析单元23的过程。
在由独特字符分析单元23执行的分析过程中,图76所示的从有框号5-2的字符框中抽取的模式,被识别成一个有97%识别可靠率的字符种类2。把‘2’输入到中间处理结果表上的‘CHARAC-TER CODE’栏中,并把‘97%’输入到中间处理结果表上的‘RELIA-BILITY’栏中。
把‘BLACK-CHARACTER-BOX/PERSONAL HAND-WRITING FEATURES’输入到‘COMPLETION OF PROCESS’栏中,并把‘TERMINATION’输入到‘PROCESS INSTRUCTION’栏中。
因为在图81所示的中间处理结果表上有框号5-3的字符框中的‘PROCESS INSTRUCTION’栏中,输入‘PERSONAL HAND-WRITING FEATURES’;故根据过程执行规则(C5),对图76所示的从有框号5-3的字符框中抽取的模式,与‘PERSONAL HAND-WRITING FEATURES’相应地执行一个图7所示的独特字符分析单元23的过程。
在由独特字符分析单元23执行的分析过程中,图76所示的从有框号5-3的字符框中抽取的模式,被识别成一个有96%识别可靠率的字符种类4。把‘4’输入到中间处理结果表上的‘CHARAC-TER CODE’栏中,并把‘96%’输入到中间处理结果表上的‘RELIA-BILITY’栏中。
把‘BASIC/PERSONAL HANDWRITING FEATURES’输入到‘COMPLETION OF PROCESS’栏中,并把‘TERMINATION’输入到‘PROCESS INSTRUCTION’栏中。
因为在图81所示的中间处理结果表上有框号6-1-1的框号的‘PROCESS INSTRUCTION’栏中,输入‘TERMINATION’,故不对图76所示的从有框号6-1-1的字符框中抽取的模式执行任何过程。
因为在图81所示的中间处理结果表上有框号6-2-2的框号的‘PROCESS INSTRUCTION’栏中输入‘TERMINATION’,故不对图76所示的从有框号6-2-2的字符框中抽取的模式执行任何过程。
通过执行上述诸过程,生成图82所示的中间处理结果表。因为对全部处理对象,都在图82所示的中间处理结果表上的‘PROCESSINSTRUCTION’栏中,输入‘TERMINATION’,故根据过程执行规则(C6),全部过程都终止。
如上所述,根据本发明的诸实施例,字符识别单元12和非字符识别单元25执行一些适当的识别过程,以处理由环境识别系统11识别的输入图象的状态。
例如,当环境识别系统11抽取一个接触分格线的字符时,它就使用框-接触字符识别单元13去专门执行一个关于框-接触字符的识别过程。当环境识别系统11抽取一个自由间距字符串时,它就使用字符串识别单元15去专门执行一个关于自由间距字符串的识别过程。当环境识别系统11抽取一个模糊字符时,它就使用模糊字符识别单元19去专门执行一个关于模糊字符的识别过程。当环境识别系统11抽取一个变形字符时,它就使用变形字符识别单元21去专门执行一个关于变形字符的识别过程。当环境识别系统11抽取一个非字符时,它就使用非字符识别单元25去专门执行一个关于非字符的识别过程。
对由字符识别单元12或非字符识别单元25得出的识别可靠率进行计算。对可靠率小的一个字符或非字符,环境识别系统11、字符识别单元12和非字符识别单元25互相反馈数据,以便重新执行一些过程。当获得高可靠率和没有要执行的可执行过程时,整个过程终止。
这样,根据本发明的诸实施例,能够在使那些识别字符时使用的特征和识别方法,自适应地随着写入字符的环境而修正的情况下,执行一个识别过程。因此,能够根据各种资料和格式的环境,实现一个高精度的字符识别。
此外,通过只输出那些作为识别结果的字符代码,同时输出环境识别结果和字符识别结果,和在环境识别结果与字符识别结果互相匹配时才输出字符识别结果,就能够用高的可靠率来认可字符识别结果。
因为能够限定非字符识别单元25去专门执行一个与字符识别过程无关的非字符识别过程,故可提高字符与非字符识别过程的可靠率。
此外,因为能够与环境无关地执行一个识别过程,故可通过在每个识别过程中增加字典和知识的容量,来提高识别可靠率。
下面描述根据本发明第三实施例的模式识别设备。
根据第三实施例的模式识别设备正确地拒绝那些明显地指示字符删除的删除线,以防误读,而不去错误地拒绝一个不同于有删除线的字符的字符,从而用高的可靠率去识别一个字符,而不给用户加重负担。
图83所示的第三实施例包括一个图象输入单元411,用于接收一个图象,检测一个来自输入图象的字符模式,和预处理所检测的图象;一个删除线字符判别单元412,用于判别一个有一些删除线的字符或一个没有删除线的标准字符,这些删除线或者只是由一些指示字符删除的水平线形成的简单删除线,或者是由一些复杂笔画形成的复杂删除线;和一个标识单元413,用于标识一个字符。
‘输入一个图象’涉及输入一个代表一个字符的原始图象。例如,当要识别一个表格式字符时,就把这个表格式字符模式传送到一个用于阅读该字符模式的光电转换器的阅读区,把它转换成一个电信号,并输出一个经二值化等处理的数字信号。
‘检测一个字符’涉及只检测一个来自输入数字图象的表格数据的字符段,并且把每个字符和其他的字符分开。
‘预处理’涉及一个字符的去除噪音,对位置标准化、字符尺寸、姿态、线稀薄度等。
判别一个有删除线的字符可以是一个预处理。
一个‘有删除线的字符’涉及一个有指示字符删除的删除线的字符。根据第三实施例,删除线可以是简单的删除线或复杂的删除线。
一个‘简单的删除线’涉及一个为指示字符删除而采用的由一个水平线所形成的删除线。简单删除线可以是一个或多个水平线。
一个‘水平线’不总是一个正确地水平的线,而是包括一个有斜度上容许公差的在水平方向上的画线。
这样,能够无误地删除一个有表观水平删除线的字符,并能减少误读。
在下述实施例中,用一种相邻投影方法判别水平删除线。
一个‘复杂的删除线’涉及一个对要删除字符画出的复杂线或笔画。为了确定一个线是否为一个复杂的删除线,就用图84所示的模式识别设备抽取复杂度数量。
‘识别一个字符’涉及抽取一个特征,输入所得的特征向量,和计算在该特征向量与标准特征向量之间的匹配状态;标准特征向量即相当于预先存储的识别字典。指示最大相似性的标准特征向量的种类是作为一个识别结果而输出的。
根据本实施例,对一个具有简单删除线或复杂删除线的字符执行一个判别过程,以便能识别一个标准字符。
因此,象一个预定的水平线,一个简单而很少偏离该预定水平线的表观删除线,一个复杂而完全不同于简单删除线的表观删除线之类的删除线,都能够作为删除线而无误地判别。
图84是一个方块图,说明一个根据本发明第四实施例模式识别设备的结构。
在图84中,删除线字符判别单元412包括一个复杂删除线字符判别过程单元414,用于判别一个有复杂删除线的字符;和一个简单删除线字符判别单元415,用于在多字符删除线字符确定过程单元414确定该模式不是一个有复杂删除线的字符时,判别一个有简单删除线的字符,其判别方法是在从有简单删除线的字符的候选者除去简单删除线的候选者时,确定一个有简单删除线的字符的候选者是否能被识别成一个字符。
根据图84所示的模式识别设备,只有当首先确定是否一个字符是一个有复杂删除线的字符以后确定该字符是没有复杂删除线的时候,才能判别一个有简单删除线的字符。因此,模式识别设备可避免在从一个字符去除简单删除线之后不能把它识别成一个字符时,把一个字符误读成一个没有删除线的字符,从而以高的可靠率判别一个有删除线的字符的候选者。
图85是一个方块图,说明根据本发明第五个实施例的模式识别设备的结构。
在图85中,删除线字符判别单元412包括一个字符表格信息抽取单元416,用于抽取字符表格信息,该信息包括至少一个象元素直方图,该图是用相连投影方法得到的,其中在目标水平扫描线中和在目标线上下预定范围内的相连线中的黑象元都是在水平方向上相加和计数的,该信息还包括来自所检测和预处理字符模式的指示图样复杂度的复杂度量;一个删除线字符候选者判别单元417,用于根据由字符表格信息抽取单元416抽取的字符表格信息,判别一个有简单删除线的字符的候选者或者一个有复杂删除线的字符的候选者;和一个删除线字符确定单元418,用于确定一个有简单删除线的字符,这是在从一个有简单删除线的字符候选者去除一个删除线的候选者之后,在能够把这个字符用识别单元413识别成一个字符时确定的。
‘字符表格信息’包括至少一个‘由一个在水平方向上进行的相连投影得到的象元数直方图’和‘复杂度的量’。
一个‘预定的范围’涉及一个在目标水平线上下的诸相连线的范围。例如,根据下述实施例,该范围可能包括三条线,即,目标水平线和在目标线上下最靠近的线。
如果‘预定的范围’被设置成窄的,则只有那些水平方向的线能被识别成简单的删除线。如果它被设置成较大,则甚至与水平线成某一角度的线也能够被识别成简单删除线。然而,如果它被设置成过大,则象元直方图峰变钝,不能正确地确定水平线。因此,要根据经验和实验适当地确定该范围。
在一个‘水平方向上相连投影’中,通过在包含一个目标水平扫描线的预定范围内的线上和在目标线上下的相连线上相加诸黑象元,来计数黑象元数。
能够用例如预定方向上的线密度、欧拉数、黑象元数等,表示一个‘复杂度的量’。
根据本实施例,由一个在水平方向上用相连投影法得到的象元数直方图,来判别一个有简单删除线的字符,并且用复杂度的量来判别一个有复杂删除线的字符。
上述的复杂度的量或在水平方向上用相连投影法得出的象元数直方图,能够客观地、容易地、迅速地和以高可靠率得到。
图86是一个方块图,根据本发明第六实施例说明模式识别设备的结构。
在图86中,复杂删除线字符判别处理单元414包括一个复杂度量抽取单元419,用于抽取一个指示图样复杂度的复杂度的量;和一个复杂删除线字符判别单元420,用于根据抽取的复杂度量,确定一个有复杂删除线的字符。简单删除线字符判别单元415包括一个象元数直方图计算单元421,用于按照相连投影法计算象元数直方图,在该法中,在目标水平扫描线上和在目标线上下预定范围内的相连线上的黑象元是在水平方向上相加和计数的;一个简单删除线字符候选者判别单元422,用于根据所计算的象元数,判别一个有简单删除线的字符的候选者;和一个简单删除线字符确定单元423,用于确定一个有简单删除线的字符,这是在从有简单删除线的字符候选者去除删除线候选者以后,能够把该字符用识别单元413识别为一个字符时确定的。
根据图86所示的模式识别设备,能够基于在水平方向上用相连投影法得到的象元数直方图和复杂度的量,判别一个有删除线的字符。
因此,除了由图84所示模式识别设备得到的效果之外,还能够用高的可靠率判别一个有删除线的字符。
图87是一个方块图,根据本发明第七个实施例说明模式识别设备的结构。
在图87中,简单删除线字符确定单元423包括一个删除线去除单元424,用于从一个有简单删除线的字符的判别候选者中去除一个删除线的候选者,并且把其结果传送到识别单元413;一个存储单元426,用于在去除删除线的候选者以前,存储一个有简单删除线的字符候选者的原始图象;和一个删除线字符确定单元425,用于即使在从字符去除删除线以后,也在能把有简单删除线的字符的候选者识别为一个字符时,把一个有简单删除线的字符的候选者确为一个有简单删除线的字符,还用于在从字符去除删除线以后,在不能把有简单删除线的字符的候选者识别为一个字符时,把一个有存储于存储单元426的简单删除线的字符的候选者确定为一个正常的字符,并把它传送到识别单元413 。
根据图87所示的模式识别设备,在用删除线去除单元424从一个有删除线的字符候选者中去除一个删除线候选者以前,原始图象是暂时存于存储单元426中的。
因此,如果一个已从其中去除删除线的候选者的有删除线的字符的候选者能被识别为一个字符,就从存储单元426中读出这个有删除线的字符的候选者的原始图象,并把它传送到识别单元413,供识别字符之用。这样,根据本发明,能够用一种简单的结构高速度地识别一个字符。
图88是一个流程图,根据本发明第八个实施例说明模式识别设备的操作。
在图88中,在步骤S301,输入一个图象,从输入图象中检测一个字符模式,并且预处理其结果。然后在步骤S302,就是否当前的字符是一个具有一个或者用唯一水平线形成的简单删除线或者用复杂笔画画成的复杂删除线提供的删除线的字符一事,对所检测和预处理的字符模式,执行一个判别过程,以便指示字符的删除或没有删除线的正常字符。这样,在步骤S303,能够把一个没有删除线的正常字符识别为一个字符。
根据图88所示的模式识别设备,确定当前的字符是一个具有一个或者用简单删除线或者用复杂删除线提供的删除线的字符,还是一个没有删除线的正常字符。这样,能够把一个正常字符识别为一个字符。
因此,即使用户不熟细删除线,或者未得到关于删除线的任何指令,也由于能够无误地去除有表观删除线的字符,故用户能够用一种简单的结构和高的可靠率去识别一个字符。
这样,能够减少表格式条目等方面的限制,并且能够明显减少用户的负担。
图89是一个流程图,根据本发明的第九个实施例说明模式识别设备的操作。
在图89中,在步骤S304,输入一个图象,从该输入图象中检测一个字符模式,并预处理其结果。然后在步骤S305,对所检测和预处理的字符模式执行一个判别过程,以判别一个具有复杂格式的复杂删除线的字符。如果在步骤S306确定,当前的字符不是一个有复杂删除线的字符,就确定当前的字符是一个具有一个只用水平线形成的简单删除线的旨在指示字符删除的字符,还是一个没有删除线的正常字符。这样,在步骤S307能够把一个没有删除线的正常字符识别为一个字符。
这样,根据图89所示的模式识别设备,当对一个有删除线的字符执行一个判别过程时,就首先对一个有复杂删除线的字符执行该过程。只有当确定,当前的字符不是一个有复杂删除线的字符时,才对一个有简单删除线的字符的候选者执行该判别过程。
因此,能够高效地和迅速地识别一个字符。
一个有简单删除线的字符的候选者,甚至在从该字符候选者中去掉删除线候选者之后,也能在把该字符识别为一个字符之时,被确定为一个有简单删除线的候选者。如果不能把该字符候选者识别为一个字符,就确定它为一个正常的字符。
因为已去掉复杂的删除线,故有复杂删除线的字符不会混杂于诸正常字符之中,从而不会误读为一个错误的字符。
此外,因为确定是否能把一个有简单删除线的字符的候选者识别为一个字符,故在该候选者是否为一个有删除线的字符方面,能够用高的可靠率正确地作出确定。
图90是一个流程图,根据本发明第十个实施例说明模式识别设备的操作。
在图90中,在步骤S311,输入一个图象,从该输入图象中检测一个字符模式,并且预处理所检测的结果。在步骤S312,对所检测和预处理的字符的复杂度量进行计算。在步骤S313,根据复杂度量,执行一个关于一个有用复杂笔画表示的复杂删除线的字符的判别。如果确定,该字符没有复杂的删除线,就在步骤S314用相连投影法得出象元数直方图,在该法中,在目标水平扫描线上和在该目标线上下的预定范围内的相连线上的黑象元是在水平方向上相加和计数的。然后在步骤S315,对一个有简单删除线的字符的候选者执行一个判别过程。如果从一个有简单删除线的字符的候选者中去掉一个删除线的候选者,并且能把其结果识别为一个字符,就把该候选者确定为一个有简单删除线的候选者。如果不能把它识别为一个字符,就在步骤S316把该候选者确定为一个正常字符,并且在步骤S317确定,是否所确定的字符能够被识别为一个字符。
这样,根据图91所示的模式识别设备,通过抽取复杂度量或进行相连投影,对一个有简单删除线的字符或一个有复杂删除线的字符,执行一个判别过程。
因此,能够用一种简单的结构以高的速度容易而正确地执行一个判别过程。
图91是一个流程图,根据本发明第十一个实施例说明模式识别设备的操作。
在图91中,在步骤S321,对所检测和预处理的字符,计算复杂度数量,例如欧拉数、线密度、黑象元密度等。在步骤S322,就当前的字符是否有复杂删除线一事,用预定的阈值,根据所计算的复杂度数量作出确定。如果确定当前的字符是一个有复杂删除线的字符,就在步骤S323输出一个拒绝代码。如果确定当前的字符没有复杂删除线,就在步骤S314计算一个水平方向的相连投影直方图,并且在步骤S351确定是否存在一个有简单删除线的字符的候选者。如果存在一个删除线的候选者,就在步骤S352把它作为有简单删除线的字符的候选者而加以去除。如果从有简单删除线的字符的候选者中去掉删除线的候选者,并且能把其结果识别为一个字符,就把这个有简单删除线的字符的候选者确定为一个有简单删除线的字符。如果不能够把其结果识别为一个字符,就在步骤S351,当在步骤S316将其定义为正常字符时确定是否当前的字符为一个有简单删除线的字符。如果它是一个有删除线的字符的候选者,就在步骤S352去掉删除线的候选者,并且对这个从其中去掉删除线候选者的有删除线的字符的候选者,检验它是否能识别成一个字符。如果它能被识别为一个字符,就确定它为一个有简单删除线的字符,并输出一个拒绝代码(步骤S355)。如果不能把它识别为一个字符,就把它确定为一个正常字符(步骤S353和S354)。在识别一个正常字符的过程中(S317),在步骤S361和S362检测所确定的标准字符,看是否能把它识别为一个字符。如果不能把它识别为一个字符,就在步骤S363输出一个拒绝代码。如果能把它识别为一个字符,就输出该识别结果(步骤S364)。
图92是一个方块图,根据本发明第十二个实施例说明模式识别设备的结构。
在图92中,该设备包括一个光阅读单元430,用于光学地阅读以某种格式输入的传送字符模式,把该字符模式转换成一种电信号,和输出一个经二值化的数字信号;一个传送单元431,用于把该格式传送到光阅读单元430的光阅读区;一个字典432,用于存储字符的标准特征向量;一个显示单元,用于在屏上显示字符;一个输出单元433,用于在纸上打印字符;一个操作单元434,用于执行各种操作;和一个CPU与存储器435,具有用于字符识别的各种功能。
如图92所示,CPU与存储器435包括一个字符检测和预处理单元436,用于检测和预处理一个来自输入图象的字符;一个复杂删除线字符判别处理单元437,用于对一个具有用复杂笔画表示的复杂删除线的字符执行一个判别过程;一个简单删除线字符判别单元438,用于对一个具有只用一个水平线形成的简单删除线的字符的候选者执行一个判别过程,该线在由复杂删除线字符判别处理单元437确定该字符没有复杂删除线时指示字符的删除;一个识别单元439,用于识别一个字符;和一个结果输出定向单元440,用于在把一个字符判别为一个有删除线的字符时拒绝该字符,在把该字符判别为一个正常字符时输出一个字符识别结果,和在把该字符判别为一个正常字符,但不能识别为一个字符时给出一个输出拒绝的方向。
如图92所示,字符检测和预处理单元436包括一个字符检测单元441,用于只对来自一个输入数字图象的格式图象的字符段进行检测,和使诸字符互相分开;和一个预处理单元442,用于从一个检测字符信号中排除干扰,和使字符的位置、尺寸等标准化。
光阅读单元430、传送单元431和字符检测与预处理单元436,相当于一个图象输入单元。
复杂删除线字符判别处理单元437包括一个复杂度数量抽取单元443,用于从一个字符模式抽取复杂度数量;和一个复杂删除线字符判别单元444,用于根据所抽取的复杂度数量,判别是否该字符模式是一个有复杂删除线的字符。
‘复杂度量’可以是在预定方向上的密度,欧拉数、黑象元密度等。
‘在预定方向上的密度’涉及一个在预定方向上扫描一个矩形中图象时,通过对从白象元变成黑象元(或从黑象元变成白象元)的诸段进行计数而得到的数值。例如,如果用一个有删除线501的字符‘2’生成一个字符模式,如图93中(A)图所示,则在垂直方向上的线密度为6,如图93中(D)图所示。
‘预定的方向’通常涉及一个字符的垂直或水平方向。
‘欧拉数’E是用连接元素数C减去孔数H表示的,即E=C-H,其中C表示在一个图象中互相连接的连接元素数,H表示图象中孔数。
例如,如果用一个有删除线502的字符‘2’生成一个字符模式,如图93中(B)图所示,则欧拉数E=-4,如图93中(E)图所示。
‘黑象元密度’D=B/S表示一个目标图象的外接矩形的面积S(总象元数)对该目标图象的外接矩形中黑象元总数B的比值。
例如,如果用有删除线503的字符‘2’生成一个字符模式,如图93中(C)图所示,则可用D=B/S表达黑象元密度D,如图93中(F)图所示。
图93中(A)至(C)示出有复杂删除线的字符的实例。
一个复杂删除线字符判别单元444根据复杂度量,例如所抽取特征的线密度、欧拉数、或黑象元密度等或它们的适当组合,执行一个判别过程。
所抽取复杂度量的一般倾向和一个正常字符或一个有删除线的字符,如下表所示。
特征/倾向 | 正常字符 | 有删除线的字符 |
最大线密度 | 小 | 大 |
欧拉数 | 小抽取值(2~-1) | 负值大绝对值 |
黑象元密度 | 小 | 大 |
根据复杂度量,用预先设备的一个阈值等,确定是否当前的字符有一个删除线。
图92所示的简单删除线字符识别单元438包括一个象元直方图计算单元445,用于按照相连投影方法计算象元数直方图,在该方法中,在目标水平扫描线上和在目标线上下的预定范围内的相连线上的黑象元是在水平方向上相加和计数的;一个简单删除线字符候选者判别单元446,用于根据所计算的象元数,对一个有简单删除线的字符的候选者,执行一个判别过程;和一个简单删除线字符确定单元447,用于在从一个有简单删除线的字符的判别候选者中去除一个删除线的候选者时,如果识别单元439识别一个字符,就确定一个有简单删除线的字符。
‘在水平方向上相连投影’涉及对在目标水平扫描线上和在该目标线上下的预定范围内的相连线上的黑象元,进行水平方向的相加和计数。
根据本实施例的情况,一个预定的范围包含3条线。
简单删除线字符候选者判别单元446确定一个有简单水平删除线的字符的候选者,该线是有一个其象元数直方图大于某一预定阈值的峰值的;并且把该相应线识别为一个删除线的候选者。
如图71所示,如果一个由简单删除线字符候选者判别单元446确定的,并且由删除线去除单元450去除其删除线候选者的,有一删除线的候选者能被识别为一个字符,就把它用简单删除线字符确定单元448确定为一个有一删除线的字符。如果不能把它识别为一个字符,就把它确定为一个正常字符(没有删除线的字符)。由删除线去除单元450用一种现有图象处理方法去除一个删除线的候选者。
如图92所示,简单删除线字符确定单元447包括一个删除线去除单元450,用于从一个有简单删除线的字符的判别候选者中去除一个删除线的候选者,并且把其结果传送到识别单元439;一个简单删除线字符确定单元448,用于在把有简单删除线的字符的判别候选者识别为一个字符时,把有简单删除线的字符的候选者确定为一个有简单删除线的字符,并且在没有把它识别为一个字符时,把它确定为一个正常字符,和把它传送到识别单元439;和一个字符候选者存储单元449,用于对一个由删除线去除单元450去除的有删除线的字符的候选者进行存储。
此外,标识单元439包括一个特征抽取单元451,用于抽取每个字符模式的特征值,和压缩数据;和一个字典整理单元452,用于按字典整理字符模式,即每个字符类型的标准特征向量。
下面参照图94和95,描述图92所示的模式识别设备的操作。
如图94所示,在步骤SJ1,传送单元431把一个包括输入字符的表格传送到光阅读单元430的阅读区,并使一个OCR输入该表格。
在步骤SJ2,光阅读单元430把一个表格上的字符模式用光电转换法转换成一个电信号,并把它作为经二值化等的数字信号而输出。
该表格可以包含输入字符及其相同颜色的字符框。
在步骤SJ3,字符检测单元441从数字信号中检测一个字符段,并使诸字符互相分开。预处理单元442使位置、尺寸、斜线粗细等标准化。
在步骤SJ4,一个复杂删除线字符判别处理单元437对一个有复杂删除线的字符,执行一个判别过程。在步骤SJ5,它不把当前的字符模式识别为一个有复杂删除线的字符。
图95所示的删除线存在确定单元A显示步骤SJ4和SJ5中的过程,以指示由复杂删除线字符判别处理单元437执行的过程的内容。
在步骤SJ41,复杂度量抽取单元443抽取复杂度量,例如欧拉数、线密度、黑象元密度等,以确定是否当前的字符模式是一个有复杂删除线的字符。
然后在步骤SJ42,复杂删除线字符判别单元444用某一预定的阈值确定,目标字符模式是一个正常字符,还是一个有复杂删除线的字符。
例如,假定在水平方向上扫描的线密度的阈值为2,在垂直方向上扫描的线密度的阈值为3,欧拉数的阈值为-1,和黑象元密度的阈值为0.6,就确定在水平方向上扫描的线密度等于或小于2时,在垂直方向上扫描的线密度等于或小于3时,欧拉数等于或大于-1时,和黑象元密度等于或小于0.6时,该字符的模式没有复杂删除线。在相反的情况下,该字符的模式被判别为一个有复杂删除线的字符。
如果在步骤SJ43,把字符模式判别为一个有复杂删除线的字符,就在步骤SJ5,把一个拒绝代码作为识别结果而输出。
如果没有把字符模式判别为一个有复杂删除线的字符,则控制转到步骤SJ6,并且简单删除线字符判别单元438执行一个判别是否存在一个水平线,即一个单删除线的过程。如果该模式被判别为一个有一删除线的字符,就在步骤SJ7把一个拒绝代码作为识别结果而输出。
由图95中删除线存在确定单元B指示判别过程。
如图95所示,在步骤SJ61,象元直方图计算单元445生成一个水平方向相连投影直方图。
举例来说,一个相连直方图可以是如图20所示,在每个线都偏移垂直于水平简单删除线的方向的情况下,通过沿水平线对每个n=3的线都添加黑象元而得到的。因此,即使水平的简单删除线没有准确地水平,也能把它正确地判别为一个简单删除线。
如果在步骤SJ62,直方图指示该峰值超过阈值N,则在步骤SJ63,简单删除线字符候选者判别单元446确定,存在一个删除线候选者,并且把该模式判别为一个有简单删除线的字符的候选者。如果这样一个峰值不存在,就确定该模式不包含一个删除线的候选者,并且把该模式判别为一个正常字符。如果在预处理中标准化一个字符尺寸,则N可以是一个固定值。如果它在预处理中未被标准化,就建议N是一个依据外接目标字符的矩形的宽度而变的变量。在这种情况下,阈值N对外接矩形宽度的比值,应作为一个固定值而适当给出。
在步骤SJ63,如果简单删除线字符候选者判别单元446把该模式判别为一个有删除线的字符的候选者,则控制转到步骤SJ64,并且字符候选者存储单元449存储一个有删除线的字符的候选者(在去除删除线之前)。删除线去除单元450对有删除线的字符候选者的水平简单删除线,进行检测和删除。
用一种现有的方法,例如通过一个n线运行长度抽取一个线的方法等,去除一个删除线的候选者。
在步骤SJ8,对已从其中去除删除线的字符模式,用识别单元439执行一个特征抽取过程。在步骤SJ9,按字典整理所抽取的特征。
在字典整理中,参照一个给定的标准特征向量,计算具匹配水平,并且把一种具有一个指示最大相似性的特征向量的字符类型,作为识别结果而输出。
如果在步骤SJ65确定,整理结果指示拒绝,则简单删除线字符确定单元448在步骤SJ66确定,有删除线的字符的该候选者是一个没有删除线的字符,并且在步骤SJ67,把临时存储于字符候选者存储单元449的有删除线的字符候选者的原始图象,传送到标识字符的标识单元439中。结果输出定向单元440指令输出单元去输出识别结果。
如果在步骤SJ65确定,已在整理过程之后把该模式标识为一个字符,则控制转到步骤SJ68,并且简单删除线字符确定单元448把有删除线的字符候选者,判别为一个有删除线的字符;然后在步骤SJ69,结果输出定向单元440把识别结果作为‘REJECT’而输出到输出单元433中。
图71中的上线示出一个实例:对一个有简单删除线的字符的候选者识别一个删除线的候选者,把除去删除线候选者的模式标识为‘5’,和把一个有删除线的字符确定为该模式。图71中的下线示出一个实例:在有简单删除线的字符的候选者中识别一个删除线的候选者,拒收一个除去删除线候选者的模式,从而把有简单删除线的原始字符的候选者判别为一个正常字符。
如上所述,根据本实施例,对一个有复杂删除线的字符,按照复杂度量作出确定;该量包括全部的在预定方向上的最大线密度,欧拉数,和黑象元密度。
因此,本实施例在高速度下以高的可靠率实现一个有复杂删除线的字符的判别。
此外,根据本实施例,可通过用相连投影方法计数象元数,判别一个有简单删除线的字符的候选者。
因此,对有一个删除线,包括在大致水平方向上画出的线以及预测的水平简单删除线在内,的字符的候选者,能够用一种简单的结构,以高的可靠率,容易而迅速地进行识别。
如上所述,根据本实施例的情况,通过执行一个删除线存在确定过程,能够对一个有删除线的字符,减少误读。此外,对一个用删除线删除的字符,能够有把握地拒收。
Claims (41)
1.一种模式识别设备,包括:
布局分析装置,用于通过识别文本、提取分格线、提取字符框、确定框和表格的类型,根据尺寸确定接触黑字符框的字符的存在,以及安排被标记的联结模式,来分析一个输入图像的布局;
质量分析装置,用于通过对整个文件/表单执行全局质量分析,并确定在对输入图像进行二进制化时使用的阈值是否适当、在通过传真传输后加入了噪声的文件/表单的质量是否可以接受以及是否生成了模糊性或变形,并且通过在被分配了所述布局分析装置中的单字符框、文本、自由间距字符框、表格的属性的每个区域中检查是否生成了模糊性或变形或者是否生成了噪声来执行本地质量分析,来分析输入图像的质量;
校正分析装置,用于分析该输入图像的校正状态,其中从输入图像中提取删除线,对于用删除线校正的字符省略字符识别过程;
字符模式识别装置,用于对该输入图象的一个处理对象的每个状态执行一个模式识别过程,所述字符模式识别装置包括一个为每种字符质量提供的识别字典,并且根据由所述质量分析装置分析的质量通过使用多个识别字典来识别字符,所述识别字典包括标准字典,模糊字符字典,变形字符字典,画面白色字符字典和纹理背景字符字典中的至少一个;
环境识别装置,用于通过根据布局、质量或校正状态抽取该输入图象的处理对象的状态,和通过选择将为从该输入图像抽取的每个状态执行的一个或多个模式识别过程,来执行一个识别过程;
其中基本字符识别过程、字符串识别过程、框接触字符识别过程、模糊字符识别过程和变形字符识别过程的字符识别过程以及删除线识别过程和噪声识别过程的非字符识别过程被执行;
从输入图像提取的状态指的是:在其中写字符的格式,包括单字符框、自由间距框、表格中的至少一个;字符及其框之间的关系;字符的模糊度;字符的变形;使用删除线的字符的删除。
2.根据权利要求1所述的模式识别设备,还包括:
模式检测装置,用于检测一个用于该处理对象的每个状态的模式。
3.根据权利要求1所述的模式识别设备,其中所述的环境识别装置包括:
中间处理结果表生成装置,用于根据关于处理对象的每个状态的确定结果,生成一个中间处理结果表,其中储存有由所述字符模式识别装置为每个状态执行的每个状态的识别过程。
4.根据权利要求1所述的模式识别设备,其中
所述的环境识别装置在为一个特定处理对象调用多个识别过程时,按照优选级执行识别过程,直至识别过程的可靠性超过某一预定值为止。
5.根据权利要求1所述的模式识别设备,其中
所述字符模式识别装置使用基于处理对象状态的知识来执行识别过程。
6.根据权利要求1所述的模式识别设备,其中
所述字符模式识别装置使用基于处理对象状态的识别函数来执行识别过程。
7.根据权利要求1所述的模式识别设备,其中
所述环境识别装置使所述字符模式识别装置为资料单元或表格页单元中的每个状态执行多个识别过程。
8.根据权利要求1所述的模式识别设备,其中
所述质量分析装置当在通过把其面积、长度和宽度分别小于各自的预定阈值的联结区的数目除以一个指定区的全部联结区的数目而得出的数值大于一个预定值时,为该指定区确定一个模糊字符。
9.根据权利要求1所述的模式识别设备,其中
所述质量分析装置,当在通过把完成模糊分格线时的内插的总长度除以一个指定区的分格线的总长度所得的数值大于一个预定值时,为该指定区确定一个模糊字符。
10.根据权利要求1所述的模式识别设备,其中
所述质量分析装置,当在把通过其黑象元密度大于一个预定阈值的联结区的数目除以一个指定区的全部联结区的数目所得的数值大于某一预定值时,为该指定区确定一个变形字符。
11.一种模式识别设备,包括:
状态抽取装置,用于从一个输入图象抽取一个处理对象的状态;所述状态抽取装置包括:
字符抽取装置,用于从输入图象中抽取一个具有预定区域尺寸的联结模式作为一个字符的候选者;
字符串抽取装置,用于从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;
分格线抽取装置,用于从输入图象中抽取一些分格线;
字符框抽取装置,用于抽取四条分格线的一个模式,以用作为包围一个区域的字符框;所述字符框抽取装置包括:
属性指定装置,用于根据分格线的联结状态和字符框的尺寸,给字符框指定单字符框、块字符框、自由间距字符框、规则表和不规则表中的一个属性;
接触字符抽取装置,用于抽取一个接触字符框的字符;
模糊字符分析装置,用于分析输入图象的一个模糊状态;
变形字符分析装置,用于分析输入图象的一个变形状态;
校正特征抽取装置,用于抽取输入图象的一个校正状态;
字符模式识别装置,用于执行一个关于处理对象的每个状态的模式识别过程;和
识别过程控制装置,用于通过为由所述状态抽取装置所抽取的处理对象的每个状态调用一个或多个模式识别过程,使识别过程得以执行。
12.根据权利要求11所述的模式识别设备,其中
所述接触字符抽取装置包括:
扫描装置,用于对所述字符框抽取装置沿字符框抽取的字符框的内部进行扫描;
相交检测装置,用于由所述扫描确定是否存在一个相交模式;
确定装置,用于当所述相交检测装置把一个模式检测为一个相交模式时,确定这个模式为一个相交于字符框的框接触字符;
部分外面字符检测装置,用于确定模式是否是部分地从扫描字符框的外面到里面写成的;和
去除装置,用于把部分地从字符框的外面到里面写成的模式从扫描的字符框中的框接触字符中去除。
13.一种模式识别设备,包括:
状态抽取装置,用于从一个输入图象抽取一个处理对象的状态;
所述状态抽取装置包括:
字符抽取装置,用于从输入图象中抽取一个具有预定区域大小的联结模式作为一个字符的候选者;
字符串抽取装置,用于从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;
分格线抽取装置,用于从输入图象中抽取一些分格线;
字符框抽取装置,用于抽取四条分格线的一个模式,以用作为包围一个区域的字符框;
接触字符抽取装置,用于抽取一个接触字符框的字符;
模糊字符分析装置,用于分析输入图象的一个模糊状态;
变形字符分析装置,用于分析输入图象的一个变形状态;和
校正特征抽取装置,用于抽取输入图象的一个校正状态;
所述校正特征抽取装置包括:
线密度计算装置,用于在一个指定方向上扫描一个矩形区中的图象时,通过对一个白象元变黑或一个黑象元变白的次数进行计数,来计算该指定方向上的线密度;
欧拉数计算装置,用于通过从图象中联结元素的数目减去图象中所含孔的数目,计算欧拉数;
黑象元密度计算装置,用于通过计算一个目标图象的面积与一个外接该目标图象的矩形的面积的比值,来计算一个黑象元密度;
线密度确定装置,用于当线密度超过一个预定值时,确定由矩形外接的目标图象为用于一个校正字符的候选者;
欧拉数确定装置,用于当欧拉数为负值并且其绝对值大于一个预定值时,确定该图象为用于一个校正字符的候选者;和
黑象元密度确定装置,用于当黑象元密度超过一个预定值时,确定该图象为一个校正字符的候选者;
字符模式识别装置,用于执行一个关于处理对象的每个状态的模式识别过程;和
识别过程控制装置,通过为由所述状态抽取装置所抽取的处理对象的每个状态调用一个或多个模式识别过程,使识别过程得以执行。
14.根据权利要求13所述的模式识别设备,其中
所述字符模式识别装置包括:
字符识别装置,用于识别一个字符的模式;
字符串识别装置,用于识别一个字符串的模式;
接触字符识别装置,用于识别一个接触一个字符框的字符的模式;
模糊字符识别装置,用于识别一个模糊字符的模式;
变形字符识别装置,用于识别一个变形字符的模式;
校正字符识别装置,用于识别一个校正字符的模式;和
独特字符识别装置,用于识别一个独特字符的模式。
15.根据权利要求14所述的模式识别设备,其中
所述字符识别装置包括:
一个特征抽取单元,用于抽取一个输入的未知字符的特征,作为一个特征向量;
一个基本字典,用于预先存储一个字符种类的特征,以用作一个特征向量;和
一个整理单元,用于计算在未知字符特征向量与字符种类特征向量之间的距离,并且将一个在未知字符的字符向量之间的距离最短的字符种类识别为未知字符。
16.根据权利要求14所述的模式识别设备,其中
所述字符识别装置包括:
变形计算装置,用于通过对一个将被识别的字符的轮廓上的凸、凹的数量进行计算,来计算所述字符的变形;
一个分段字典,用于预先存储一个字符种类的特征,作为一个字符向量;
一个字符分段生成单元,用于在端点分开字符的轮廓,并生成字符分段;
一致性产生单元,用于以这样的方式在一个未知字符的字符分段与一个字符种类的字符分段之间产生一致性,即:当变形指示一个大于预定值的数值时,字符分段的角度变化的累积值彼此最接近;和
一个整理单元,用于根据一致性计算在未知字符特征向量与字符种类特征向量之间的距离,并且将一个在未知字符的字符向量之间的距离最短的字符种类识别为未知字符。
17.根据权利要求14所述的模式识别设备,其中
所述字符串识别装置包括:
判别相生成装置,用于把由P个指示模式的特征的特征值表示的样本数据,分类成一个第一群成功检测和一个第二群不成功检测,并且在一个P维空间中离第一群和第二群的重力中心的相等距离处,生成一个判别相;
可靠性计算装置,用于得到一个在P维空间中输入数据的P个特征值的位置与判别相之间的距离,并且根据该得到的距离计算输入数据的检测可靠性;和
检测确定装置,用于根据输入数据的检测可靠性和所检测的输入数据的识别可靠性,确定一个检测输入数据的位置。
18.根据权利要求14所述的模式识别设备,其中
所述接触字符识别装置包括:
字符框去除装置,用于从一个框接触字符中去除一个字符框;
字符完成装置,用于通过根据分离的线的方向去除字符框,从因去除字符框而出现的模糊字符完成一个字符;
再完成装置,用于通过插入在去除字符框以前重叠字符框的线,完成一个在去除字符框时分离的模式;
学习模式生成装置,用于在一个第一预定条件下,生成一个其中字符与字符框互相接触的学习模式;
一个知识表,用于存储学习模式的识别可靠性以及该预定条件,并且在识别可靠性小于一个预定值时存储用于学习模式的字符重新识别方法;和
字符重新识别装置,用于当一个由所述字符完成装置完成的模式或一个由所述再完成装置完成的模式满足一个第二预定条件时,由存储于知识表中的字符重新识别方法来重新识别一个字符。
19.根据权利要求14所述的模式识别设备,其中
所述模糊字符识别装置包括:
一个特征抽取单元,用于抽取一个输入的未知字符的特征,作为一个特征向量;
一个模糊字符字典,其中预先储存有模糊字符的字符种类的特征;
一个整理单元,用于计算一个在未知字符的特征向量与字符种类的特征向量之间的距离,并且将一个在未知字符的字符向量之间的距离最短的字符种类识别为未知字符。
20.根据权利要求14所述的模式识别设备,其中
所述变形字符识别装置包括:
一个特征抽取单元,用于抽取一个输入的未知字符的特征,作为一个特征向量;
一个变形字符字典,其中预先储存有变形字符的字符种类的特征;
一个整理单元,用于计算一个在未知字符的特征向量与字符种类的特征向量之间的距离,并且将一个在未知字符的字符向量之间的距离最短的字符种类识别为未知字符。
21.根据权利要求14所述的模式识别设备,其中
所述校正字符识别装置包括:
直方图值计算装置,用于在作为校正字符候选者而抽取的模式的方向上,计算一个直方图值;
线去除装置,用于去除一个其直方图值大于一个预定值的线;
完成装置,用于通过对由于去除该线而变模糊的模式的模糊部分进行内插,生成一个完成模式;
字符识别装置,用于识别一个完成模式中的字符;和
去除线识别装置,用于当一个完成模式被识别为一个字符时,把一个由所述线去除装置去除的线以为是一个去除线,并且当这个完成模式被拒绝时,把这个由所述线去除装置去除的线以为是一个字符的一部分。
22.根据权利要求14所述的模式识别设备,其中
所述独特字符识别装置包括:
群集装置,用于当群集每个种类的手写字符以后,生成多个包含由一个单独的手写者手写的字符的群,以用作每个种类中的元素;
群抽取装置,用于从所述群集装置生成的群中,抽取包含的元素数小于预定值的元素的群;
群间距离计算装置,用于计算一个在一个由所述群抽取装置抽取的第一群与一个属于另一种类的第二群之间的距离;和
种类校正装置,用于当在第一群与第二群之间的距离小于一个预定值时,集成第一群与第二群,并且把一个属于第一群的手写字符的种类校正为一个第二群的种类。
23.根据权利要求14所述的模式识别设备,其中
所述识别过程控制装置在所述字符抽取装置抽取一个字符的候选者时调用所述字符识别装置;在所述字符串抽取装置抽取一个字符串的候选者时调用所述字符串识别装置;在所述接触字符抽取装置抽取一个接触字符框的字符时调用所述接触字符识别装置;在所述模糊字符分析装置抽取一个输入图象的模糊状态时调用所述模糊字符识别装置;在所述变形字符分析装置抽取一个输入图象的变形状态时调用所述变形字符识别装置;和在所述校正特征抽取装置抽取一个输入图象的校正状态时调用所述校正字符识别装置。
24.根据权利要求14所述的模式识别设备,其中
所述识别过程控制装置在由所述字符识别装置确定的字符可靠性大于一个预定值时,调用所述独特字符识别装置。
25.根据权利要求12所述的模式识别设备,其中
所述识别过程控制装置包括:
处理次序控制规则存储装置,其中储存有一个调用程序,该程序根据来自输入图象的处理对象的状态的抽取结果,指示要调用哪一个由所述模式识别装置执行的识别过程;
一个处理次序表,其中储存了在所述模式识别装置调用多个关于一个特定对象的识别过程时的一个调用次序;
中间处理结果表生成装置,用于根据每个处理对象的调用程序和次序,由所述字符模式识别装置生成一个中间处理结果表,以指示执行诸识别过程的一个次序;和
过程执行规则存储装置,其中储存有一个根据在所述中间处理结果表上输入的识别过程的结果来指令一个随后过程的程序。
26.一种模式识别设备,包括:
字符抽取装置,用于从一个输入图象抽取一个字符;
非字符抽取装置,用于从一个输入图象抽取一个非字符;
字符识别装置,用于识别一个字符;
非字符识别装置,用于识别一个非字符;和
环境识别装置,用于当所述字符抽取装置抽取一个字符时,指令所述字符识别装置执行一个识别过程,和用于当所述非字符抽取装置抽取一个非字符时,指令所述非字符识别装置执行一个识别过程;其中
所述环境识别装置计算可靠性,该可靠性指示关于在所述字符抽取装置抽取一个字符时从所述字符识别装置得到的识别结果的确定性;并且在关于从所述字符识别装置得到的识别结果的确定性小于一个预定值时,指令所述非字符识别装置执行一个识别过程,其中由所述字符抽取装置抽取的字符被当作一个非字符。
27.根据权利要求26所述的模式识别设备,其中
所述环境识别装置计算可靠性,该可靠性指示关于一个在所述非字符抽取装置抽取一个非字符时从所述非字符识别装置得到的识别结果的确定性;并且在这个关于从所述非字符识别装置得到的识别结果的确定性小于一个预定值时,指令所述字符识别装置执行一个识别过程,其中由所述非字符抽取装置抽取的非字符被当作一个字符。
28.一种模式识别设备,包括;
第一字符模式识别装置,用于识别一个处于第一状态的处理对象的模式;
第二字符模式识别装置,用于识别一个处于第二状态的处理对象的模式;和
环境识别装置,用于从一个输入图象中抽取处理对象的一个状态,指令所述的第一字符模式识别装置对一个处于第一状态的处理对象执行一个识别过程,并且指令所述的第二字符模式识别装置对一个处于第二状态的处理对象执行一个识别过程;其中
从输入图像提取的状态指的是:在其中写字符的格式,包括单字符框、自由间距框、表格中的至少一个;字符及其框之间的关系;字符的模糊度;字符的变形;使用删除线的字符的删除;
所述第一和第二字符模式识别装置包括一个为模糊字符、变形字符和高质量字符的每种质量提供的识别字典,并且通过根据输入图象的质量利用多个识别字典来识别字符,所述识别字典包括标准字典,模糊字符字典,变形字符字典,画面白色字符字典和纹理背景字符字典中的至少一个,并且
基本字符识别过程、字符串识别过程、框接触字符识别过程、模糊字符识别过程和变形字符识别过程的字符识别过程以及删除线识别过程和噪声识别过程的非字符识别过程被执行。
29.根据权利要求28所述的模式识别设备,其中
所述环境识别装置在从一个单独的处理对象抽取第一状态和第二状态时,指令所述的第一和第二字符模式识别装置对一个处理对象执行识别过程。
30.根据权利要求28所述的模式识别设备,其中
所述环境识别装置计算可靠性,该可靠性指示关于由所述第一和第二字符模式识别装置得到的识别结果的确定性,并且在该确定性大于一个预定值时,把识别结果作为最后结果而输出。
31.一种图象识别设备,包括:
图象输入装置,用于输入一个图象,从该输入图象中检测一个图象区域,所述图象区域包含不带删除线图象的字符模式或带有删除线图象的字符模式,并通过去除噪声、使字符的位置、尺寸、姿态、线细度标准化来执行一个预处理;
删除线字符判别装置,用于判别一个字符模式是否是下列至少之一:一个没有删除线图象的正常字符,一个带有包括指示一个字符的删除的水平线图象的简单删除线图象的字符模式,以及一个带有呈复杂形式的复杂删除线图像的字符模式;和
标识装置,用于通过提取所述字符的特征,输入获得的特征向量以及计算特征向量和作为预先存储在一个识别字典中的向量的标准特征向量间的匹配的状态来标识一个字符,其中指示出最高类似度的标准特征向量的种类被作为识别结果输出。
32.根据权利要求31所述的图象识别设备,其中
所述删除线字符判别装置包括:
复杂删除线字符判别处理装置,用于判别一个有一复杂删除线图象的字符模式;和
简单删除线字符判别装置,用于当所述复杂删除线判别装置没有判别出带有复杂删除线图象的字符模式时,判别具有简单删除线的字符模式,其中根据是否从一个对象中去除了简单删除线将字符模式的候选者上的一个简单删除线图像标识为字符。
33.根据权利要求31所述的图象识别设备,其中所述删除线字符判别装置包括:
字符格式信息抽取装置,用于对一个被检测和预处理的字符模式抽取字符格式信息,所述字符格式信息包含
一个指示图形的复杂度的复杂度量与一个通过水平方向相连投影获得的象元数直方图中的至少一个,在所述水平方向相连投影中,在一个对象水平扫描线上和在对象水平扫描线上方和下方的预定范围内的一条线上把黑象元相加;
判别装置,用于根据由所述字符格式信息抽取装置抽取的字符格式信息,判别一个有简单删除线图象的字符模式的候选者或者一个有复杂删除线图象的字符模式的候选者;和
删除线字符定义装置,用于当所述识别装置在从有简单删除线图象的字符的候选者中去掉删除线以后能够识别一个字符时,定义一个有简单删除线图象的字符图象。
34.根据权利要求31所述的图象识别设备,其中所述复杂删除线字符判别处理装置包括:
复杂度抽取装置,用于抽取一个复杂度的量,该量指示图形复杂度;
复杂删除线字符判别装置,用于判别一个有复杂删除线图象的字符模式,和
所述简单删除线字符判别装置包括:
象元数直方图计算装置,用于计算一个用水平方向相连投影得到的象元数,在该投影情况中,在一个对象水平扫描线上和在对象水平扫描线上方和下方的预定范围内的一条线上把黑象元相加;
简单删除线图象字符候选者判别装置,用于根据所计算的象元数,判别一个有简单删除线图象候选者的字符模式;和
简单删除线图象字符定义装置,用于当所述标识装置在从一个有简单删除线图象的字符模式的已判别候选者中去掉删除线图象以后标识出一个字符时,定义一个有简单删除线图象的字符模式。
35.根据权利要求34所述的图象识别设备,其中所述简单删除线字符定义装置包括:
删除线去除装置,用于从一个有简单删除线图象的字符模式的判别候选者中去除一个删除线图象;
字符候选者存储装置,用于在去除删除线图象之前存储带有简单删除线图象的字符模式的候选者;和
删除线确定装置,用于当一个有简单删除线图象的字符模式的候选者在除去其删除线图象以后能够被识别为一个字符时,确定一个有简单删除线图象的字符模式的候选者为一个有简单删除线图象的字符;当一个有简单删除线图象的字符候选者不能够被标识为一个字符时,确定在所述字符候选者存储装置中存储的有简单删除线图象的字符模式的候选者为正常字符;并且把一个确定结果传送到所述的标识装置中。
36.一种模式识别方法,包括下列步骤:
从一个输入图象中抽取一个处理对象的一个状态,其中所述抽取步骤还包括下列步骤:
从输入图象中抽取一个具有预定面积的联结模式作为一个字符的候选者;
从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;
抽取四条分格线的一个模式,以用作为包围一个区的字符框;其中所述抽取步骤还包括:
根据分格线的联结状态和字符框的尺寸,给字符框指定一个单字符框、块字符框、自由间距字符框、规则表和不规则表中的一个属性;
抽取一个接触字符框的字符;
分析输入图象的一个模糊状态;
分析输入图象的一个变形状态;
抽取输入图象的一个校正状态;和
通过为该处理对象选择适合于该状态的识别过程来识别一个模式;其中
从输入图像提取的状态指的是:在其中写字符的格式,包括单字符框、自由间距框、表格中的至少一个;字符及其框之间的关系;字符的模糊度;字符的变形;使用删除线的字符的删除。
37.一种图象识别方法,包括下列步骤:
输入一个图象;
从该输入图象中检测一个图象区域,该图象区域包含不带删除线图象的字符模式或带有删除线图象的字符模式;
通过去除噪声,对字符的位置、尺寸、姿态、线细度标准化来执行一个预处理;
对一个被检测到或预处理的字符模式,判别一个字符模式是一个没有删除线图象的正常字符模式,还是一个有删除线图象的字符,
判别具有删除线图象的字符是一个包含一个指示字符删除的水平线的简单删除线图象,还是一些呈复杂形式的复杂删除线图象;和
标识一个没有删除线图像的正常字符。
38.一种图象识别方法,包括下列步骤:
输入一个图象;
从该输入图象中检测一个图象区域,该图象区域包含不带删除线图象的字符模式或带有删除线图象的字符模式;
通过去除噪声,对字符的位置、尺寸、姿态、线细度标准化来执行一个预处理;
对一个被检测到或预处理的字符模式,判别一个字符模式是否带有一个复杂删除线图象;
当判别该字符不是带有复杂删除线图象的字符时,就判别该字符是一个没有删除线图象的正常字符模式,还是一个带有一个只包含一个指示字符删除的水平线图象的简单删除线图象的字符;和
标识这个没有删除线图象的正常字符。
39.一种模式识别方法,包括下列步骤:
输入一个图象,通过只从输入图像的表单数据中检测一个字符部分并使每个字符与其它字符分离来从该输入图象中检测一个字符模式,并通过去除噪声,对字符的位置、尺寸、姿态、线细度标准化来执行一个预处理;
对一个被检测到或预处理的字符模式,判别一个字符模式是否带有一个复杂删除线图象字符;
当该字符模式不是带有一个复杂删除线图象的字符时,对被检测到或预处理的字符模式用水平方向相连投影计算一个象元数直方图,在所述投影中,在一个对象水平扫描线上和在对象水平扫描线上方和下方的预定范围内的一条线上把黑象元相加;
根据象元直方图,确定一个有简单删除线图象的字符模式的候选者;
当从其中去掉删除线图象的有简单删除线图象的字符模式的候选者能够被标识为一个字符时,定义一个有简单删除线图象的字符模式,并且当从其中去除删除线图象的有简单删除线图象的字符模式的该候选者不能够被标识为一个字符时,定义一个正常字符;和
为所定义的正常字符标识字符。
40.根据权利要求39所述的模式识别方法,还包括:
确定该字符是否为一个有简单删除线图象的字符模式的候选者;
当该字符是一个有简单删除线图象的字符模式的候选者时,去掉该删除线;
确定已经从其中去掉删除线图象的有删除线图象的字符模式的候选者是否能够被标识为一个字符;
当该候选者能够被标识为一个字符时,定义一个有简单删除线图象的字符模式的候选者;
当该候选者不能够被识别为一个字符时,定义一个正常字符;
在标识正常字符时,确定所定义的正常字符是否能够被识别为一个字符;
当该正常字符不能够被标识为一个字符时,输出一个拒绝代码;
当该正常字符能够被标识为一个字符时,输出一个字符类型代码;和
当该字符带有删除线时,输出拒绝代码。
41.一种模式识别方法,包括下列步骤:
从一个输入图象中抽取一个处理对象的一个状态,其中所述抽取步骤还包括下列步骤:
从输入图象中抽取一个具有预定面积的联结模式作为一个字符的候选者;
从多个字符候选者中抽取一些相邻的字符,以用作一个字符串的候选者;
从输入图象中抽取一些分格线;
抽取四条分格线的一个模式,以用作包围一个区的字符框;其中所述抽取步骤还包括:
根据分格线的联结状态和字符框的尺寸,给字符框指定一个单字符框、块字符框、自由间距字符框、规则表和不规则表中的一个属性;
抽取一个接触字符框的字符;
分析输入图象的一个模糊状态;
分析输入图象的一个变形状态;
抽取输入图象的一个校正状态;
对处于第一状态的处理对象,执行一个专门针对第一状态的模式识别过程;和
对处于第二状态的处理对象,执行一个专门针对第二状态的模式识别过程;其中
从输入图像提取的状态指的是:在其中写字符的格式,包括单字符框、自由间距框、表格中的至少一个;字符及其框之间的关系;字符的模糊度;字符的变形;使用删除线的字符的删除。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00173096A JP3345246B2 (ja) | 1996-01-09 | 1996-01-09 | 文字認識装置及び文字認識方法 |
JP001730/96 | 1996-01-09 | ||
JP001730/1996 | 1996-01-09 | ||
JP255217/1996 | 1996-09-27 | ||
JP25521796 | 1996-09-27 | ||
JP255217/96 | 1996-09-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1162795A CN1162795A (zh) | 1997-10-22 |
CN1156791C true CN1156791C (zh) | 2004-07-07 |
Family
ID=26335003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB971020116A Expired - Fee Related CN1156791C (zh) | 1996-01-09 | 1997-01-08 | 模式识别设备与方法 |
Country Status (3)
Country | Link |
---|---|
US (4) | US6104833A (zh) |
KR (1) | KR100248917B1 (zh) |
CN (1) | CN1156791C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978782A (zh) * | 2014-04-11 | 2015-10-14 | 南京视察者信息技术有限公司 | 基于触屏技术的客流分析方法 |
Families Citing this family (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6519046B1 (en) * | 1997-03-17 | 2003-02-11 | Fuji Photo Film Co., Ltd. | Printing method and system for making a print from a photo picture frame and a graphic image written by a user |
JPH1196301A (ja) * | 1997-09-22 | 1999-04-09 | Hitachi Ltd | 文字認識装置 |
JP3584458B2 (ja) * | 1997-10-31 | 2004-11-04 | ソニー株式会社 | パターン認識装置およびパターン認識方法 |
JP3599180B2 (ja) * | 1998-12-15 | 2004-12-08 | 松下電器産業株式会社 | 検索方法、検索装置および記録媒体 |
CN1237476C (zh) * | 1999-02-19 | 2006-01-18 | 株式会社理光 | 图形检测方法、图像处理控制方法、图像处理装置 |
JP4412762B2 (ja) * | 1999-05-31 | 2010-02-10 | 富士通株式会社 | 点線抽出方法、その装置及びその記録媒体 |
US6563502B1 (en) | 1999-08-19 | 2003-05-13 | Adobe Systems Incorporated | Device dependent rendering |
JP3604993B2 (ja) * | 2000-03-16 | 2004-12-22 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法 |
US7221795B2 (en) * | 2000-06-02 | 2007-05-22 | Japan Science And Technology Corporation | Document processing method, recording medium having recorded thereon document processing program, document processing program, document processing apparatus, and character-input document |
US7027649B1 (en) * | 2000-11-27 | 2006-04-11 | Intel Corporation | Computing the Euler number of a binary image |
US7598955B1 (en) | 2000-12-15 | 2009-10-06 | Adobe Systems Incorporated | Hinted stem placement on high-resolution pixel grid |
US6681060B2 (en) | 2001-03-23 | 2004-01-20 | Intel Corporation | Image retrieval using distance measure |
JP4846924B2 (ja) * | 2001-05-31 | 2011-12-28 | キヤノン株式会社 | パターン認識装置 |
JP2004530992A (ja) * | 2001-06-15 | 2004-10-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオ情報における自動的な自然コンテンツ検出 |
JP4100885B2 (ja) * | 2001-07-11 | 2008-06-11 | キヤノン株式会社 | 帳票認識装置、方法、プログラムおよび記憶媒体 |
JP3863775B2 (ja) * | 2001-12-25 | 2006-12-27 | 株式会社九州エレクトロニクスシステム | 画像情報圧縮方法及び画像情報圧縮装置並びに画像情報圧縮プログラム |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
US7016529B2 (en) * | 2002-03-15 | 2006-03-21 | Microsoft Corporation | System and method facilitating pattern recognition |
JP2004145072A (ja) * | 2002-10-25 | 2004-05-20 | Riso Kagaku Corp | 手書き文字フォント作成装置及び手書き文字フォント作成プログラム |
US7227993B2 (en) * | 2003-01-27 | 2007-06-05 | Microsoft Corporation | Learning-based system and process for synthesizing cursive handwriting |
US20040146200A1 (en) * | 2003-01-29 | 2004-07-29 | Lockheed Martin Corporation | Segmenting touching characters in an optical character recognition system to provide multiple segmentations |
US20040151377A1 (en) * | 2003-02-04 | 2004-08-05 | Boose Molly L. | Apparatus and methods for converting network drawings from raster format to vector format |
US7606915B1 (en) | 2003-02-25 | 2009-10-20 | Microsoft Corporation | Prevention of unauthorized scripts |
US7624277B1 (en) * | 2003-02-25 | 2009-11-24 | Microsoft Corporation | Content alteration for prevention of unauthorized scripts |
JP4144395B2 (ja) * | 2003-03-25 | 2008-09-03 | ブラザー工業株式会社 | 画像処理装置およびそれを備えた画像形成装置 |
US7002597B2 (en) * | 2003-05-16 | 2006-02-21 | Adobe Systems Incorporated | Dynamic selection of anti-aliasing procedures |
US7006107B2 (en) * | 2003-05-16 | 2006-02-28 | Adobe Systems Incorporated | Anisotropic anti-aliasing |
JP2004348591A (ja) * | 2003-05-23 | 2004-12-09 | Canon Inc | 文書検索方法及び装置 |
CN1303563C (zh) * | 2003-09-29 | 2007-03-07 | 摩托罗拉公司 | 用于压缩手写字符模板的方法和系统 |
CN100433050C (zh) * | 2004-01-08 | 2008-11-12 | 日本电气株式会社 | 移动通信系统、移动终端和固定站设备,字符识别设备、方法和程序 |
US7602995B2 (en) * | 2004-02-10 | 2009-10-13 | Ricoh Company, Ltd. | Correcting image distortion caused by scanning |
JP3861157B2 (ja) | 2004-02-27 | 2006-12-20 | 国立大学法人広島大学 | 参照データ最適化装置とパターン認識システム |
JP2005251115A (ja) * | 2004-03-08 | 2005-09-15 | Shogakukan Inc | 連想検索システムおよび連想検索方法 |
US7580039B2 (en) * | 2004-03-31 | 2009-08-25 | Adobe Systems Incorporated | Glyph outline adjustment while rendering |
US7333110B2 (en) * | 2004-03-31 | 2008-02-19 | Adobe Systems Incorporated | Adjusted stroke rendering |
US7639258B1 (en) | 2004-03-31 | 2009-12-29 | Adobe Systems Incorporated | Winding order test for digital fonts |
US7602390B2 (en) * | 2004-03-31 | 2009-10-13 | Adobe Systems Incorporated | Edge detection based stroke adjustment |
US7719536B2 (en) * | 2004-03-31 | 2010-05-18 | Adobe Systems Incorporated | Glyph adjustment in high resolution raster while rendering |
US8249309B2 (en) * | 2004-04-02 | 2012-08-21 | K-Nfb Reading Technology, Inc. | Image evaluation for reading mode in a reading machine |
JP4398777B2 (ja) * | 2004-04-28 | 2010-01-13 | 株式会社東芝 | 時系列データ分析装置および方法 |
US7561738B2 (en) * | 2004-09-22 | 2009-07-14 | Microsoft Corporation | Symbol grouping and recognition in expression recognition |
US20060075392A1 (en) * | 2004-10-05 | 2006-04-06 | International Business Machines Corporation | System and method for reverse engineering of pattern string validation scripts |
JP3962748B2 (ja) * | 2005-03-28 | 2007-08-22 | キヤノン株式会社 | 情報処理装置及びその方法 |
US7724981B2 (en) * | 2005-07-21 | 2010-05-25 | Ancestry.Com Operations Inc. | Adaptive contrast control systems and methods |
JP4920928B2 (ja) * | 2005-08-08 | 2012-04-18 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
US20070127824A1 (en) * | 2005-12-07 | 2007-06-07 | Trw Automotive U.S. Llc | Method and apparatus for classifying a vehicle occupant via a non-parametric learning algorithm |
US7583841B2 (en) * | 2005-12-21 | 2009-09-01 | Microsoft Corporation | Table detection in ink notes |
US7664325B2 (en) * | 2005-12-21 | 2010-02-16 | Microsoft Corporation | Framework for detecting a structured handwritten object |
US7734092B2 (en) * | 2006-03-07 | 2010-06-08 | Ancestry.Com Operations Inc. | Multiple image input for optical character recognition processing systems and methods |
US7756340B2 (en) * | 2006-07-11 | 2010-07-13 | Pegasus Imaging Corporation | Method and apparatus for identifying and/or removing combs from scanned images |
JP4443576B2 (ja) * | 2007-01-18 | 2010-03-31 | 富士通株式会社 | パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法 |
US7873215B2 (en) * | 2007-06-27 | 2011-01-18 | Seiko Epson Corporation | Precise identification of text pixels from scanned document images |
JP2009070226A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | マッチング装置 |
EP2223265A1 (en) * | 2007-11-20 | 2010-09-01 | Lumex As | A method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character |
US8634645B2 (en) * | 2008-03-28 | 2014-01-21 | Smart Technologies Ulc | Method and tool for recognizing a hand-drawn table |
US7471826B1 (en) | 2008-03-31 | 2008-12-30 | International Business Machines Corporation | Character segmentation by slices |
US7809195B1 (en) * | 2008-09-18 | 2010-10-05 | Ernest Greene | Encoding system providing discrimination, classification, and recognition of shapes and patterns |
US8239435B2 (en) * | 2008-11-04 | 2012-08-07 | Seiko Epson Corporation | Thresholding of image diffences maps using first and second two-dimenstional array wherein respective euler number is determined |
JP5343617B2 (ja) * | 2009-02-25 | 2013-11-13 | 富士通株式会社 | 文字認識プログラム、文字認識方法および文字認識装置 |
KR20100120753A (ko) * | 2009-05-07 | 2010-11-17 | (주)실리콘화일 | 문자인식을 위한 이미지 센서 및 이미지 센싱 방법 |
JP5586917B2 (ja) * | 2009-10-27 | 2014-09-10 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
WO2011079432A1 (en) * | 2009-12-29 | 2011-07-07 | Nokia Corporation | Method and apparatus for generating a text image |
KR101214772B1 (ko) * | 2010-02-26 | 2012-12-21 | 삼성전자주식회사 | 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법 |
JP5591578B2 (ja) * | 2010-04-19 | 2014-09-17 | 日本電産サンキョー株式会社 | 文字列認識装置および文字列認識方法 |
US9285983B2 (en) * | 2010-06-14 | 2016-03-15 | Amx Llc | Gesture recognition using neural networks |
US8737702B2 (en) * | 2010-07-23 | 2014-05-27 | International Business Machines Corporation | Systems and methods for automated extraction of measurement information in medical videos |
CN102375988B (zh) * | 2010-08-17 | 2013-12-25 | 富士通株式会社 | 文件图像处理方法和设备 |
US8947736B2 (en) * | 2010-11-15 | 2015-02-03 | Konica Minolta Laboratory U.S.A., Inc. | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern |
US9319556B2 (en) | 2011-08-31 | 2016-04-19 | Konica Minolta Laboratory U.S.A., Inc. | Method and apparatus for authenticating printed documents that contains both dark and halftone text |
JP6008076B2 (ja) * | 2011-10-13 | 2016-10-19 | セイコーエプソン株式会社 | プロジェクター及び画像描画方法 |
KR102073024B1 (ko) * | 2012-11-30 | 2020-02-04 | 삼성전자주식회사 | 사용자 단말에서 메모 편집장치 및 방법 |
JP2014127188A (ja) * | 2012-12-27 | 2014-07-07 | Toshiba Corp | 整形装置及び方法 |
JP2014215877A (ja) * | 2013-04-26 | 2014-11-17 | 株式会社デンソー | 物体検出装置 |
KR101532652B1 (ko) * | 2013-05-22 | 2015-06-30 | 재단법인대구경북과학기술원 | 영상 인식 계산 장치 및 그 방법 |
EP2818948B1 (en) * | 2013-06-27 | 2016-11-16 | ABB Schweiz AG | Method and data presenting device for assisting a remote user to provide instructions |
KR101526490B1 (ko) * | 2013-10-25 | 2015-06-08 | 경희대학교 산학협력단 | 클라우드 컴퓨팅에서의 효율적 자원관리를 위한 시각 데이터 가공장치 및 그 방법 |
KR20150049700A (ko) * | 2013-10-30 | 2015-05-08 | 삼성전자주식회사 | 전자 장치에서 입력을 제어하는 방법 및 장치 |
US9928572B1 (en) | 2013-12-20 | 2018-03-27 | Amazon Technologies, Inc. | Label orientation |
JP6045752B2 (ja) * | 2014-05-14 | 2016-12-14 | 共同印刷株式会社 | 二次元コード、二次元コードの解析システム及び二次元コードの作成システム |
CN104156694B (zh) * | 2014-07-18 | 2019-03-19 | 百度在线网络技术(北京)有限公司 | 一种用于识别图像中的目标对象的方法与设备 |
JP2016153933A (ja) * | 2015-02-20 | 2016-08-25 | 株式会社リコー | 画像処理装置、画像処理システム、画像処理方法、プログラム、及び記録媒体 |
JP6390501B2 (ja) * | 2015-04-15 | 2018-09-19 | 京セラドキュメントソリューションズ株式会社 | 学習支援装置および学習支援方法 |
JP6705237B2 (ja) * | 2016-03-18 | 2020-06-03 | 株式会社リコー | 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム |
JP2017215807A (ja) * | 2016-05-31 | 2017-12-07 | 富士ゼロックス株式会社 | プログラムおよび情報処理装置 |
US10372980B2 (en) * | 2016-11-16 | 2019-08-06 | Switch, Inc. | Electronic form identification using spatial information |
JP2018112839A (ja) * | 2017-01-10 | 2018-07-19 | 富士通株式会社 | 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法 |
US11004205B2 (en) * | 2017-04-18 | 2021-05-11 | Texas Instruments Incorporated | Hardware accelerator for histogram of oriented gradients computation |
JP2019139592A (ja) * | 2018-02-13 | 2019-08-22 | シャープ株式会社 | 文字認識装置、文字認識方法 |
US10565443B2 (en) * | 2018-02-16 | 2020-02-18 | Wipro Limited | Method and system for determining structural blocks of a document |
GB2571530B (en) * | 2018-02-28 | 2020-09-23 | Canon Europa Nv | An image processing method and an image processing system |
JP7259491B2 (ja) * | 2019-04-01 | 2023-04-18 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
WO2021054850A1 (ru) * | 2019-09-17 | 2021-03-25 | Публичное Акционерное Общество "Сбербанк России" | Способ и система интеллектуальной обработки документа |
JP7235134B2 (ja) | 2019-11-08 | 2023-03-08 | 日本電気株式会社 | 物体検知装置、学習方法、及び、プログラム |
CN110968667B (zh) * | 2019-11-27 | 2023-04-18 | 广西大学 | 一种基于文本状态特征的期刊文献表格抽取方法 |
JP7484198B2 (ja) * | 2020-02-03 | 2024-05-16 | 富士フイルムビジネスイノベーション株式会社 | 文書処理装置およびプログラム |
US11961316B2 (en) * | 2022-05-10 | 2024-04-16 | Capital One Services, Llc | Text extraction using optical character recognition |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057477A (ja) | 1983-09-08 | 1985-04-03 | Fuji Xerox Co Ltd | パタ−ン認識装置 |
US5253303A (en) * | 1988-02-15 | 1993-10-12 | Nec Corporation | Character recognizing method and apparatus thereof |
EP0381773B1 (en) * | 1988-07-20 | 1998-06-10 | Fujitsu Limited | Character recognition apparatus |
JPH0772906B2 (ja) * | 1991-07-10 | 1995-08-02 | 富士ゼロックス株式会社 | 文書認識装置 |
DE69232493T2 (de) * | 1991-10-21 | 2003-01-09 | Canon K.K., Tokio/Tokyo | Verfahren und Gerät zur Zeichenerkennung |
CA2078423C (en) * | 1991-11-19 | 1997-01-14 | Per-Kristian Halvorsen | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information |
DE69328640T2 (de) * | 1992-02-07 | 2000-09-28 | Canon K.K., Tokio/Tokyo | Verfahren und Einrichtung zur Mustererkennung |
US5481621A (en) * | 1992-05-28 | 1996-01-02 | Matsushita Electric Industrial Co., Ltd. | Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns |
JP2951814B2 (ja) * | 1993-02-25 | 1999-09-20 | 富士通株式会社 | 画像抽出方式 |
JP3250317B2 (ja) * | 1993-04-20 | 2002-01-28 | 富士通株式会社 | 文字認識装置 |
US5761340A (en) * | 1993-04-28 | 1998-06-02 | Casio Computer Co., Ltd. | Data editing method and system for a pen type input device |
JP2933801B2 (ja) * | 1993-06-11 | 1999-08-16 | 富士通株式会社 | 文字の切り出し方法及びその装置 |
JP3269889B2 (ja) | 1993-09-03 | 2002-04-02 | 沖電気工業株式会社 | 光学式文字読取システム |
JPH07160827A (ja) * | 1993-12-09 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 手書きストローク編集装置及び方法 |
US5745599A (en) * | 1994-01-19 | 1998-04-28 | Nippon Telegraph And Telephone Corporation | Character recognition method |
JP3453422B2 (ja) * | 1994-02-10 | 2003-10-06 | キヤノン株式会社 | 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置 |
US5470313A (en) * | 1994-02-24 | 1995-11-28 | Cardiovascular Dynamics, Inc. | Variable diameter balloon dilatation catheter |
JP3400151B2 (ja) * | 1994-12-08 | 2003-04-28 | 株式会社東芝 | 文字列領域抽出装置および方法 |
JPH08221576A (ja) * | 1994-12-12 | 1996-08-30 | Toshiba Corp | 文字列における直線検出方式、直線除去方式および宛名領域判別装置 |
JP3437296B2 (ja) * | 1994-12-16 | 2003-08-18 | 富士通株式会社 | 文字列高速抽出装置 |
JP2817646B2 (ja) * | 1995-02-01 | 1998-10-30 | 日本電気株式会社 | 文書編集装置 |
US6512848B2 (en) * | 1996-11-18 | 2003-01-28 | Canon Kabushiki Kaisha | Page analysis system |
-
1997
- 1997-01-03 US US08/778,621 patent/US6104833A/en not_active Expired - Lifetime
- 1997-01-08 CN CNB971020116A patent/CN1156791C/zh not_active Expired - Fee Related
- 1997-01-09 KR KR1019970000322A patent/KR100248917B1/ko not_active IP Right Cessation
-
1999
- 1999-07-29 US US09/363,020 patent/US6335986B1/en not_active Expired - Lifetime
-
2001
- 2001-12-04 US US10/000,525 patent/US6850645B2/en not_active Expired - Fee Related
- 2001-12-04 US US10/000,506 patent/US6687401B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978782A (zh) * | 2014-04-11 | 2015-10-14 | 南京视察者信息技术有限公司 | 基于触屏技术的客流分析方法 |
CN104978782B (zh) * | 2014-04-11 | 2017-09-19 | 南京视察者图像识别科技有限公司 | 基于触屏技术的客流分析方法 |
Also Published As
Publication number | Publication date |
---|---|
US6104833A (en) | 2000-08-15 |
CN1162795A (zh) | 1997-10-22 |
KR19980023917A (ko) | 1998-07-06 |
US20020061135A1 (en) | 2002-05-23 |
US6335986B1 (en) | 2002-01-01 |
US6850645B2 (en) | 2005-02-01 |
KR100248917B1 (ko) | 2000-03-15 |
US20030113016A1 (en) | 2003-06-19 |
US6687401B2 (en) | 2004-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1156791C (zh) | 模式识别设备与方法 | |
CN1269068C (zh) | 标题抽取设备及标题抽取方法 | |
CN1282937C (zh) | 数据媒体处理装置及数据媒体处理方法 | |
CN1191536C (zh) | 手形手势识别装置及识别方法 | |
CN1161687C (zh) | 手写体匹配技术 | |
CN1159673C (zh) | 从图像中提取管理信息的设备与方法 | |
CN1215433C (zh) | 联机文字识别装置及方法 | |
CN100347723C (zh) | 基于几何代价与语义-识别代价结合的脱机手写汉字字符的切分方法 | |
CN1136516C (zh) | 图案抽取装置和方法 | |
CN1213592C (zh) | 采用自适应二值化的图象处理方法和设备 | |
CN1324521C (zh) | 用于识别图象字符的预处理设备和方法 | |
CN1171162C (zh) | 基于字符分类检索字符串的装置和方法 | |
CN100347719C (zh) | 基于密度图模型的指纹识别方法 | |
CN1225484A (zh) | 地址识别设备和方法 | |
CN1627315A (zh) | 目标检测 | |
CN100348050C (zh) | 目标检测 | |
CN1041773C (zh) | 由字符图象直方图0-1图形表示识别字符的方法和装置 | |
CN1266643C (zh) | 基于阿拉伯字符集的印刷体字符识别方法 | |
CN1777887A (zh) | 用于创建递归可缩放模板实例的数据表中的系统和方法 | |
CN1020054C (zh) | 光照输入手写印刷体汉字识别系统 | |
CN101030254A (zh) | 数据媒体处理装置及数据媒体处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040707 Termination date: 20140108 |