CN1273401A - 文字识别装置 - Google Patents

文字识别装置 Download PDF

Info

Publication number
CN1273401A
CN1273401A CN99123281A CN99123281A CN1273401A CN 1273401 A CN1273401 A CN 1273401A CN 99123281 A CN99123281 A CN 99123281A CN 99123281 A CN99123281 A CN 99123281A CN 1273401 A CN1273401 A CN 1273401A
Authority
CN
China
Prior art keywords
literal
character
mentioned
dictionary
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99123281A
Other languages
English (en)
Other versions
CN1181446C (zh
Inventor
伊崎保直
镰田英夫
坂根俊司
井出克美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1273401A publication Critical patent/CN1273401A/zh
Application granted granted Critical
Publication of CN1181446C publication Critical patent/CN1181446C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明提供可以从文字识别难的文字图像中正确并且高速地识别文字的文字识别装置。包括:文字区域分离部分,推定被输入的文字图像的文字宽度,分离出与该文字宽度相当的长度的文字区域;特征抽出部分,抽出被分离的文字区域内的文字图像的特征;标准图案词典,由单个文字标准图案词典和多文字标准图案词典的双方组成;词典核对部分,将用特征抽出部分抽出的文字图案的特征,和词典中的单个文字以及文字列的特征对照,抽出文字图案表示的文字或者文字列的候补。

Description

文字识别装置
本发明涉及将被输入的文字图像作为文字进行识别的文字识别装置。
以往,在将被输入的文字图像作为文字进行识别的文字识别装置的领域中,例如OCR(光学式文字读取装置)或者组合图像扫描仪和OCR软件的文字识别装置等在应用领域广泛使用。在以往的OCR用票单中,使用印刷有每单个文字的文字填写框的票单,在使用汉字的系统中文字填写框的大小也采用容易填入汉字那样大小的文字填写框。由此具有对于OCR来说容易正确地识别被填入的文字,对于填写者来说促使其在填写文字时不要和相邻的文字接触的效果。
但是,随着OCR利用领域的进一步扩展,对于用一般所使用的通常的票单那样的小的票单不受文字框限制地被填入的文字列,即,在通常的传票等上以不规则的文字间隔、不规则的填入方法填入的相邻文字之间相互接触那样的低品质的手写文字列,也要求有可以以实用的识别精度识别的文字识别装置。
另外,在印刷的文字列的情况下,要使用如OCR-B或者多字体等那样只用多个特定的字体精心印刷的OCR票单,但对于被印刷的文字列,也希望一种文字识别装置,其可以从用不特定的印字装置以多样的文字间距印刷的,有多种变形的文字列,例如用文字间距窄的印字装置或者用比例间距印刷的文字列,或者半角文字和全角文字混合存在的文字列等中以实用的识别精度分离文字列。
在以往的文字识别装置中的文字分离方式,特别在从自由间距的文字列,即未设定文字框的字段中分离出文字的文字分离方式中,采用对于孤立的黑象素的连接区域求出文字列的高度信息,从其高度信息中求出文字的间距信息,用该值合并或者分离相邻的文字,从而分离出应该作为识别对象的单个文字的方式。或者采用将1行、1字段的文字列投影到与行方向、字段方向垂直的方向上,从文字列的高度信息中求文字的间距信息,用该值从投影直方图中分离出文字位置的方式。当其分离位置不能确定为一种的情况下也可以求多种的分离位置。
通常,收集根据预先由不特定的多位书写者确定的笔迹填入的文字,从这些文字中抽出依据识别方式的文字图案的特征用统计的方法等制成标准图案。另外,标准图案,也有从被收集的文字中制成平均图案的。在手写文字的情况下,因为因书写者不同而产生大的文字变形所以对于各种字制成多种标准图案。通常将一种标准图案称为模板,将收集了多种标准图案的词典称为多模板词典。作为词典核对方法,采用从由输入票单中分离出的单个文字中抽出该文字图案的特征,在该特征和标准图案词典的模板的特征之间进行近似度计算或者距离计算,将具有最大近似度的类型或者具有最小的距离的模板的类型作为识别结果求出的方法。作为候补文字列,按照距离小的顺序求例如将8位作为候补文字列。
对于印刷文字也可以使用同样的方法求候补文字列。当有多种候补的情况下可以采用用图案之间的类似度评价值,或者用知识处理等的语言处理确定最佳的分离候补的方法。
一般,当识别在通常的传票上用如手写输入那样的自由间距填入的文字列,或者用非特定的印字装置印刷的文字列的情况下,多是相邻的文字之间接触,另外在印刷文字列的情况下有半角文字和全角文字混合存在的情况,由于相邻的文字之间大多接触,所以在检出每一个文字识别的方法中,很难判断到什么范围为单个文字,实现在实用中可以容忍的识别精度很难。还有由平假名、片假名,以及在汉字中有偏(汉字的左边)和旁(汉字的左边)原本就分离出的文字区域组成的文字,如果不能正确地识别这些文字区域也就连是用哪种文字写入的都不能判断。
在印刷文字列的文字分离中,作为从1行文字列推定各个文字的间距的方法提出了以下的各种方法。
第1种方法,将1行文字列的黑象素投影在行方向上求构成行的文字的平均高度。接着,将文字列的黑象素投影在与行方向垂直的方向上将黑象素的行方向的频度作成直方图表示,从其直方图中求频度为0的位置,即文字列被间断切成的位置,或者应该切断的直方图极小点,即接触文字或者重叠文字的切断候补位置。根据该切断候补位置,将根据前面求出的文字列的平均高度准确看出全角文字、半角文字列的位置作为文字分离位置。
第两种方法,将1行文字列的黑象素投影在与行方向垂直的方向上将黑象素的行方向的频度制成直方图表示,从该直方图中求频度为0的位置,或者直方图的极小点,对于该文字列求多种被推定为文字分离位置的位置。多种文字分离位置中的某一个是最接近的文字分离位置的判定,靠文字列的类似度评价和识别结果的判断确定。
第3种方法,对1行文字列求黑象素的连接区域,对于连接区域的排列小的区域之间合并,大的区域被分成多个段确定单个文字的区域进行文字分离。此时的小区域,大区域的判断根据文字列的高度进行。
但是,不论上述哪种方法都分别存在以下的问题。即,在第1种方法中,当1行的文字列全部由全角文字构成的情况下,因为一般认为全角文字的文字宽度和文字高度全部相等,所以可以从平均文字高度正确推定文字宽度,因而,可以正确地分离出每单个文字,但当半角文字和全角文字混合存在的情况下,例如在全角的假名汉字混杂的文字列中混入半角的英文数字或者片假名的情况下,文字位置只偏移半角,半角两个文字被识别为一个文字,不能求得正确的文字分离位置。
另外,在第两种方法中,因为对1行的文字列可以得到多种分离结果所以在1行的识别处理中需要多行的处理时间,又因为在接触文字很多的情况下等会出现非常多的分离结果,所以存在识别处理速度显著降低的问题。
另外,在第3种方法中,对于接触的文字列部分的分离识别精度上存在很多的问题,进行正确的文字识别很困难。
鉴于上述的问题,本发明的目的在于,提供一种即使是从文字识别难的文字图像中也可以正确并且高速地识别文字的文字识别装置。
实现上述目的的本发明的文字识别装置,包括以下部分:
文字区域分离部分,从被输入的文字图像中推定文字宽度从该文字图像中分离出与文字宽度相当的长度的文字区域;
特征抽出部分,抽出被上述文字区域分离部分分离出的文字区域内的文字图案的特征;
标准图案词典,由记录了标准文字的单个文字的各种特征的单个文字标准图案词典和记录了排列规定数量的标准文字的文字列的各种特征的多文字标准词典两方组成;
词典核对部分,把在上述特征抽出部分中抽出的,文字区域内的文字图案的特征,和被记录在构成上述标准图案词典的上述单个文字图案词典以及上述多文字标准图案词典中的单个文字以及文字列的各种特征对照,抽出该文字区域内的文字图案表示的文字或者文字列的候补。
在此,本发明的文字识别装置最好具备验证部分,当由上述词典核对部分,抽出把上述文字区域内的文字图案的特征和被记录在上述多文字标准图案词典中的文字列的特征对照的结果文字列的候补的情况下,在上述特征抽出部分中,抽出把抽出文字列的候补的文字区域进一步分割成和构成其文字列的文字数相同的数量的形成的各分割区域的各自的文字图案的特征,在上述词典核对部分中,把上述分割区域各自的文字图案的特征,和被记录在上述单个文字标准图案词典中的单个文字的各种特征对照抽出与上述分割区域的排列对应的文字列的候补,检验该文字列的候补,是否与用上述多文字标准图案词典抽出的文字列的候补一致。
另外,上述文字区域分离部分,最好在每偏移和上述规定数相同地分割文字宽度时的一分割长度,从上述文字图像中分离出与上述文字宽度相当的长度的文字区域。
另外,上述词典核对部分,最好是对于被上述文字区域分离部分分离出的文字区域在各自抽出文字或者文字列的候补的同时,综合被抽出的文字或者文字列的候补后抽出文字排列的候补。
进而,上述词典核对部分,最好是当残留有不能进行文字识别的不能识别文字的区域的情况下,将上述不能识别文字的区域的文字图案的特征和被记录在上述单个文字标准图案词典中的单个文字的各种特征对照抽出文字候补。上述词典最好是上述两情况之一。
图1是运用本发明的文字识别装置的计算机的外观图(a)以及内部构成图(b)。
图2是本发明的文字识别装置的实施例1的功能方框图。
图3是展示本发明的文字识别装置的实施例2的概略构成图。
图4是说明被设置在实施例2的文字识别装置中的验证部分的动作的流程图。
图5是实施例2中的检验过程的说明图。
图6是本发明的文字识别装置的实施例3中的文字分离方式的说明图。
图7是展示实施例3中的文字分离方式的另一处理例子的图。
图8是展示实施例3中的文字分离方式的处理例子的图。
图9是实施例4的不能识别文字的区域的处理的流程图。
以下,说明本发明的实施例。
图1是运用本发明的文字识别装置的计算机的外观图(a)以及内部构成图(b)。
如图1(a)以及图1(b)所示,该计算机60,由系统总线70连接CPU61、存储器62、显示装置63、打印机64、CD-ROM驱动器65、磁盘66、鼠标67、键盘68,以及图像扫描器69等构成,在该计算机60中形成有本发明的文字识别装置。
由图像扫描装置69向该计算机60输入文字图像进行文字识别。
图2,是本发明的文字识别装置的实施例1中的功能方框图。
如图2所示,该实施例1的文字识别装置100包括:文字区域分离部分11,从被输入的文字图像10中推定文字宽度并从文字图像10中分离出与文字宽度相当的长度的文字区域;特征抽出部分12,抽出被文字区域分离部分11分离出的文字区域内的文字图案的特征;标准图案词典14,由记录有标准文字的一个文字的各种特征的单个文字标准图案词典14-1和记录有排列规定数量标准文字的文字列的各自的特征的多文字标准图案词典14-2两方面组成;词典核对部分13,把在特征抽出部分12中抽出的文字区域内的文字图案的特征,和被记录在构成标准图案词典14的单个文字标准图案词典14-1以及多文字标准图案词典14-2中的单个文字以及文字列各自的特征对照并抽出该文字区域内的文字图案表示的文字或者文字列的候补;候补文字输出部分15,存储被抽出的文字或者文字列的候补并输出到外部。
以下,说明本实施例1的文字识别装置100的动作。
例如,当用图像扫描器等从票单等取得的文字图像10被输入到该文字识别装置100时,由文字区域分离部分11求文字的平均高度,据此推定文字宽度。文字的平均高度,通过将文字列的黑象素投影到行方向上求得,以日文的全角文字的宽度和高度大致相等地被填入的情况居多这一点为前提可以从文字的平均高度推定文字间距,即文字宽度。用该文字宽度可以检测出全角文字。
半角文字因为是全角文字的宽度的一半所以可以用文字的平均高度的一半检测半角文字的一个字。
对于相邻的文字之间接触的接触文字,当文字区域的宽度是上述文字宽度的两个文字宽度时,通过将文字区域强制地一分为二就可以作为两个文字检出。另外,当存在三个文字宽度的情况下可以将文字区域强制地一分为三。
与这样得到的文字宽度相当的长度的文字区域被从文字图像10的左端顺序分离。文字宽度的推定以及文字区域的分离,不仅可以从文字图像10的左端开始,还可以根据需要从文字图像10的中间进行。
特征抽出部分12,抽出被分离出的文字区域内的文字图像的特征。文字图像的特征,例如,可以将1文字大小的矩形区域分割成纵8列横8行的8×8=64区域,用在垂直方向和水平方向上扫描计数黑象素的个数得到的投影分布函数表示。用这样的方法抽出的文字区域内的文字图案的特征,在词典核对部分13中,通过和被记录在单个文字标准图案词典14-1以及多文字标准图案词典14-2中的单个文字以及文字列的各自的特征对照求相互间的距离,按照距离小的顺序求例如10个候补。
在此,标准图案词典14(参照图2),由从正常的单个文字的文字区域中经统计制成的单个文字标准图案词典14-1,和记录了排列规定数量,例如两个标准文字的文字列各自的特征的多文字标准图案词典14-2这2部分构成。
这样,在本实施例中作为标准图案词典14具备单个文字标准图案词典14-1以及多文字标准图案词典14-2这两种词典是因为,当在全角文字列中存在半角数字时,因为文字区域分离部分11,将半角两个文字作为一个文字检出,所以将该半角两个文字作为一个图案进行词典对照的缘故。
在标准图案词典14中,叙述了标准图案和其类别,即表示制成其标准图案的文字类别的文字代码。在单个文字标准图案词典的情况下,叙述了例如“0”那样的一个文字代码,在多文字标准图案词典的情况下,叙述了例如“00”那样的两个文字代码的排列。
通过使用在词典核对部分13中的单个文字标准图案词典进行对照得到的结果,因为被判断为是可以作为正常单个文字检出的文字区域,所以直接将一个文字代码作为候补输出。通过使用在词典核对部分13中的多文字标准图案词典进行对照得到的结果,将多文字代码的排列作为候补输出。
在候补文字输出部分15中,整理从词典核对部分13输出的文字代码制成最终候补文字列,单个文字的候补直接作为一个文字的代码输出到外部,多文字的候补作为多文字代码的排列输出到外部。
这样,在本实施例的文字识别装置100中,因为并不着眼于整个文字行而是着眼于局部的文字列部分,而是通过使用由单个文字标准图案词典和多文字标准图案词典双方组成的标准图案词典进行对照,因此即使从包含半角文字或者文字之间接触的低品质的文字列中,也可以正确地分离文字,所以文字识别精度提高,而且由于不需要抽出很多的分离候补由此还可以缩短识别处理时间。
以下,说明本发明的文字识别装置的实施例2。
图3,是展示本发明的文字识别装置的实施例2的概略构成图。
如图3所示,本实施例2的文字识别装置200,除了具备和图2所示的实施例1的文字识别装置100相同的文字区域分离部分11、特征抽出部分12、由单个文字标准图案词典14-1和多文字标准图案词典14-2的双方组成的标准图案词典14、词典核对部分13,以及候补文字输出部分15之外,追加了验证部分16。
该验证部分16,在由词典核对部分13,抽出将文字区域内的文字图案的特征和被记录在多个文字标准图案词典14-2中的文字列的特征对照后的结果文字列的候补时,在特征抽出部分12中,抽出将抽出上述文字列的候补的文字区域进一步分割成和构成其文字列的文字数相同的数量的各分割区域中的各文字图案的特征,在词典核对部分13中,将分割区域的各文字图案的特征,和被记录在单个文字标准图案词典14-1中的单个文字的各种特征对照后抽出与分割区域的排列对应的文字列的候补,检验该文字列的候补,是否和用多文字标准图案词典14-2抽出的文字列的候补一致。
图4,是说明实施例2的文字识别装置中的验证部分的动作的流程图,图5,是说明实施例2中的检验的功能的说明图。
如图4所示,判定识别结果是否是多文字图案的识别结果(步骤S1),当判定结果是多文字图案的识别结果的情况下,即,是词典核对部分13,将文字区域内的文字图案的特征和被记录在多文字标准图案词典14-2中的文字列的特征对照的结果的情况下,在文字列的候补被抽出的情况下再次进行其文字区域的分离(步骤S2)。即,在特征抽出部分12中,抽出把抽出上述文字列的候补的文字区域进一步分割成和构成其文字列的文字数相同数量的各分割区域的各个文字图案的特征。
下面根据图5说明此前的处理过程,通过词典核对部分13(参照图3)的对照结果,当将多个文字,例如,“0”的两个文字作为一个图案20识别时,用文字区域分离部分11进行该文字区域的分离,在表示图案20的垂直方向的黑象素投影直方图的极小值位置进行分割。在此例子中因为是两个文字所以被二分割为图案20-1和图案20-2。在半角文字排列两个文字的情况下被二等分。
接着,进行被分割后的文字各自的识别(步骤S3)。即,词典核对部分13,把被分割后的各个文字图案20-1、20-2的特征,和被记录在单个文字标准图案词典14-1中的单个文字的各种特征对照后抽出与分割区域的排列对应的文字列的候补。
接着,进行识别结果的验证(步骤S4)。即,验证部分16,检验用单个文字标准图案词典14-1抽出的文字列的候补,是否和用多文字标准图案词典14-2抽出的文字列的候补一致。
验证部分16的验证结果(步骤S5),当用单个文字标准图案词典14-1抽出的文字列的候补,和用多文字标准图案14-2抽出的文字列的候补一致的情况下,判断被分割的文字准确,将这些图案20-1、20-2的文字代码21、22(参照图5)输出到候补文字输出部分15。在步骤S5中的判断结果,当两者不一致时,判断为分割是不准确的,将分割结果从候补中删除(步骤S6)。
因为在实施例2中进行这种验证,所以可以从图5所示的两个文字之间接触的情况下的文字图像中进行正确的文字识别。
以下,说明本发明的文字识别装置的实施例3。
图6,是本发明的文字识别装置的实施例3中的文字分离方式的说明图。
本实施例3的文字识别装置,具有和图2或者图3所示的实施例1或者实施例2的文字识别装置类似的构成,只是文字区域分离部分的功能和实施例1以及实施例2的文字识别装置不同。即,在实施例3的文字识别装置的文字区域分离部分中,从被输入的文字图像中在每偏移将文字宽度分割为2段时的一段长度时就分离出与文字宽度相当的长度的文字区域。
下面说明与从如图6所示的“1”到“0”的10个全角文字列相当的文字图像30中分离文字区域的情况。
首先,将文字图像30的黑象素在和文字列方向垂直的方向上,即在推定为横向书写文字列的文字图像30的情况下,投影在上下方向上制成直方图,求该直方图的极小位置,根据从高度H判断从文字图像的开头开始出现与H以及H/2相当的距离的极小值的位置的间隔推定W以及W/2。而后在该文字宽度W中在使间隔每偏移W/2时分离文字区域。
图6的情况下,首先将a1的文字区域“12”作为一个文字分离,进行特征抽出、词典核对,求候补。因为在该文字区域“12”的情况下距离多文字标准图案词典14-2(参照图3)中的“12”的标准图案最近,所以用和实施例2中同样的方法再次进行文字分离、特征抽出、词典核对,以及检验,文字区域“12”被分割成两个文字区域,得到“1”以及“2”这两个文字的候补。接着,只偏移W/2的a两个文字区域“23”被作为一个文字分离,进行和文字区域a1同样的识别处理,得到“2”以及“3”这两个文字的候补。同样地识别处理文字区域a3,a4,……,得到  “3”以及“4”这两个文字的候补、“4”以及“5”这两个文字的候补……。
词典核对部分13,对于如上述那样分离出的各文字区域,在抽出文字或者文字列的候补的同时综合被抽出文字或者文字列的候补后抽出文字列的候补并输出到候补文字列输出部分。
通过这样进行的文字分离,即使是全角文字和半角文字混合存在的文字图像也可以进行正确的文字识别。
另外,如果采用该文字分离方式,即使在下面那样的接触文字的情况下也可以进行正确的文字识别。
图7是展示实施例3中的文字分离方式的另一处理例子的图。
如图7所示,在该文字图像40中包含一个“1”,和相互接触的7个“0”。即使在该文字图像40的情况下,也和图6中一样,首先将a1的文字区域“10”作为一个文字分离,进行特征抽出、词典核对,求候补。。因为在该文字区域“10”的情况下与多文字标准图案词典14-2(参照图3)中的“10”的标准图案距离最近,所以用和在实施例2中同样的方法得到“1”以及“0”这两个文字的候补。接着,只偏移W/2的a两个文字区域“00”被作为一个文字分离,得到“0”以及“0”这两个文字的候补,同样地处理a3,a4,……的区域。
词典核对部分13,对于如上述那样分离出的各文字区域,在抽出文字或者文字列的候补的同时综合被抽出文字或者文字列的候补后抽出文字列的候补并输出到候补文字列输出部分。
通过进行这样的文字分离即使是相邻文字之间接触的文字图像也可以进行正确的文字识别。
接着,说明本发明的文字识别装置的实施例4。
本实施例4的文字识别装置,具有和图2或者图3所示的文字识别装置100、200大致相同的构成,但本实施例的词典核对部分的构成是,在残留有不能识别文字的区域的情况下,将该文字图案的特征和被记录在单个文字标准图案词典14-1中的单个文字的各种特征对照抽出文字候补。
图8,是本发明的文字识别装置的实施例4中的文字分离方式的说明图。
如图8(a)所示,当在全角的片假名文字的排列中混入与半角相当的文字宽度的浊音点或者空白的文字图像50的情况下,如图8(b)所示,首先,用和实施例2以及实施例3中同样的方法从平均高度H推定文字宽度W,从文字图像50的左端开始以文字宽度W分离文字区域a1“カ”,片假名的“カ”被识别。接着,只偏移W/2分离位置用文字宽度W分离出文字区域a2进行识别处理。但是该文字区域a2因为和词典不匹配所以不能得到文字候补。以下同样地继续进行a3,a4,a5,a6各文字区域的分离、识别处理。
在图8(b)的情况下,文字区域a1、文字区域a3,以及文字区域a6分别被作为片假名文字“カ”、片假名文字“カ”,以及片假名文字“ク”识别,但文字区域a2、文字区域a4,以及文字区域a5经词典核对的结果,被废弃。如此使分离位置每移动W/2得到的文字候补被本实施例的词典核对部分综合,作为文字排列的候补抽出。在图8的例子中,从文字区域a1得到的文字“カ”和从文字区域a3得到的文字“カ”被综合后得到文字排列“カカ”,但在从文字区域a3得到的文字“カ”和从文字区域a6得到的文字“カ”之间残留有不能识别文字的不能识别文字的区域a7。
因此,本实施例的词典核对部分,因为不能识别文字的区域a7是相当于半角文字的文字区域,所以通过将该不能识别文字的区域a7的文字图案的特征和被记录在单个文字标准图案词典14-1(参照图2)中的单个文字的各种特征对照重新抽出文字候补将不能识别文字的区域a7作为半角浊音点识别。这样,就可以从图8(b)所示的文字列中得到图8(c)所示的识别结果。
图9,是实施例4中的不能识别文字的区域的处理的流程图。
如图9所示,求文字区域a1~an的识别结果(步骤S11),判定在文字区域a1~an中是否有不能识别的区域(步骤S12),当有不能识别的区域的情况下,将不能识别的区域看作一个文字用单个文字标准图案词典14-1进行词典对照求文字候补。
如上所述,在本实施例4中,即使半角单个文字混入全角的文字之间也可以正确地识别之。另外,如图8所示即使在半角的空白混入全角文字之间的情况下也和上述的半角浊音点的情况一样可以同样正确地识别。
如上所述,如果采用本发明的文字识别装置,因为使用由记录有标准文字单个文字的各种特征的单个文字标准图案词典,和记录有排列规定数量的标准文字得到文字列的各自的特征的多文字标准图案词典的两方组成的标准词典进行文字识别,所以无论是如填写通常的传票那样的以不规则的间隔、填写方式填写的文字列,还是全角文字、半角文字混合存在的印刷文字列都可以高精度地分离文字并识别,可以实现从文字识别难的文字图像中正确并且高速地进行文字识别的文字识别装置。

Claims (5)

1、一种文字识别装置,其特征在于:包括以下部分,文字区域分离部分,从被输入的文字图像中推定文字宽度,从该文字图像中分离出与该文字宽度相当的长度的文字区域;特征抽出部分,抽出被上述文字区域分离部分分离出的文字区域内的文字图像的特征;标准图案词典,由记录了标准文字单个文字的各种特征的单个文字标准图像词典和记录了以规定数量排列标准文字形成的文字列的各自的特征的多文字标准图像词典两部分组成;词典核对部分,将用上述特征抽出部分抽出的文字区域内的文字图像的特征,和构成上述标准图像词典的记录在上述单个文字标准图像词典以及上述多文字标准图像词典中的单个文字以及文字列的各自特征对照,抽出该文字区域内的文字图案表示的文字或者文字列的候补。
2、权利要求1所述的文字识别装置,其特征在于:具备验证部分,当由上述词典核对部分,抽出把上述文字区域内的文字图案的特征和被记录在上述多个文字标准图案词典中的文字列的特征核对的结果文字列的候补的情况下,在上述特征抽出部分中,抽出把抽出文字列的候补的文字区域进一步分割成和构成其文字列的文字数相同的文字数形成的各分割区域的文字图案的特征,在上述词典核对部分中,把上述各分割区域的文字图案的特征,和被记录在上述单个文字标准图案词典中的单个文字的各种特征对照抽出与上述分割区域的排列对应的文字列的候补,检验该文字列的候补,是否与用上述多文字标准图案词典抽出的文字列的候补一致。
3、如权利要求1或者2所述的文字识别装置,其特征在于:上述文字区域分离部分,在每偏移一分割长度时,分离出与上述文字宽度相当的长度的文字区域,其中该分割长度是将该文字宽度分割为和上述规定数相同时的长度。
4、如权利要求3所述的文字识别装置,其特征在于:上述词典核对部分,对于被上述文字区域分离部分分离的各文字区域,在抽出文字或者文字列的候补的同时综合被抽出的文字或者文字列的候补抽出文字排列的候补。
5、如权利要求4所述的文字识别装置,其特征在于:上述词典核对部分,在残留有不能识别文字的区域的情况下,将上述不能识别文字的区域的文字图案的特征和被记录在上述单个文字标准图案词典中的单个文字的各种特征对照抽出文字候补。
CNB99123281XA 1999-05-06 1999-11-01 文字识别装置 Expired - Fee Related CN1181446C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP126053/1999 1999-05-06
JP12605399A JP4280355B2 (ja) 1999-05-06 1999-05-06 文字認識装置

Publications (2)

Publication Number Publication Date
CN1273401A true CN1273401A (zh) 2000-11-15
CN1181446C CN1181446C (zh) 2004-12-22

Family

ID=14925485

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB99123281XA Expired - Fee Related CN1181446C (zh) 1999-05-06 1999-11-01 文字识别装置

Country Status (3)

Country Link
JP (1) JP4280355B2 (zh)
KR (1) KR100582039B1 (zh)
CN (1) CN1181446C (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100375008C (zh) * 2002-07-17 2008-03-12 株式会社理光 像域分离装置,图像处理装置,图像形成装置
CN101354703B (zh) * 2007-07-23 2010-11-17 夏普株式会社 文档图像处理装置和文档图像处理方法
CN101354704B (zh) * 2007-07-23 2011-01-12 夏普株式会社 字形特征字典制作装置及具备该装置的文档图像处理装置
CN101763505B (zh) * 2009-12-29 2011-12-07 重庆大学 基于投影对称性的车牌字符特征提取及分类方法
CN101226596B (zh) * 2007-01-15 2012-02-01 夏普株式会社 文档图像处理装置以及文档图像处理方法
CN102867178A (zh) * 2011-07-05 2013-01-09 富士通株式会社 汉字识别方法和装置
CN101493896B (zh) * 2008-01-24 2013-02-06 夏普株式会社 文档图像处理装置及文档图像处理方法
CN105869140A (zh) * 2015-11-24 2016-08-17 乐视致新电子科技(天津)有限公司 图像处理方法和装置
CN107016392A (zh) * 2016-01-27 2017-08-04 四川效率源信息安全技术股份有限公司 一种去除图片中文字边框的方法
CN107071179A (zh) * 2017-04-25 2017-08-18 北京小米移动软件有限公司 日程管理方法及装置
CN108875570A (zh) * 2017-05-15 2018-11-23 京瓷办公信息系统株式会社 信息处理装置、存储介质和信息处理方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム
JP2005352653A (ja) * 2004-06-09 2005-12-22 Omron Corp 文字認識装置
KR100598115B1 (ko) * 2004-08-31 2006-07-10 삼성전자주식회사 고속 문자인식방법 및 장치
JP5041775B2 (ja) * 2006-09-28 2012-10-03 沖電気工業株式会社 文字切出方法及び文字認識装置
KR102570961B1 (ko) * 2020-10-21 2023-08-25 엄혜용 온라인 게임 내에서 문자를 인식하는 텍스트 마이닝 장치
KR20230164347A (ko) * 2022-05-25 2023-12-04 (주)그리드원 Ocr 대상 문자열에 대한 문자열 보정 방법 및 상기 문자열 보정 방법을 수행하는 컴퓨팅 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152877A (ja) * 1993-12-01 1995-06-16 Matsushita Electric Ind Co Ltd 英文字認識装置
JP2988304B2 (ja) * 1995-02-23 1999-12-13 松下電器産業株式会社 文字列管理装置
JP2751865B2 (ja) * 1995-04-17 1998-05-18 日本電気株式会社 文字列認識装置
JPH09245120A (ja) * 1996-03-11 1997-09-19 Hitachi Ltd 文字切出し方法
TW490643B (en) * 1996-05-21 2002-06-11 Hitachi Ltd Estimated recognition device for input character string
JPH09326012A (ja) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd 文字認識装置および文字認識方法
JP3452774B2 (ja) * 1997-10-16 2003-09-29 富士通株式会社 文字認識方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100375008C (zh) * 2002-07-17 2008-03-12 株式会社理光 像域分离装置,图像处理装置,图像形成装置
CN101226596B (zh) * 2007-01-15 2012-02-01 夏普株式会社 文档图像处理装置以及文档图像处理方法
CN101354703B (zh) * 2007-07-23 2010-11-17 夏普株式会社 文档图像处理装置和文档图像处理方法
CN101354704B (zh) * 2007-07-23 2011-01-12 夏普株式会社 字形特征字典制作装置及具备该装置的文档图像处理装置
CN101493896B (zh) * 2008-01-24 2013-02-06 夏普株式会社 文档图像处理装置及文档图像处理方法
CN101763505B (zh) * 2009-12-29 2011-12-07 重庆大学 基于投影对称性的车牌字符特征提取及分类方法
CN102867178A (zh) * 2011-07-05 2013-01-09 富士通株式会社 汉字识别方法和装置
CN102867178B (zh) * 2011-07-05 2015-06-10 富士通株式会社 汉字识别方法和装置
CN105869140A (zh) * 2015-11-24 2016-08-17 乐视致新电子科技(天津)有限公司 图像处理方法和装置
CN107016392A (zh) * 2016-01-27 2017-08-04 四川效率源信息安全技术股份有限公司 一种去除图片中文字边框的方法
CN107071179A (zh) * 2017-04-25 2017-08-18 北京小米移动软件有限公司 日程管理方法及装置
CN108875570A (zh) * 2017-05-15 2018-11-23 京瓷办公信息系统株式会社 信息处理装置、存储介质和信息处理方法
CN108875570B (zh) * 2017-05-15 2022-04-19 京瓷办公信息系统株式会社 信息处理装置、存储介质和信息处理方法

Also Published As

Publication number Publication date
KR20000075420A (ko) 2000-12-15
CN1181446C (zh) 2004-12-22
KR100582039B1 (ko) 2006-05-23
JP2000315247A (ja) 2000-11-14
JP4280355B2 (ja) 2009-06-17

Similar Documents

Publication Publication Date Title
CN1181446C (zh) 文字识别装置
Chaudhuri et al. Automatic recognition of printed Oriya script
Shi et al. Line separation for complex document images using fuzzy runlength
CN104966051B (zh) 一种文档图像的版式识别方法
Pal et al. Automatic identification of english, chinese, arabic, devnagari and bangla script line
Pal et al. Identification of different script lines from multi-script documents
Baird et al. Reading chess
Casey et al. Intelligent forms processing
Shijian et al. Script and language identification in noisy and degraded document images
Pal et al. Automatic separation of words in multi-lingual multi-script Indian documents
Dhandra et al. Script identification based on morphological reconstruction in document images
JP2004272798A (ja) 画像読み取り装置
Abuhaiba Arabic font recognition using decision trees built from common words
Bhagvati et al. On developing high accuracy OCR systems for Telugu and other Indian scripts
Unnikrishnan et al. Combined script and page orientation estimation using the tesseract ocr engine
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
Baird Global-to-local layout analysis
Dhandra et al. Word-wise script identification from bilingual documents based on morphological reconstruction
Sinha et al. Word–wise script identification from indian documents
JP5041775B2 (ja) 文字切出方法及び文字認識装置
Kumar et al. Line based robust script identification for indianlanguages
Chanda et al. Identification of Japanese and English script from a single document page
Mitra et al. Character segmentation for handwritten Bangla words using image processing
JP3372005B2 (ja) 文字認識装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041222

Termination date: 20141101

EXPY Termination of patent right or utility model