CN1215201A

CN1215201A - 字符识别/修正方式

Info

Publication number: CN1215201A
Application number: CN98107408A
Authority: CN
Inventors: 伊崎保直
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1997-10-16
Filing date: 1998-04-23
Publication date: 1999-04-28
Anticipated expiration: 2018-04-23
Also published as: KR100412317B1; KR19990036515A; JP3452774B2; CN1140878C; JPH11120293A

Abstract

本发明用于高精度地识别书写到各种发票上不规则的低品质的字符串。通过在输入字符串和特定字符标准模式词典之间进行第1匹配处理,从输入字符串中抽出特定字符或特定字符串。其次,从特定字符词典和与其链接的知识词典中抽出属于指定类别的,并且有可能位于从输入字符串中抽出的各特定字符或特定字符串的前后的区域的候补单词组。并且,对于属于候补单词组的各候补单词,通过使用标准模式词典进行第2匹配处理,识别构成输入字符串的字符。

Description

字符识别/修正方式

本发明涉及识别书写到通常所见到的各种发票上的字符串，特别涉及识别以不规则的字符间隔或用不规则的书写方法书写的在相邻字符之间发生接触、分离的那种低品质的字符串的技术。

读取图像数据并变换为字符编码数据的OCR(光学字符读取装置)随着其应用领域的扩大，已在各种业务中进行使用。每一种业务使用不同的发票，并且书写到发票上的字符串和书写者也是各种各样的。

在先有的OCR用发票中，字符登录框是使用按逐个字符印刷的字符框，特别是在书写汉字时，是使用大的字符框。对OCR装置而言，这是为了容易逐个字符检测所书写的字符，另外，对于书写者说来，这是为了促使其在书写时所书写的字符不与相邻的字符接触。

这样的发票，例如即使只书写2、3个住所或姓名，所书写的字符数也有数十个字符，结果，就必须使用大尺寸的发票，从而将增加费用。另外，对于书写者说来，也增加了必须逐个字符书写到框中的麻烦。

随着OCR的应用领域扩大，已迫切需要不受字符框约束而能将汉字字符串书写到通常的发票那样小的发票中，并且可以按实用上的识别精度进行识别，并在修正不能阅读的字符时可以有效地进行修正的字符识别/修正技术。

在先有的典型的字符识别方法中，是参照称为存储书写识别对象字符串的字符框的发票上的坐标位置的定义体的文件，逐个字符检测所书写的字符并将它们分离开来。并且，通过对该分离开的各字符进行识别处理，输出作为识别结果的候补字符组。

分离开的字符的识别处理，例如可以按如下方式进行。

首先，收集由大量的不特定的书写者按照预先规定的书写方式所书写的字符，从这些字符中抽出与识别方式相关的特征量，利用统计的方法(例如，分组方法)作成标准模式。并且，根据作为目的的每一种字种的标准模式作成标准模式词典。

标准模式，例如可以作为通过将所收集的各字符模式平均而得到的平均模式而作成。更具体地说，就是利用通过运算与所收集的各字符对应的特征量的平均而得到的平均特征量来表现该平均模式。

在手写字符的识别处理中，由于手写者不同而发生大的字形变形，所以，对各字种作成多个标准模式。通常，1个标准模式称为1个模板，对上述各字种根据多个标准模式作成的词典称为多个模板词典。

字符识别处理，使用上述标准模式词典或多个模板词典进行。具体而言，就是从根据输入发票分离出来的1个字符抽出特征量，在该特征量与构成标准模式词典(或多个模板词典)的各模板(标准模式)的特征量之间计算类似度或距离(欧几里得距离、马哈赖诺毕斯距离等)。并且，按类似度大的顺序或距离小的顺序，将指定顺序位次(例如，8位)之前的各模板所属的各字种类别作为候补字符组而输出。

这里，所识别的字符是表示住所或姓名的字符时，通常对上述候补字符组进行使用住所单词、姓名单词的知识处理。

更具体地说，首先就是各书写位置的候补字符组通过按整个书写位置进行组合然后输出候补字符组。

其次，对构成该候补字符组的各候补字符串比较在该候补字符串中是否存在知识处理对象的住所词典或姓名词典内的各单词字符串。

并且，按照该比较结果，例如按照构成候补字符串的各候补字符的顺序位次等，对该候补字符串打分。

在对所有的候补字符串进行该处理之后，将得分最高得候补字符串作为知识处理结果而输出。

作为关于这种知识处理的先有技术，例如已在日本国特许公开公报特开昭61-107486号中所公开了，这是大家所熟知的。

这里，识别如像向通常的发票上书写那样用自由间距书写的住所、姓名那样的汉字字符串时，通常会发生很多相邻的字符之间相互接触的现象，另外，相反，也会存在对汉字分离为偏、旁那样而书写的字符。

因此，在逐个字符检测书写字符并分离出来进行识别的先有的字符识别方法中，难于判断哪个范围是1个字符的范围，实现达到实用上的识别精度是困难的。

此外，如果不能正确地识别各字符，则有时就连书写的是何种字符都不能判断，在以确定构成单词的字符数为前提的先有的知识处理中，谋求提高识别精度是有限度的。

另外，特别是在住所地名等的识别处理中，例如在不能利用知识处理识别高位级的单词(例如，东京都、大阪府等)时，通常在该阶段低位级的单词也不能进行知识处理，所以，为了修正住所地名，就必须从第1个字符开始顺序修正所有的字符串。

作为用于识别上述那样的自由间距的字符串的第1先有技术，已在日本国特许公报特公平8-23875号“单词读取方式”中所公开，这是大家已知的。在该第1先有技术中，作为识别结果的候补字符串与单词词典通过DP匹配等进行对照，选择一致的字符多的单词，再次分离出不一致的部分，对该分离出的字符串进行进一步识别。

作为用于识别自由间距的字符串的第2先有技术，已在日本国特许公开公报特开昭63-136291号“单词读取方式”中公开了，这是大家已知的。在该第2先有技术中，使用作为标准模式而具有表示字符的偏、旁的各部分的部分模式的标准模式词典进行识别处理，根据候补字符串的各字符的偏、旁生成字符串，进行它们与单词词典的匹配处理。

作为用于识别自由间距的字符串的第3先有技术，已在日本国特许公开公报特开平8-171614号“字符串读取装置”中所公开，这是大家已知的。在该第3先有技术中，在候补字符串中不包含正确字符而发生读取转移时或者由于存在与正确字符竞争的字符候补而发生多个读取候补时等，就检测预想字符串的存在可能性。

但是，研究了对我们日常所书写的字符串即相邻字符间的接触频繁地发生、字符宽度也随各字符而变化很大、很多东倒西歪的低品质的字符串的识别处理时，上述第1～第3先有技术存在以下问题。

首先，在第1先有技术中，优先处理候补字符串中的哪个字符不一定，由于对等地处理候补字符串中的所有的字符，所以，有可能根据最初的字符分离位置只将完全不适当的单词选择为候补字符了。

其次，在第2先有技术中，在对相邻字符相互接触的区域的处理中存在问题。

此外，在第3先有技术中，虽然描述了几个检测手段的实现方法，但是，不论哪个方法都使用字符候补的组合，它们的检测性能与最初的字符的分离结果关系很大。

本发明的目的在于通过着眼于特定的字符而高精度地识别低品质的字符串。

本发明以识别构成书写到具有指定类别的书写范围的输入字符串的字符的字符识别/修正方法、和与其具有同等功能的字符识别装置或计算机可以读取的记录媒体为前提。

在本发明中，首先通过在输入字符串和第1识别词典(特定字符标准模式词典107)之间进行第1匹配处理，从输入字符串中抽出特定字符或特定字符串。更具体地说，就是在第1识别词典中存储与特定字符或特定字符串对应的标准模式，通过在输入字符串的模式和第1识别词典内的各标准模式之间进行第1匹配处理，从输入字符串中抽出特定字符或特定字符串。上述特定字符或特定字符串是例如在指定类别中出现的频度高的或识别精度高的字符或字符串。

其次，从不同类别单词词典(特定字符词典110、知识词典111)中抽出有可能属于指定类别(例如，住所字符串)并且位于从输入字符串中抽出的各特定字符或特定字符串的前后的输入字符串中的区域的候补单词组。

并且，对于属于所抽出的候补单词组的各候补单词，通过根据与该各候补单词有关的信息对该各候补单词所位于的输入字符串中的各区域使用第2识别词典(标准模式词典113)进行第2匹配处理，识别构成输入字符串的字符。更具体地说，就是在第2识别词典中存储与和属于候补单词组的候补单词关联的字符或字符串对应的标准模式，对于属于候补单词组的各候补单词，通过根据与该各候补单词相关的信息对该各候补单词所位于的输入字符串中的各区域在该各候补单词的模式和第2识别词典内的各标准模式之间进行第2匹配处理，识别构成输入字符串的字符。这时，作为与各候补单词有关的信息，例如可以使用该各候补单词的字符数的信息。另外，第2识别词典也可以包含第1识别词典。

根据上述发明的结构，首先优先地识别输入字符串中的特定字符或特定字符串，根据该识别结果来假定其前后的候补单词，进而通过使用该候补单词的信息再次识别构成输入字符串的字符，便可高精度识别构成通常所见到的书写到各种帐薄(发票)上的以不规则的间隔和书写方法所书写的输入字符串的字符。

在上述发明的结构中，与输入字符串并列地显示构成输入字符串的字符的识别结果，由用户指定该显示的输入字符串上的所希望的区域，修正与该所希望的区域对应的字符或字符串，根据与通过该修正而得到的正确字符或正确字符串有关的信息再次进行候补单词组的抽出处理和第2匹配处理，从而再次识别构成输入字符串的字符。这时，应答对所显示的输入字符串上的所希望区域的指定，显示该所希望区域的多个候补识别结果。

利用这种字符修正技术，只修正特定的字符或字符串便可自动地修正其他不能识别的部分。

另外，在上述发明的结构中，对于各候补单词，具有书写上的变化波动的单词作为属于候补单词组的新的候补单词而输出。

利用这种书写上的变化波动的控制技术，可以灵活地对待各种书写方法。

图1是本发明实施例的结构图。

图2是本发明实施例的总体控制动作流程图(之一)。

图3是本发明实施例的总体控制动作流程图(之二)。

图4是本发明实施例的总体控制动作流程图(之三)。

图5是表示书写范围定义的数据格式例的图。

图6是字符分离部的控制动作流程图(之一)。

图7是字符分离部的控制动作流程图(之二)。

图8是字符分离部的控制动作的说明图。

图9是关于书写的波动的控制动作流程图。

图10是知识词典(住所)的结构图。

图11是特定字符词典的结构图。

图12是表示特定字符词典110的结构例(之一)的图。

图13是表示特定字符词典110的结构例(之二)的图。

图14是表示特定字符词典110的结构例(之三)的图。

图15是表示特定字符词典110的结构例(之四)的图。

图16是书写的变化波动的控制动作的说明图。

图17是候补单词检索部的动作说明图(之一)。

图18是候补单词检索部的动作说明图(之二)。

图19是候补单词检索部的动作说明图(之三)。

图20是利用标准模式词典的字符串检测/识别动作的说明图。

图21是输入部和显示部的动作说明图(之一)。

图22是输入部和显示部的动作说明图(之二)。

图23是输入部和显示部的动作说明图(之三)。

图24是记录实现本实施例的程序的记录媒体的说明图。

下面，参照附图详细说明本发明的实施例。

图1是本发明实施例的结构图。

首先，字符分离部103使用定义关于帐薄的书写范围位置的信息的书写范围定义104，从由图像存储器102中读出的书写到帐薄上的输入字符串101中的开头顺序逐个分离字符。

其次，特征抽出部105从该分离出的字符中抽出特征量。

接着，匹配部106进行该分离出的字符的特征量和特定字符标准模式词典107内的各特定字符标准模式的特征量之间的匹配处理，按匹配度高的顺序将指定顺序位之前的各特定字符标准模式所属的各特定字符的字种类别作为对上述分离出的字符的候补特定字符向候补字符串缓冲器108输出。

对字符分离部103从输入字符串101的开头顺序分离出的各字符进行利用字符分离部103、特征抽出部105和匹配部106进行的上述一系列的特定字符识别处理。结果，在候补字符串缓冲器108中，就按照与从输入字符串101中分离出的字符的排列顺序对应的排列顺序保持与各字符对应的候补特定字符。

候补单词检索部109从候补字符串缓冲器108得到的候补特定字符串中全部抽出由相邻的任意2个特定字符构成的组(特定字符组)，并检索各特定字符组是否已登录到特定字符词典110中。

在1组的特定字符组已登录到特定字符词典110中时，候补单词检索部109就从与该登录记录器链接的知识词典11中的记录器中检索被构成该特定字符组的2个特定字符夹在中间的单词组，将该检索的单词组作为候补单词组保持到候补单词缓冲器112中。

候补单词检索部109对于从候补字符串缓冲器108中抽出的上述个特定字符组，抽出与它们对应的候补单词组，并保持到候补单词缓冲器112中。

结果，在候补单词缓冲器112中，对1组特定字符组可以得到1各以上的候补单词组，最后，便可得到多个特定字符组的候补单词组的集合。

对于1组的特定字符组，顺序读出属于候补单词缓冲器112得到的候补单词组的各候补单词，并对它们进行以下一系列的处理。

首先，字符分离部103使用从候补单词缓冲器112输出的候补单词的信息对从图像存储器102中读出的输入字符串101中，再次分离出被构成该候补单词所属的特定字符组的2个特定字符夹在中间的字符串区域内的字符串。

特征抽出部105从再次分离出的字符串中抽出特征量。

此外，匹配部106进行该再次分离出的字符串的特征量和第2词典即标准模式词典113内的各标准模式的特征量的匹配处理，按照匹配度高的顺序，将指定顺序位之前的各标准模式所属的字符串的类别作为对上述候补单词的候补识别结果组，保持到候补字符串缓冲器108中。

利用字符分离部103、特征抽出部105和匹配部106对于上述1组的特定字符组，对属于候补单词缓冲器112得到的候补单词组的各候补单词进行上述一系列的再次识别处理，在候补单词缓冲器108中对各候补单词可以得到指定顺序位之前的候补识别结果组。

并且，匹配部106对属于上述1组的特定字符组的各候补单词从候补字符串缓冲器108得到的指定顺序位之前的全部候补识别结果组中，最稳妥地将可靠性高的识别结果，更具体地说就是将匹配度最高的候补识别结果，作为被构成上述1组的特定字符组的2个特定字符夹在中间的部分的识别结果向知识处理部114输出。

利用字符分离部103、特征抽出部105和匹配部106进行的属于1组的特定字符组的候补单词组的各候补单词的上述一系列的再次识别处理，对登录到候补单词缓冲器112中的各特定字符组进行。结果，与被构成各特定字符组的2个特定字符夹在中间的各字符区域对应的识别结果向知识处理部114输出。

知识处理部114对与被构成各特定字符组的2个特定字符夹在中间的各字符区域对应的识别结果，通过使用书写范围定义104和知识词典11的知识处理，决定由上述各字符区域构成的全部字符区域的最终识别结果，并将其向识别结果缓冲器115输出。

在上述一系列的识别处理中，对于最后未满足识别条件的字符或字符串的部分，附加上拒识(不能识别)信息。

这时，识别结果缓冲器115得到的识别结果通过接口部116在详细部117上进行显示。用户对显示部117上的识别结果的显示，可以从由鼠标和键盘等构成的输入部118修正不能识别字符/字符串。

用户只从输入部118指定不能识别字符/字符串列的特定的正确字符，关于该正确字符的信息便从接口部116向正确字符缓冲器119和区域坐标缓冲器120输出。

候补单词检索部109将从正确字符缓冲器119得到的与正确字符有关的信息作为特定字符的信息，通常通过使用上述特定字符词典110和知识词典11进行候补单词的检索处理，便可正确地再次识别不能识别的字符。另外，字符分离部103通过从区域坐标缓冲器120取得由用户指定的正确字符的分离位置，便可进行正确的字符的分离。

如上所述，在本实施例中，对于书写到帐薄中的各书写范围中的住所、姓名、物品名等的输入字符串101，通过着眼于在各范围内出现频度高的字符或特定的字符/字符串，使用知识词典111保持的单词信息和具有层次结构的住所等的字符串时各字符区域的接续信息，便可选择被上述特定字符夹在中间的字符区域的候补单词。

此外，在本实施例中，通过使用该候补单词的信息进行从输入字符串101抽出被上述特定字符夹在中间的字符区域和对该字符区域的再次识别处理，便可以高的识别精度识别在相邻字符间以发生很多接触、分离的书写方式书写的字符串。

图2至图4是表示具有图1所示的结构的本发明的实施例实现的全部控制的动作流程图。

(特定字符的识别处理)

首先，字符分离部103使用定义关于帐薄的书写范围位置的信息的书写范围定义104，从图像存储器102中作为2值化图像数据读出的书写到帐薄上的输入字符串101中的开头顺序逐个进行字符分离(图2的S201)。

图5是表示字符分离部103使用的记入范围定义104的数据格式例的图。

例如，在帐薄上设置范围1、2，识别书写到这2个范围内的字符串时，书写范围定义104按以下方式进行决定。

首先，将帐薄的上部作为坐标原点，将横向定义为x轴，将纵向定义为y轴，对于范围1、2，该范围的左上端的位置的坐标(范围原点坐标)和由x轴方向的范围宽度及y轴方向的范围高度构成的范围的大小数据如图5(a)所示的那样定义。长度的单位为毫米或英寸。

其次，对于范围1、2，定义表示各范围书写什么种类的字符串的范围类别。

这些信息用图5(b)所示的表示形式作为书写范围定义104特别地保持到图中未示出存储装置中。

字符分离部103通过使用上述书写范围定义104，在从图像存储器102中读出的图像数据上决定各范围的字符区域之后，对该字符区域内的图像数据进行由图6所示的动作流程图所示的字符分离控制。

这里，如图8(a)所示，设从书写范围定义104中抽出的对象区域的范围原点坐标为(x₀,y₀)、x轴方向的范围宽度为dx、y轴方向的范围高度为dy。

首先，字符分离部103通过对x轴方向的各扫描线累计计算黑像素数，如图8(b)所示的那样，计算表示各y坐标位置的x轴方向的黑像素的出现频度的水平直方图(图6的S601)。

其次，如图8(b)所示，字符分离部103从其上方和下方扫描上述水平直方图，计算最初超过频度值C的位置α和β，将进而根据它们计算的数值α-β作为该对象区域的字符串高度h(S602)。

然后，字符分离部103通过对y轴方向的各扫描线累计计算黑像素数，如图8(c)所示的那样计算表示各x坐标位置的y轴方向的黑像素的出现频度的垂直直方图(图6的S603)。

接着，如图8(c)所示，字符分离部103从其左边开始扫描上述垂直直方图，分离出频度值从小于阈值d变化到大于阈值d的点x₁、x₃、x₅、…(x_2n-1:n=1、2、…)，作为候补位置进行计算，另外，也分离出频度值从大于阈值d变化到小于阈值d的点x₂、x₄、x₆、…(x_2m:m=1、2、…)，作为候补位置进行计算(S604)。

然后，字符分离部103计算满足下述条件式的区域[x_2m,x_{2n 1}]，并将其作为字符分离结果(S605)。

【数式1】

h-t₁≤x_2m-x_2n-1≤h+t₂

(m=1、2、3、…),(n=1、2、3、…)

其中，h为在上述S602计算的字符高度，t₁和t₂是通过输入字符串101的学习采样而决定的参量。在图8(c)的例中，下述3个区域作为字符分离结果进行计算。

[x₁,x₂]

[x₃,x₄]

[x₅,x₈]

字符分离部103判断S605的处理结果是否留下满足下述条件式的区域(S606)。

【数式2】

x_2l-x_2l-1＞h+t₂

(l=1、2、3、…)

在S606的判断如果为NO，字符分离部103就结束该控制处理。

在S606的判断如果是YES，字符分离部103就在区域[x_{2l- 1},x_2l]中，计算是小于在S603计算的垂直直方图的频度值比阈值d大的指定值并且满足下述条件式的值k。

【数式3】

h≈(x_2l-x_2l-1)/k

结果，将把区域[x_2l-x_2l-1]作k份分割的各位置作为字符分离位置进行计算(以上，为S607)。在图8(d)的例中，为l=1、k=2，将把区域[x₁,x₂]分割为2份的位置x′作为字符分离位置进行计算。

然后，字符分离部103结束该控制处理。

以上说明的图6的动作流程图与字符分离部103对字符数未预先给定的范围所进行的字符分离处理对应。

与此相反，如根据从候补单词缓冲器112中读出的候补单词的信息再次进行识别处理时那样，有时字符分离部103也对作为字符分离的对象的区域和该区域内的字符数已预先给定的范围进行字符分离处理。

这时，字符分离部103进行图7的S701的处理，取代图6的S605～607的处理。

即，当给定作为字符分离对象的区域的左端的x坐标为x_s、右端的x坐标为x_t、上述区域内的字符数为n时，字符分离部103就将具有与是在图6的S603计算的垂直直方图的频度值小于指定值并且满足下述条件式的值X_n接近的相邻间隔的位置作为字符分离位置进行计算。

【数式4】

(x_t-x_s)/n=X_n

具体而言，设相邻的2个字符分离位置为x_i、x_i+1(i=1、2、…、x_s≤x_i、x_i+1≤x_t)时，字符分离部103计算满足下述条件式的字符分离位置x_i(x_i≠x_s,x_t)。

【数式5】

X_n-t₅≤x_i+1-x_i≤X_n+t₆

其中，t₅和t₆是通过输入字符串101的学习采样而决定的参量。

在由以上说明的字符分离部103进行的字符分离处理后，特征抽出部105从该分离出的1字符中抽出作为用于进行识别的特征量即特征矢量(图2的S202)。

具体而言，就是特征抽出部105通过例如以下一系列的处理抽出特征矢量。

即，首先，特征抽出部105从分离出的字符的图像数据中抽出字符轮廓像素。

然后，特征抽出部105将该分离出的区域分割为多个分割区域。

此外，特征抽出部105按各分割区域对该分割区域内的各轮廓像素抽出方向成分(例如，纵向、横向、左斜方向、右斜方向的4个方向成分)，通过累计计算该分割区域内的全部轮廓像素的方向成分，计算该分割区域内的各方向成分的累计值，从而计算将它们作为与各方向成分对应的要素值而具有的部分特征矢量。

最后，特征抽出部105通过综合所有的分割区域的部分特征矢量的各要素，抽出特征矢量。

如上述那样在特征抽出部105抽出分离出的字符的特征矢量后，匹配部106进行该分离出的字符的特征矢量与特定字符标准模式词典107内的各特定字符标准模式的特征矢量之间的匹配处理(图2的S203)，按匹配度高的顺序将指定顺序位之前的各特定字符标准模式所属的各特定字符的字种类别作为上述分离出的字符的候补特定字符组向候补字符串缓冲器108输出(图2的S204)。

更具体地说，就是匹配部106计算在该分离出的字符的特征矢量与特定字符标准模式词典107内的各特定字符标准模式的特征矢量之间例如距离(欧几里得距离、马哈赖诺毕斯距离等)。并且，匹配部106按距离小的顺序将指定顺序位(n位)之前的各特定字符标准模式所属的各特定字符的字种类别作为上述分离出的特定字符的候补特定字符组向候补字符串缓冲器108输出。

1位的特定字符标准模式的距离大于指定的阈值T₁时，就将拒识(不能识别)信息附加到该分离出的字符上。

下面，举具体例说明上述特定字符标准模式词典107。

现在，考虑输入字符串101为住所字符串的情况。

在本实施例中，开始在例如住所字符串中，可以只识别表示其层次结构的区分的出现频度高的由“都”“道”“府”“县”“市”“区”“郡”“町”“村”“字”“大字”等1字符或2字符构成的特定字符。另外，在住所字符串中，“东”“西”“南”“北”等特定字符，出现频度也很高。

因此，在本实施例中，为了提高这些特定字符的识别精度，使用仅由这些特定字符的标准模式构成的词典容量小的特定字符标准模式词典107。

通过准备这种与标准模式词典113不同的特定字符标准模式词典107，便可缩短识别处理速度，并且可以提高识别精度。

特定字符标准模式词典107也可以采用与标准模式词典113相同的词典而构成，为了提高特定字符的识别精度，对各特定字符存储多个模板(标准模式)。

另一方面，在输入字符串101为姓名字符串时，虽然不存在像住所字符串那样相区分的字符，但是，存在出现频度高的字符种类。例如，名字使用的字符在出现频度中在高位500位之前的字符种类占了约82％，所以，可以用高位N个字符作成特定字符标准模式词典107。

或者，也可以从标准模式词典113中有选择地仅将N个字种用于进行特定字符的识别。

并且，特定字符词典110与上述特定的字种对应。

另外，也可以不根据出现频度选择字种，而根据大量的实际数据统计地决定容易识别的字符，选择这些决定的字种。

由字符分离部103、特征抽出部105和匹配部106进行的上述一系列的特定字符识别处理，对字符分离部103从输入字符串101的开头顺序分离出的各字符进行(反复进行图2的S205→202的处理)。结果，各字符的候补特定字符组就按照与从输入字符串101中分离出的字符的排列顺序对应的排列顺序保持到候补字符串缓冲器108中。

(特定字符间区域的候补单词的检索和在该区域中的再次识别处理)

候补单词检索部109从候补字符串缓冲器108得到的候补特定字符组的集合中抽出全部由相邻的任意的2个特定字符构成的组(特定字符组)，并检索这些特定字符组是否已登录在特定字符词典110中。并且，在1组的特定字符组已登录在特定字符词典110中时，候补单词检索部109就从与该登录记录数据链接的知识词典11中的记录数据中检索被构成该特定字符组的2个特定字符夹在中间的单词组，并将该检索的单词组作为候补单词组保持到候补单词缓冲器112中(以上，为图3的S206)。

现在，考虑输入字符串101为住所字符串的情况。对于住所字符串以外的姓名字符串、品名字符串等，由于不具有层次结构，所以，除了关于层次结构的部分，可以和住所字符串的情况一样地实现。

作为住所词典的知识词典11的结构，例如如图10所示的那样，按照住所的层次结构，分割为等级1：都道府县、等级2：市区郡、等级3：町村、…，各存储属于各层的单词。

另一方面，如图11所示，对于由“字符1”和“字符2”这样的2个特定字符构成的特定字符组对应的各记录数据，由用于表示已存储了被构成该特定字符组的2个特定字符夹在中间的单词组的知识词典111上的记录数据的集合的指针信息，和从该指针开始的数据数信息构成的数据组存储到特定字符词典110中。作为该数据组，如图11所示，可以指定多个组，对于特定字符词典110的各特定字符组的记录数据，如图11所示的那样，也存储了与上述指针信息和数据数信息的数据组的数对应的指针数信息N。

在图12的例中，记录由特定字符词典110内的空白字符和“县”这样的2个特定字符构成的特定字符组对应的记录数据，已登录了分别表示从图10所示的知识词典111内的等级1区域内的单词“青森”开始的n₁个记录数据，和从相同的等级1区域内的单词“神奈川”开始的n₂个记录数据的数据组(指针信息和数据数信息)和指针数N=2。

另外，在图13的例中，对于由特定字符词典11 内的“都”和“区”这样的2个特定字符构成的特定字符组对应的记录数据，已登录了从图10所示的知识词典111内的等级2区域内的单词“千代田”开始的n₃个记录数据和指针数N=1。

另外，住所通常以“…丁目…番地…方”这样的书写方式而结束，但是，夹在这种特定字符“丁目”“番地”“番”“方”“号”之间的区域中，多数情况不是单词而是书写数字。这时，如图14所示，对于与特定字符词典110内的由上述特定字符构成的特定字符组对应的记录数据，不是设定上述那样的由指针信息和数据数信息构成的数据组，而是设定“(数字)*n”这样的符号。候补单词检索部109从特定字符词典1100中检索到已设定上述那样的符号的记录数据时，检测在夹在上述那样的特定字符中间的区域连续地书写数字的情况，并将表示该信息的检测结果写入到候补单词缓冲器112中。

此外，也可以采用例如图15所示的那样的特定字符词典110和知识词典11的结构。

即，在图15的例中，对于特定字符词典110内的与由空白字符和“川”这样的2个特定字符构成的特定字符组对应的记录数据，设定指示知识词典111内的4个字符的单词“神奈川县”的指针信息和数据数=1以及指示知识词典111内的2个字符的单词“神奈”的指针信息和数据数=1。

另外，对于特定字符词典110内的与由“川”和“中”这样的2个特定字符构成的特定字符组对应的记录数据，设定指示知识词典111内的2个字符的单词“崎山”的指针信息和数据数=1。

此外，对于特定字符词典110内的与由“中”和“中”这样的2个特定字符构成的特定字符组对应的记录数据，设定指示知识词典111内的5个字符的单词“原区上小田”的指针信息和数据数=1。

这样，便可将与在住所字符串中以高的频度出现的特定字符和单词对应的信息存储到特定字符词典110和知识词典111中。

其次，如图16所示，对于特定字符词典110内的与由表示“区”和住所的结尾的特定字符的2个特定字符构成的特定字符组对应的记录数据，在已链接了知识词典111内的单词“丸の内”时，作为表示的变化波动，有可能不是书写为“丸の内”而是书写为“丸丿内”这样的字符串。这时，在知识词典11中存储与所有的表示上的变化波动对应的单词，就是一种浪费。

因此，在本实施例中，在从特定字符词典110中检索链接的知识词典111内的单词时，就进行用于处置由图9的动作流程图所示的表示上的变化波动的控制动作。

首先，候补单词检索部109对1组的特定字符组按照迄今说明的规则检索特定字符词典110和知识词典111，并将该检索结果的单词组作为与现在处理中的特定字符组对应的候补单词组写入候补单词缓冲器112中(图9的S901)。该S901是图3的S206的一部分。

其次，作为图3的S206的一部分，候补单词检索部109对于1组的特定字符组分别对候补单词缓冲器112得到的候补单词组反复进行图9的S902～910所示的一系列的处理。

即，在构成所检测的单词的字符中存在平假名时，候补单词检索部109就将该平假名变更为片假名，并将该变更结果而得到的单词作为与现在处理中的特定字符组对应的其他候补单词写入到候补单词缓冲器112中(图9的S902→903)。

其次，在构成所检测的单词的字符中存在平假名时，候补单词检索部109就将该片假名变更为平假名，并将该变更结果而得到的单词作为与现在处理中的特定字符组对应的其他候补单词写入到候补单词缓冲器112中(图9的S904→905)。

然后，在构成所检测的单词的字符中存在汉字数字时，候补单词检索部109就将该汉字数字变更为阿拉伯数字，并将该变更结果而得到的单词作为与现在处理中的特定字符组对应的其他候补单词写入到候补单词缓冲器112中(图9的S906→907)。

其次，在构成所检测的单词的字符中存在阿拉伯数字时，候补单词检索部109就将该阿拉伯数字变更为汉字数字，并将该变更结果而得到的单词作为与现在处理中的特定字符组对应的其他候补单词写入到候补单词缓冲器112中(图9的S908→909)。

最后，在构成所检测的单词的字符中存在可以省略的字符(例如，“丿口”省略为“口”时的“丿”)时，候补单词检索部109就将省略掉该可以省略的字符后得到的字符串作为与现在处理中的特定字符组对应的其他候补单词写入到候补单词缓冲器112中(图9的S908→909)。

对于1组特定字符组，在候补单词缓冲器112中还有不对表示上的变化波动进行控制处理的候补单词组时，候补单词检索部109就反复进行上述图9的S902～910所示的一系列的处理(反复进行图9的S111→902～910→911)。

如上所述，对于1组特定字符组，对候补单词缓冲器112得到的候补单词组可以实现对表示上的变化波动的控制。

通过上述处理，对于从候补字符串缓冲器108中选择的1组特定字符组，候补单词缓冲器112可以得到候补单词组。

现在，例如书写了图17所示的输入字符串101时，通过上述图2的S201～205的特定字符的识别处理，就将区域1701识别为特定字符“都”、将区域1702识别为特定字符“区”。

对于该识别结果，在上述图3的S206，候补单词检索部109在特定字符词典110中检测由空白字符和特定字符“都”构成的特定字符组的记录数据，从与该登录记录数据链接的知识词典111中的登记项目中检索由构成该特定字符组的2个特定字符夹在中间的1个单词“东京”，并将该检索的单词作为与由空白字符和特定字符“都”构成的特定字符组对应的候补单词组保持到候补单词缓冲器112中。这时，对于上述特定字符组的候补单词组的数是1个，如图18所示，候补单词“东京”的字符数为2个字符。

另外，在后面所述的图3的S211的判断之后第2次进行的图3的S206，候补单词检索部109在特定字符词典110中检测由特定字符“都”和“区”构成的特定字符组的记录数据，从与该登录记录数据链接的图10所示的知识词典111中的登记项目中检索由构成该特定字符组的2个特定字符夹在中间的23个单词“千代田”“中央”“港”…，并将这些检索的单词组作为与上述特定字符组对应的候补单词组保持到候补单词缓冲器112中。这时，对上述特定字符组的候补单词组的数为23个，如图19所示，各候补单词的字符数为3个字符、2个字符或1个字符中的某一种。

这样，对于从候补字符串缓冲器108中选择的1组的特定字符组，候补单词缓冲器112得到候补单词组后，通过字符分离部103、特征抽出部105和匹配部106对属于该候补单词组的各候补单词进行图3的S207～211的一系列的再次识别处理，对各候补单词抽出指定顺序位之前的候补识别结果群。

首先，字符分离部103在从图像存储器102中读出的输入字符串101中使用从候补单词缓冲器112中输出的候补单词的信息，再次分离被构成该候补单词所属的特定字符组的2个特定字符夹在中间的字符串区域内的字符串(图3的S207)。

这时，候补单词的字符数是例如图18所示的“东京”或图19所示的“中央”那样的2个字符时，字符分离部103按照上述图6的S601～604和图7的S701所示的动作流程图将作为字符分离的对象的区域分割为2部分(上述数式3中n=2)，决定各字符的分离位置。

另外，候补单词的字符数是例如图19所示的“千代田”那样3个字符时，字符分离部103将作为字符分离对象的区域分割为3部分(上述数式3中n=3)，决定各字符的分离位置。

此外，候补单词的字符数是例如图19所示的“港”那样的1个字符时，字符分离部103就假定在作为字符分离的对象的区域只存在1个字符(上述数式3中的n=1)。

其次，特征抽出部105对再次分离出的字符串如上述那样逐个字符抽出特征矢量(图3的S208)。

此外，匹配部106对上述各字符进行该字符的特征矢量与作为第2词典的标准模式词典113内的各标准模式的特征矢量之间的匹配处理(图3的S209)，将按照匹配度高的顺序指定顺序位之前的各标准模式所属的各字种类别作为对上述字符的保护字符组向候补字符串缓冲器108输出(图3的S210)。

更具体地说，匹配部106计算在上述字符的特征矢量和标准模式词典113内的各标准模式的特征矢量之间的例如距离(欧几里得距离、马哈赖诺毕斯距离等)。并且，匹配部106按距离小的顺序将指定顺序位(n位)之前的各标准模式所属的各字种类别作为对上述字符的候补字符组向候补字符串缓冲器108输出。

对于构成由字符分离部103再次分离出的字符串的各字符，如上所述，在候补字符串缓冲器108按距离小的顺序得到指定顺序位之前的候补字符组后，对于1个特定字符组，对属于候补单词缓冲器112得到的候补单词组的其他候补单词反复进行S207～210的一系列的处理。

对于1个特定字符组，候补字符串缓冲器108对属于候补单词缓冲器112得到的候补单词组的所有的候补单词按构成它们的各字符得到指定顺序位之前的候补字符组时，匹配部106就对各候补单词将全部构成它们的各字符的指定顺序位之前的候补字符组组合，生成候补字符串组，对它们所包含的各候补字符串利用下式计算其平均距离(图3的S212)。

【数式6】

(D₁+D₂+…+D_m)/m

其中，m是对象候补单词的字符数，D_i(1≤i≤m)表示在对象候补单词内的第i个字符中为了构成对象候补字符串而选择的候补字符的距离。

并且，匹配部106从与1个特定字符组的所有的候补单词对应地生成的候补字符串组中按照与构成它们的各候补字符串对应的平均距离小的顺序选择指定个数(P个)的候补字符串，并将它们作为由构成上述特定字符组的2个特定字符夹在中间的字符区域的识别结果向知识处理部114输出。

这样，在得到由构成1个特定字符组的2个特定字符夹在中间的字符区域的识别结果时，就再次从图3的S213返回到S206的处理。

并且，通过上述图2的S201～205的特定字符的识别处理，从候补字符串缓冲器108得到的候补特定字符组的集合中再次抽出由相邻的其他任意的2个特定字符构成的其他的特定字符组，通过对该特定字符组再次进行图3的S206～212的一系列的控制处理，对各特定字符组反复进行计算由构成该特定字符组的2个特定字符夹在中间的字符区域的识别结果这样的动作(图3的S213→206～212→213的反复)。

知识处理部114对与由构成各特定字符组的2个特定字符夹在中间的各字符区域对应的识别结果通过使用书写范围定义104和知识词典111的知识处理，决定由上述各字符区域构成的全体字符区域的最终识别结果，并将其向识别结果缓冲器115输出(图4的S214)。

通过对帐薄的各书写范围位置反复进行以上说明的图2的S201～图4的S214的一系列控制处理，决定对各书写范围的最终识别结果(图4的S215→图2的S201的反复)。

在上述一系列的识别处理中，对直至最后未满足识别条件的字符或字符串的部分附加上拒识(不能识别)信息。

这时，识别结果缓冲器115得到的识别结果通过接口部116在显示部117上显示。用户对显示部117上的识别结果的显示可以通过由鼠标和键盘等构成的输入部118对不能识别字符/字符串进行修正。

用户通过输入部118只指定不能识别字符/字符串中的特定的正确字符，关于该正确字符的信息就从接口部116向正确字符缓冲器119和区域坐标缓冲器120输出。

在图21的例中，在显示部117上与识别结果2102并列地显示对象字符串的图像2101。用户通过作为输入部118的鼠标等指示了图像2101上的特定区域2103时，与其对应的识别结果字符2104就进行强调或反转显示等。对于该显示，用户通过作为输入部118的键盘等输入正确字符“都”时，关于该正确字符“都”的信息就从接口部116向正确字符缓冲器119和区域坐标缓冲器120输出。当然，用户指示了图像2101上的例如与“东京”对应的区域并将与其对应的识别结果“束长”修正为“东京”时，关于该正确字符“东京”的信息就从接口部116向正确字符缓冲器119和区域坐标缓冲器120输出。

候补单词检索部109将关于正确字符缓冲器119得到的正确字符的信息作为特定字符的信息，通过进行使用上述特定字符词典110和知识词典111的候补单词的检索处理，便可正确地再次识别不能识别的字符。另外，字符分离部103通过从区域坐标缓冲器120中取得由用户指定的正确字符的分离位置，便可进行正确的字符的分离。

另外，在图22的例中，在显示部117上与识别结果2202并列地显示对象字符串的图像。用户通过作为输入部118的鼠标等指示了该图像上的特定区域2201时，与其对应的识别结果字符2203进行强调或反转显示等，同时在指示部分显示识别结果候补2204。对于该显示，用户通过作为输入部118的键盘等选择正确字符“都”时，关于该正确字符“都”的信息就从接口部116向正确字符缓冲器119和区域坐标缓冲器120输出。这时，在指示部分显示的识别结果候补2204按所显示的字符的出现频度顺序或者在如住所字符串那样具有层次结构时按由该层次结构决定的顺序或单纯地按字符代码顺序进行显示。

在图22的例之后，如图23所示，对于指示位置和与其对应的识别结果位置2302，也可以通过进行同样的修正处理正确地再次识别字符串2303。

关于对由构成各特定字符组的2个特定字符夹在中间的各字符区域的再次识别处理，在上述图3的S207～212对怪1个候补单词的各字符个别地再次进行识别处理，最后输出对该候补单词的识别结果。

这时，匹配部106通过将从标准模式词典113上检索的字符种类限定为候补单词所属的类别的字符种类，实现高效率的再次识别处理。

另一方面，对由2个特定字符夹在中间的整个字符区域，也可以进行特征矢量的抽出和匹配部106的匹配处理。这时，在标准模式词典113中保持将“川崎”“横滨”“横须贺”…各个单词作为1个模式的标准模式的特征矢量，匹配部106进行将1个候补单词的全体作为1个模式的特征矢量与标准模式词典113内的各标准模式的特征矢量的匹配处理。

这时，匹配部106通过将从标准模式词典113上检索的单词组限定为候补单词所属的类别的单词组，实现高效率的再次识别处理。

更具体地说，就是在例如住所字符串的识别中，匹配部106通过将从标准模式词典113上检索的单词组限定为构成候补单词所属的层次等级的单词组，实现高效率的再次识别处理。

例如，如图20所示，在由2个特定字符“县”和“市”夹在中间的区域的再次识别处理中，可以将标准模式词典113限定为只表示“川崎”“横滨”“横须贺”…等市的单词组。

另外，在例如住所字符串的识别中，得到高位等级的识别结果时，匹配部106通过将从标准模式词典113上检索的单词组限定为构成属于该高位等级的识别结果并且构成候补单词所属的低位等级的单词组，实现更高效率的再次识别处理。

例如，住所字符串的等级1的识别结果为“青森”时，等级2的标准模式就可以不是可由2个特定字符“县”“市”夹在中间而出现的所有的单词组，而限定为表示属于“青森县”的市的单词组。

与上述相反，在例如住所字符串的识别中，在得到低位等级的识别结果时，匹配部106通过将从标准模式词典113上检索的单词组限定为构成该低位等级的识别结果并且是候补单词所属的高位等级的单词组，也可以补救高位的不能识别状态。

对于记录实现本实施例的程序的记录媒体的补充

本发明由计算机使用时，也可以构成为用于使计算机具有和由本发明的实施例的各结构所实现的功能相同的功能的计算机可以读出的记录媒体。

这时，如图24所示，例如软盘、CD-ROM盘、光盘、可移动硬盘等便携式记录媒体2402通过网络线路2403实现本发明的实施例的各种功能的程序装载到计算机2401的本体2404内的存储器(RAM或硬盘等)2405中而运行。

按照本发明的字符识别技术首先优先地识别输入字符串中的特定字符或特定字符串，根据该识别结果假定其前后的候补单词，进而通过使用该候补单词的信息再次识别构成输入字符串的字符，便可高精度地识别构成书写到通常所见到各种帐薄(发票)上的那种以不规则的间隔、书写方法书写的输入字符串的字符。

按照本发明的字符修正技术，只修正特定的字符或字符串便可自动地修正其他不能识别的部分。

按照本发明的对表示上的变化波动进行控制的技术，可以灵活地对待各种书写方法。

Claims

1．一种字符识别方法，用于识别构成书写到具有指定类别的书写范围内的输入字符串的字符，其特征在于：

通过在上述输入字符串与第1识别词典之间进行第1匹配处理，从上述输入字符串中抽出特定字符或特定字符串；

从不同类别的单词词典中抽出属于上述指定类别的并且有可能位于从上述输入字符串中抽出的各特定字符或特定字符串的前后的上述输入字符串中的区域的候补单词组；

对于属于该抽出的候补单词组的各候补单词组，根据与该各候补单词有关的信息，对该各候补单词所在的上述输入字符串中的各区域，通过使用第2识别词典进行第2匹配处理，识别构成上述输入字符串的字符。

2．按权利要求1所述的字符识别方法，其特征在于：将与上述特定字符或特定字符串对应的标准模式存储到上述第1识别词典中；通过在上述输入字符串的模式和上述第1识别词典内的各标准模式之间进行上述第1匹配处理，从上述输入字符串中抽出上述特定字符或特定字符串。

3．按权利要求1或2的任一权项所述的字符识别方法，其特征在于：将与和属于上述候补单词组的候补单词关联的字符或字符串对应的标准模式存储到上述第2识别词典中；对于属于上述候补单词组的各候补单词，根据与该各候补单词有关的信息，对该各候补单词所在的上述输入字符串中的各区域，通过在该各候补单词的模式和上述第2识别词典内的各标准模式之间进行上述第2匹配处理，识别构成上述输入字符串的字符。

4．按权利要求1至3的任一权项所述的字符识别方法，其特征在于：具有如下过程，即作为关于上述各候补单词的信息，使用该各候补单词的字符数的信息。

5．按权利要求1至4的任一权项所述的字符识别方法，其特征在于：作为上述第1识别词典，使用包含该第1识别词典的上述第2识别词典。

6．按权利要求1至5的任一权项所述的字符识别方法，其特征在于：通过在上述输入字符串和上述第1识别词典之间进行第1匹配处理，从上述输入字符串中抽出在上述指定类别中出现的频度高的特定字符或特定字符串。

7．按权利要求1至5的任一权项所述的字符识别方法，其特征在于：通过在上述输入字符串和上述第1识别词典之间进行第1匹配处理，从上述输入字符串中抽出识别精度高的特定字符或特定字符串。

8．一种使用权利要求1至7的任一权项所述的字符识别方法的字符修正方法，其特征在于：与上述输入字符串并列地显示构成上述输入字符串的字符的识别结果；指定该显示的输入字符串上的所希望的区域，修正与该所希望的区域对应的字符或字符串；根据与通过该修正而得到的正确字符或正确字符串有关的信息，通过再次进行上述候补单词组的抽出处理和上述第2匹配处理，再次识别构成上述输入字符串的字符。

9．按权利要求8所述的字符修正方法，其特征在于：具有如下过程，即应答上述显示的输入字符串上的所希望的区域的指定，显示该所希望的区域中的多个候补识别结果。

10．按权利要求1至9的字符识别方法或字符修正方法，其特征在于：对于上述各候补单词具有变化波动的单词作为属于上述候补单词组的新的候补单词而输出。

11．一种字符识别装置，用于识别构成书写到具有指定类别的书写范围中的输入字符串的字符，其特征在于：

具有通过在上述输入字符串与第1识别词典之间进行第1匹配处理，从上述输入字符串中抽出特定字符或特定字符串的特定字符/特定字符串抽出单元；

从不同类别的单词词典中抽出属于上述指定类别的，并且有可能位于从上述输入字符串中抽出的，各特定字符或特定字符串的前后的上述输入字符串中的区域的候补单词组的候补单词组抽出单元；和

对于属于该抽出的候补单词组的各候补单词组，根据与该各候补单词有关的信息，对该各候补单词所在的上述输入字符串中的各区域，通过使用第2识别词典进行第2匹配处理，识别构成上述输入字符串的字符的输入字符串识别单元。

12．一种在计算机使用时记录由其读出的程序的计算机可以读出的记录媒体，其特征在于：记录用于使计算机具有以下功能的程序，即通过在书写到具有指定类别的书写范围内的输入字符串和第1识别词典之间进行第1匹配处理，从上述输入字符串中抽出特定字符或特定字符串的功能；

从不同类别的单词词典中抽出属于上述指定类别的，并且有可能位于从上述输入字符串中抽出的各特定字符或特定字符串的前后的，上述输入字符串中的区域的候补单词组的功能；和

对于属于该抽出的候补单词组的各候补单词组，根据与该各候补单词有关的信息，对该各候补单词所在的上述输入字符串中的各区域，通过使用第2识别词典进行第2匹配处理，识别构成上述输入字符串的字符的功能。