JPH02195489A

JPH02195489A - 文字認識の後処理装置

Info

Publication number: JPH02195489A
Application number: JP1013907A
Authority: JP
Inventors: Yasuaki Nakano; 中野　康明; Hiromichi Fujisawa; 浩道藤澤; Akizo Kadota; 門田　彰三; Toshihiro Hananoi; 花野井　歳弘
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1989-01-25
Filing date: 1989-01-25
Publication date: 1990-08-02
Also published as: KR910014839A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は文字認識の後処理装置に係り、特に住所や氏名
などの情報を高精度に認識する目的に好適な文字認識の
後処理装置に関する。

〔従来の技術〕

通常の文字認識装置（以下、ＯＣＲと略する）では、認
識性能は１００％完全ではなく、誤読や不読が避けられ
ない。ここでいう不読の中には、認識結果として候補文
字が全く得られないものと。

複数個の候補文字が得られてそのいずれかを決定できな
いものとが含まれる。以下、前者の不読を拒絶性の不読
または単に拒絶、後者の不読を競合性の不読または単に
競合と呼んで区別することがある。

このようなＯＣＲの認識性能の不完全性を補うため、た
とえば住所や氏名など単語としてまとまって書かれた文
字列の読み取り結果について、単語照合を行って認識性
能を高める手法が提案されている。単語照合とは、住所
や氏名として存在し得る単語の集合を予め単語辞書とし
て用意しておき、認識結果として得られた候補文字列を
単ａ辞書に含まれる単語と順次比較して単語の距離を求
め、単語距離をあらかじめ設定した閾値と比較して、単
語距離の小さい単語を候補単語と判定するものである。

ここで候補文字列とは、各入力文字パターンに対する候
補文字集合を並べたものをいう、このような手法は、例
えば特公昭６Ｏ−５５８６６ｒ文字認識装置」に述べら
れている。また、単語と認識候補文字列との比較に際し
てＯＣＲでの認識結果の情報を利用するため、候補文字
に対して順位ごとに重みを付けて単語間の距離を計算す
る手法が、特開昭５８−４８１８１　ｒ文字認識後処理
方式」や特公昭６１−２００３８　ｒ文字認識装置」に
述べられている。さらに、住所のように複数の単語から
なる文字列に対して、単語辞書との比較を行う方法も特
公昭６２−６２３８８　ｒ住所読取装置」に述べられて
いる。

〔発明が解決しようとする課題〕

上記の従来技術では、文字認識結果が競合性不読であれ
ば正解単語の距離が小さくなるため、単語照合の精度が
高くなる。しかし、文字認識の結果に誤読あるいは不読
が含まれる場合には、正解単語の距離が大きくなるため
、正解単語を候補の中に含めるには、単語照合の閾値を
大きく取っておく必要があった。しかし、単語辞書の中
に含まれる語数が少ない場合は閾値を大きくとっても良
いが、単語辞書の語数が大きくなると、候補単語の個数
が増大してしまうため、単語照合の閾値を大きく取ると
単語照合の効果が十分得られないという問題点があった
。

単語照合で正解単語を候補に含めるための別の手段とし
て、文字認識結果として得られた候補文字に対して、あ
らかじめ定めた候補追加規則により、候補文字として推
定できる文字をも認識結果の候補の中に追加する方法も
提案されている。しかし、この方法でも、候補追加を積
極的に行うと候補単語の個数が増大してしまい、候補追
加の程度が小さければ正解単語が候補の中に入って来な
いという問題があった。

従って１本発明の目的は、ｍ語照合の閾値を適切に選択
し、あるいは候補追加規則を適切に設定する方法を与え
ることにより、単語照合の効果を十分発揮させることに
ある。

［１１１！を解決するための手段〕上記の目的は、単語照合の様態を外部、たとえば上位コ
ンピュータから指示し、単語照合の様態ごとに適切な閾
値を選択させ、あるいは適切な候補追加規則を選択させ
ることによって達成される。

〔作用〕

まず、従来方式による単語照合の原理を説明する。カナ
文字で書かれた地名（県名）の場合を例に取り、入力文
字が「ワカヤマ」であったとき、各文字に対する認識結
果として、入力　　　　　ワ　　カ　　ヤ　　マ第１位　　　り　　サ　　ヤ　　ア２　　　　　　フ　　カ　　オ　　マ３　ユヤキャ４　　　　　　　　　　り　　シのように候補文字が得られたとする。

ここで、アングラインを付けた文字は正解文字を示す。

この候補文字列と、単語辞書の中に存在する各単語との
距離は１文字ごとの距離の総和として定義され、文字ご
との距離は、例えば単語の中に含まれる文字が第ｎ位候
補であるとき（ｎ−１）であると定義される。したがっ
て、単語「ワカヤマ」に対する距離は最初の文字「ワ」
は第３位なので距離２となり、以下同様にして単語全体
ではＤ＝２＋ｌ＋Ｏ＋１＝４となる。同様に単語「ツクシマ」に対してはＤ＝１＋３
＋３＋１＝＝８となる。以下同様に全ての単語との距離を求め、距離が
閾値ＤＭ八へ以下になる単語を候補単語として設定する
。この例で、閾値をＤＭ＾ｘ＝９に取れば、「ワカヤマ
」、「ツクシマ」が候補単語として得られる。候補単語
の定め方の別の方法として、最小距離との距離差が閾値
ＤＤＩＦ以下の場合は候補とするものもあり、ＤｏｗＦ
＝３に取れば「ワカヤマ」のみが候補となる。上記の二
つの閾値ＤＨＡＸＤＤＩＦをそれぞれ絶対閾値、相対閾
値と呼ぶ。絶対閾値と相対閾値の両者を併用する候補単
語判定法もあり、また絶対閾値あるいは相対閾値を単語
長の関数として定める方法もある。

上記の例では、各文字パターンに対し候補中に正解が含
まれているとしたが、候補中に正解が含まれていない場
合は、上記の方法では正解単語を候補として得ることが
できない０例えば、上記の例で正解が「フクオカ」であ
る場合、第４文字目において正解文字が候補の中に含ま
れていないので、正解単語に対する距離が得られない。

この場合に、候補文字に類似した文字を候補文字として
追加する処理が知られている（この処理を類似文字追加
処理と呼ぶ）。この例では、第４文字目の候補に、「ヤ
」に対する類似文字ｒ力」を追加する処理を行った後、
単語照合を行う、ただし、追加文字に対する距離はやや
大きく、例えば５にとるものと“する、この時「フクオ
カ」の単語距離はＤ＝１＋３＋１＋５＝９となり、　ＤＭ＾ｘ＝９とすれば、候補単語の中に入る
。なお、候補追加は第４字目以外でも行われるが、第２
字目では「ヤ」に対する類似文字「力」は既に候補中に
存在するので追加は不要である。

「ヤ」以外の候補文字に対する候補追加は簡単のため省
略しである。候補追加処理は、各候補に対する類似文字
をあらかじめ定めたテーブルを参照して行ねれる。

候補追加の極端な場合として、全ての文字を候補文字と
して追加してしまう方法もある（この処理を全文字追加
処理と呼ぶ）。ただし、この場合は追加文字に対する距
離はかなり大きくしておく必要があり、例えば８にとる
ものとする。このようにすれば、４文字の単語に対して
必ず距離が求められる。たとえば、上記の例で「オカヤ
マ」、「トクシマ」に対して、単語距離はそれぞれ１０
．１５が得られる。

候補追加を行うことにより、正解単語が候補として得ら
れやすくなる利点はあるが、同時に無関係な単語が多数
候補になることは明かである。

次に、本発明の詳細な説明する前に、以下の実施例で用
いられる単語照合の原理を説明する。ただし、本発明は
特定の単語照合の手法に限定されるものではなく、次に
述べる手法以外のものを使用しても良い。

実施例で用いる単語照合手法の原理を、第１図を用いて
説明する０本手法では、候補文字列から、第１図（Ａ）
のような有限オートマトンを生成する。

このオートマトンに単語辞書に含まれる各単語を文字列
として表したものを順次入力し、その文字列が受理され
るかどうか、またその場合の距離はいくらになるかを求
める。

第１図（Ａ）のオートマトンで丸印は状態を示し、その
中に書かれた文字は状態番号を示し、状態と状態の間が
単語の各文字位置に対応する。状態間の線は遷移を示し
、ある状態で線上の左側に書かれた文字がオートマトン
に入力された場合に、その遷移経路をたどって次の状態
に遷移することを示す。線上の右側に書かれた数字は、
その遷移に要するコストであり、この場合は、候補文字
の順位に相当する値としている。遷移経路に応じたコス
トを加算したものが、その単語に対する距離として出力
される。ある単語の処理の途中で、遷移経路が存在しな
いような文字が出現した場合、その単語に対する処理は
打ち切られ、距離としては非常に大きな値（例えば９９
９）が出力される。

第１図から、単語「ワカヤマ」がこの有限オートマトン
に入力されたとき、太線で示された経路を辿り、単語の
距離はＤ＝２＋１＋Ｏ＋１＝４となることは容易に確かめられる。同様に、単語「ツク
シマ」は距離９となる。

第１図（Ｂ）、（Ｃ）は、候補追加を行った場合のオー
トマトンを示し、（Ｂ）は類似文字候補追加を行った場
合であり、破線で示される遷移経路が追加された候補文
字に対応し、この場合のコストは５としである。（Ｃ）
は全文字候補追加を行った場合に対応し、破線で示され
た遷移経路の上に記されたｏｔｈｅｒｓは候補に含まれ
ていない任意の文字が通過する経路であり、通過コスト
は８としである。

第１図に示したオートマトンを用いる方式は、単語照合
を高速に処理できる利点がある。

次に、複数の単語からなる複合単語に対して、実施例で
採用した単語照合の原理を説明する。カナ文字で書かれ
た住所を例に取り、住所は都道府県、市郡区１区町村の
３階層からなるものとする（実際の住所には、さらに大
字・字、下目、番地などの表記が続いたり、郵便番号を
付記したりするが、階層数が増えた場合として考えれば
良いので、下記の説明から容易に類推できよう）。

入力帳票上で、住所は各階層ごとに別々の記入帯に分離
して書かれるものとする（記入帯が分離されず、全階層
が連続して書かれる場合にも容易に拡張できるが、説明
の簡単のため記入帯は分離されているとする）、、住所
の例としてオカヤマケン／ニイミシ／カナヤを考える。ここで、「／」は記入帯が分かれていること
を示す。各記入帯ごとに、文字認識、単語照合を行うこ
とにより、各階層での候補単語として都道府県：ワカヤマケン、オカヤマケン市郡区　：ニイ
ミシ、ニイツシ区町村　：カナダ、カナダ、カナダ、ヤマヤが得られた
とする。ただし、区町村での候補単語で３個の「カナダ
」があるが、これらは別々の土地の地名を表わす、ここ
では、これら３個を別の単語として考え、「カナキー１
．２．３」と表わす。

単語照合の段階では、これらの候補のうち、いずれが正
しいかを判断することは困難である。しかし、都道府県
、市郡区、区町村の単語の間には従属関係があり、これ
を利用すればさらに候補を限定できる。この例では、第
２図に示すようにｒカナヤーＩＪはｒニイミシ」に、「
ニイミシ」は「オカヤマケン」に属するので、結局３階
層全てについて従属関係をを満足する候補単語の組合せ「オカヤマケン」十「ニイミシＪ＋ｒカナヤー１」が得
られる。一方、「カナヤーニ」及び「ヤマヤ」はｒニイ
ッシ」に属するが、「ニイッシ」が属する「ニイガタケ
ン」は候補単語の中に含まれていないので、「ニイツシ
」、「カナキー２」、「ヤマヤ」は候補単語から除去さ
れる。「オカヤマケン」も、「カナキー３」も、これに
接続する市郡区階層の単語が候補にないので、候補単語
から除去される。このように、階層間の従ノーー関係を
考慮することにより、単語照合の正解率が高まる。

以下では、この処理を複合単語照合処理と呼ぶ。

これに対し、前述した１個の単語の照合を単純単語照合
処理と呼ぶ。

次に１本発明の原理を述べる。本発明では、複数種類の
単語照合の様態（モード）という概念を導入する。一つ
の様態は、単純単語照合と複合単語照合のどちらを用い
るかの指定である。また、別の様態は、概略単語照合、
精細単語照合のいずれを用いるかの指定である。概略単
語照合は、候補が多数出ても良いから正解単語をできる
だけ候補に含めようとするものであり、精細単語照合は
、正解単語が得られなくても良いが、誤った単語が照合
されることを避けようとするものである。また、別の様
態は、階層単語照合を使用するか否かの指定である。階
層単語照合は、複数種類の単語照合を組合せた照合方法
である。その他、複合単語照合において、記入帯が分離
されているか否かも一つの様態である。このように、単
語照合を規定するいくつかの様態があり、使用状況に応
じて各様態を指定することになる。例えば、人名の場合
でも、不特定の人名を読み取る際には単語辞書のサイズ
が大きくなるので、概略単語照合では候補単語が増えす
ぎ、精細単語照合を選んだ方が良いが、ある事業所の中
の人名に限られる場合には、概略単語照合でも差し支え
ない。

単語照合の様態は、本発明が適用されるシステムに対し
て使用者から与えられる。すなわち、通常の文字ｕｒａ
システムにおいては、書式情報（フォーマット情報）と
称して、文字認識の様態を指定する情報が外部から与え
られるが、書式情報の一項目として、単語照合の様態を
指定する部分を設けるようにする。使用者から指定され
た単語照合の様態は、システムを制御するコンピュータ
によって、書式情報から取り出され、単語照合部に与え
られる。

本発明においては、単語照合の様態に応じて、単語照合
における各種のパラメータや処理手順を制御する。

パラメータを制御する一つの方法は、絶対閾値と相対閾
値を単語照合の様態に応じて変えるものである。その一
つの例は、精細単語照合では、絶対閾値と相対閾値を小
さく取り、概略単語照合では、これらを大きく取る。こ
のように取ることにより、精細単語照合では正解単語が
得られない場合もあるが、誤照合は少なくなり、概略単
語照合では多数の候補が出る代わりに、正解単語が候補
に含まれるようになることは明らかである。パラメータ
の制御法の中には、単語照合を行う時のオートマトンの
遷移に要するコストを変える方法もある。

処理手順を制御する一つの方法は、単語照合の様態に応
じて、候補追加方法を変えるものである。

その一つの例は、単純単語照合では候補追加を行わない
か、あるいは類似文字追加を行うようにし、複合単記照
合では全文字追加を行うようにするものである。このよ
うにすれば、単純単語照合では候補数はあまり増加しな
いで済む。一方、複合単語照合の場合、各階層ごとの単
語照合では多数の候補が発生するが、階層間の従属関係
の検査によって無縁な候補は除外されるので、誤照合を
生ずることがほとんどない。

階層単語照合の場合には、処理手順の指定が可能である
０階層単語照合の一つのやり方は、概略単語照合とＷ１
１単語照合を組合せるものであるが、その組合せ方法と
して、最初に概略単語照合を行って得られた候補につい
て精細単語照合を行う方法と、最初に精細単語照合を行
って、候補が得られなかった場合に概略単語照合を行う
方法の２種類がある。前音は高速性の長所があり、後者
は平均候補数をあまり増加することなく照合失敗を防ぐ
ことができる。階層単語照合の別のやり方に、候補追加
方法を切り替えるものがあり、例えば最初は候補追加を
行わずに単語照合を行い、照合失敗の場合に候補追加を
行うものである。階層単語照合の処理手順は、上に述べ
たように選択可能としておいても良く、最も有効と考え
られる一つを選んで固定しておいてもよい。

以上に説明したように１本発明により文字認識の後処理
が処理対象に応じて最も有効なものが選択される。

〔実施例〕

以下、本発明による一実施例を第３図により説明する。

第３図は、本発明による文字認識の後、処理方式を実現
するシステムの装置構成を示す図である。

同システムは、システムを制御するＣＰＵ　（中央制御
装置り１００、主メモリ１０１、端末１０２、システム
フッ４９１０３１文書画像の走査を行うためのスキャナ
１０４、ビデオメモリ１０５、文字認識部１０６．単語
照合部１０７、ワークファイル１０８、バス１０９を基
本部として持つ。

各部の動作の流れを以下に詳細に説明する。

ＣＰＵ１００は、主メモリ１０１の中のプログラムを実
行することにより、以下に述べるシステム全体の動作を
制御する。システム各部の動作に応じて、必要なプログ
ラムをシステムファイル１０３から主メモリ１０１にロ
ードあるいは退避したり、各プログラムに実行権を付与
したりすることは、オペレーティングシステムプログラ
ムにより行われるが、その動作は周知の通りであるから
省略する。以下の説明で、システム各部が自律的に動作
するように述べるが、実際にはＣＰＵ１００のプログラ
ム制御に従って動作することを簡略化して述べたもので
ある。また、システム各部の間のデータ授受はバス１０
９を介して行われるが、説明を簡略化するため、システ
ム各部間で直接データ転送が行われるように述べる。

端末１０２は、プログラムが要求する時点で、操作者と
のデータ授受を行うために用いられる。

以下の説明では端末１０２の記述を省略し、　ｃｐｕｌ
ｏｏが直接操作者とデータ授受を行うように述べる場合
もある。

操作者は、作業の最初に端末１０２を介してＣＰＵ１０
０と対話し、読取対象文書の形式や読取様態などの書式
情報をＣＰＵ１００に与えるが。

その中で単語照合の様態を指定する情報も与えておく。

操作者が読取対象文書１１０をスキャナ１０４にセット
すると、スキャナ１０４は文書１１０の上の画像を走査
し、二値ディジタル画像に変換して、ビデオメモリ１０
５に格納する。ビデオメモリ１０５は文書画像以外にも
後述する各種のデータの格納に用いられ、それぞれが相
互に干渉しないよう別々の領域に格納されるが、以下で
は特に断わらずにビデオメモリ１０５と記述している。

文字認識部１０６は、予め与えられた書式情報に従って
、ビデオメモリ１０５の中の文書画像から、文字の記入
された領域を探索し、その中の文字パターンを切出し、
認識する０文字の切出し、認識処理については公知であ
るので省略する。Ｕ諏結果は、各文字パターンに対する
候補文字の系列として表され、ビデオメモリ１０５に格
納される。

文字認識が終了すると、ＣＰＵ１００の制御により単語
照合処理が行われる。第４図に単語照合処理の流れ図を
ＰＡＤ形式で示す０本実施例は、単語照合の様態として
概略単語照合と精細単語照合とを選択可能とするもので
ある。それぞれの中で、単純単語照合と複合単語照合が
あるが、この実施例では単純単語照合を対象としている
。また。

概略単語照合と精細単語照合の他に、階層単語照合の様
態が存在するが、階層単語照合については後述する。

第４図の流れ図において、４０１は単語照合様態が概略
単語照合か、精細単語照合かを判定する部分である。こ
の単語照合様態を表す情報は、ＣＰＵ１００から送られ
る。この情報を用いて、第５図に示す表を引き、単語照
合処理で用いる各種のパラメータを取り出す。

第５図は、単語照合様態とパラメータの関係を示す表の
一表現方法を表したものである。第５図で５０１，５０
２は単語照合様態を表し、５０１では概略単語照合、精
細単語照合、階層単語照合の区別を表し、５０２では単
純単語照合、複合単語照合の区別を表す。前述したよう
に、本実施例では階層単語照合は考慮せず、また単純単
語照合のみを対象としているので、第５図の表で第１行
と第３行のみが選択の対象となる。５０３　、５０４は
単語照合に先立つ候補追加処理として、全文字追加を行
うか、類似文字追加を行うかの指定である。ただし、５
０４は階層単語照合においてのみ意味を持ち、本実施例
では参照されない、５０５゜５０６は後述する絶対閾値
Ｄ　ｗａｘと相対閾値Ｄ　ａ　ｔ　ｉを指定する部分で
ある。

第４図の流れ図の説明に戻り、単語照合様態が概略単語
照合の場合は、４０２において第５図の項目５０３の第
１列を参照して、候補追加処理方法として、全文字追加
処理を指定する。精細単語照合である場合は同様に５０
３の第３列を参照して、４０３において候補追加処理方
法として、類似文字追加処理を指定する。４０４は単語
照合の準備を行う部分であり、その中には候補文字追加
処理も含まれるが、４０２または４０３で指定された処
理を行う。４０５は、単語照合における単語辞書の種類
を指定する部分で、書式により指定された辞書を選択す
る。具体的には、あらかじめメモリ１０５の上にロード
しておいた複数個の単語辞書の一つを、その先頭アドレ
スを指定することにより選択するものである。４０６は
単語照合を行う部分であり、文字認識の候補文字列から
生成された有限オートマトンに、単語辞書に含まれる各
単語を順次入力し、各単語に対する距離を求める処理を
行う、この単語距離を求める処理は、文字認識部の出力
文字数と等しい長さの単語についてのみ行う、単語照合
の詳細については後述する。４０７は単語照合部の出力
から総合判定を行う部分である。単語照合部の出力は、
各単語に対する距離を並べたリストであり、ビデオメモ
リ１０５に出力される。このリストの中で、距離が絶対
閾値Ｄｍａｘより小さい単語を求める。その中で最小距
離を求め、さらに最小距離からの差が相対閾値Ｄ　ｍ　
ｔ　ｉ以下の単語を候補単語として設定する。この絶対
閾値り、口及び相対閾値Ｄ　ｄｔ　ｉの値は、第５図の
表の項目５０５，５０６から求める。

このようにして候補単語が求まると、ＣＰＵ１００はこ
の候補単語を端末１０２の上に表示し、操作者の選択あ
るいは修正を行わせる。ここで、選択とは表示されてい
る候補単語の中から正しい単語を選ぶものであり、修正
とは表示された単語の中に正しい単語が存在しない場合
に、操作者が正しい単語を入力するものである。この時
、認識対象となった部分の画像を候補単語と同時に端末
１０２に表示することは選択あるいは修正を行う上で有
効である。

操作者の選択あるいは修正を経た単語データはワークフ
ァイル１０８に出力される。用途によっては、操作者の
選択・修正を行わずに、単語照合での第１位単語をその
まま出力してもよい。

次に、単語照合の詳細について述べる。第６図によりビ
デオメモリ内におけるデータの表現方法について、第７
図により文字認識結果の候補文字列から生成される有限
オートマトンの遷移表についての説明を行う。

第６図は、文字ｖｌｌ郡部０６の出力である候補文字列
のビデオメモリ１０５内での表現方法の一例を示す。第
６図で、６０１はポインタテーブルであり、各文字パタ
ーンに対する候補文字数Ｎ直。

Ｎ、、　Ｎ、１０６．と、候補文字列を格納したテーブ
ル６０２へのポインタｐ１．ｐ、、ｐ、１．．。

を有する。６０２は候補文字テーブルであり、各文字パ
ターンごとの候補文字を並べたもので、先頭からの相対
アドレスＰ１以降に、第１字での候補（この例ではり、
）、ワ）が、同じくＰ２以降に第２字での候補文字が並
ぶ。

第７図は、候補文字列から生成される有限オートマトン
で用いられる遷移表の表現方法の一例を示す、この遷移
表は、単語照合部１０７に付属する内部メモリの中に作
られる。

第７図で、７０１は有限オートマトンの各状態ｓ、、　
ｓ、、　ｓ、、　ｓ、１０６．に対応する情報を含むテ
ーブルである。但し、Ｓｏは第１図の初期状態Ｓを、Ｓ
工１１．は第１図の状態■１０．に対応する。以下二の
テーブル７０１を状７ａｉ１ｍ移表あるいは略して遷移
表と呼ぶ、また、第７図で、７０２は各遷移に対するコ
ストを記憶したテーブルであり、以下このテーブル７０
２を遷移コスト表と呼ぶ、有限オートマトンの各状態は
７０１における先頭アドレスポインタＪ、、Ｊ、、Ｊ、
。

１０．によって表される。

遷移表７０１及び遷移コスト表７０２は、第４図の単語
照合準備４０４で作られるもので、その概要を述べる。

遷移コスト値は候補文字の順位によって定まるが、順位
をコストに変換する規則は、ＣＰＵ１００から単語照合
部１０７に送られた単語照合の様態に応じて設定される
。第７図に示した例では、コストは全文字追加処理、す
なわち第１図（Ｃ）の説明図に対応するものであり、文
字認識の結果、候補文字として出力された文字に対して
は、順位から１を減じたものをコストとして与え、それ
以外の文字にはコスト８を与える。候補文字追加処理を
行わない場合、すなわち第１図（Ａ）の場合は１文字認
識の候補の中に含まれない文字に対しては、次アドレス
として、最終状態のアドレスを与え、遷移コストは非常
に大きな値（例えば９９９）を与える。候補文字追加処
理として類似文字追加処理を行う場合、すなわち第１図
（Ｂ）の場合は、まず候補文字追加処理を行わない場合
と同様にして遷移表と遷移コスト表を作った後、文字認
識の結果得ら九た候補文字から、あらかじめ作成してお
いた類似文字テーブルを引いて定まる類似文字について
、遷移表では次アドレスとして次状態のアドレスを与え
、遷移コスト表ではコスト５を与える。以上の説明から
理解されるように、遷移表７０１と遷移コスト表７０２
を書き換えることにより、候補追加規則を変化させるこ
とができ、言い替えれば照合方法を変化させることかで
きる。

各状態に対して、７０１，７０２における先頭アドレス
ポインタＪ０、Ｊい　Ｊ２．、、、が定まる（説明を簡
単にするため、二つのテーブルで同じ記号を用いる）、
この例では、第１状態に対してＪ　ｓ　＝Ｊ　ａ　＋　（ｘ　　　１　）　Ｘ　２５６
　Ｘ　２で定める。すなわち、７０１，７０２は各状態
ごとに２５６個のエントリを有するテーブルである。

２５６個のエントリは文字コードに対応しており。

この例ではＪＩＳコードにより文字を表わす。従って、
例えば１文字「キ」はＪＩＳコードで１８３であるから
、（先頭から数えて）１８４番目のエントリに対応して
いる。

状態遷移表７０１は、有限オートマトンの各状態Ｓｔ（
実際にはアドレスＪｔで示される）において、文字ＣＩ
が到来したときの動作を記述するものであり、次状態８
７（実際にはアドレスＪＪ）に遷移することを示す、遷
移コスト表７０２には、その遷移に対して発生するコス
トＷＪが記憶されており、７０１と７０２で先頭からの
相対アドレスが等しいもの同士が対応する。第７図の例
で言えば、初期状７１８０（実際にはアドレスＪ０で文
字「）」が到来すれば、遷移表７０１でアドレス（Ｊ、
＋２０４）の内容を引いて、次アドレスＪ□を、また遷
移コスト表７０２の同じアドレスからコスト１を得る。

同様に、文字「へ」が到来すれば次アドレスＪ１とコス
ト８を得る。上に述べたように、この場合のコストは全
文字追加処理に対応するものである。

このようにして、入力文字列が与えられれば、遷移表７
０１を参照することにより、有限オートマトンを順次辿
ることができ、遷移コスト表７０２からその遷移に要す
るコストも順次得られることがねかる。

第７図の例では、ＪＩＳコード２５６個全てについてエ
ントリを設けるとしたが、例えば入力文字列が片仮名に
限定されることが判っている場合には、ＪＩＳコードは
１６６（ヲ）から１９１（＠　：半濁点）までの範囲に
入るから、エントリとして入力コードＣ（ｉ　）の代り
に（Ｃ（ｉ）−１６６）を用いれば、５８個のエントリ
で済む。

文字詔識部１０６の高力である候補文字列から、有限オ
ートマトンの遷移表と遷移コスト表を生成する処理、ま
たその中で候補文字追加を行う処理、あるいは単語が与
えられたとき、遷移表をたどって距離を求める処理は、
情報処理分野の専門家には容易に実現され得ると思われ
るので、説明を省略する。

次に、単語照合部１０７すなわち有限オートマトンによ
る文字列受理の処理を実現するハードウェアの詳細な説
明を行う。

第８図は、単語照合部１０７の構成を示す構成図である
。第８図において入力端子８００には単語辞書から与え
られる文字列が入力される。この文字列の各文字コード
はレジスタ８０１でラッチされ、そのラッチされた文字
コードはメモリ８０２及び８０９の入力となる。メモリ
８０２は第７図の状態遷移表７０１を記憶しているもの
で、以後第８図の説明においてはメモリ８０２を状態遷
移表あるいは単に遷移表と記述することがある。メモリ
８０９は第７図の遷移コスト表７０２を記憶しているも
ので、以後第８図の説明においてはメモリ８０９を遷移
コスト表と記述することがある。

遷移表８０２には、もう一つの入力として遷移表８０２
自身の出力がレジスタ８０３及びセレクタ８０４を経て
供給されている。遷移表８０２の出力は、有限オートマ
トンにおける次状態を表わす値（先頭アドレス）であり
、遷移表８０２に対する二つの入力、すなわち次状態の
先頭アドレスと文字コードとから、遷移表のアドレスが
決定され、そのアドレスの内容が読み出されて出力とな
る。

セレクタ８０４の入力にはもう１個のレジスタ８１７の
出力がつながれているが、レジスタ８１７は入力端子８
１６から与えられる出発アドレスを記憶するものである
０通常は、入力端子８１６には初期状態のアドレスが与
えられるが、途中状態のアドレスを与えれば、オートマ
トンの途中の状態から出発することもできる。

単語照合部１０７の動作開始時に、セレクタ８０４で８
１７側を選択して初期状態のアドレスを遷移表８０２の
初期値とする。その後、セレクタ８０４で８０３側を選
択する。以後は、入力端子８００から到来する文字コー
ドに同期して、遷移表を辿る動作が繰り返される。入力
される文字列が尽きたとき、遷移表８０２は最終状態に
到達しており、この状態はデコーダ８０５で解読されて
出力端子８０６から結果識別番号として出力される。デ
コーダ８０５の出力は、最終状態以外ではＯであるが、
０以外の出力はレジスタ８０７に対しラッチ制御信号と
して働き、最終状態はレジスタ８０７でラッチされる。

この値は、出力端子８０８から結果確定信号として最終
到達状態として出力される。本実施例では、意味のある
到達状態は最終状態の１個のみとしているので、デコー
ダ８０５は必ずしも必要ではないが、有限オートマトン
の途中まで到達したことを検出したい場合に対処するた
め、デコーダ８０５とレジスタ８０７を設けて有限オー
トマトンの中でどこまで到達しているかを識別する。デ
コーダ８０５で解読すべき到達目標状態の値は、外部か
ら与えられレジスタに保持される（図示せず）ａ一方、セレクタ８０４の出力は遷移コスト表８０９の入
力にもつながれている。遷移ニス１−表に対する二つの
入力、すなわち各状態の先頭アドレスと文字コードから
、遷移に要するコストが決定され、加算器８１０に与え
られる。加算器の出力はレジスタ８１１でラッチされ、
そのラッチ出力は再び加算器８１０に入るので、レジス
タ８１１には遷移に要するコストの累積値が格納される
。

この累積値は出力端子７１２に出力される。

この累積値は、また比較器８１５にも与えられ。

入力端子８１３からレジスタ８１４にセットされた最悪
値と比較される。比較器８１５の出力は出力端子８１８
から外部に取り出されている。外部回路でこの信号を監
視することにより、累積コストが異常に大きい単語に対
する処理を途中で打ち切ることもできる。

以上に述べたように、本実施例においてはＣＰＵ１００
から与えられた単語照合の様態によって、単語照合にお
ける照合方法あるいはパラメータを変えることができる
ので、対象に応じて最適な単語照合を行うことができる
。

次に本発明による文字認識の後処理方式の第二の実施例
について述べる。この第二の実施例は複数単語を処理す
るのに適する。第二の実施例を実現するシステムは、第
一の実施例と同じく、第３図の装置構成により実現され
、ＣＰＵ１００の処理プログラムにより複合語処理を行
う。第９図に、第二の実施例の処理の流れ図をＰＡＤ形
式で示す。

なお、複合単語照合においても概略単語照合と精細単語
照合が選択できるが、この実施例では精細単語照合とし
て説明する。

第９図の流れ図において、９０１は単語照合様態が単純
単語照合か、複合単語照合かを判定する部分である。単
純単語照合の場合は、９０２〜９０５の処理が実行され
る。９０２では、第５図の項目５０３で第３行を参照し
、候補追加処理方法として類似文字追加処理を指定する
。９０３で単語照合準備を行うが、その中で類似文字追
加処理が行われる。９０４で単語辞書の種類を指定する
。９０５は単語照合部１０７に単語照合動作を指示する
部分である。

一方、９０１の判定で複合単語照合である場合。

９０６〜９１４の処理が実行される。９０６において、
第５図の項目５０３で第４行を参照し、候補追加処理方
法として、全文字追加処理を指定する。９０７は階層数
（ここではＭで表す）回だけ以下の処理を繰り返すルー
プ制御であり、ｍは階層の番号を表わす、９０８で単語
照合準備を行うが、その中で全文字追加処理が行われる
。９０９は、第ｍ階層における単語辞書の種類を指定す
る部分で、９０４と同様である。９０８は単語照合部１
０７に単語照合動作を指示する部分で、９０４と同様で
ある。９０９〜９１０の処理がＭ回実行された後、９１
１でメモリ１０５の上に関係辞書をロードしくあらかじ
めロードしておいても良い）９１２で接続関係のチエツ
クを行って、接続関係を満たさない候補単語を除去する
。９１３は総合判定を行う部分である。総合判定として
は各種の手法が存在するが、ここではその−例として、
接続関係を満たす候補単語の組が−通りの場合は。

その候補単語の組を出力し、接続関係を満たす候補単語
の組が複数の場合は、その中で単語距離の和が最小とな
る組を出力し、接続関係を満たす候補単語の組が存在し
ない場合は、各階層ごとの候補単語の１位を組合せて候
補とする処理を行う。

本実施例の説明では省略したが、単語照合の絶対間、値
Ｄ＋ａａｘと相対閾値Ｄ　ｄ　ｌ　ｉは第５図の表から
定められることは第一の実施例と同様である。

次に本発明による文字認識の後処理方式の第三の実施例
について述べる。この第三の実施例は階層的単語照合を
行うもので、単純単語照合の場合について説明するが、
複合単語照合についても同様に実現できる。第三の実施
例を実現するシステムは、第一の実施例と同じく、第３
図の装置構成により実現され、ＣＰＵ１００の処理プロ
グラムにより複合語処理を行う、第１０図に、第三の実
施例の処理の流れ図をＰＡＤ形式で示す。１００１は、
単語照合の様態を判定する部分で、この実施例では概略
単語照合、精細単語照合、階層的単語照合のうちの一つ
を選択するものである。１００１で概略あるいは精細が
指定されている場合は、１００２の概略単語照合、また
は１００３の精細単語照合が実行されるが、その内容は
第４図を用いて述べたものと同様である。１００１で階
層的単語照合が指定された場合、まず１００４で第１層
の単語照合が実行される。このとき、候補文字追加方法
として、第５図の表で項目５０３の第５行で指定された
全文字追加を行う、すなわち、第１層では概略単語照合
を行ったと等価な結果を得る。　１００４の第１層処理
の結果、１００５で候補単語数を判定し、候補単語数が
０個の場合は１００６で第２層の単語照合が実行される
。このとき、候補文字追加方法として、第５図の表で項
目５０４の第５行で指定された類似文字追加を行う、す
なわち、第２層では精細単語照合を行ったと等価な結果
を得る。

この実施例における階層的単語照合では、第１層で概略
単語照合を行った結果により、第２層で精細単語照合を
行うか否かを定めているが、逆に精細単語照合を行った
結果により概略単語照合を行うか否かを定めるようにし
ても良い、そのためには、第５図の表で項目５０３，５
０４を書き換えれば良い、また、第１層と第２層で閾値
の値を変えるようにしても良く、そのためには第５図の
表の項目を追加して、第２層での閾値を別に定める用に
すれば良い。

次に本発明による文字ｔｇｍの後処理方式の第四の実施
例について述べる。この第四の実施例は複合単語照合に
おいて、候補推定を行うか否かを選択するものである。

第四の実施例を実現するシステムは、第一の実施例と同
じく、第３図の装置構成により実現され、ＣＰＵ１００
の処理プログラムにより複合語処理を行う。第１１図に
、第四の実施例の処理の流れ図をＰＡＤ形式で示す、　
１１０１は、単語照合の様態を判定する部分で、複合単
語照合において候補推定を行うか否かを判定する。

この推定を行うか否かを指定する情報も第５図と同様に
して、表の形式で格納しておくものであるが、図示は省
略する。単語照合１１ｏ１で候補推定を行うことが指定
された場合、１１０２で候補単語数がＯの階層が存在す
るか否かを判定する。

候補単語数がＯのＰ１層が存在しない場合（すなわち全
ての階層において少なくとも１個は候補単語が存在する
場合）は何もしないが、候補単語数が０の階層が存在す
る場合、１１０３において、その階層での単語辞書に含
まれる単語を候補単語とする。ただし、その階層での入
力文字列と長さが等しい単語のみを候補単語とする。１
１０４で、通常の複合単語照合を行う０通常の複合単語
照合とは第９図の９０５〜９１２で示されるような処理
である。

この実施例では、１１０３において、その階層での単語
辞書に含まれる単語のうち、長さの一致する単語を全て
候補単語としたが、その代わりに、その階層での単語照
合の閾値をさらに大きくして再度単語照合して候補単語
を推定することもできる。また、その階層の上位階層に
おける候補単語のそれぞれについて、下位すなわち当該
階層に接続する単語を求めて候補単語と推定しても良い
。

また、その階層の下位階層における候補単語のそれぞれ
について、上位すなわち当該階層に接続する単語を求め
て候補単語と推定しても良い。また、上位階層と下位階
層の両方の候補単語から求めた単語集合の共通集合を候
補単語と推定しても良い。

さらに、上記の候補単語の各種の推定方法を組合せても
良い。

また、第四の実施例の拡張として、ある階層において候
補単語が存在せず、その上位または下位に２個以上の連
続する階層で候補単語が存在するとき、その２個以上の
連続する階層について接続関係の検査を行って、候補単
語の削減を行って置き、それから第四の実施例と同様の
処理を行うこともできる。

〔発明の効果〕

本発明によれば、単語照合の様態に応じて最も適した単
語照合の手法あるいはパラメーが選択できるので、単語
照合の正解率、したがって単語照合後の文字正解率が高
くなる効果がある。文字正解率とは、正解文字が候補文
字中の第１位となる割合である。

カタカナによる単語の読取結果に対して単語照合を適用
した実験結果により、本発明の効果を示す。実験対象の
一つは人名（姓２１，６１０語）である。

もう一つの実験対象は、日本全国の地名であり、都道府
県（４７語）、市郡区（１，２５１語）、区町村（５０
，８２０語）の３階層からなる。人名の場合は、ランダ
ムに約４，４００　ＷＪｔを選び、実験サンプルとした
。地名の場合は、区町村の階層からランダムに約１０，
０００語を選び、各単語の上位に接続する市郡区及び都
道府県の２階層の単語をそれぞれ求めて、３階層の複合
単語的１ｏ、ｏｏｏ組を作って実験サンプルとした０文
字認識装置の認識特性をシミュレートし、上記の単語の
疑似読取結果を作成し、単語照合部に供給した。

人名の場合、４，４００語について単純単語照合を行い
、候補文字追加法として類似文字追加と全文字追加を比
較した。文字正解率は、単語照合前は９０．９％である
が、単語照合後は類似文字追加の場合９６．１％、全文
字追加の場合９５．５％となって、類似文字追加の方が
優れていることが判った。一方。

地名の場合、３階層の複合単語１０，０００組に対する
複合単語照合における候補文字追加方法を比較した。単
語照合後の第１位文字正解率は類似文字追加の場合９７
．２％、全文字追加の場合９９．３％となり、全文字追
加の方が優れていることが判った。したがって、本発明
を適用して、単語照合の対象に応じて単語照合様態を指
定することにより、最適の単語照合性能を発揮できるこ
とが明らかである。

【図面の簡単な説明】第１図、第２図は文字認識の後処理方式の〃Ｘ理を示す
説明図、第３図は本発明の実施例の装置構成を示す図、
第４図、第９図、第１０図、第１１図は実施例における
文字認識処理の流れ図、第５図、第６図、第７図は実施
例におけるメモリ内での情報の配置を示す説明図、第８
図は単語照合を実行する回路のブロック図である。１００・・・中央制御装置、１０１・・・主メモリ、１
０２・・・端末、１０３・・・システムファイル、１０
４・・・スキャナ、１０５・・・ビデオメモリ、１０６・・・文学誌郡部、１０７・・・単語照合部、１０８・・・ワークファイル、１０９・・・バス。第図第図第図（Ａ）（Ｂ）（Ｃ）第図第図第図第図第図第図第図

Claims

【特許請求の範囲】１、ディジタル画像を入力する手段と、上記ディジタル
画像の内部に存在する文字パターンを認識して各文字パ
ターンに対する単数または複数の候補文字を求める手段
と、複数の単語を記憶してなる単語辞書と、上記単数ま
たは複数の候補文字を組合せて得られる候補文字列を上
記の単語辞書に含まれる単語と照合する手段と、複数種
の単語照合様態から一つを選択する手段とを有し、上記
の選択された単語照合様態によって上記の単語照合手段
における照合方法またはパラメータを変化させることを
特徴とする文字認識の後処理装置。２、特許請求の範囲第１項記載の文字認識の後処理方式
において、上記の単語照合手段は認識結果の候補文字に
所定の規則に従って候補文字を追加する機能を有し、上
記所定の規則は単語照合の様態ごとに異なっていること
を特徴とする文字認識の後処理装置。３、特許請求の範囲第１項記載の文字認識の後処理装置
において、複数個の単語辞書と、上記の複数個の単語辞
書に含まれる単語の相互の関係を記憶してなる関係辞書
と、上記の複数個の文字パターン群ごとに候補単語を求
める手段とを有し、入力されたディジタル画像の内部に
存在する複数個の文字パターン群を認識して各文字パタ
ーン群に含まれるそれぞれの文字パターンに対する候補
文字を求め、各文字パターン群ごとに単語照合を行って
候補単語を求め、上記の候補単語間の接続関係が関係辞
書に含まれる情報と一致する候補単語を選択することを
特徴とする文字認識の後処理装置。４、特許請求の範囲第１項記載の文字認識の後処理装置
において、単語照合様態の一つは、単語照合の結果得ら
れる候補単語が存在しない場合、単語照合における照合
方法またはパラメータを変更して再度単語照合を行うよ
うに制御するものであることを特徴とする文字認識の後
処理装置。５、特許請求の範囲第３項記載の文字認識の後処理装置
において、単語照合の結果得られる候補単語が存在しな
い場合、候補単語を追加した後、候補単語間の接続関係
によって候補単語の選択を行うことを特徴とする文字認
識の後処理装置。