JP2985813B2

JP2985813B2 - 文字列認識装置および知識データベース学習方法

Info

Publication number: JP2985813B2
Application number: JP9003889A
Authority: JP
Inventors: 俊史山内
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1997-01-13
Filing date: 1997-01-13
Publication date: 1999-12-06
Anticipated expiration: 2017-01-13
Also published as: JPH10198764A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文書を自動認識す
る文字列認識装置に関し、特に文書中の文字列を認識す
るときに、認識対象に関する単語知識や文法などの言語
的知識を利用して、認識不能文字や誤認識文字を修正
し、認識精度を高める文字列認識装置に関する。さらに
は、その文字列認識装置に備えられる知識データベース
の学習方法に関する。

【０００２】

【従来の技術】従来の文字列認識装置は、認識対象であ
る文字列（文書）を光学的にスキャンして、画像として
情報入力する画像入力部と、その入力画像データから文
書の書式を判定するとともに、読み取り領城を抽出する
領域解析部と、読み取り領域の中から文字列候補を切り
出し、文字列候補から個別文字を切り出す文字切り出し
部と、切り出された個々の文字に対して、文字認識処理
を行う個別文字認識部とからなる。

【０００３】この文字列認識装置では、１文字単位の個
別文字認識処理を行う場合に、類似文字の存在などのた
めに認識率に限界がある。例えば、数字の「７」とカタ
カナの「ク」や、数字の「０」と英字の「〇」のように
同形で、文脈情報を利用しないと認識が困難な文字が認
識率低下の原因となっている。

【０００４】そこで、認識精度を高めるために、文脈情
報として認識対象に関する単語知識や文法的知識のよう
な言語的知識を用いるようにしたものがある。この場
合、個別文字認識部では、認識結果を一意に判定するの
ではなく、複数の候補文字を出力し、知識処理部におい
て候補文字の組合せから得られる候補文字列と、予め知
識データベースとして登録されている知識データとの照
合を行う。これにより、知識データに基づき認識不能文
字や誤認識文字を補完し、知識データと最も整合の良い
結果を出力することができ、文字列の一部が認識できな
い場合でも、文字列としての認識率を高めることができ
る。

【０００５】認識対象に関する知識には、様々な種類が
ある。例えば、住所、氏名、商品名、顧客コードのよう
な単語知識や、主語と述語、形容詞と名詞などのつなが
りのような、文法的な知識が用いられる。これら認識対
象に関する知識は、知識データベースと呼ばれ、文字列
認識装置内のハードディスク装置やメモリなどの記億装
置に記億される。

【０００６】知識データベースの中でも、住所・氏名な
どは量的に膨大で、転居や出生などにより随時、知識デ
ータベースの内容変更が発生する。そのため、常に知識
データベースを最新の状態にしておくことが必要で、頻
繁なメンテナンスが必要とされる。また、住所氏名で
は、略称なども用いられる場合がある。例えば、「○○
電気株式会社府中事業場」を「○○電気（株）府中事
業場」、「○電府中」などとする場合がある。これらの
略称などは、表記のバリエーションが多く、全てのバリ
エーションをカバーすることは容易でない。

【０００７】上記のように知識データベースの内容が常
に変更される場合や、データの表記のバリエーションが
多い場合には、知識データベースに登録されていない単
語や文法規則などの未登録語が発生する場合があり、こ
れらの未登録語に対する処理が重要になる。

【０００８】先に出願されている技術としては、知識処
理において、単語辞書に未登録語が存在した場合に、無
理な候補選択を避けるために、文字数に応じた文法規則
を満足するダミー文字からなる未登録語テンプレートを
生成し、照合した後、ダミー文字に対して認識候補文字
などから再変換を行い、誤り率を低減する方法などがあ
る。

【０００９】

【発明が解決しようとする課題】上述した従来の技術
は、未登録語が入力された場合に、登録語の中から無理
な候補選択を行うことを避け、誤認識しないようにする
ことを目的としている。そのため、入力された未登録語
を知識データベースに登録するといったことは行わず、
知識データベース自体も変化しない。

【００１０】上記のように未登録語の知識データベース
への登録が行われず、知識データベースの内容が更新さ
れない従来のものにおいては、知識データベースにない
未登録語（例えば、「○電府中」などの略称は一般に登
録されていない場合が多い。）については認識すること
はできない。

【００１１】さらに、従来のものでは、同一の未登録語
が何度も繰り返し入力される場合、その都度、未登録語
としての処理が行われ、知識処理による補完処理は行わ
れないことから、同一の未登録語が繰り返し入力される
ような場合に補完処理によって十分な読み取り性能を得
ることができないという問題点がある。

【００１２】本発明の目的は、上記課題を解決し、認識
候補文字列が未登録語である場合には、その認識候補文
字列を知識データベースに登録し、知識データベースを
自動的に学習することが可能な文字列認識装置および知
識データベース学習方法を提供することにある。

【００１３】

【課題を解決するための手段】上記目的を達成するた
め、本発明の文字列認識装置は、認識対象である文字列
を光学的に読み取って画像データを得る画像処理部と、
前記画像データから文字列領域を解析する領域解析部
と、前記文字列領域から１文字単位の文字領域を推定
し、文字ブロックの切り出しを行う文字切り出し部と、
前記文字ブロック毎に文字カテゴリーを代表する標準的
な文字との照合を行い個別文字認識候補を得る個別文字
認識部と、認識対象に関する知識データが予め登録され
た知識データベースと、前記個別文字認識候補を文字ブ
ロックの出現順序に並べて認識候補文字列を生成し、該
認識候補文字列と前記知識データベースに登録されてい
る知識データとを照合し、認識候補文字列の中の認識不
能文字の補完および誤認識文字の修正を行う知識処理部
と、前記領域解析部において得られる書式情報もしくは
前記文字切り出し部において得られる平均文字サイズ情
報もしくは前記個別文字認識部において得られる手書き
／印刷情報またはこれら情報の組み合せからなる付帯情
報を有し、前記知識処理部にて生成された認識候補文字
列と該認識候補文字列にともなう付帯情報とに基づいて
前記知識データベースの内容の更新を行う知識データベ
ース学習制御部と、を有することを特徴とする。

【００１４】

【００１５】上記の場合、前記知識データベース学習制
御部は、仮登録バッフアと、前記知識処理部にて生成さ
れた認識候補文字列が前記知識データベースに登録され
ているか否かを判定し、未登録語である場合には該未登
録語を前記仮登録バッフアへ仮登録する仮登録バッフア
登録制御部と、前記知識データベースへの新規知識デー
タの追加登録を行う知識データ登録制御部と、からな
り、前記仮登録バッフア登録制御部は、前記仮登録バッ
フアに仮登録された未登録語が前記知識処理部にて生成
された場合には、該未登録語を前記新規知識データとし
て前記知識データ登録制御部へ出力するとともに前記仮
登録バッフアから削除するように構成してもよい。

【００１６】さらに、前記仮登録バッフア登録制御部
は、前記仮登録バッフアに仮登録された未登録語が前記
知識処理部にて生成された場合に、該未登録語と仮登録
バッフアに仮登録された未登録語との付帯情報が一致す
るか否かを判定し、一致しない場合にのみその未登録語
を前記新規知識データとして前記知識データ登録制御部
へ出力するように構成してもよい。

【００１７】本発明の知識データベース学習方法は、認
識対象に関する知識データが予め登録された知識データ
ベースを備え、認識対象である文字列を光学的に読み取
って認識候補文字列を生成し、該認識候補文字列と前記
知識データベースに登録されている知識データとの照合
を行って文字列の認識を行う文字列認識装置において行
われる知識データベースの学習方法であって、前記認識
候補文字列に関する書式情報もしくは平均文字サイズ情
報もしくは手書き／印刷情報またはこれら情報の組み合
せからなる付帯情報を有し、前記認識候補文字列と該認
識候補文字列にともなう付帯情報とに基づいて前記知識
データベースの内容の更新を行うことを特徴とする。

【００１８】

【００１９】上記の場合、前記知識データベースの内容
の更新の処理は、生成された認識候補文字列が前記知識
データベースに登録されているか否かを判定し、未登録
の場合は該認識候補文字列を未登録語として仮登録バッ
ファに仮登録する第１の工程と、前記第１の工程で仮登
録された未登録語が認識候補文字列として生成された場
合には、該未登録語を新規知識データとして前記知識デ
ータベースに登録するとともに前記仮登録バッファから
削除する第２の工程と、を含むようにしてもよい。

【００２０】さらに、前記第１の工程で仮登録された未
登録語が認識候補文字列として生成された場合に、該未
登録語と仮登録バッフアに仮登録された未登録語との付
帯情報が一致するか否かを判定する第３の工程を含み、
該第３の工程にて付帯情報が一致しないと判定された場
合にのみ、前記第２の工程を行うようにしてもよい。

【００２１】上記の通りの本発明によれば、知識データ
ベースを自動的に学習することができるので、未登録語
についても知識処理による補完・修正処理が可能とな
る。加えて、本発明によれば、生成された認識候補文字
列と付帯情報とに基づいて知識データベースの内容が更
新され、知識データベースを自動的に学習することがで
きるので、同一の未登録語が何度も繰り返し入力される
場合には、２回目以降に入力される同一未登録語につい
て知識処理による補完・修正処理が可能となる。

【００２２】本発明のうち仮登録バッフアに仮登録され
た未登録語が認識候補文字列として生成された場合に、
該未登録語と仮登録バッフアに仮登録された未登録語と
の付帯情報が一致するか否かを判定し、一致しない場合
にのみその未登録語を知識データベースへ登録するもの
においては、以下のような作用がある。

【００２３】認識率を高めるためには、文字列の認識結
果に基づいて未登録語を知識データベースに登録し、知
識データベースを自動的に学習することが望ましいが、
一般には、文字列認識結果は必ずしも１００％正しいと
いう保証はない。誤認識が発生している認識候補文字列
を無条件に知識データベースに登録してしまうと、認識
候補文字列内に認識誤りがある場合でもそのまま登録さ
れてしまい、誤った知識データによって補完処理が行わ
れることになり、その結果、知識データベース学習後の
文字列の補完処理において誤り率が高くなって、登録前
よりもむしろ認識精度が低下することになる。

【００２４】本発明では、未登録語の知識データベース
への登録は、未登録語が仮バッファの内容と一致し、か
つ、それらの付帯情報が一致しない場合にのみ行われる
ので、誤った知識データの登録はより少ないものとな
る。一般に、誤認識され易い印字フォントを持つ機種の
プリンターによって印字された文字列は繰り返し誤認識
されることから、このような作用は特に有効になる。

【００２５】

【発明の実施の形態】次に、本発明の実施形態について
図面を参照して説明する。図１は、本発明の文字列認識
装置の一実施形態の全体構成を示すブロック図である。

【００２６】本実施形態の文字列認識装置は、画像処理
部１、領域解析部２、文字切り出し部３、個別文字認識
部４、知識処理部５、知識データベース学習制御部６、
個別文字認識辞書７、知識データベース８から構成され
る。

【００２７】画像処理部１は、読み取り対象である帳票
・文書データ９を画像データに変換する処理部であっ
て、帳票・文書データ９に対して光源から光が照射さ
れ、その反射光がＣＣＤなどの撮像素子に結像されて電
気信号に変換されるように構成されている。この画像処
理部１では、文字列（文書データ）を光学的にスキャン
することにより入力画像データ１０が生成される。

【００２８】この画像処理部１における入力画像データ
１０の生成では、まず撮像素子から出力された電気信号
（アナログ）を量子化する。一般には、量子化した画像
を更に白黒の２値画像に変換する。続いて、その後の認
識処理を容易にするために孤立ノイズ除去などの前処理
を施す。具体的には、スムージング、ノイズ除去などの
フィルタリング処理を施して、入力画像データ１０を生
成する。

【００２９】領域解析部２は、入力画像データ１０の中
から読み取り対象文字列を抽出するための処理を行う。
この領域解析部２では、入力画像データ１０に対して、
黒画素塊の外接矩形ブロックの抽出、黒画素ヒストグラ
ムの特徴抽出などを行い、抽出した外接矩形ブロックの
分布や黒画素ヒストグラムの分布から、文書上における
認識対象の文字列の位置の推定、文字列の方向（縦書き
／横書き）の推定を行う。この推定結果が、文字列領域
画像１１として出力される。

【００３０】文字切り出し部３は、文字列領域画像１１
から１文字単位の領域を推定し、文字を切り出す処理を
行う部であって、一般に処理の内容は領域解析部２にお
ける処理と同様であるが、領域解析部よりさらに局所
的、かつ、詳細に領域解析を行う。具体的には、黒画素
塊の外接矩形ブロックの分布、黒画素塊の外接矩形ブロ
ックの大きさ、黒画素ヒストグラムの分布、空白検出、
黒画素塊の輪郭追跡などの特徴抽出を行い、抽出した特
徴に基づいて文字ピッチの推定と１文字単位の領域の切
り出し処理を行う。この文字ピッチの推定と１文字単位
の領域の切りだし処理の結果が、個別文字画像１２とし
て出力される。

【００３１】個別文字認識部４は、個別文字画像１２に
対して個別文字認識辞書７との照合を行い、個別文字認
識結候補１３を得る。この個別文字認識部４では、まず
個別文字画像１２から詳細な特徴を抽出し、特徴パター
ンを生成する。文字特徴としては、一般に濃淡特徴、方
向特徴、輪郭特徴、背景特徴、ストローク特徴などが用
いられる。個別文字認識辞書７には、文字カテゴリーを
代表する標準的な文字に対して、その特徴抽出方法によ
って抽出された特徴パターンを、文字カテゴリー情報な
どの属性情報とともに登録してある。ここでは、文字カ
テゴリーを代表する標準的な文字に対する特徴パターン
を標準パターンと定義する。続いて、個別文字認識部４
では入力文字の特徴パターンと標準パターンとの間の照
合を行い、入力文字の特徴パターンと照合度の最も高い
標準パターンの属する文字カテゴリーを個別文字認識候
補１３として出力する。ここでの照合では、入力文字の
特徴パターンと標準パターンの間の類似度、もしくは距
離を計算し、最も類似度の高い、もしくは距離の最も小
さい標準パターンの属する文字カテゴリーが個別文字認
識候補１３として出力される。

【００３２】知識処理部５は、個別文字認識候補１３を
領域解析部２および文字切り出し部３で検出した文字ブ
ロックの出現順序に並べ、認識候補文字列を生成し、認
識候補文字列と予め先験的知識として登録されている知
識データベース８の内容とを照合し、認識候補文字列の
中のリジェクト文字を補完し、誤認識文字を修正する処
理を行う。

【００３３】この知識処理部５における知識処理では、
まず文字ブロックの出現順序にしたがって個別文字認識
候補１３を認識候補文字列バッフアに格納する。この時
点で、個別文字認識候補１３には、入力文字を正認識し
ている場合、誤認識している場合、読み取り不能の場合
の３種類の場合がある。本形態における知識処理は、個
別文字認識候補１３が読み取り不能の場合における読み
取り不能データを補完することと、誤認識している場合
における誤認識データを補完し訂正することを目的とし
ている。認識対象が予め既知の文字列情報の集合から成
る場合は、それらの既知の文字列情報の集合を知識デー
タベースに登録しておき、認識候補文字列バッフアの内
容と知識データベース８の内容との照合を行い、認識候
補文字列バッファの中から知識データベース８の内容と
一致する認識候補文字列を選択する。認識候補文字列の
中の一部の認識候補文字が一致しない場合は、知識デー
タベース８の内容にしたがって補完・訂正処理を行う。
ここで、知識データベース８は単語の集合である場合
と、文法的知識として構文で記述される場合とがある。

【００３４】知識データベース学習制御部６は、本形態
の文字列認識装置の最も特徴的な構成部であって、認識
候補文字列が既知の知識データと一致しないが、知識デ
ータとしての形式を満たしている場合に、その認識候補
文字列を未登録語として知識データベース８に追加登録
を行う。但し、認識候補文字列の一部に誤りがある場合
には、誤った知識データを登録しないようにするため
に、知識データベース学習制御部６では領域解析部２、
文字切り出し部３、個別文字認識部４、知識処理部５か
ら得られる情報を利用して、その認識候補文字列である
未登録語が知識データとして知識データベース８に追加
登録することが適当であるかの否かの判定を行う。

【００３５】以下、この知識データベース学習制御部６
にて行われる、認識候補文字列である未登録語を知識デ
ータとして追加登録する手順について、図２〜図７を用
いて詳細に説明する。

【００３６】図２は、図１の知識データベース学習制御
部６の構成を詳細に示したブロック図である。知識デー
タベース学習制御部６は、仮登録パッフア登録制御部３
３、仮登録バッフア３４、知識データベース登録制御部
３５から成り、認識候補文字列３０をいったん仮登録バ
ッフア３４に登録し、さらに条件を満足した場合に、仮
登録バッファ３４から知識データベース３６に追加登録
する制御を行う。

【００３７】知識データベース学習制御部６への入力情
報としては、認識候補文字列３０と付帯情報３１とがあ
る。付帯情報３１は、領域解析部２、文字切り出し部
３、個別文字認識部４において得られる任意の情報（特
徴）を利用することが可能であるが、ここでは、それら
の情報の中でも有効である書式、平均文字サイズ、手書
き文字／印刷文字の３種類の情報を用いることとする。
すなわち、本実施形態では、付帯情報３１は領域解析部
２から得られる縦書き／横書きの書式情報、文字切り出
し部３から得られる平均文字サイズ、個別文字認識部４
から得られる手書き／印刷の文字種情報からなる。

【００３８】図３は、認識候補文字列３０と付帯情報３
１の一例を示す図で、文字列認識装置に帳票１、帳票
２、帳票３、帳票４、帳票５、帳票６の順番で６種類の
帳票が入力された際の情報が示されている。また、図４
の（ａ）〜（ｃ）には入力された帳票１〜３の具体例が
示されており、図５の（ｅ）〜（ｆ）には入力された帳
票４〜６の具体例が示されている。なお、以下の説明で
挙げられる「○○電気」の「○○」の部分は名称を示す
部分で、後述するリジェクトや補完などの処理が施され
た部分とは異なる。同様に、「府中市ＸＸ町１・１０」
の「ＸＸ」の部分も町名を示しており、リジェクトや補
完などの処理が施された部分とは異なる。

【００３９】最初に入力された帳票１は縦書きの手書き
帳票で、文字サイズは平均６ｍｍ×７ｍｍで記載されて
いる。この帳票１では、「気」が旧字体のためリジェク
トとなり、「府中市ＸＸ町１−１０ ○○電？株式会
社」が認識候補文字列として得られる。

【００４０】続いて入力された帳票２は横印字の印刷帳
票で、文字サイズは３ｍｍ×３ｍｍで印刷文字としては
やや小さい文字サイズである。この帳票２では、○○電
気の「電」の文字の下部がかすれ「電」を「雷」と誤認
識し、「府中市ＸＸ町１−１０ ○○雷気府中事業場」
が認識候補文字列として得られる。

【００４１】続いて入力された帳票３は帳票２とほとん
ど同一の画像であり、帳票２と同様に「電」を「雷」と
誤認識した結果である。印刷帳票で同一のプリンターで
印字されている場合などは、しばしばこのような状態が
発生し、一度誤ったデータと同一の誤りが繰り返し発生
する場合がある。

【００４２】続いて入力された帳票４は縦書きの手書き
文字で、平均文字サイズは比較的大きく８ｍｍ×９ｍｍ
であり、認識候補文字として「府中市ＸＸ町１・１０
○電府中」が得られる。

【００４３】続いて入力された帳票５は印刷帳票である
が、帳票２、帳票３とは印刷したプリンターの種類が異
なり、文字サイズも大きく、文字のかすれも発生してい
ないため、認識候補文字として「府中市ＸＸ町１−１０
○電府中」が得られる。

【００４４】続いて入力された帳票６は手書きの横書き
帳票で、「電」の下部のストロークがやや短いためリジ
ェクトし、「府中市ＸＸ町１・１０ ○？府中」の認識
結果が得られる。

【００４５】上述の認識候補文字列は入力帳票の画像に
対して領域解析部２にて読み取り対象領域が抽出され、
文字切り出し部３にて個々の文字に切り出しされ、個別
文字認識部４にて認識処理を行った結果、候補として出
力される文字列であり、認識候補文字列の中にはリジェ
クト文字、誤認識文字が存在する。知識処理部５は、こ
れらのリジェクト文字や誤認識文字に対して、認識対象
の知識データを利用することによって補完し、文字列の
正認識率を高める。

【００４６】図２を参照して知識データベース学習制御
部６の動作を説明すると、知識データベース学習制御部
６では、仮登録バッファ登録制御部３３において登録条
件を満たしたとき、認識候補文字列３０、付帯情報３１
が仮登録語バッフア３４に仮登録語、仮登録語の付帯情
報として登録される。そして、知識データベース登録制
御部３５において登録条件を満たしたとき、知識データ
ベース３６に登録される。

【００４７】図６は知識データベース３６への登録手順
を示すフローチャート、図７は知識データベース３６に
おける学習結果の一例を示す図である。以下、図６およ
び図７を参照して、仮登録バッファ３４への登録手順お
よび知識データベース３６への登録手順について具体的
に説明する。

【００４８】ここでは、図２の知識データベース３６に
は、初期値として図７に示すような知識データベースの
内容にある「府中市ＸＸ町１−１０ ○○電気株式会
社」、「府中市ＸＸ町１−１０ ○○電気府中事業場」
が登録されていると仮定し、知識処理部５の処理とし
て、１文字の認識誤り修正、１文字のリジェクト補完を
行うものとし、図３に示した帳票１〜６が順次入力され
た場合の登録手順を例に挙げて説明する。なお、認識の
誤り修正文字数とリジェクト補完文字数は、認識候補文
字列の文字列長と知識データベースの文字列長を越えな
い範囲で任意に設定することができるが、ここでは両者
とも１文字として説明する。

【００４９】（１）帳票１の入力図３の帳票１（図４（ａ）参照）が入力されると、入力
パターンの認識候補文字列として「府中市ＸＸ町１−１
０ ○○電？株式会社」、その付帯情報として「書式＝
縦」を得る（ステップ１０１）。入力パターンの認識候
補文字列が得られると、続いて、その得られた認識候補
文字列が様式を満たしているかどうかのチェックが行わ
れる（ステップ１０２）。ここで、様式を満たすとは、
「府中市ＸＸ町１−１０」の文字列が認識候補文字列と
して出力されることをいう。このステップ１０２におい
て様式を満たしていれば以下のステップ１０３の処理を
行い、満たしていなければ後述するリジェクト処理（ス
テップ１０８）を行う。ここでは、帳票１の入力により
得られた認識候補文字列は、ステップ１０２における様
式を満たしているためステップ１０３の処理に遷る。

【００５０】ステップ１０３の処理では、帳票１の入力
により得られた認識候補文字列に対応する知識データが
知識データベースに登録されているか否かが判定され
る。登録されていれば、知識データベースの内容から認
識候補文字列と一致する知識データを参照し、認識候補
文字列との照合が行われる（ステップ１０７）。登録さ
れていない場合は、後述するステップ１０４の処理を行
う。ここでは、図７に示すように、知識データベース中
に帳票１の入力により得られた認識候補文字列の住所部
分の「府中市ＸＸ町１−１０」と一致する知識データと
して「○○電気株式会社」と「○○電気府中事業場」が
登録されているので、これら知識データと認識候補文字
列である「府中市ＸＸ町１−１０ ○○電？株式会社」
との照合が行われる。ここで、１文字の認識誤り修正、
１文字のリジェクト補完の条件を満たす知識データは
「○○電気株式会社」であるため、上記ステップ１０７
の処理では、「○○電気株式会社」の知識データを参照
して「○○電？株式会社」の部分に対して１文字のリジ
ェクト補完が行われ、「府中市ＸＸ町１−１０ ○○電
気株式会社」の知識処理結果を得る。

【００５１】（２）帳票２の入力次に、帳票２（図４（ｂ）参照）が入力されると、入力
パターンの認識候補文字列として「府中市ＸＸ町１−１
０ ○雷府中」、その付帯情報として「書式＝横」を得
る（ステップ１０１）。この認識候補文字列はステップ
１０２の処理において様式を満たしているが、「○雷府
中」の部分が図７の知識データベースの初期値である
「○○電気株式会社」、「○○電気府中事業場」と２文
字以上一致しないため、ステップ１０３の処理では未登
録語と判定され、以下のステップ１０４の処理が行われ
る。

【００５２】ステップ１０４の処理では、認識候補文字
列が仮登録語バッフア（図２の３４）内の仮登録語と一
致するかどうかをチェックする。このチェックの時点で
は、仮登録バッファの内容は空きのため一致せず、次処
理のステップ１０５へ遷る。ステップ１０５の処理で
は、認識候補文字列である「府中市ＸＸ町１−１０ ○
電府中」とその付帯情報である「書式＝横」を仮登録パ
ッファ３４に登録する。この仮登録バッフア３４への登
録条件を満たしたとき、仮登録パッファ登録信号３７は
０Ｎになり、登録後０ＦＦになる。仮登録パッファ登録
制御部３３は、この仮登録パッファ登録信号３７のＯＮ
・ＯＦＦに基づいて登録制御を行う。

【００５３】続いてステップ１０６の処理に遷り、認識
候補文字列が登録語であるかどうかが判断される。登録
語の場合は上述したステップ１０７の処理が行われる。
ここでは、認識候補文字列は知識データベースの登録語
でないため、ステップ１０８においてリジェクト処理が
行われ、知識処理結果としてはリジェクトが出力され
る。

【００５４】上述のように、帳票２の入力では、「○雷
府中」の部分が図７の知識データベースの初期値である
「○○電気株式会社」、「○○電気府中事業場」と認識
候補文字列との照合を行ったとき、２文字以上一致しな
い文字があるため、知識処理結果としてはリジェクトに
なるが、その認識候補文字列は次回の処理のために仮登
録語バッフア３４へ仮登録される。

【００５５】（３）帳票３の入力次に、帳票３（図４（ｃ）参照）が入力されると、入力
パターンの認識候補文字列として「府中市ＸＸ町１−１
０ ○雷府中」、その付帯情報として「書式＝横」を得
る（ステップ１０１）。この帳票３は図４（ｂ）の帳票
２とほとんど同じ画像データであり、認識候補文字列も
同一であることから、上述の帳票２の入力の場合と同じ
手順で処理が行われるが、ステップ１０４の処理におい
て、「○雷府中」が仮登録バッファの内容（ここでは、
帳票２の入力によって「○雷府中」が登録されている）
と一致するため、次処理のステップ１０９の処理へ遷
る。

【００５６】ステップ１０９の処理では、認識候補文字
列の付帯情報である「書式＝横」が仮登録バッファに登
録された登録語の付帯情報の「書式＝横」と一致するた
め、上述のステップ１０６の処理に遷り、認識候補文字
列が登録語であるかどうかが判断される。ここでは認識
候補文字列は知識データベースの登録語でないため、ス
テップ１０８においてリジェクト処理が行われ、知識処
理結果としてはリジェクトが出力され、仮登録バッフア
の内容、知識データベースの内容とも変化しない。

【００５７】（４）帳票４の入力次に、帳票４（図４（ｄ）参照）が入力されると、入力
パターンの認識候補文字列として「府中市ＸＸ町１−１
０ ○電府中」、その付帯情報として「書式＝縦」を得
る。この認識候補文字列はステップ１０２の処理におい
て様式を満たしているが、「○電府中」の部分が図７の
知識データベースの初期値である「○○電気株式会
社」、「○○電気府中事業場」と２文字以上一致しない
ため、ステップ１０３の処理では未登録語と判定され、
次のステップ１０４の処理が行われる。

【００５８】ステップ１０４の処理では認識候補文字列
が仮登録語バッフア３４内の仮登録語と一致するかどう
かをチェックする。このチェックの時点では、仮登録バ
ッフアの内容は「府中市ＸＸ町１−１０ ○雷府中書
式＝横」の登録のみで、バッフアの内容と認識候補文字
列が一致しないため次のステップ１０５へ遷る。

【００５９】ステップ１０５の処理では、候補文字列で
ある「府中市ＸＸ町１−１０ ○電府中」と付帯情報で
ある「書式＝縦」が仮登録バッフア３４に登録される。
続くステップ１０６の処理では未登録語と判定され、ス
テップ１０８の処理で知識処理結果としてリジェクトが
出力される。

【００６０】（５）帳票５の入力次に、帳票５（図４（ｅ）参照）が入力されると、入力
パターンの認識候補文字列として「府中市ＸＸ町１−１
０ ○電府中」、その付帯情報として「書式＝横」を得
る。この認識候補文字列はステップ１０２の処理におい
て様式を満たしているが、「○電府中」の部分が図７の
知識データベースの初期値である「○○電気株式会
社」、「○○電気府中事業場」と２文字以上一致しない
ため、ステップ１０３の処理では未登録語と判定され、
次のステップ１０４の処理が行われる。

【００６１】ステップ１０４の処理では認識候補文字列
が仮登録語バッフア３４内の仮登録語と一致するかどう
かをチェックする。このチェックの時点では、仮登録バ
ッフアには「府中市ＸＸ町１−１０ ○雷府中／○電府
中書式＝横／縦」が登録されており、仮登録バッフア
の内容と認識候補文字列とが一致するため、次のステッ
プ１０９へ遷る。

【００６２】ステップ１０９の処理では、付帯情報が一
致しないため次のステップ１１０の処理へ遷り、知識デ
ータベース登録制御部（図２の３５）によって認識候補
文字列（仮登録語）が新規知識データとして知識データ
ベースに追加登録される。続くステップ１１１の処理で
は、仮登録バッファ登録制御部３３によって新規知識デ
ータとされた仮登録語が仮登録パッフアから削除され、
次のステップ１０６に遷る。

【００６３】ステップ１０６の処理では、認識候補文字
列が登録語がどうかの判定が行われ、未登録語の場合の
はリジェクト処理（ステップ１０８）が行われ、登録語
の場合には知識データベースの内容を参照し、知識デー
タと認識候補文字列との照合が行われる（ステップ１０
７）。ここでは、ステップ１１０の処理で認識候補文字
列（未登録語）が知識データベースに登録されているの
で、認識候補文字列と対応する知識データ（登録語）が
認識結果として出力され、結果として「府中市ＸＸ町１
−１０ ○電府中」を得る。

【００６４】（６）帳票６の入力次に、帳票６（図４（ｆ）参照）が入力されると、入力
パターンの認識候補文字列として「府中市ＸＸ町１−１
０ ○？府中」、その付帯情報として「書式＝縦」を得
る。この認識候補文字列はステップ１０２の処理におい
て様式を満たすとともに、１文字の認識誤り修正、１文
字のリジェクト補完の条件を満たす知識データとして、
知識データベース（ここでは、「○○電気株式会社」、
「○○電気府中事業場」、「○電府中」の３つがある）
の登録内容に「○電府中」があるため、ステップ１０３
の処理では登録語と判定され、次のステップ１０７の処
理へ遷る。ステップ１０７の処理では、「○？府中」の
部分に対して１文字のリジェクト補完が行われ、「府中
市ＸＸ町１−１０ ○電府中」の知識処理結果を得る。

【００６５】図７における知識処理結果を集計すると、
図４の６種類の帳票に対する知識処理に対して、正認識
３件、リジェクト３件の結果となる。

【００６６】＜比較例１＞図８は、認識候補文字列を単
純に知識データベースに登録した場合の処理結果を示す
図である。この場合、「府中市ＸＸ町１−１０ ○雷府
中」という誤った知識データが登録される。このため
に、図８の知識処理結果を集計すると、図４の６種類の
帳票に対する知識処理では、正認識２件、リジェクト２
件、誤認識２件の結果となる。

【００６７】＜比較例２＞図９は、認識候補文字列に対
して、仮登録パッフアの書式のチェックをせずに、知識
データベースに登録した場合の処理結果を示す図であ
る。この場合も、「府中市ＸＸ町１−１０ ○雷府中」
という誤った知識データが登録されるために、図８の知
識処理結果を集計すると、図４の６種類の帳票に対する
知識処理では、正認識２件、リジェクト３件、誤認識１
件の結果となる。

【００６８】＜他の実施形態＞なお、上述の図６に示し
た登録手順の場合、同一の認識候補文字列が同一書式で
連続して得られた場合、例えば帳票５に相当する文字列
データが連続して入力された場合に処理結果が全てリジ
ェクトになる場合がある。同一の認識候補文字列が同一
書式で繰り返し得られた場合に処理結果がリジェクトに
ならいようにするには、図６におけるステップ１０９の
処理において、書式情報が一致した場合にステップ１１
０の処理へ遷り、一致しない場合にはステップ１０５の
処理へ遷るようにすればよい。これにより、帳票５のよ
うな知識データベースにない同一フォーマットの略称が
繰り返し入力される場合にも、その略称を知識データベ
ースに登録できる。

【００６９】上述した実施形態では、知識データベース
への登録の際に書式情報の一致・不一致を判定するよう
になっているが、図１０に示すように、図６のステップ
１０９の処理において書式情報に代えて平均文字サイズ
に基づき知識データベースへの登録の制御を行うように
してもよく、また図１１に示すように手書き／印刷に基
づき知識データベースの登録の制御を行うようにしても
よい。また、図６のステップ１０９の処理においてこれ
らの情報を組み合せた付帯情報の一致・不一致を判定す
るようにすれば、知識データベースへの誤った知識デー
タの登録を防止でき、より精度の高いものとすることが
できる。

【００７０】

【発明の効果】以上説明したように構成される本発明に
よれば、知識データベースを自動的に学習でき、同一の
未登録語が繰り返し入力されるような場合においても、
補完処理によって十分な読み取り性能を得ることができ
るので、効率的かつ高性能な文字列認識装置が実現可能
である。

【００７１】また、未登録語の知識データベースへの登
録を、未登録語が仮バッファの内容と一致し、かつ、そ
れらの付帯情報が一致しない場合にのみ行うように構成
してるので、誤った知識データの登録を防止でき、知識
データベースの自動学習の精度をさらに高めた文字列認
識装置が実現可能である。

【図面の簡単な説明】

【図１】本発明の文字列認識装置の一実施形態の全体構
成を示すブロック図である。

【図２】図１の知識データベース学習制御部６の構成を
詳細に示したブロック図である。

【図３】認識候補文字列３０と付帯情報３１の一例を示
す図である。

【図４】（ａ）〜（ｃ）は入力帳票１〜３の具体例を示
す図である。

【図５】（ｄ）〜（ｆ）は入力帳票４〜６の具体例を示
す図である。

【図６】知識データベース３６への登録手順を示すフロ
ーチャートである。

【図７】知識データベース３６における学習結果の一例
を示す図である。

【図８】認識候補文字列を単純に知識データベースに登
録した場合の処理結果を示す図である。

【図９】認識候補文字列に対して、仮登録パッフアの書
式のチェックをせずに、知識データベースに登録した場
合の処理結果を示す図である。

【図１０】付帯情報として平均文字サイズ情報を用いた
場合の知識データベースへの登録手順を示すフローチャ
ートである。

【図１１】付帯情報として手書き／印刷情報を用いた場
合の知識データベースへの登録手順を示すフローチャー
トである。

【符号の説明】

１画像処理部２領域解析部３文字切り出し部４個別文字認識部、５知識処理部６知識データベース学習制御部７個別文字認識辞書８知識データベース

Claims

(57)【特許請求の範囲】

【請求項１】認識対象である文字列を光学的に読み取
って画像データを得る画像処理部と、前記画像データから文字列領域を解析する領域解析部
と、前記文字列領域から１文字単位の文字領域を推定し、文
字ブロックの切り出しを行う文字切り出し部と、前記文字ブロック毎に文字カテゴリーを代表する標準的
な文字との照合を行い個別文字認識候補を得る個別文字
認識部と、認識対象に関する知識データが予め登録された知識デー
タベースと、前記個別文字認識候補を文字ブロックの出現順序に並べ
て認識候補文字列を生成し、該認識候補文字列と前記知
識データベースに登録されている知識データとを照合
し、認識候補文字列の中の認識不能文字の補完および誤
認識文字の修正を行う知識処理部と、前記領域解析部において得られる書式情報もしくは前記
文字切り出し部において得られる平均文字サイズ情報も
しくは前記個別文字認識部において得られる手書き／印
刷情報またはこれら情報の組み合せからなる付帯情報を
有し、前記知識処理部にて生成された認識候補文字列と
該認識候補文字列にともなう付帯情報とに基づいて前記
知識データベースの内容の更新を行う知識データベース
学習制御部と、を有することを特徴とする文字列認識装
置。
【請求項２】請求項１に記載の文字列認識装置におい
て、前記知識データベース学習制御部は、仮登録バッフアと、前記知識処理部にて生成された認識候補文字列が前記知
識データベースに登録されているか否かを判定し、未登
録語である場合には該未登録語を前記仮登録バッフアへ
仮登録する仮登録バッフア登録制御部と、前記知識データベースへの新規知識データの追加登録を
行う知識データ登録制御部と、からなり、前記仮登録バッフア登録制御部は、前記仮登録バッフア
に仮登録された未登録語が前記知識処理部にて生成され
た場合には、該未登録語を前記新規知識データとして前
記知識データ登録制御部へ出力するとともに前記仮登録
バッフアから削除することを特徴とする文字列認識装
置。
【請求項３】請求項２に記載の文字列認識装置におい
て、前記仮登録バッフア登録制御部は、前記仮登録バッフア
に仮登録された未登録語が前記知識処理部にて生成され
た場合に、該未登録語と仮登録バッフアに仮登録された
未登録語との付帯情報が一致するか否かを判定し、一致
しない場合にのみその未登録語を前記新規知識データと
して前記知識データ登録制御部へ出力することを特徴と
する文字列認識装置。
【請求項４】認識対象に関する知識データが予め登録
された知識データベースを備え、認識対象である文字列
を光学的に読み取って認識候補文字列を生成し、該認識
候補文字列と前記知識データベースに登録されている知
識データとの照合を行って文字列の認識を行う文字列認
識装置において行われる知識データベースの学習方法で
あって、前記認識候補文字列に関する書式情報もしくは平均文字
サイズ情報もしくは手書き／印刷情報またはこれら情報
の組み合せからなる付帯情報を有し、前記認識候補文字
列と該認識候補文字列にともなう付帯情報とに基づいて
前記知識データベースの内容の更新を行うことを特徴と
する知識データベース学習方法。
【請求項５】請求項４に記載の知識データベース学習
方法において、前記知識データベースの内容の更新の処理は、生成された認識候補文字列が前記知識データベースに登
録されているか否かを判定し、未登録の場合は該認識候
補文字列を未登録語として仮登録バッファに仮登録する
第１の工程と、前記第１の工程で仮登録された未登録語が認識候補文字
列として生成された場合には、該未登録語を新規知識デ
ータとして前記知識データベースに登録するとともに前
記仮登録バッファから削除する第２の工程と、を含むこ
とを特徴とする知識データベース学習方法。
【請求項６】請求項５に記載の知識データベース学習
方法において、前記第１の工程で仮登録された未登録語が認識候補文字
列として生成された場合に、該未登録語と仮登録バッフ
アに仮登録された未登録語との付帯情報が一致するか否
かを判定する第３の工程を含み、該第３の工程にて付帯
情報が一致しないと判定された場合にのみ、前記第２の
工程を行うことを特徴とす知識データベース学習方法。