JP2985813B2 - 文字列認識装置および知識データベース学習方法 - Google Patents
文字列認識装置および知識データベース学習方法Info
- Publication number
- JP2985813B2 JP2985813B2 JP9003889A JP388997A JP2985813B2 JP 2985813 B2 JP2985813 B2 JP 2985813B2 JP 9003889 A JP9003889 A JP 9003889A JP 388997 A JP388997 A JP 388997A JP 2985813 B2 JP2985813 B2 JP 2985813B2
- Authority
- JP
- Japan
- Prior art keywords
- knowledge
- character string
- character
- recognition
- knowledge database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
る文字列認識装置に関し、特に文書中の文字列を認識す
るときに、認識対象に関する単語知識や文法などの言語
的知識を利用して、認識不能文字や誤認識文字を修正
し、認識精度を高める文字列認識装置に関する。さらに
は、その文字列認識装置に備えられる知識データベース
の学習方法に関する。
る文字列(文書)を光学的にスキャンして、画像として
情報入力する画像入力部と、その入力画像データから文
書の書式を判定するとともに、読み取り領城を抽出する
領域解析部と、読み取り領域の中から文字列候補を切り
出し、文字列候補から個別文字を切り出す文字切り出し
部と、切り出された個々の文字に対して、文字認識処理
を行う個別文字認識部とからなる。
別文字認識処理を行う場合に、類似文字の存在などのた
めに認識率に限界がある。例えば、数字の「7」とカタ
カナの「ク」や、数字の「0」と英字の「〇」のように
同形で、文脈情報を利用しないと認識が困難な文字が認
識率低下の原因となっている。
報として認識対象に関する単語知識や文法的知識のよう
な言語的知識を用いるようにしたものがある。この場
合、個別文字認識部では、認識結果を一意に判定するの
ではなく、複数の候補文字を出力し、知識処理部におい
て候補文字の組合せから得られる候補文字列と、予め知
識データベースとして登録されている知識データとの照
合を行う。これにより、知識データに基づき認識不能文
字や誤認識文字を補完し、知識データと最も整合の良い
結果を出力することができ、文字列の一部が認識できな
い場合でも、文字列としての認識率を高めることができ
る。
ある。例えば、住所、氏名、商品名、顧客コードのよう
な単語知識や、主語と述語、形容詞と名詞などのつなが
りのような、文法的な知識が用いられる。これら認識対
象に関する知識は、知識データベースと呼ばれ、文字列
認識装置内のハードディスク装置やメモリなどの記億装
置に記億される。
どは量的に膨大で、転居や出生などにより随時、知識デ
ータベースの内容変更が発生する。そのため、常に知識
データベースを最新の状態にしておくことが必要で、頻
繁なメンテナンスが必要とされる。また、住所氏名で
は、略称なども用いられる場合がある。例えば、「○○
電気株式会社 府中事業場」を「○○電気(株)府中事
業場」、「○電府中」などとする場合がある。これらの
略称などは、表記のバリエーションが多く、全てのバリ
エーションをカバーすることは容易でない。
に変更される場合や、データの表記のバリエーションが
多い場合には、知識データベースに登録されていない単
語や文法規則などの未登録語が発生する場合があり、こ
れらの未登録語に対する処理が重要になる。
理において、単語辞書に未登録語が存在した場合に、無
理な候補選択を避けるために、文字数に応じた文法規則
を満足するダミー文字からなる未登録語テンプレートを
生成し、照合した後、ダミー文字に対して認識候補文字
などから再変換を行い、誤り率を低減する方法などがあ
る。
は、未登録語が入力された場合に、登録語の中から無理
な候補選択を行うことを避け、誤認識しないようにする
ことを目的としている。そのため、入力された未登録語
を知識データベースに登録するといったことは行わず、
知識データベース自体も変化しない。
への登録が行われず、知識データベースの内容が更新さ
れない従来のものにおいては、知識データベースにない
未登録語(例えば、「○電府中」などの略称は一般に登
録されていない場合が多い。)については認識すること
はできない。
が何度も繰り返し入力される場合、その都度、未登録語
としての処理が行われ、知識処理による補完処理は行わ
れないことから、同一の未登録語が繰り返し入力される
ような場合に補完処理によって十分な読み取り性能を得
ることができないという問題点がある。
候補文字列が未登録語である場合には、その認識候補文
字列を知識データベースに登録し、知識データベースを
自動的に学習することが可能な文字列認識装置および知
識データベース学習方法を提供することにある。
め、本発明の文字列認識装置は、認識対象である文字列
を光学的に読み取って画像データを得る画像処理部と、
前記画像データから文字列領域を解析する領域解析部
と、前記文字列領域から1文字単位の文字領域を推定
し、文字ブロックの切り出しを行う文字切り出し部と、
前記文字ブロック毎に文字カテゴリーを代表する標準的
な文字との照合を行い個別文字認識候補を得る個別文字
認識部と、認識対象に関する知識データが予め登録され
た知識データベースと、前記個別文字認識候補を文字ブ
ロックの出現順序に並べて認識候補文字列を生成し、該
認識候補文字列と前記知識データベースに登録されてい
る知識データとを照合し、認識候補文字列の中の認識不
能文字の補完および誤認識文字の修正を行う知識処理部
と、前記領域解析部において得られる書式情報もしくは
前記文字切り出し部において得られる平均文字サイズ情
報もしくは前記個別文字認識部において得られる手書き
/印刷情報またはこれら情報の組み合せからなる付帯情
報を有し、前記知識処理部にて生成された認識候補文字
列と該認識候補文字列にともなう付帯情報とに基づいて
前記知識データベースの内容の更新を行う知識データベ
ース学習制御部と、を有することを特徴とする。
御部は、仮登録バッフアと、前記知識処理部にて生成さ
れた認識候補文字列が前記知識データベースに登録され
ているか否かを判定し、未登録語である場合には該未登
録語を前記仮登録バッフアへ仮登録する仮登録バッフア
登録制御部と、前記知識データベースへの新規知識デー
タの追加登録を行う知識データ登録制御部と、からな
り、前記仮登録バッフア登録制御部は、前記仮登録バッ
フアに仮登録された未登録語が前記知識処理部にて生成
された場合には、該未登録語を前記新規知識データとし
て前記知識データ登録制御部へ出力するとともに前記仮
登録バッフアから削除するように構成してもよい。
は、前記仮登録バッフアに仮登録された未登録語が前記
知識処理部にて生成された場合に、該未登録語と仮登録
バッフアに仮登録された未登録語との付帯情報が一致す
るか否かを判定し、一致しない場合にのみその未登録語
を前記新規知識データとして前記知識データ登録制御部
へ出力するように構成してもよい。
識対象に関する知識データが予め登録された知識データ
ベースを備え、認識対象である文字列を光学的に読み取
って認識候補文字列を生成し、該認識候補文字列と前記
知識データベースに登録されている知識データとの照合
を行って文字列の認識を行う文字列認識装置において行
われる知識データベースの学習方法であって、前記認識
候補文字列に関する書式情報もしくは平均文字サイズ情
報もしくは手書き/印刷情報またはこれら情報の組み合
せからなる付帯情報を有し、前記認識候補文字列と該認
識候補文字列にともなう付帯情報とに基づいて前記知識
データベースの内容の更新を行うことを特徴とする。
の更新の処理は、生成された認識候補文字列が前記知識
データベースに登録されているか否かを判定し、未登録
の場合は該認識候補文字列を未登録語として仮登録バッ
ファに仮登録する第1の工程と、前記第1の工程で仮登
録された未登録語が認識候補文字列として生成された場
合には、該未登録語を新規知識データとして前記知識デ
ータベースに登録するとともに前記仮登録バッファから
削除する第2の工程と、を含むようにしてもよい。
登録語が認識候補文字列として生成された場合に、該未
登録語と仮登録バッフアに仮登録された未登録語との付
帯情報が一致するか否かを判定する第3の工程を含み、
該第3の工程にて付帯情報が一致しないと判定された場
合にのみ、前記第2の工程を行うようにしてもよい。
ベースを自動的に学習することができるので、未登録語
についても知識処理による補完・修正処理が可能とな
る。加えて、本発明によれば、生成された認識候補文字
列と付帯情報とに基づいて知識データベースの内容が更
新され、知識データベースを自動的に学習することがで
きるので、同一の未登録語が何度も繰り返し入力される
場合には、2回目以降に入力される同一未登録語につい
て知識処理による補完・修正処理が可能となる。
た未登録語が認識候補文字列として生成された場合に、
該未登録語と仮登録バッフアに仮登録された未登録語と
の付帯情報が一致するか否かを判定し、一致しない場合
にのみその未登録語を知識データベースへ登録するもの
においては、以下のような作用がある。
果に基づいて未登録語を知識データベースに登録し、知
識データベースを自動的に学習することが望ましいが、
一般には、文字列認識結果は必ずしも100%正しいと
いう保証はない。誤認識が発生している認識候補文字列
を無条件に知識データベースに登録してしまうと、認識
候補文字列内に認識誤りがある場合でもそのまま登録さ
れてしまい、誤った知識データによって補完処理が行わ
れることになり、その結果、知識データベース学習後の
文字列の補完処理において誤り率が高くなって、登録前
よりもむしろ認識精度が低下することになる。
への登録は、未登録語が仮バッファの内容と一致し、か
つ、それらの付帯情報が一致しない場合にのみ行われる
ので、誤った知識データの登録はより少ないものとな
る。一般に、誤認識され易い印字フォントを持つ機種の
プリンターによって印字された文字列は繰り返し誤認識
されることから、このような作用は特に有効になる。
図面を参照して説明する。図1は、本発明の文字列認識
装置の一実施形態の全体構成を示すブロック図である。
部1、領域解析部2、文字切り出し部3、個別文字認識
部4、知識処理部5、知識データベース学習制御部6、
個別文字認識辞書7、知識データベース8から構成され
る。
・文書データ9を画像データに変換する処理部であっ
て、帳票・文書データ9に対して光源から光が照射さ
れ、その反射光がCCDなどの撮像素子に結像されて電
気信号に変換されるように構成されている。この画像処
理部1では、文字列(文書データ)を光学的にスキャン
することにより入力画像データ10が生成される。
10の生成では、まず撮像素子から出力された電気信号
(アナログ)を量子化する。一般には、量子化した画像
を更に白黒の2値画像に変換する。続いて、その後の認
識処理を容易にするために孤立ノイズ除去などの前処理
を施す。具体的には、スムージング、ノイズ除去などの
フィルタリング処理を施して、入力画像データ10を生
成する。
から読み取り対象文字列を抽出するための処理を行う。
この領域解析部2では、入力画像データ10に対して、
黒画素塊の外接矩形ブロックの抽出、黒画素ヒストグラ
ムの特徴抽出などを行い、抽出した外接矩形ブロックの
分布や黒画素ヒストグラムの分布から、文書上における
認識対象の文字列の位置の推定、文字列の方向(縦書き
/横書き)の推定を行う。この推定結果が、文字列領域
画像11として出力される。
から1文字単位の領域を推定し、文字を切り出す処理を
行う部であって、一般に処理の内容は領域解析部2にお
ける処理と同様であるが、領域解析部よりさらに局所
的、かつ、詳細に領域解析を行う。具体的には、黒画素
塊の外接矩形ブロックの分布、黒画素塊の外接矩形ブロ
ックの大きさ、黒画素ヒストグラムの分布、空白検出、
黒画素塊の輪郭追跡などの特徴抽出を行い、抽出した特
徴に基づいて文字ピッチの推定と1文字単位の領域の切
り出し処理を行う。この文字ピッチの推定と1文字単位
の領域の切りだし処理の結果が、個別文字画像12とし
て出力される。
対して個別文字認識辞書7との照合を行い、個別文字認
識結候補13を得る。この個別文字認識部4では、まず
個別文字画像12から詳細な特徴を抽出し、特徴パター
ンを生成する。文字特徴としては、一般に濃淡特徴、方
向特徴、輪郭特徴、背景特徴、ストローク特徴などが用
いられる。個別文字認識辞書7には、文字カテゴリーを
代表する標準的な文字に対して、その特徴抽出方法によ
って抽出された特徴パターンを、文字カテゴリー情報な
どの属性情報とともに登録してある。ここでは、文字カ
テゴリーを代表する標準的な文字に対する特徴パターン
を標準パターンと定義する。続いて、個別文字認識部4
では入力文字の特徴パターンと標準パターンとの間の照
合を行い、入力文字の特徴パターンと照合度の最も高い
標準パターンの属する文字カテゴリーを個別文字認識候
補13として出力する。ここでの照合では、入力文字の
特徴パターンと標準パターンの間の類似度、もしくは距
離を計算し、最も類似度の高い、もしくは距離の最も小
さい標準パターンの属する文字カテゴリーが個別文字認
識候補13として出力される。
領域解析部2および文字切り出し部3で検出した文字ブ
ロックの出現順序に並べ、認識候補文字列を生成し、認
識候補文字列と予め先験的知識として登録されている知
識データベース8の内容とを照合し、認識候補文字列の
中のリジェクト文字を補完し、誤認識文字を修正する処
理を行う。
まず文字ブロックの出現順序にしたがって個別文字認識
候補13を認識候補文字列バッフアに格納する。この時
点で、個別文字認識候補13には、入力文字を正認識し
ている場合、誤認識している場合、読み取り不能の場合
の3種類の場合がある。本形態における知識処理は、個
別文字認識候補13が読み取り不能の場合における読み
取り不能データを補完することと、誤認識している場合
における誤認識データを補完し訂正することを目的とし
ている。認識対象が予め既知の文字列情報の集合から成
る場合は、それらの既知の文字列情報の集合を知識デー
タベースに登録しておき、認識候補文字列バッフアの内
容と知識データベース8の内容との照合を行い、認識候
補文字列バッファの中から知識データベース8の内容と
一致する認識候補文字列を選択する。認識候補文字列の
中の一部の認識候補文字が一致しない場合は、知識デー
タベース8の内容にしたがって補完・訂正処理を行う。
ここで、知識データベース8は単語の集合である場合
と、文法的知識として構文で記述される場合とがある。
の文字列認識装置の最も特徴的な構成部であって、認識
候補文字列が既知の知識データと一致しないが、知識デ
ータとしての形式を満たしている場合に、その認識候補
文字列を未登録語として知識データベース8に追加登録
を行う。但し、認識候補文字列の一部に誤りがある場合
には、誤った知識データを登録しないようにするため
に、知識データベース学習制御部6では領域解析部2、
文字切り出し部3、個別文字認識部4、知識処理部5か
ら得られる情報を利用して、その認識候補文字列である
未登録語が知識データとして知識データベース8に追加
登録することが適当であるかの否かの判定を行う。
にて行われる、認識候補文字列である未登録語を知識デ
ータとして追加登録する手順について、図2〜図7を用
いて詳細に説明する。
部6の構成を詳細に示したブロック図である。知識デー
タベース学習制御部6は、仮登録パッフア登録制御部3
3、仮登録バッフア34、知識データベース登録制御部
35から成り、認識候補文字列30をいったん仮登録バ
ッフア34に登録し、さらに条件を満足した場合に、仮
登録バッファ34から知識データベース36に追加登録
する制御を行う。
報としては、認識候補文字列30と付帯情報31とがあ
る。付帯情報31は、領域解析部2、文字切り出し部
3、個別文字認識部4において得られる任意の情報(特
徴)を利用することが可能であるが、ここでは、それら
の情報の中でも有効である書式、平均文字サイズ、手書
き文字/印刷文字の3種類の情報を用いることとする。
すなわち、本実施形態では、付帯情報31は領域解析部
2から得られる縦書き/横書きの書式情報、文字切り出
し部3から得られる平均文字サイズ、個別文字認識部4
から得られる手書き/印刷の文字種情報からなる。
1の一例を示す図で、文字列認識装置に帳票1、帳票
2、帳票3、帳票4、帳票5、帳票6の順番で6種類の
帳票が入力された際の情報が示されている。また、図4
の(a)〜(c)には入力された帳票1〜3の具体例が
示されており、図5の(e)〜(f)には入力された帳
票4〜6の具体例が示されている。なお、以下の説明で
挙げられる「○○電気」の「○○」の部分は名称を示す
部分で、後述するリジェクトや補完などの処理が施され
た部分とは異なる。同様に、「府中市XX町1・10」
の「XX」の部分も町名を示しており、リジェクトや補
完などの処理が施された部分とは異なる。
帳票で、文字サイズは平均6mm×7mmで記載されて
いる。この帳票1では、「気」が旧字体のためリジェク
トとなり、「府中市XX町1−10 ○○電?株式会
社」が認識候補文字列として得られる。
票で、文字サイズは3mm×3mmで印刷文字としては
やや小さい文字サイズである。この帳票2では、○○電
気の「電」の文字の下部がかすれ「電」を「雷」と誤認
識し、「府中市XX町1−10 ○○雷気府中事業場」
が認識候補文字列として得られる。
ど同一の画像であり、帳票2と同様に「電」を「雷」と
誤認識した結果である。印刷帳票で同一のプリンターで
印字されている場合などは、しばしばこのような状態が
発生し、一度誤ったデータと同一の誤りが繰り返し発生
する場合がある。
文字で、平均文字サイズは比較的大きく8mm×9mm
であり、認識候補文字として「府中市XX町1・10
○電府中」が得られる。
が、帳票2、帳票3とは印刷したプリンターの種類が異
なり、文字サイズも大きく、文字のかすれも発生してい
ないため、認識候補文字として「府中市XX町1−10
○電府中」が得られる。
帳票で、「電」の下部のストロークがやや短いためリジ
ェクトし、「府中市XX町1・10 ○?府中」の認識
結果が得られる。
対して領域解析部2にて読み取り対象領域が抽出され、
文字切り出し部3にて個々の文字に切り出しされ、個別
文字認識部4にて認識処理を行った結果、候補として出
力される文字列であり、認識候補文字列の中にはリジェ
クト文字、誤認識文字が存在する。知識処理部5は、こ
れらのリジェクト文字や誤認識文字に対して、認識対象
の知識データを利用することによって補完し、文字列の
正認識率を高める。
部6の動作を説明すると、知識データベース学習制御部
6では、仮登録バッファ登録制御部33において登録条
件を満たしたとき、認識候補文字列30、付帯情報31
が仮登録語バッフア34に仮登録語、仮登録語の付帯情
報として登録される。そして、知識データベース登録制
御部35において登録条件を満たしたとき、知識データ
ベース36に登録される。
を示すフローチャート、図7は知識データベース36に
おける学習結果の一例を示す図である。以下、図6およ
び図7を参照して、仮登録バッファ34への登録手順お
よび知識データベース36への登録手順について具体的
に説明する。
は、初期値として図7に示すような知識データベースの
内容にある「府中市XX町1−10 ○○電気株式会
社」、「府中市XX町1−10 ○○電気府中事業場」
が登録されていると仮定し、知識処理部5の処理とし
て、1文字の認識誤り修正、1文字のリジェクト補完を
行うものとし、図3に示した帳票1〜6が順次入力され
た場合の登録手順を例に挙げて説明する。なお、認識の
誤り修正文字数とリジェクト補完文字数は、認識候補文
字列の文字列長と知識データベースの文字列長を越えな
い範囲で任意に設定することができるが、ここでは両者
とも1文字として説明する。
パターンの認識候補文字列として「府中市XX町1−1
0 ○○電?株式会社」、その付帯情報として「書式=
縦」を得る(ステップ101)。入力パターンの認識候
補文字列が得られると、続いて、その得られた認識候補
文字列が様式を満たしているかどうかのチェックが行わ
れる(ステップ102)。ここで、様式を満たすとは、
「府中市XX町1−10」の文字列が認識候補文字列と
して出力されることをいう。このステップ102におい
て様式を満たしていれば以下のステップ103の処理を
行い、満たしていなければ後述するリジェクト処理(ス
テップ108)を行う。ここでは、帳票1の入力により
得られた認識候補文字列は、ステップ102における様
式を満たしているためステップ103の処理に遷る。
により得られた認識候補文字列に対応する知識データが
知識データベースに登録されているか否かが判定され
る。登録されていれば、知識データベースの内容から認
識候補文字列と一致する知識データを参照し、認識候補
文字列との照合が行われる(ステップ107)。登録さ
れていない場合は、後述するステップ104の処理を行
う。ここでは、図7に示すように、知識データベース中
に帳票1の入力により得られた認識候補文字列の住所部
分の「府中市XX町1−10」と一致する知識データと
して「○○電気株式会社」と「○○電気府中事業場」が
登録されているので、これら知識データと認識候補文字
列である「府中市XX町1−10 ○○電?株式会社」
との照合が行われる。ここで、1文字の認識誤り修正、
1文字のリジェクト補完の条件を満たす知識データは
「○○電気株式会社」であるため、上記ステップ107
の処理では、「○○電気株式会社」の知識データを参照
して「○○電?株式会社」の部分に対して1文字のリジ
ェクト補完が行われ、「府中市XX町1−10 ○○電
気株式会社」の知識処理結果を得る。
パターンの認識候補文字列として「府中市XX町1−1
0 ○雷府中」、その付帯情報として「書式=横」を得
る(ステップ101)。この認識候補文字列はステップ
102の処理において様式を満たしているが、「○雷府
中」の部分が図7の知識データベースの初期値である
「○○電気株式会社」、「○○電気府中事業場」と2文
字以上一致しないため、ステップ103の処理では未登
録語と判定され、以下のステップ104の処理が行われ
る。
列が仮登録語バッフア(図2の34)内の仮登録語と一
致するかどうかをチェックする。このチェックの時点で
は、仮登録バッファの内容は空きのため一致せず、次処
理のステップ105へ遷る。ステップ105の処理で
は、認識候補文字列である「府中市XX町1−10 ○
電府中」とその付帯情報である「書式=横」を仮登録パ
ッファ34に登録する。この仮登録バッフア34への登
録条件を満たしたとき、仮登録パッファ登録信号37は
0Nになり、登録後0FFになる。仮登録パッファ登録
制御部33は、この仮登録パッファ登録信号37のON
・OFFに基づいて登録制御を行う。
候補文字列が登録語であるかどうかが判断される。登録
語の場合は上述したステップ107の処理が行われる。
ここでは、認識候補文字列は知識データベースの登録語
でないため、ステップ108においてリジェクト処理が
行われ、知識処理結果としてはリジェクトが出力され
る。
府中」の部分が図7の知識データベースの初期値である
「○○電気株式会社」、「○○電気府中事業場」と認識
候補文字列との照合を行ったとき、2文字以上一致しな
い文字があるため、知識処理結果としてはリジェクトに
なるが、その認識候補文字列は次回の処理のために仮登
録語バッフア34へ仮登録される。
パターンの認識候補文字列として「府中市XX町1−1
0 ○雷府中」、その付帯情報として「書式=横」を得
る(ステップ101)。この帳票3は図4(b)の帳票
2とほとんど同じ画像データであり、認識候補文字列も
同一であることから、上述の帳票2の入力の場合と同じ
手順で処理が行われるが、ステップ104の処理におい
て、「○雷府中」が仮登録バッファの内容(ここでは、
帳票2の入力によって「○雷府中」が登録されている)
と一致するため、次処理のステップ109の処理へ遷
る。
列の付帯情報である「書式=横」が仮登録バッファに登
録された登録語の付帯情報の「書式=横」と一致するた
め、上述のステップ106の処理に遷り、認識候補文字
列が登録語であるかどうかが判断される。ここでは認識
候補文字列は知識データベースの登録語でないため、ス
テップ108においてリジェクト処理が行われ、知識処
理結果としてはリジェクトが出力され、仮登録バッフア
の内容、知識データベースの内容とも変化しない。
パターンの認識候補文字列として「府中市XX町1−1
0 ○電府中」、その付帯情報として「書式=縦」を得
る。この認識候補文字列はステップ102の処理におい
て様式を満たしているが、「○電府中」の部分が図7の
知識データベースの初期値である「○○電気株式会
社」、「○○電気府中事業場」と2文字以上一致しない
ため、ステップ103の処理では未登録語と判定され、
次のステップ104の処理が行われる。
が仮登録語バッフア34内の仮登録語と一致するかどう
かをチェックする。このチェックの時点では、仮登録バ
ッフアの内容は「府中市XX町1−10 ○雷府中 書
式=横」の登録のみで、バッフアの内容と認識候補文字
列が一致しないため次のステップ105へ遷る。
ある「府中市XX町1−10 ○電府中」と付帯情報で
ある「書式=縦」が仮登録バッフア34に登録される。
続くステップ106の処理では未登録語と判定され、ス
テップ108の処理で知識処理結果としてリジェクトが
出力される。
パターンの認識候補文字列として「府中市XX町1−1
0 ○電府中」、その付帯情報として「書式=横」を得
る。この認識候補文字列はステップ102の処理におい
て様式を満たしているが、「○電府中」の部分が図7の
知識データベースの初期値である「○○電気株式会
社」、「○○電気府中事業場」と2文字以上一致しない
ため、ステップ103の処理では未登録語と判定され、
次のステップ104の処理が行われる。
が仮登録語バッフア34内の仮登録語と一致するかどう
かをチェックする。このチェックの時点では、仮登録バ
ッフアには「府中市XX町1−10 ○雷府中/○電府
中 書式=横/縦」が登録されており、仮登録バッフア
の内容と認識候補文字列とが一致するため、次のステッ
プ109へ遷る。
致しないため次のステップ110の処理へ遷り、知識デ
ータベース登録制御部(図2の35)によって認識候補
文字列(仮登録語)が新規知識データとして知識データ
ベースに追加登録される。続くステップ111の処理で
は、仮登録バッファ登録制御部33によって新規知識デ
ータとされた仮登録語が仮登録パッフアから削除され、
次のステップ106に遷る。
列が登録語がどうかの判定が行われ、未登録語の場合の
はリジェクト処理(ステップ108)が行われ、登録語
の場合には知識データベースの内容を参照し、知識デー
タと認識候補文字列との照合が行われる(ステップ10
7)。ここでは、ステップ110の処理で認識候補文字
列(未登録語)が知識データベースに登録されているの
で、認識候補文字列と対応する知識データ(登録語)が
認識結果として出力され、結果として「府中市XX町1
−10 ○電府中」を得る。
パターンの認識候補文字列として「府中市XX町1−1
0 ○?府中」、その付帯情報として「書式=縦」を得
る。この認識候補文字列はステップ102の処理におい
て様式を満たすとともに、1文字の認識誤り修正、1文
字のリジェクト補完の条件を満たす知識データとして、
知識データベース(ここでは、「○○電気株式会社」、
「○○電気府中事業場」、「○電府中」の3つがある)
の登録内容に「○電府中」があるため、ステップ103
の処理では登録語と判定され、次のステップ107の処
理へ遷る。ステップ107の処理では、「○?府中」の
部分に対して1文字のリジェクト補完が行われ、「府中
市XX町1−10 ○電府中」の知識処理結果を得る。
図4の6種類の帳票に対する知識処理に対して、正認識
3件、リジェクト3件の結果となる。
純に知識データベースに登録した場合の処理結果を示す
図である。この場合、「府中市XX町1−10 ○雷府
中」という誤った知識データが登録される。このため
に、図8の知識処理結果を集計すると、図4の6種類の
帳票に対する知識処理では、正認識2件、リジェクト2
件、誤認識2件の結果となる。
して、仮登録パッフアの書式のチェックをせずに、知識
データベースに登録した場合の処理結果を示す図であ
る。この場合も、「府中市XX町1−10 ○雷府中」
という誤った知識データが登録されるために、図8の知
識処理結果を集計すると、図4の6種類の帳票に対する
知識処理では、正認識2件、リジェクト3件、誤認識1
件の結果となる。
た登録手順の場合、同一の認識候補文字列が同一書式で
連続して得られた場合、例えば帳票5に相当する文字列
データが連続して入力された場合に処理結果が全てリジ
ェクトになる場合がある。同一の認識候補文字列が同一
書式で繰り返し得られた場合に処理結果がリジェクトに
ならいようにするには、図6におけるステップ109の
処理において、書式情報が一致した場合にステップ11
0の処理へ遷り、一致しない場合にはステップ105の
処理へ遷るようにすればよい。これにより、帳票5のよ
うな知識データベースにない同一フォーマットの略称が
繰り返し入力される場合にも、その略称を知識データベ
ースに登録できる。
への登録の際に書式情報の一致・不一致を判定するよう
になっているが、図10に示すように、図6のステップ
109の処理において書式情報に代えて平均文字サイズ
に基づき知識データベースへの登録の制御を行うように
してもよく、また図11に示すように手書き/印刷に基
づき知識データベースの登録の制御を行うようにしても
よい。また、図6のステップ109の処理においてこれ
らの情報を組み合せた付帯情報の一致・不一致を判定す
るようにすれば、知識データベースへの誤った知識デー
タの登録を防止でき、より精度の高いものとすることが
できる。
よれば、知識データベースを自動的に学習でき、同一の
未登録語が繰り返し入力されるような場合においても、
補完処理によって十分な読み取り性能を得ることができ
るので、効率的かつ高性能な文字列認識装置が実現可能
である。
録を、未登録語が仮バッファの内容と一致し、かつ、そ
れらの付帯情報が一致しない場合にのみ行うように構成
してるので、誤った知識データの登録を防止でき、知識
データベースの自動学習の精度をさらに高めた文字列認
識装置が実現可能である。
成を示すブロック図である。
詳細に示したブロック図である。
す図である。
す図である。
す図である。
ーチャートである。
を示す図である。
録した場合の処理結果を示す図である。
式のチェックをせずに、知識データベースに登録した場
合の処理結果を示す図である。
場合の知識データベースへの登録手順を示すフローチャ
ートである。
合の知識データベースへの登録手順を示すフローチャー
トである。
Claims (6)
- 【請求項1】 認識対象である文字列を光学的に読み取
って画像データを得る画像処理部と、 前記画像データから文字列領域を解析する領域解析部
と、 前記文字列領域から1文字単位の文字領域を推定し、文
字ブロックの切り出しを行う文字切り出し部と、 前記文字ブロック毎に文字カテゴリーを代表する標準的
な文字との照合を行い個別文字認識候補を得る個別文字
認識部と、 認識対象に関する知識データが予め登録された知識デー
タベースと、 前記個別文字認識候補を文字ブロックの出現順序に並べ
て認識候補文字列を生成し、該認識候補文字列と前記知
識データベースに登録されている知識データとを照合
し、認識候補文字列の中の認識不能文字の補完および誤
認識文字の修正を行う知識処理部と、前記領域解析部において得られる書式情報もしくは前記
文字切り出し部において得られる平均文字サイズ情報も
しくは前記個別文字認識部において得られる手書き/印
刷情報またはこれら情報の組み合せからなる付帯情報を
有し、 前記知識処理部にて生成された認識候補文字列と
該認識候補文字列にともなう付帯情報とに基づいて前記
知識データベースの内容の更新を行う知識データベース
学習制御部と、を有することを特徴とする文字列認識装
置。 - 【請求項2】 請求項1に記載の文字列認識装置におい
て、前記知識データベース学習制御部は、 仮登録バッフアと、 前記知識処理部にて生成された認識候補文字列が前記知
識データベースに登録されているか否かを判定し、未登
録語である場合には該未登録語を前記仮登録バッフアへ
仮登録する仮登録バッフア登録制御部と、 前記知識データベースへの新規知識データの追加登録を
行う知識データ登録制御部と、からなり、 前記仮登録バッフア登録制御部は、前記仮登録バッフア
に仮登録された未登録語が前記知識処理部にて生成され
た場合には、該未登録語を前記新規知識データ として前
記知識データ登録制御部へ出力するとともに前記仮登録
バッフアから削除する ことを特徴とする文字列認識装
置。 - 【請求項3】 請求項2に記載の文字列認識装置におい
て、前記仮登録バッフア登録制御部は、前記仮登録バッフア
に仮登録された未登録語が前記知識処理部にて生成され
た場合に、該未登録語と仮登録バッフアに仮登録された
未登録語との付帯情報が一致するか否かを判定し、一致
しない場合にのみその未登録語を前記新規知識データと
して前記知識データ登録制御部へ出力する ことを特徴と
する文字列認識装置。 - 【請求項4】 認識対象に関する知識データが予め登録
された知識データベースを備え、認識対象である文字列
を光学的に読み取って認識候補文字列を生成し、該認識
候補文字列と前記知識データベースに登録されている知
識データとの照合を行って文字列の認識を行う文字列認
識装置において行われる知識データベースの学習方法で
あって、 前記認識候補文字列に関する書式情報もしくは平均文字
サイズ情報もしくは手書き/印刷情報またはこれら情報
の組み合せからなる付帯情報を有し、前記認識候補文字
列と該認識候補文字列にともなう付帯情報とに基づいて
前記知識データベースの内容の更新を行うことを特徴と
する知識データベース学習方法。 - 【請求項5】 請求項4に記載の知識データベース学習
方法において、 前記知識データベースの内容の更新の処理は、 生成された認識候補文字列が前記知識データベースに登
録されているか否かを判定し、未登録の場合は該認識候
補文字列を未登録語として仮登録バッファに仮登録する
第1の工程と、 前記第1の工程で仮登録された未登録語が認識候補文字
列として生成された場合には、該未登録語を新規知識デ
ータとして前記知識データベースに登録するとともに前
記仮登録バッファから削除する第2の工程と、を含む こ
とを特徴とする知識データベース学習方法。 - 【請求項6】 請求項5に記載の知識データベース学習
方法において、 前記第1の工程で仮登録された未登録語が認識候補文字
列として生成された場合に、該未登録語と仮登録バッフ
アに仮登録された未登録語との付帯情報が一致 するか否
かを判定する第3の工程を含み、該第3の工程にて付帯
情報が一致しないと判定された場合にのみ、前記第2の
工程を行う ことを特徴とす知識データベース学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9003889A JP2985813B2 (ja) | 1997-01-13 | 1997-01-13 | 文字列認識装置および知識データベース学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9003889A JP2985813B2 (ja) | 1997-01-13 | 1997-01-13 | 文字列認識装置および知識データベース学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10198764A JPH10198764A (ja) | 1998-07-31 |
JP2985813B2 true JP2985813B2 (ja) | 1999-12-06 |
Family
ID=11569759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9003889A Expired - Fee Related JP2985813B2 (ja) | 1997-01-13 | 1997-01-13 | 文字列認識装置および知識データベース学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2985813B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4945593B2 (ja) * | 2009-03-13 | 2012-06-06 | 株式会社東芝 | 文字列照合装置、文字列照合プログラム及び文字列照合方法 |
JP5703191B2 (ja) * | 2011-11-02 | 2015-04-15 | 株式会社日立製作所 | 文書認識支援装置、文書検索装置及び文書管理方法 |
-
1997
- 1997-01-13 JP JP9003889A patent/JP2985813B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10198764A (ja) | 1998-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595410B (zh) | 手写作文的自动批改方法及装置 | |
Lee et al. | A new methodology for gray-scale character segmentation and recognition | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
US20040006467A1 (en) | Method of automatic language identification for multi-lingual text recognition | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JP3485020B2 (ja) | 文字認識方法及び装置ならびに記憶媒体 | |
CN113408535B (zh) | 一种基于中文字符级特征和语言模型的ocr纠错方法 | |
CN111539414B (zh) | 一种ocr图像字符识别和字符校正的方法及系统 | |
JP2985813B2 (ja) | 文字列認識装置および知識データベース学習方法 | |
CN111652157A (zh) | 一种低资源语种与通用语种的字典词条提取及识别方法 | |
JP2003030654A (ja) | パターン識別装置、パターン識別方法及びパターン識別用プログラム | |
JP2751865B2 (ja) | 文字列認識装置 | |
JPH11328315A (ja) | 文字認識装置 | |
JP2005339039A (ja) | 文書処理装置および文書処理方法 | |
JP3157557B2 (ja) | 文字認識装置 | |
KR102627591B1 (ko) | 문서로부터 정보를 추출하기 위한 장치의 동작 방법 및 그 장치 | |
JP3173363B2 (ja) | Ocrのメンテナンス方法及び装置 | |
JP2968354B2 (ja) | 文字認識結果の後処理方法 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JPH0256086A (ja) | 文字認識の後処理方法 | |
Lee et al. | Analysis of error count distributions for improving the post-processing performance of OCCR | |
JP2002312398A (ja) | 文書検索装置 | |
JP3929560B2 (ja) | 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
JPH01171080A (ja) | 誤り自動訂正文字認識装置 | |
JP3151866B2 (ja) | 英文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071001 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081001 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091001 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101001 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111001 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121001 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 14 |
|
LAPS | Cancellation because of no payment of annual fees |