JP3727422B2 - Character recognition apparatus and method - Google Patents
Character recognition apparatus and method Download PDFInfo
- Publication number
- JP3727422B2 JP3727422B2 JP23332496A JP23332496A JP3727422B2 JP 3727422 B2 JP3727422 B2 JP 3727422B2 JP 23332496 A JP23332496 A JP 23332496A JP 23332496 A JP23332496 A JP 23332496A JP 3727422 B2 JP3727422 B2 JP 3727422B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- candidate
- unit
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、帳票や名刺等の予め記載項目が明らかな文書画像を認識する文字認識装置及びその方法に関する。
【0002】
【従来の技術】
近年、文字認識装置が普及し、その文字認識の精度の向上が望まれている。
図16は、特開昭63ー311492号公報に記載の従来の文字認識装置の構成図である。この文字認識装置は、画像入力部1と、画像メモリ2と、サブ文字パターン切り出し部3と、文字パターン抽出部4と、認識部5と、認識辞書6と、単語処理部7と、単語辞書8と、表示部9とを備えている。
【0003】
サブ文字パターン切り出し部3は、漢字であれば「偏」と「旁」とのように文字の構成要素であるサブ文字パターンを文書画像から切り出す。文字パターン抽出部4は切り出されたサブ文字パターンの組み合わせをし、認識部5はその文字パターンの組み合わされた文字パターンを認識して、候補文字列を複数作成する。単語処理部7は、単語辞書8を照合して作成された候補文字列から一の単語を認識結果として確定する。
【0004】
【発明が解決しようとする課題】
ところで、従来の装置では、様々なサブ文字パターンの組み合わせの可能性を考慮して文字認識をしているので、文字を認識するまでの処理に時間を要する。更に、複数の作成された候補文字列を単語辞書と照合して一の単語を決定するけれども、単語辞書との照合ができれば、決定された単語を正しい認識結果であるとして出力していたので、その認識精度は必ずしも高くない。
【0005】
本発明は上記課題に鑑み、複数項目が記載された文書の記載内容を短時間で精度よく文字認識する文字認識装置及びその方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記課題を解決するために本発明は、対象とする文書画像が複数の記載項目に相当する文字列画像からなり、そのような文書画像の文字認識をする文字認識装置であって、文書画像の入力を受け付けると文字列画像の高さに基づいて又は、指示を受けると指示に基づいて文字画像を切り出す文字切出手段と、字種別に文字特徴が登録された認識辞書と、前記文字切出手段で切り出された文字画像を前記認識辞書の全範囲又は指示された範囲で照合して複数の文字候補を選択する文字候補選択手段と、認識対象とする文書画像の全ての記載項目に関連する単語を属性ごとに分類して登録している単語辞書と、前記文字候補選択手段で選択された文字画像の連続した文字候補を組み合わせて及び単独で前記単語辞書の全範囲又は指示された範囲で照合し、一致する単語があれば単語候補としてその属性とともに抽出し、一致するものがなければ属性を未定義として文字候補をそのまま単語候補として抽出する単語抽出手段と、前記単語抽出手段で抽出された単語候補をキーワードとして文字列画像単位で記載項目に分類する記載項目分類手段と、記載項目ごとに記載内容である単語の関連する属性、記載条件の一覧を記録した関連ルールテーブルと、前記単語抽出手段で単語辞書の全範囲で照合して得られた単語候補が前記関連ルールテーブルの当該記載項目の内容を満たすか否かを判定する関連判定手段と、前記関連判定手段で満たさないと判定されたときに、前記文字切出手段、文字候補選択手段又は単語抽出手段に所定の指示を与える指示手段と、前記関連判定手段で満たすと判定された単語候補と指示手段の指示に従い抽出された単語候補とを出力する出力手段とを備えることとしているので、指示手段は、関連判定手段が記載項目ごとに記載内容の属性等を満たさないと判定した単語候補を誤認識とみなして、文字切出手段等に指示する。したがって、認識精度が向上する。
【0008】
【発明の実施の形態】
以下、本発明に係る文字認識装置を図面を用いて説明する。
図1は、本発明に係る文字認識装置の一実施の形態の構成図である。この文字認識装置は、画像入力部101と、文字切り出し部102と、認識辞書103と、文字認識部104と、単語辞書105と、単語照合部106と、項目分類部107と、項目関連ルール記憶部108と、再処理判定部109と、結果出力部110とを備えている。
【0009】
画像入力部101は、スキャナ等からなり、オペレータにより用意された記載項目が予め決められている原稿をL/E(Light/Electric)変換等して、2値データで構成される画素(黒画素と白画素)の集合である文書画像にして文字切り出し部102に通知する。図2は、文字切り出し部102に通知された名刺の文書画像201を示している。
【0010】
文字切り出し部102は、画像入力部101から文書画像の通知を受けると、文書画像を走査して、黒画素の数を縦方向又は横方向に数え、走査線ごとの黒画素の分布から文字列画像を抽出する。この抽出した文字列画像に番号を付し、その位置例えば、文字列画像を外接する矩形の左上端点と右下端点との座標を求め、その文字列画像の高さを計算する。
【0011】
次に、この文字列画像の存在方向と直角方向に文字列画像を走査して、その黒画素の分布からその文字列画像の高さとほぼ同一の幅をもつ文字画像を切り出す。即ち、各文字列画像から全角サイズの文字画像を切り出す。切り出した文字画像に番号を付して、その位置とともに文字認識部104に通知する。
図3は、図2に示した文書画像201から抽出された文字列画像L1〜L5と、各文字列画像ごとに切り出された文字画像C1,C2,…を示している。
【0012】
また、文字切り出し部102は、再処理判定部109から後述する再処理条件テーブル801の内容に基づいて、文字画像切り出し条件とその文字画像の番号(処理範囲)との通知を受けると、その文字画像切り出し条件例えば等ピッチやプロポーショナルピッチに従い通知された番号の範囲の文字画像を処理範囲として新たな文字画像を切り出す。新たに切り出した文字画像は、上記の処理と同様であり、新たに各文字画像に番号を付し、その位置やラン情報とともに文字認識部104に通知される。
【0013】
認識辞書103は、文字コードとその文字コードに対応する文字の標準特徴ベクトルとを登録している。ここで文字コードには、漢字、平仮名、カタカナ、数字、英字のコードの他に記号等のコードも含まれている。この認識辞書103は、漢字、…、記号等の字種別に文字コード等が登録されている。
文字認識部104は、文字切り出し部102から文字画像等の通知を受けると、その特徴ベクトルを抽出し、認識辞書103の全ての文字コードの標準特徴ベクトルと照合し、例えば、市街地距離を求めて、その値の小さい標準特徴ベクトルに対応する文字コードを上位から複数個抽出し、文字候補として記憶する。この文字画像の認識処理を全文字列画像の全ての文字画像について行うと、単語照合部106を起動する。
【0014】
図4は、図3に示した文字画像を認識処理した結果を説明するための図である。各文字列画像L1〜L5の文字画像C1,C2,…を縦列に示し、各文字候補の上位、1位〜3位を横列に記載している。この文字候補は、実際は文字コードで記憶されている。
例えば、文字列画像L1の文字画像C1の1位文字候補は「認」であり、2位文字候補は「誌」であり、3位文字候補は「詰」である。
【0015】
また、文字認識部104は、再処理判定部109から文字画像認識条件の通知を受けている場合には、認識辞書103のその条件例えば文字種が数字だけ、英字、数字、記号だけ等に限定した照合範囲で上記と同様、複数個の文字コードを抽出し文字候補として記憶する。再切り出し文字画像についての再認識処理が全て終了すると単語照合部106を起動する。
【0016】
単語辞書105は、図5に示すように単語欄501と、単語欄501に登録されている単語の総括的な内容を表わす属性欄502とを有し、各属性に対応して複数の単語が登録されている。なお、実際には、単語は文字コードで示されている。
即ち、「株式」、「有限」、「会社」、…等の単語の総括的な内容を表わす属性は「会社」であり、属性「メイル」には、「メイル」、「MAIL」、「jp」、…等の単語が含まれていることを示している。なお、この単語辞書105の内容は、認識対象の文書画像によって変更される。
【0017】
本実施の形態では、文書画像201として「名刺」が対象とされているので、このような単語辞書105の内容となっている。
また、この属性欄502の「会社」〜「メイル」迄に含まれている単語欄501の各単語は、後述する記載項目を分類するキーワードとして用いられる。
単語照合部106は、文字認識部104に起動されると、文字認識部104で抽出された各文字列画像の先頭の文字候補から連続する文字候補を単語候補として読み出し、単語辞書105の単語欄に登録されている単語に一致するものがあれば、それを単語候補として決定し、その単語の属性とともに記憶する。この際、単語候補の読み出しは、上位の文字候補を優先し、1位同士の文字候補に一致する単語が単語辞書105に登録されていないときに、1位と2位、1位と3位のように文字候補を組み合わせて単語候補を読み出すこととする。この1位、2位、3位の文字候補を次の文字候補と組み合わせても単語が見つからないときには、1位の文字候補を単語候補として決定し、属性は「未定義」として記憶する。全ての文字列画像の全ての文字候補について、単語照合処理が終了すると項目分類部107を起動する。
【0018】
図6は、単語辞書105を照合して得られた単語候補を示している。図4に示した文字列画像L1の場合には、文字画像C1,C2の1位文字候補の組み合わせが単語辞書105の属性「一般」に単語「認識」として登録されているので、文字画像C1,C2を単語候補「認識」として決定する。続いて、文字候補C3,C4の1位文字候補の組み合わせが属性「氏名」に単語「珠代」として登録されているので文字画像C3,C4を単語候補「珠代」として決定する。同様に文字画像C5,C6を単語候補「会社」と決定する。
【0019】
ここで、文字画像C3,C4の2位と3位の文字候補を組み合わせると、単語辞書105の属性「会社」の単語「株式」と一致するけれども、文字候補の上位のものを組み合わせた「珠代」を単語候補としている。
文字列画像L2の文字画像C3,C4の場合には、1位文字候補同士の組み合わせ「大郎」は、単語辞書105にはないので、文字画像C3の2位文字候補「太」と文字画像C4の1位文字候補の組み合わせた単語「太郎」が単語辞書105の属性「氏名」に登録されているので単語候補として決定される。
【0020】
文字列画像L5の文字画像C6,C11の1位から3位迄の文字候補は全て単語辞書105に単語登録されていないので、1位の文字候補を単語候補「旧」、「卯」として属性を未定義の「未」とそれぞれしている。
また、単語照合部106は、再処理判定部109から文字画像の番号と単語辞書照合条件との通知を受けた場合には、文字認識部104で認識された連続する又は単独の文字候補を組み合わせて単語候補を決定する際、単語辞書105の照合範囲を通知された属性に従うようにして再決定する。
【0021】
即ち、単語辞書照合条件として属性「会社」、「一般」が通知されているときには、文字列画像L1の文字画像C3,C4のそれぞれ2位と3位の文字候補を組み合わせた「株式」(属性「会社」)を単語候補と決定する。このとき、属性「氏名」に含まれる単語辞書105の「珠代」は排除される。
このようにして、単語候補が再決定されると、再処理判定部109に決定した単語候補をその文字画像の番号とともに通知する。
【0022】
項目分類部107は、単語照合部106から起動されると、単語照合部106に記憶されている文字列画像単位で単語候補をキーワードとして予定されたどの記載項目であるか分類する。文字列画像L1では、文字画像C5、C6の単語候補「会社」が単語辞書105の属性「会社」にあるので記載項目が「会社」と分類される。なお、この際、属性「氏名」の単語候補「珠代」によって「氏名」に分類しようとしても、残りの「認識」、「会社」が属性「氏名」にはないので分類されない。文字列画像L2では、単語候補「名刺」「太郎」の属性「氏名」より記載項目が「氏名」と分類される。文字列画像L3,L4,L5の記載項目は、それぞれ「住所」、「電話」、「メイル」に分類される。なお、この記載項目の分類には、文字列画像のレイアウト等を参照して判断されるけれども、本発明の本旨と異なるので説明を省略する。
【0023】
全ての文字列画像について記載項目の分類が終わると再処理判定部109を起動する。
項目関連ルール記憶部108は、図7に示す関連ルールテーブル701と図8に示す再処理条件テーブル801とを記憶している。
関連ルールテーブル701は、記載項目702ごとの記載内容に関連する属性703と記載内容の特殊条件704とを含んでいる。この関連ルールテーブル701から記載項目「会社」の関連する属性は「会社」と「一般」とが含まれており、他の属性は含まれないことがわかる。即ち、他の属性の単語候補を含んでいれば文字画像を誤認識したことになる。
【0024】
特殊条件704から記載項目「住所」において、「〒」の次に記載されている文字画像は「3又は5桁の数字」であることがわかる。また、記載項目「電話」の文字列画像の最後は「4桁の数字」であることがわかる。
再処理条件テーブル801は、記載項目802と再処理条件803とを含み、再処理条件803には、その処理範囲804と文字画像切り出し条件805と文字画像認識条件806と単語辞書照合条件807とを含んでいる。
【0025】
例えば、文字列画像が記載項目「会社」と分類された場合には、その文字列画像の単語照合部106において決定された単語候補の属性が関連する属性703に含まれていないときには、再処理条件803の処理範囲804を「関連する属性を満たさない文字画像の単語候補」と規定し、単語辞書照合条件807を「属性会社又は一般と限定」するよう規定している。これによって、単語照合部106の単語候補決定のための単語辞書105の照合範囲は、属性「会社」、「一般」の単語に限定される。
【0026】
また、文字列画像が記載項目「電話」と分類されている場合には、単語候補の属性が関連する属性703に含まれていないときには、再処理条件803の処理範囲804を関連する属性を満たさない単語候補及びその単語候補に連なる「メイル」以外の単語候補と規定し、文字画像切り出し条件805をプロポーショナルピッチと、文字認識条件806を文字種を「数字」、「記号」と限定するよう規定している。
【0027】
再処理判定部109は、項目分類部107に起動されると、項目関連ルール記憶部108に記憶されている関連ルールテーブル701を読み出す。次に、項目分類部107で文字列画像単位ごとに分類された記載項目に含まれる単語候補に関連ルールテーブル701の関連する属性703に反する単語候補の属性があるか否か、特殊条件704があるときに、その条件を満たさない単語候補があるか否かを判定する。いずれの判定でも否定のときには、全文字列画像についての再処理条件の判定が終了したか否かを判定し、終了していれば結果出力部110を起動する。終了していなければ、次の文字列画像について、関連ルールテーブル701の内容に反するか否かの判定を繰り返す。
【0028】
いずれかの判定で肯定のときには、その文字列画像の認識に誤りがあるので、項目分類部107で分類されたその文字列画像の記載項目が「メイル」であるか「住所」または「電話」であるか、「会社」または「氏名」であるかを判定する。記載項目の判定をすると、項目関連ルール記憶部108に記憶されている再処理条件テーブル801からその記載項目802の再処理条件803を読み出す。
【0029】
「メイル」と判定したときには、その関連する属性を満たさない単語候補とその単語候補に連なる「メイル」以外の単語候補の文字画像の番号とプロポーショナルピッチでの文字画像切り出しをする旨とを文字切り出し部102に通知し、認識辞書103の英字、数字、記号を照合対象とする旨を文字認識部103に通知し、単語辞書106の属性がメイル、英字、数字、記号の単語を単語照合の範囲とする旨を単語照合部107に通知する。
【0030】
記載項目を「住所」と判定したときには、その特殊条件を満たさない単語候補の文字画像の番号と等ピッチの「3」又は「5」文字で文字画像を切り出す旨を文字切り出し部102に通知し、認識辞書103の数字を照合対象とする旨を文字認識部104に通知する。
記載項目を「電話」と判定したときには、その関連する属性を満たさない単語候補の文字画像の番号とプロポーショナルピッチでの文字画像を切り出す旨を文字切り出し部102に通知し、認識辞書103の数字、記号を照合対象とする旨を文字認識部104に通知する。
【0031】
記載項目を「会社」と判定したときには、関連する属性を満たさない単語候補の文字画像の番号と単語辞書105の属性が会社、一般の単語を照合対象とする旨とを単語照合部106に通知する。
記載項目を「氏名」と判定したときには、関連する属性を満たさない単語候補の文字画像の番号と単語辞書105の属性が氏名、肩書の単語を照合範囲とする旨とを単語照合部106に通知する。
【0032】
再処理判定部109は、例えば、文字列画像L1の場合には、記載項目を「会社」と判定し、その文字画像C3,C4とを関連する属性を満たさない「珠代」と認識しているので、単語照合部106に文字画像C3,C4の文字候補の単語辞書105の照合範囲を会社、一般に限定するよう単語照合部106に通知する。これによって、単語照合部106は、文字認識部104で認識された文字画像C3の2位文字候補「株」と文字画像C4の3位文字候補「式」とを組み合わせた属性「会社」の「株式」を単語候補として再認識する。
【0033】
文字画像L3の場合には、記載項目を「住所」と判定し、その文字画像C2を特殊条件に反する英字「M」と認識している(図6)。その文字画像C2(図9(a))は、文字切り出し部102によって、文字画像切り出し条件805に従い、図9(b)に示すように3個の文字画像C21、C22、23として切り出される。これによって、文字認識部104は、図9(c)に示すように認識辞書103と照合して文字候補を抽出する。単語照合部106は、単語辞書105と文字候補を照合して、文字画像C21、C22、C23の1位文字候補を単語候補「1」、「2」、「1」とそれぞれ決定する。
【0034】
文字列画像L5の場合には、記載項目を「メイル」と判定し、その文字画像C1〜C3以外の文字画像C4〜C11を文字認識の再処理範囲としている(図10(a))。文字切り出し部102は、再処理判定部109から通知されたプロポーショナルピッチに従い図10(b)に示すように、文字画像C4〜C14を切り出す。文字認識部104は、再処理判定部109から通知された英文、数字、記号の範囲で認識辞書103と照合し、図10(c)に示すような文字候補を抽出する。単語照合部106は、再処理判定部109から通知された属性がメイル、英字、数字、記号の範囲で文字候補を組み合わせて単語辞書105と照合し、その属性とともに図10(d)に示すように単語候補を決定する。
【0035】
なお、文字画像C13,C14の1位の文字候補の組み合わせ「lp」は属性「メイル」に存在しないので文字画像C13の2位文字候補「j」と文字画像C14の1位文字候補「p」とから単語候補「jp」が決定されている。
また、再処理判定部109は、単語照合部106から再処理の結果の通知を受けると、再処理の処理範囲外とした先の認識結果とともに結果出力部110に文字列画像の番号と、その認識項目と、その認識結果である文字コードとを通知する。
【0036】
結果出力部110は、文字コード等を表示画面に表示させるためのビットマップデータを保持し、再処理判定部109から認識結果である文字コード等の通知を受けると、表示画面に図11に示すような、文書画像の認識結果を表示するとともに、この認識結果を記憶しておく。
次に、本実施の形態の動作を図12、図13のフローチャートを参照して説明する。
【0037】
画像入力部101は、オペレータからの文書原稿例えば「名刺」の入力を受け付け、2値化された文書画像に変換する(S1202)。
文字切り出し部102は、文書画像から文字列画像を抽出する(S1204)。抽出した全文字列画像から文字画像を全角文字として切り出す(S1206,S1208)。
【0038】
次に文字認識部104は、認識辞書103の全字種を照合範囲として切り出された文字画像を照合して文字候補を抽出し、全文字列画像の全文字画像についてのこの照合を繰り返す(S1210,S1212)。
単語照合部106は、得られた連続する文字候補を単語辞書105の全属性の単語を対象として単語照合を行い、上位の文字候補の組合せを優先して単語候補とその属性との抽出を全文字列画像の全文字画像について終わるまで繰り返す(S1214,S1216)。全ての文字候補の組合せをすることなく、上位の文字候補の組合せによって単語照合の結果、一致する単語が単語辞書105に見つかれば単語照合ができたとするので、単語照合の時間は短縮される。この単語候補の認識誤りは、後の属性等の判定により修正ができる。
【0039】
次に、項目分類部107は、単語候補をキーワードとして、文字列画像の記載項目を全文字列画像について分類する(S1218,S1220)。
再認識処理部109は、全文字列画像について再認識が終了したか否かを判定し(S1222)、終了していないときは、項目関連ルール記憶部108に記憶されている関連ルールテーブル701の内容に反するか否かを記載項目ごとに判定し(S1224)、反しないときはS1222に戻り、関連ルールテーブル701の関連する属性703と単語候補の属性とが一致しない又は、特殊条件704に反するときはS1302に移る。
【0040】
S1302において、再処理判定部109は、文字列画像の記載項目が「メイル」であるか否かを判定する(S1302)。「メイル」でないときはS1316に移り、「メイル」のときは、再処理条件テーブル801の記載項目802の「メイル」の処理範囲804に記載の文字画像の番号を文字切り出し部102に通知する(S1304)。
【0041】
文字切り出し部102は、通知された文字画像と文字画像切り出し条件805のプロポーショナルピッチとに従い、文字画像を再切り出しする(S1306)。
文字認識部104は、文字画像認識条件806の認識辞書103の文字種の英字、数字、記号を照合範囲として文字候補を認識し、再切り出しされた文字画像がなくなるまで処理を繰り返す(S1308,S1310)。
【0042】
次に、単語照合部106は、単語辞書照合条件807の単語辞書105の属性のメイル、英字、数字、記号を照合範囲として連続した文字候補を組み合わせて又は単独の文字候補を単語候補に決定する。この処理を再認識された単語候補がなくなるまで繰り返し(S1312,S1314)、S1222に戻る。
S1316において、再処理判定部109は、文字列画像の記載項目が「住所」又は「電話」であるか否かを判定し(S1316)、ないときはS1326に移る。「住所」又は「電話」のときは、文字切り出し部102に再処理条件テーブル801の処理範囲804の内容を通知するとともに、記載項目が「住所」のときは等ピッチの3又は5文字の文字画像切り出し条件805を、記載項目が「電話」のときはプロポーショナルピッチの文字画像切り出し条件805をそれぞれ通知する(S1318)。
【0043】
文字切り出し部102は、再処理判定部109から通知された処理範囲と切り出し条件とに従い、文字画像を再切り出しする(S1320)。
文字認識部104は、「住所」のときは、認識辞書103の文字種の数字を照合範囲とし、「電話」のときは文字種を数字、記号を照合範囲と限定して、再切り出しされた文字画像を文字候補として認識し、再切り出しされた文字画像の認識が全て終わるまで繰り返し(S1322,S1324)、S1222に戻る。
【0044】
S1326では、単語照合部106は、再認識の対象とした文字候補の単語照合が全て終了するまで記載項目が「会社」、「氏名」の場合に、再処理条件テーブル801の処理範囲804に規定する文字画像の文字候補の組み合わせによる単語辞書照合条件を「会社」のときには単語の属性を会社、一般とし、「氏名」のときには属性を氏名、肩書として照合条件を限定して単語候補を決定する(S1328)。この後S1222に戻る。
【0045】
このようにして、最初に記載項目を考慮しないで粗い文字画像の切り出し条件によって文字画像を切り出して文字認識した後に、その記載項目を分類して記載内容に応じた文字画像を切り出して文字候補を認識して、記載内容に応じた属性を有する単語候補を決定するので、文字認識の精度と効率が飛躍的に向上する。
S1222において、再処理判定部109が全文字列画像の再認識を終了したと判定したときは、結果出力部110は、入力された文書画像から認識した単語候補をその文字列画像ごとにその記載項目とともに表示画面に表示して(S1226)、処理を終了する。
【0046】
なお、本実施の形態では、図1に示したような構成で本発明に係る文字認識装置を実現したけれども、本発明はプログラムによって実現し、これをフロッピーディスク等の記録媒体に記録して移送することにより、独立した他のコンピュータ・システムで容易に実施することができる。図14は、これをフロッピーディスクで実施する場合を説明する図である。
【0047】
記録媒体本体であるフロッピーディスク1401の物理フォーマットは、同心円状に外周から内周に向かってトラック1、2、…、80を作成し、角度方向に16のセクタに分割している。このように割り当てられた領域に従って、プログラムを記録する。
このフロッピーディスク1401は、ケース1402に収納され、これによって、ディスクを埃や外部からの衝撃から守り、安全に移送することができる。
【0048】
図15は、フロッピーディスク1401にプログラムの記録再生を行うことを説明する図である。図示のようにコンピュータ・システム1501にフロッピーディスクドライブ1502を接続することにより、ディスク1401に対してプログラムを記録再生することが可能となる。ディスク1401はフロッピーディスクドライブ1502に、挿入口1503を介して組込み、および取り出しがなされる。記録する場合はコンピュータ・システム1501からプログラムをフロッピーディスクドライブ1502によってディスク1401に記録する。再生する場合は、フロッピーディスクドライブ1502がプログラムをディスク1401から読み出し、コンピュータ・システム1501に転送する。
【0050】
【発明の効果】
以上述べたように、本発明によれば、対象とする文書画像が複数の記載項目に相当する文字列画像からなり、そのような文書画像の文字認識をする文字認識装置であって、文書画像の入力を受け付けると文字列画像の高さに基づいて又は、指示を受けると指示に基づいて文字画像を切り出す文字切出手段と、字種別に文字特徴が登録された認識辞書と、前記文字切出手段で切り出された文字画像を前記認識辞書の全範囲又は指示された範囲で照合して複数の文字候補を選択する文字候補選択手段と、認識対象とする文書画像の全ての記載項目に関連する単語を属性ごとに分類して登録している単語辞書と、前記文字候補選択手段で選択された連続した文字画像の文字候補を組み合わせて及び単独で前記単語辞書の全範囲又は指示された範囲で照合し、一致する単語があれば単語候補としてその属性とともに抽出し、一致するものがなければ属性を未定義として文字候補をそのまま単語候補として抽出する単語抽出手段と、前記単語抽出手段で抽出された単語候補をキーワードとして文字列画像単位で記載項目に分類する記載項目分類手段と、記載項目ごとに記載内容である単語の関連する属性、記載条件の一覧を記録した関連ルールテーブルと、前記単語抽出手段で単語辞書の全範囲で照合して得られた単語候補が前記関連ルールテーブルの当該記載項目の内容を満たすか否かを判定する関連判定手段と、前記関連判定手段で満たさないと判定されたときに、前記文字切出手段、文字候補選択手段又は単語抽出手段に所定の指示を与える指示手段と、前記関連判定手段で満たすと判定された単語候補と指示手段の指示に従い抽出された単語候補とを出力する出力手段とを備えることとしているので、記載項目の内容に反しない属性の単語候補は正しい認識であるとして再度の認識は行わないので認識に要する時間は短縮され、記載項目の内容に反するような属性の単語候補は誤認識であるとして再認識するので認識精度が向上する。
【0051】
また、本発明によれば、前記指示手段は、前記関連判定手段で満たさないと判定されたときに、該単語候補の文字画像を含む文字列画像の前記文字切出手段での文字画像の切り出し条件と、前記文字候補選択手段での文字候補の照合条件と、前記単語抽出手段での単語候補の照合条件とを所定の条件に変更する指示を与える条件変更指示部を含むこととしてるので、誤認識であるとされた単語候補を正しく認識することができる。
【0052】
また、本発明によれば、前記指示手段は、記載項目ごとに認識対象とする処理範囲と、文字画像の切り出し条件と、文字候補の字種と、単語候補の属性との処理条件を記録した処理条件テーブルと、前記関連判定手段で満たさないと判定されたとき、該単語候補を含む文字列画像の処理条件を前記処理条件テーブルからその記載項目ごとに読み出す読出部とを有し、前記条件変更指示部は、前記文字切出手段に前記読出部が読み出した処理範囲に含まれる文字画像と文字画像の切り出し条件とを指示する第1条件指示部と、前記文字候補選択手段に前記読出部が読み出した前記認識辞書の照合範囲を限定する字種を指示する第2条件指示部と、前記単語抽出手段に前記読出部が読み出した前記単語辞書の照合範囲を限定する属性を指示する第3条件指示部とを備えることとしているので、記載項目ごとに予め再処理条件が明確となり、文書画像の認識効率が高まる。
【0053】
また、本発明によれば、前記単語抽出手段は、最初に単語候補を抽出するときには、前記文字候補選択手段で選択された複数の文字候補のうち上位の文字候補の組合せを優先して単語候補を抽出し、前記第3条件指示部からの指示を受けたときには、その照合範囲を優先して単語候補を抽出することとしているので、認識処理に要する時間を短縮することができる。
【0054】
また、本発明によれば、対象とする文書画像が複数の記載項目に相当する文字列画像からなり、そのような文書画像の文字認識をする文字認識方法であって、文書画像の入力を受け付けると文字列画像の高さに基づいて文字画像を切り出す第1文字切出ステップと、前記第1文字切出ステップで切り出された文字画像を字種別に文字特徴が登録された認識辞書の全範囲で照合して複数の文字候補を選択する第1文字候補選択ステップと、前記第1文字候補選択ステップで選択された連続した文字画像の文字候補を組み合わせて及び単独で、認識対象とする文書画像の全ての記載項目に関連する単語を属性ごとに分類して登録している単語辞書の全範囲で照合し、一致する単語があれば単語候補としてその属性とともに抽出し、一致するものがなければ属性を未定義として文字候補をそのまま単語候補として抽出する第1単語抽出ステップと、前記第1単語抽出ステップで抽出された単語候補をキーワードとして文字列画像単位で記載項目に分類する記載項目分類ステップと、前記第1単語抽出ステップで抽出された単語候補が記載項目ごとに記載内容である単語の関連する属性、記載条件の一覧を記録した関連ルールテーブルの当該記載項目の内容を満たすか否かを判定する関連判定ステップと、前記関連判定ステップで満たさないと判定されたときに、文字画像の切り出し条件を指示する第1指示ステップと、前記第1指示ステップにおける切り出し条件に従い文字画像を切り出す第2文字切出ステップと、第2文字切出ステップで切り出された文字画像の認識辞書の照合範囲を指示する第2指示ステップと、前記第2指示ステップにおける指示に従い文字候補を選択する第2文字候補選択ステップと、前記第2文字候補選択ステップで選択された文字候補の単語辞書の照合範囲を指示する第3指示ステップと、前記第3指示ステップにおける指示に従い単語候補を抽出する第2単語候補抽出ステップと、前記関連判定ステップで満たすと判定された単語候補と前記第2単語候補抽出ステップで抽出された単語候補とを認識結果として出力する出力ステップとを有して実行することとしているので、上記文字認識装置と同様の効果を得ることができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の一実施の形態の構成図である。
【図2】上記実施の形態の画像入力部で変換された文書画像の一例を示す図である。
【図3】上記実施の形態の文字切り出し部で切り出された文字画像の一例を示す図である。
【図4】上記実施の形態の文字認識部で図3に示した文字画像から認識された文字候補を説明するための図である。
【図5】上記実施の形態の単語辞書の一例の説明図である。
【図6】上記実施の形態の単語照合部で図4の文字候補から照合処理された単語候補とその属性とを説明するための図である。
【図7】上記実施の形態の項目関連ルール記憶部に記憶されている関連ルールテーブルの内容を示す図である。
【図8】上記実施の形態の項目関連ルール記憶部に記憶されている再処理条件テーブルの内容を示す図である。
【図9】上記実施の形態の文字列画像L3の文字画像C2における再認識処理を説明するための図である。
【図10】上記実施の形態の文字列画像L5の文字画像C4〜C11における再認識処理を説明するための図である。
【図11】上記実施の形態の結果出力部で出力表示された文書画像の認識結果の一例を示す図である。
【図12】上記実施の形態の動作を説明するフローチャートである。
【図13】上記実施の形態の動作を説明するフローチャートである。
【図14】上記実施の形態で説明した文字認識方法を記録した記録媒体の説明図である。
【図15】上記記録媒体のコンピュータシステムへの装着を説明する図である。
【図16】従来の文字認識装置の構成図である。
【符号の説明】
101 画像入力部
102 文字切り出し部
103 認識辞書
104 文字認識部
105 単語辞書
106 単語照合部
107 項目分類部
108 項目関連ルール記憶部
109 再処理判定部
110 結果出力部
1401 フロッピーディスク
1501 コンピュータシステム
1502 フロッピーディスクドライブ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character recognition apparatus and method for recognizing a document image in which items described in advance, such as forms and business cards, are clear.
[0002]
[Prior art]
In recent years, character recognition devices have become widespread, and it is desired to improve the accuracy of character recognition.
FIG. 16 is a block diagram of a conventional character recognition apparatus described in Japanese Patent Laid-Open No. 63-311492. This character recognition device includes an
[0003]
The sub character
[0004]
[Problems to be solved by the invention]
By the way, in the conventional apparatus, since character recognition is performed in consideration of the possibility of combining various sub-character patterns, it takes time to recognize characters. Furthermore, although a plurality of candidate character strings are collated with a word dictionary to determine one word, if the collation with the word dictionary can be performed, the determined word is output as a correct recognition result. The recognition accuracy is not necessarily high.
[0005]
In view of the above problems, an object of the present invention is to provide a character recognition device and a method for recognizing characters in a document in which a plurality of items are described accurately in a short time.
[0007]
[Means for Solving the Problems]
To solve the above problems The present invention is a character recognition device for recognizing characters of a document image, in which the target document image is composed of character string images corresponding to a plurality of description items. Character cutting means for cutting out a character image based on the height of the character or on the basis of the instruction, a recognition dictionary in which character characteristics are registered in the character type, and a character image cut out by the character cutting means Character candidate selection means for selecting a plurality of character candidates by collating with the entire range of the recognition dictionary or the designated range, and classifying words related to all the description items of the document image to be recognized for each attribute. The word dictionary registered in combination with the consecutive character candidates of the character image selected by the character candidate selection means and collated alone in the entire range of the word dictionary or in the designated range, Ah If there is no match, the word extraction unit extracts the character candidate as the word candidate as it is and the character candidate extracted by the word extraction unit as a keyword Description item classification means for classifying into description items in units of images, a related rule table that records a list of related attributes and description conditions of words that are description contents for each description item, and the entire range of the word dictionary by the word extraction means When it is determined that the word candidate obtained by collating with the relation candidate satisfies the contents of the description item of the relation rule table and the relation determination means does not satisfy the word candidate, An instruction means for giving a predetermined instruction to the output means, the character candidate selection means or the word extraction means, and the word candidate and the indicator determined to be satisfied by the association determination means Output means for outputting the word candidates extracted according to the instruction of the instruction, the instruction means misrecognizes the word candidates that the association determination means determines that the description content attribute or the like is not satisfied for each description item Instructing the character cutting means and the like. Therefore, recognition accuracy is improved.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, a character recognition device according to the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram of an embodiment of a character recognition device according to the present invention. This character recognition device includes an
[0009]
The
[0010]
Upon receiving the notification of the document image from the
[0011]
Next, the character string image is scanned in a direction perpendicular to the direction in which the character string image exists, and a character image having the same width as the height of the character string image is cut out from the black pixel distribution. That is, a full-width character image is cut out from each character string image. A number is assigned to the clipped character image, and the
3 shows character string images L1 to L5 extracted from the
[0012]
When the
[0013]
The
When the
[0014]
FIG. 4 is a diagram for explaining the result of recognition processing for the character image shown in FIG. The character images C1, C2,... Of the character string images L1 to L5 are shown in a column, and the top, first to third places of each character candidate are shown in a row. This character candidate is actually stored as a character code.
For example, the first character candidate of the character image C1 of the character string image L1 is “approval”, the second character candidate is “magazine”, and the third character candidate is “filled”.
[0015]
Further, when the
[0016]
As shown in FIG. 5, the
That is, the attribute representing the general content of the words “stock”, “finite”, “company”,... Is “company”, and the attribute “mail” includes “mail”, “MAIL”, “jp”. ",... Are included. The contents of the
[0017]
In this embodiment, since “business card” is targeted as the
In addition, each word in the
When activated by the
[0018]
FIG. 6 shows word candidates obtained by collating the
[0019]
Here, combining the 2nd and 3rd character candidates of the character images C3 and C4 matches the word “stock” of the attribute “company” in the
In the case of the character images C3 and C4 of the character string image L2, the combination “Taro” of the first character candidates is not in the
[0020]
Since the first to third character candidates of the character images C6 and C11 of the character string image L5 are not registered as words in the
When the
[0021]
That is, when the attributes “company” and “general” are notified as the word dictionary matching condition, “stock” (attribute) combining the second and third character candidates of the character images C3 and C4 of the character string image L1. "Company") is determined as a word candidate. At this time, “Tsuyo” of the
Thus, when a word candidate is re-determined, the
[0022]
When activated by the
[0023]
When the classification of the description items is completed for all the character string images, the
The item relation
The association rule table 701 includes an
[0024]
From the
The reprocessing condition table 801 includes a
[0025]
For example, when the character string image is classified as the description item “company”, the re-processing is performed when the attribute of the word candidate determined by the
[0026]
If the character string image is classified as the entry item “telephone” and the attribute of the word candidate is not included in the
[0027]
When activated by the
[0028]
If any of the determinations are affirmative, there is an error in the recognition of the character string image. Therefore, the description item of the character string image classified by the
[0029]
When it is determined to be “mail”, the word candidate that does not satisfy the related attribute, the character image number of the word candidate other than “mail” that is connected to the word candidate, and the character image cutout at the proportional pitch are cut out. The
[0030]
When it is determined that the description item is “address”, the
When it is determined that the description item is “telephone”, the
[0031]
When it is determined that the description item is “company”, the
When it is determined that the description item is “name”, the
[0032]
For example, in the case of the character string image L1, the
[0033]
In the case of the character image L3, the description item is determined to be “address”, and the character image C2 is recognized as the letter “M” contrary to the special condition (FIG. 6). The character image C2 (FIG. 9A) is cut out by the
[0034]
In the case of the character string image L5, the description item is determined to be “mail”, and character images C4 to C11 other than the character images C1 to C3 are set as a reprocessing range of character recognition (FIG. 10A). The
[0035]
Since the combination “lp” of the first character candidate of the character images C13 and C14 does not exist in the attribute “mail”, the second character candidate “j” of the character image C13 and the first character candidate “p” of the character image C14. The word candidate “jp” is determined from the above.
When the
[0036]
The
Next, the operation of the present embodiment will be described with reference to the flowcharts of FIGS.
[0037]
The
The
[0038]
Next, the
The
[0039]
Next, the
The
[0040]
In step S1302, the
[0041]
The
The
[0042]
Next, the
In step S1316, the
[0043]
The
The
[0044]
In S1326, the
[0045]
In this manner, after character recognition is performed by cutting out character images according to the rough character image cutout conditions without considering the written items in the first place, the written items corresponding to the written contents are cut out by classifying the written items and character candidates are extracted. Recognizing and determining word candidates having attributes according to the contents of description, the accuracy and efficiency of character recognition are dramatically improved.
When the
[0046]
In this embodiment, the character recognition apparatus according to the present invention is realized with the configuration shown in FIG. 1, but the present invention is realized by a program, which is recorded on a recording medium such as a floppy disk and transferred. By doing so, it can be easily implemented by another independent computer system. FIG. 14 is a diagram for explaining a case where this is implemented with a floppy disk.
[0047]
The physical format of the
The
[0048]
FIG. 15 is a diagram for explaining the recording / reproduction of a program on the
[0050]
【The invention's effect】
As mentioned above, According to the present invention, the target document image is composed of character string images corresponding to a plurality of description items, and is a character recognition device for recognizing characters of such a document image. Based on the height of the row image or when an instruction is received, a character cutout means that cuts out a character image based on the instruction, a recognition dictionary in which character characteristics are registered in the character type, and the character cutout means Character candidate selection means for selecting a plurality of character candidates by collating the character image with the entire range of the recognition dictionary or the designated range, and words related to all the description items of the document image to be recognized for each attribute The word dictionary classified and registered and the character candidates of the continuous character images selected by the character candidate selection means are combined and matched in the whole range of the word dictionary or the designated range, and they match. single If there is a word candidate, it is extracted along with its attribute, and if there is no match, the attribute is undefined and the character candidate is extracted as it is as a word candidate, and the word candidate extracted by the word extraction means is used as a keyword. Description item classification means for classifying into description items in character string image units, a related rule table in which a list of related attributes and description conditions of words that are description contents for each description item is recorded, and the word extraction means When it is determined that the word candidate obtained by collating in the entire range satisfies the contents of the description item of the related rule table, and when it is determined not to be satisfied by the related determination unit, An instruction means for giving a predetermined instruction to the character extraction means, the character candidate selection means or the word extraction means; and the word candidates determined to be satisfied by the association determination means; Output means for outputting the word candidates extracted in accordance with the instructions of the indicating means, so that word candidates with attributes that do not contradict the contents of the description items are recognized as correct recognition, so that recognition is not performed again. The time required is shortened, and the word candidates having attributes that are contrary to the contents of the description items are re-recognized as erroneous recognition, so that the recognition accuracy is improved.
[0051]
Further, according to the present invention, when the instruction unit determines that the relation determination unit does not satisfy the instruction, the character extraction of the character string image including the character image of the word candidate is performed by the character extraction unit. Since it includes a condition change instruction unit that gives an instruction to change the condition, the character candidate collating condition in the character candidate selecting means, and the word candidate collating condition in the word extracting means to a predetermined condition, It is possible to correctly recognize word candidates that have been erroneously recognized.
[0052]
Further, according to the present invention, the instruction means records a processing range to be recognized for each description item, a character image clipping condition, a character candidate character type, and a word candidate attribute. A processing condition table; and a reading unit that reads out the processing condition of the character string image including the word candidate for each description item from the processing condition table when it is determined that the relation determination unit does not satisfy the condition determination unit. The change instructing unit includes a first condition instructing unit that instructs the character extracting unit to specify a character image included in the processing range read by the reading unit and a character image clipping condition, and the character candidate selecting unit to the reading unit. A second condition designating unit that designates a character type that limits the collation range of the recognition dictionary read by the user, and an attribute that designates an attribute that limits the collation range of the word dictionary read by the reading unit to the word extracting unit. Since the possible and a condition instructing section, pre-reprocessing conditions for each described item becomes clear, it increases the recognition efficiency of the document image.
[0053]
According to the present invention, when the word extracting unit first extracts a word candidate, the word candidate is given priority to a combination of upper character candidates among the plurality of character candidates selected by the character candidate selecting unit. When the word candidate is extracted with priority given to the collation range when the instruction is received from the third condition instruction unit, the time required for the recognition process can be shortened.
[0054]
According to the present invention, there is also provided a character recognition method for recognizing characters of a document image, in which the target document image is composed of character string images corresponding to a plurality of description items, and accepts input of the document image. A first character cutting step for cutting out a character image based on the height of the character string image, and the entire range of the recognition dictionary in which character features are registered for the character type of the character image cut out in the first character cutting step A document image to be recognized by combining the first character candidate selection step for selecting a plurality of character candidates by collating with the character candidates for the consecutive character images selected in the first character candidate selection step Words related to all the description items are collated in the entire range of the registered word dictionary classified by attribute, and if there is a matching word, it is extracted as a word candidate with the attribute, A first word extraction step for extracting a character candidate as a word candidate with the attribute undefined, and a description item for classifying the word candidate extracted in the first word extraction step into a description item for each character string image as a keyword. Whether the word candidates extracted in the classification step and the first word extraction step satisfy the content of the description item in the related rule table in which a list of related attributes and description conditions of the word as the description content is recorded for each description item An association determination step for determining whether or not, a first instruction step for instructing a character image cut-out condition when it is determined that the relation determination step is not satisfied, and a character image in accordance with the cut-out condition in the first instruction step The collation range of the recognition dictionary of the character image cut out by the second character cutting out step and the second character cutting out step A second instruction step to indicate, a second character candidate selection step for selecting a character candidate in accordance with the instruction in the second instruction step, and a collation range of the word dictionary of the character candidate selected in the second character candidate selection step A third instruction step that performs extraction, a second word candidate extraction step that extracts word candidates in accordance with instructions in the third instruction step, a word candidate that is determined to be satisfied in the association determination step, and an extraction in the second word candidate extraction step Therefore, it is possible to obtain the same effect as that of the character recognition device.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of an embodiment of a character recognition device according to the present invention.
FIG. 2 is a diagram illustrating an example of a document image converted by an image input unit according to the embodiment.
FIG. 3 is a diagram illustrating an example of a character image cut out by a character cutout unit according to the embodiment.
4 is a diagram for explaining character candidates recognized from the character image shown in FIG. 3 by the character recognition unit of the embodiment. FIG.
FIG. 5 is an explanatory diagram of an example of the word dictionary of the embodiment.
6 is a diagram for explaining word candidates and their attributes collated from the character candidates in FIG. 4 by the word collating unit of the embodiment. FIG.
FIG. 7 is a diagram showing the contents of a related rule table stored in the item related rule storage unit of the embodiment.
FIG. 8 is a diagram showing the contents of a reprocessing condition table stored in the item-related rule storage unit of the embodiment.
FIG. 9 is a diagram for explaining re-recognition processing in the character image C2 of the character string image L3 in the embodiment.
FIG. 10 is a diagram for explaining re-recognition processing in character images C4 to C11 of the character string image L5 in the embodiment.
FIG. 11 is a diagram illustrating an example of a recognition result of a document image output and displayed by the result output unit of the embodiment.
FIG. 12 is a flowchart illustrating the operation of the embodiment.
FIG. 13 is a flowchart illustrating the operation of the embodiment.
FIG. 14 is an explanatory diagram of a recording medium on which the character recognition method described in the above embodiment is recorded.
FIG. 15 is a diagram for explaining attachment of the recording medium to a computer system.
FIG. 16 is a configuration diagram of a conventional character recognition device.
[Explanation of symbols]
101 Image input unit
102 character cutout
103 recognition dictionary
104 Character recognition part
105 word dictionary
106 Word verification unit
107 Item classification
108 Item-related rule storage unit
109 Reprocessing determination unit
110 Result output section
1401 Floppy disk
1501 Computer system
1502 Floppy disk drive
Claims (5)
文書画像の入力を受け付けると文字列画像の高さに基づいて又は、指示を受けると指示に基づいて文字画像を切り出す文字切出手段と、
字種別に文字特徴が登録された認識辞書と、
前記文字切出手段で切り出された文字画像を前記認識辞書の全範囲又は指示された範囲で照合して複数の文字候補を選択する文字候補選択手段と、
認識対象とする文書画像の全ての記載項目に関連する単語を属性ごとに分類して登録している単語辞書と、
前記文字候補選択手段で選択された文字画像の連続した文字候補を組み合わせて及び単独で前記単語辞書の全範囲又は指示された範囲で照合し、一致する単語があれば単語候補としてその属性とともに抽出し、一致するものがなければ属性を未定義として文字候補を そのまま単語候補として抽出する単語抽出手段と、
前記単語抽出手段で抽出された単語候補をキーワードとして文字列画像単位で記載項目に分類する記載項目分類手段と、
記載項目ごとに記載内容である単語の関連する属性、記載条件の一覧を記録した関連ルールテーブルと、
前記単語抽出手段で単語辞書の全範囲で照合して得られた単語候補が前記関連ルールテーブルの当該記載項目の内容を満たすか否かを判定する関連判定手段と、
前記関連判定手段で満たさないと判定されたときに、前記文字切出手段、文字候補選択手段又は単語抽出手段に所定の指示を与える指示手段と、
前記関連判定手段で満たすと判定された単語候補と指示手段の指示に従い抽出された単語候補とを出力する出力手段とを備えることを特徴とする文字認識装置。A target document image consists of character string images corresponding to a plurality of description items, and is a character recognition device for character recognition of such a document image,
A character cutout means for cutting out a character image based on the height of the character string image when receiving an input of a document image or based on the instruction when receiving an instruction;
A recognition dictionary in which character features are registered as character types;
Character candidate selection means for selecting a plurality of character candidates by collating the character image clipped by the character cutout means with the entire range of the recognition dictionary or the designated range;
A word dictionary in which words related to all description items of a document image to be recognized are classified and registered for each attribute;
Combining consecutive character candidates of the character image selected by the character candidate selecting means and collating them alone in the entire range of the word dictionary or the designated range, and if there is a matching word, it is extracted along with its attributes as a word candidate If there is no match, the word extraction means for extracting the character candidate as it is as the word candidate without defining the attribute,
A description item classification means for classifying the word candidates extracted by the word extraction means into a description item in character string image units as keywords;
A related rule table that records a list of related attributes and description conditions of words that are description contents for each description item,
Relevance determining means for determining whether or not word candidates obtained by collating with the entire range of the word dictionary by the word extracting means satisfy the contents of the description item of the related rule table;
An instruction unit that gives a predetermined instruction to the character extraction unit, the character candidate selection unit, or the word extraction unit when it is determined that the relation determination unit does not satisfy the condition determination unit;
A character recognition apparatus comprising: an output unit that outputs a word candidate determined to be satisfied by the association determination unit and a word candidate extracted according to an instruction from the instruction unit.
前記関連判定手段で満たさないと判定されたときに、該単語候補の文字画像を含む文字列画像の前記文字切出手段での文字画像の切り出し条件と、前記文字候補選択手段での文字候補の照合条件と、前記単語抽出手段での単語候補の照合条件とを所定の条件に変更する指示を与える条件変更指示部を含むことを特徴とする請求項1記載の文字認識装置。The instruction means includes
When it is determined that the relation determination unit does not satisfy the condition, the character image cut-out condition in the character cut-out unit of the character string image including the character image of the word candidate and the character candidate selection unit in the character candidate selection unit and matching condition, the character recognition system according to claim 1, characterized in that it comprises a condition change instruction unit that gives an instruction to change the matching condition of word candidates in the word extraction means on a predetermined condition.
記載項目ごとに認識対象とする処理範囲と、文字画像の切り出し条件と、文字候補の字種と、単語候補の属性との処理条件を記録した処理条件テーブルと、
前記関連判定手段で満たさないと判定されたとき、該単語候補を含む文字列画像の処理条件を前記処理条件テーブルからその記載項目ごとに読み出す読出部とを有し、
前記条件変更指示部は、
前記文字切出手段に前記読出部が読み出した処理範囲に含まれる文字画像と文字画像の切り出し条件とを指示する第1条件指示部と、
前記文字候補選択手段に前記読出部が読み出した前記認識辞書の照合範囲を限定する字種を指示する第2条件指示部と、
前記単語抽出手段に前記読出部が読み出した前記単語辞書の照合範囲を限定する属性を指示する第3条件指示部とを備えることを特徴とする請求項2記載の文字認識装置。The instruction means includes
A processing condition table that records processing conditions to be recognized for each description item, character image clipping conditions, character candidate character types, and word candidate attributes;
A reading unit that reads out the processing condition of the character string image including the word candidate for each description item from the processing condition table when it is determined not to be satisfied by the association determination unit;
The condition change instruction unit
A first condition instructing unit for instructing the character extracting unit to specify a character image included in the processing range read by the reading unit and a character image extracting condition;
A second condition instructing unit that instructs the character candidate selecting unit to specify a character type that limits a collation range of the recognition dictionary read by the reading unit;
3. The character recognition device according to claim 2, further comprising: a third condition indicating unit that instructs the word extracting unit to specify an attribute that limits a collation range of the word dictionary read by the reading unit.
最初に単語候補を抽出するときには、前記文字候補選択手段で選択された複数の文字候補のうち上位の文字候補の組合せを優先して単語候補を抽出し、
前記第3条件指示部からの指示を受けたときには、その照合範囲を優先して単語候補を抽出することを特徴とする請求項3記載の文字認識装置。The word extracting means includes
When extracting word candidates for the first time, a word candidate is extracted by giving priority to a combination of upper character candidates among a plurality of character candidates selected by the character candidate selecting means,
Wherein when receiving an instruction from the third condition instructing section, the character recognition apparatus according to claim 3, wherein the extracting the word candidate in favor of the comparison range.
文書画像の入力を受け付けると文字列画像の高さに基づいて文字画像を切り出す第1文字切出ステップと、
前記第1文字切出ステップで切り出された文字画像を字種別に文字特徴が登録された認識辞書の全範囲で照合して複数の文字候補を選択する第1文字候補選択ステップと、
前記第1文字候補選択ステップで選択された連続した文字候補を組み合わせて及び単独で、認識対象とする文書画像の全ての記載項目に関連する単語を属性ごとに分類して登録している単語辞書の全範囲で照合し、一致する単語があれば単語候補としてその属性とともに抽出し、一致するものがなければ属性を未定義として文字候補をそのまま単語候補として抽出する第1単語抽出ステップと、
前記第1単語抽出ステップで抽出された単語候補をキーワードとして文字列画像単位で記載項目に分類する記載項目分類ステップと、
前記第1単語抽出ステップで抽出された単語候補が記載項目ごとに記載内容である単語の関連する属性、記載条件の一覧を記録した関連ルールテーブルの当該記載項目の内容を満たすか否かを判定する関連判定ステップと、
前記関連判定ステップで満たさないと判定されたときに、文字画像の切り出し条件を指示する第1指示ステップと、
前記第1指示ステップにおける切り出し条件に従い文字画像を切り出す第2文字切出ステップと、
第2文字切出ステップで切り出された文字画像の認識辞書の照合範囲を指示する第2指示ステップと、
前記第2指示ステップにおける指示に従い文字候補を選択する第2文字候補選択ステップと、
前記第2文字候補選択ステップで選択された文字候補の単語辞書の照合範囲を指示する第3指示ステップと、
前記第3指示ステップにおける指示に従い単語候補を抽出する第2単語候補抽出ステップと、
前記関連判定ステップで満たすと判定された単語候補と前記第2単語候補抽出ステップで抽出された単語候補とを認識結果として出力する出力ステップとを有して実行することを特徴とする文字認識方法。A character recognition method in which a target document image consists of character string images corresponding to a plurality of description items, and character recognition of such a document image is performed,
A first character extraction step of extracting a character image based on the height of the character string image upon accepting an input of a document image;
A first character candidate selection step of selecting a plurality of character candidates by collating the character image extracted in the first character extraction step with the entire range of the recognition dictionary in which character characteristics are registered for the character type;
A word dictionary in which words related to all description items of a document image to be recognized are classified and registered for each attribute in combination with and independently of the consecutive character candidates selected in the first character candidate selection step. A first word extraction step for collating with all the ranges, extracting a word candidate with its attribute if there is a matching word, and extracting a character candidate as a word candidate with the attribute undefined if there is no matching word;
A description item classification step for classifying the word candidates extracted in the first word extraction step into description items in character string image units as keywords;
It is determined whether or not the word candidate extracted in the first word extraction step satisfies the content of the description item in the related rule table in which a list of related attributes and description conditions of the word as the description content is recorded for each description item. Relevance determination step,
A first instruction step for instructing a character image cut-out condition when it is determined that the relation determination step is not satisfied;
A second character cutting step of cutting out a character image in accordance with the cutting conditions in the first instruction step;
A second instruction step for instructing the collation range of the recognition dictionary of the character image extracted in the second character extraction step;
A second character candidate selection step of selecting a character candidate according to the instruction in the second instruction step;
A third instruction step for instructing a collation range of the word dictionary of the character candidates selected in the second character candidate selection step;
A second word candidate extraction step for extracting word candidates in accordance with the instructions in the third instruction step;
A character recognition method comprising: an output step of outputting as a recognition result the word candidate determined to be satisfied in the association determination step and the word candidate extracted in the second word candidate extraction step .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23332496A JP3727422B2 (en) | 1996-09-03 | 1996-09-03 | Character recognition apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23332496A JP3727422B2 (en) | 1996-09-03 | 1996-09-03 | Character recognition apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1078997A JPH1078997A (en) | 1998-03-24 |
JP3727422B2 true JP3727422B2 (en) | 2005-12-14 |
Family
ID=16953363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23332496A Expired - Lifetime JP3727422B2 (en) | 1996-09-03 | 1996-09-03 | Character recognition apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3727422B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7305129B2 (en) * | 2003-01-29 | 2007-12-04 | Microsoft Corporation | Methods and apparatus for populating electronic forms from scanned documents |
JP4597644B2 (en) * | 2003-11-28 | 2010-12-15 | シャープ株式会社 | Character recognition device, program and recording medium |
CN101356541B (en) * | 2006-01-13 | 2012-05-30 | 富士通株式会社 | Method and apparatus for processing account ticket |
JP5125573B2 (en) * | 2008-02-12 | 2013-01-23 | 富士通株式会社 | Region extraction program, character recognition program, and character recognition device |
JP5831420B2 (en) * | 2012-09-28 | 2015-12-09 | オムロン株式会社 | Image processing apparatus and image processing method |
-
1996
- 1996-09-03 JP JP23332496A patent/JP3727422B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH1078997A (en) | 1998-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2077313C (en) | Methods and apparatus for selecting semantically significant images in a document image without decoding image content | |
CA2077274C (en) | Method and apparatus for summarizing a document without document image decoding | |
JP3452774B2 (en) | Character recognition method | |
JP3294995B2 (en) | Form reader | |
JPH07200732A (en) | Word-object extraction method and noise removable method in raster image | |
US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
JP4991407B2 (en) | Information processing apparatus, control program thereof, computer-readable recording medium storing the control program, and control method | |
US6535652B2 (en) | Image retrieval apparatus and method, and computer-readable memory therefor | |
JPS5947641A (en) | Producer of visiting card data base | |
JP3727422B2 (en) | Character recognition apparatus and method | |
JPH06290251A (en) | Document image processing method of electronic file device | |
US20110033114A1 (en) | Image processing apparatus and computer readable medium | |
JP4054453B2 (en) | Character recognition device and program recording medium | |
JPH06103402A (en) | Business card recognizing device | |
JP2002063197A (en) | Retrieving device, recording medium and program | |
JP4263928B2 (en) | Character recognition device, character recognition method, character recognition program, and recording medium | |
JPH0757040A (en) | Filing device provided with ocr | |
JPH07152856A (en) | Optical character reader | |
JPH04309B2 (en) | ||
JP2931485B2 (en) | Character extraction device and method | |
JP3412998B2 (en) | Image processing apparatus and method | |
JPS63282586A (en) | Character recognition device | |
JP2924356B2 (en) | Optical character reader | |
JP2972443B2 (en) | Character recognition device | |
JP2021157627A (en) | Information processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050928 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091007 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091007 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101007 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111007 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121007 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131007 Year of fee payment: 8 |
|
EXPY | Cancellation because of completion of term |