JP4055976B2 - 文書画像処理方法、文書画像処理装置及び記録媒体 - Google Patents

文書画像処理方法、文書画像処理装置及び記録媒体 Download PDF

Info

Publication number
JP4055976B2
JP4055976B2 JP21531499A JP21531499A JP4055976B2 JP 4055976 B2 JP4055976 B2 JP 4055976B2 JP 21531499 A JP21531499 A JP 21531499A JP 21531499 A JP21531499 A JP 21531499A JP 4055976 B2 JP4055976 B2 JP 4055976B2
Authority
JP
Japan
Prior art keywords
character recognition
character
target area
recognition system
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21531499A
Other languages
English (en)
Other versions
JP2001043316A (ja
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP21531499A priority Critical patent/JP4055976B2/ja
Publication of JP2001043316A publication Critical patent/JP2001043316A/ja
Application granted granted Critical
Publication of JP4055976B2 publication Critical patent/JP4055976B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書画像処理の分野に係り、特に、文書画像上の文字の領域に対する文字認識処理を含む文書画像処理の分野に関する。
【0002】
【従来の技術】
特開平10−198705号公報には、文書画像を見出し(タイトル)、本文、写真、表等に領域分割し、見出しの領域と本文の領域に対して文字認識を行う技術が開示されている。特開平8−87528号公報には、文書構造ごとに文字パターンの抽出を行い、文字認識結果を文書構造と対応付けして蓄積する技術が開示されている。また、特開平10−177641号公報には、文書画像からテキスト領域を抽出して文字認識を行い、認識結果から選択した文字列を文書画像の検索のためのキーワードとして保存するが、その際に、文字の相対的サイズを計算してキーワードに対応付けて保存しておき、キーワード検索を行った場合に、キーワードに対応した文字の相対的サイズを検索結果の重み付けに利用する技術が開示されている。
【0003】
【発明が解決しようとする課題】
例えば前記特開平10−177641号公報に述べられているように、文字認識結果を検索用のキーワードとして利用するような文書画像処理においては、高い認識率が望まれる。しかし、これまでに実用化されている各種の文字認識系では、高い文字認識率を達成しようとすると処理時間が増加する傾向が一般に認められるため、やみくもに高認識率を得ようとすることは、処理速度が低下するため現実的ではない。
【0004】
よって、本発明の目的は、文書画像上の文字認識対象領域に対する文字認識処理を含む文書画像処理において、文字認識精度と処理速度を両立させることにある。
【0005】
【課題を解決するための手段】
文書のレイアウト構造に着目すると、文字認識の対象となる領域を、誤認識を極力排除したい領域と、多少の誤認識が許容される領域とに分けて扱ってよい場合が多い。例えば、文字認識結果を検索用キーワードとして利用することを想定した文書画像処理の場合、文書画像上のタイトル領域のような特定の領域は、その文字認識結果がキーワードとして利用される可能性が高いであろうから、誤認識を極力排除したい(文字認識結果の重要性が高い)領域であろう。また、タイトル領域のような、文書の内容に関連した重要な語句が記載された領域は、領域内の文字数が比較的少ないことが多い。さらに、キーワードとして利用されるような重要な語句は、拡大文字や色つき文字で記載されることも多い。
【0006】
本発明は、そのような点に着目して前記目的を達成しようとするものであり、その主たる特徴は、文書画像上の個々の文字認識対象領域毎に、その文字認識処理に用いる文字認識系を低速だが高精度の第1の文字認識系あるいは低精度だが高速の第2の文字認識系から選択することであり、また、文字認識対象領域のレイアウト構造上の属性や、領域内の文字数、文字の大きさ、文字色を文字認識系の選択基準として利用することである。
【0007】
【発明の実施の形態】
以下、添付図面を参照し、本発明の実施の形態を説明する。なお、説明の繰り返しを避けるため、添付図面中の複数の図面において、同一部分又は対応部分には同一の参照符号又は同様の参照符号を用いる。
【0008】
図1に、本発明による文書画像処理装置のブロック構成の一例を示す。ここに示す文書画像処理装置は、画像入力部100、レイアウト解析部102、文字認識部104、文字認識処理のために参照される文字認識用辞書112及び言語辞書114から構成される。文字認識用辞書112は1文字単位の文字認識のための辞書であり、言語辞書114は1文字単位の文字認識結果に対する後処理のために利用される単語等の言語知識を格納した辞書である。画像入力部100は、イメージスキャナ等の画像入力機器を利用して文書原稿をスキャンし、その画像データを入力したり、記録媒体に予め記憶されている文書画像データを入力したり、あるいは、通信回線を介して外部より文書画像データを取り込んだりする部分である。なお、入力された文書画像データや、それに対する処理の過程で発生するデータを記憶するための記憶装置も当然に存在するが、図中には明示されていない。
【0009】
レイアウト解析部102は、画像入力部100によって入力された文書画像に対するレイアウト解析を行い、文書画像上の領域を文字認識対象領域(文字の領域)と、それ以外の図又は表の領域とに分類し、文字認識対象領域については、そのレイアウト構造上の属性であるヘッダ、フッタ、タイトル、本文等の識別も行う。また、文字認識対象領域については、必要に応じて、領域内の文字数、文字の大きさ、文字色も求める。本発明においては、レイアウト解析によって得られた文字認識対象領域の属性、文字数、文字の大きさ、文字色の情報は、文字認識対象領域に対する文字認識処理に使用する文字認識系の選択のために利用される。すなわち、レイアウト解析部102は、文書画像上の各文字認識対象領域を抽出する手段と、各文字認識対象領域に関し文字認識系の選択基準となる当該文字認識対象領域を特定する情報を取得するための手段とを含んでいる。
【0010】
レイアウト解析に関しては、前記公開特許公報にも見られるように数多くの手法が提案されている。本発明においても、そのような公知の手法を利用し得る。例えば、扱う文書のレイアウトが固定している場合には、予め用意されたフォーマット情報中に指定されている座標値から、ヘッダ、タイトル、本文、フッタなどの領域とその属性を識別するような、よく知られた手法を利用し得る。フォーマットの異なる複数種類の文書を扱う場合には、例えば前記特開平10−198705号公報に述べられているように、文字サイズなどに基づいて文書の種類を特定したうえで、その種類の文書に対応したフォーマット情報を利用して文書画像上の領域と属性の識別を行うような手法を利用してよい。
【0011】
図4に、入力された文書画像とそのレイアウト解析結果の一例を示す。なお、より複雑なレイアウト解析を行って、図4に示す領域3のような図や表の領域の内部にある文字の領域なども独立した領域として抽出するようにしてもよい。
【0012】
本発明によれば、文字認識部104は、複数種類の文字認識系と、それら複数の文字認識系の中から、個々の文字認識対象領域毎に、文字認識処理に使用するための文字認識系を選択する系選択部を具備する。ここに示す例では、文字認識系(1)106と文字認識系(2)108の2種類の文字認識系と、個々の文字認識対象領域毎に、その文字認識処理に使用するための文字認識系として文字認識系(1)106又は文字認識系(2)108を選択する系選択部110を具備する。ここでは、図3に示すように、一方の文字認識系(1)106は認識率は高いが低速のもの、もう一方の文字認識系(2)108は高速であるが認識率が低いものであるとして説明する。
【0013】
このような本発明による文書画像処理装置は、専用のハードウェアとして実現してもよいし、一般的な構成のコンピュータ上でソフトウェアによって実現してもよい。後者の場合、レイアウト解析部102や文字認識部104の機能をコンピュータ上で実現させるためのプログラム、換言すれば、本発明による文書画像処理方法の処理ステップを実行させるためのプログラムが、コンピュータのメモリにロードされてCPUにより実行される。そのようなプログラムが記録されたフロッピーディスク、CD−ROM、RAM、ROM等の記録媒体も本発明に包含される。
【0014】
なお、処理対象となる文書の種類はユーザ毎に異なる場合が多い。文書の種類が異なると、それに用いられるフォントや語句などに違いがある。したがって、複数のユーザが想定される場合には、文字認識用辞書112及び言語辞書114をユーザ別に用意する構成にすると、文字認識精度の面で一般に有利である。
【0015】
また、本発明による文書画像処理装置は、その一部の構成要素間をネットワークを介して接続するような構成としてもよい。例えば図2に示すように、クライアント/サーバー・システム上に本発明による文書画像処理装置を構築し、サーバー116とネットワーク120を介して接続される各クライアント118に、ユーザ別の文字認識用辞書112及び言語辞書114を配置し、全ユーザに利用される文字認識部104とレイアウト解析部102をサーバー116に配置するような構成が可能である。このようにすると、各ユーザーが、その扱う文書の種類に応じた最適な文字認識用辞書112及び言語辞書114を文字認識処理に利用することが可能になるとともに、文字認識部104の機能向上などは、文字認識部104そのもの、又は、そのためのプログラムの更新だけで対応でき、多くのユーザが最新の文字認識部104を利用できるなどのメリットがある。なお、図2においては、画像入力部100がクライアント118側に設けられているが、サーバー116側にも画像入力部を配置してもよい。
【0016】
次に、上に述べたような本発明による文書画像処理装置において実行される文書画像処理の内容を図5のフローチャートを参照して説明する。
【0017】
まず、画像入力部100によって文書画像が入力される(テップ200)。次に、レイアウト解析部102において、入力された文書画像に対するレイアウト解析が行われる(ステップ201)。このレイアウト解析によって、文書画像上の文字認識対象領域、図領域、表領域の分類が行われるとともに、各文字認識対象領域に関して、当該文字認識対象領域を特定する情報、すなわち、文字認識系の選択基準として利用される情報が得られる。この情報としては、前述のように、各文字認識対象領域の属性(ヘッダ、フッタ、タイトル、本文等の別)、文字数、文字の大きさ、文字色などである。ただし、その全てを必ずしも得る必要はなく、ステップ204で必要な情報だけを得れば足りる。
【0018】
レイアウト解析が終了すると、レイアウト解析部102において、文書画像上の1つの領域を選択し(ステップ202)、その領域が図又は表の領域であるか調べる(ステップ203)。その領域が図領域又は表領域であるとき、つまり、その領域が文字認識対象領域でないときには、レイアウト解析部102はステップ202に戻って次の領域を選択する。
【0019】
選択した領域が図領域でも表領域でもないとき、すなわち、その領域が文字認識対象領域であるときには、レイアウト解析部102は、文字認識部104に対し、その領域に関する文字認識系の選択基準としての情報を通知するとともに文字認識を指示する。文字認識部104の系選択部110は、通知された文字認識系選択基準としての情報に基づいて、その文字認識対象領域に対し使用すべき文字選択系を選択する(ステップ204)。そして、文字認識部104は、系選択部110によって選択された文字認識系(1)106又は文字認識系(2)108を使用して、その文字認識対象領域に対する文字認識処理を実行する(ステップ205,206)。
【0020】
このような処理が、レイアウト解析処理により抽出された領域について順次行われ、全ての領域に対する処理が終わると(ステップ208,yes)、文字認識処理結果及びレイアウト解析結果が出力される(ステップ209)。この出力データは、例えば、文書のデータベース化やその検索などに利用される。
【0021】
《実施例1》 本発明の実施例1においては、文字認識対象領域の属性が文字認識系の選択基準として利用される。すなわち、その領域が文字認識対象領域であるときには、レイアウト解析部102は、文字認識部104に対し、その文字認識対象領域の属性を通知するとともに文字認識を指示する。文字認識部104においては、系選択部110で文字認識対象領域の属性がタイトルであるか調べ、タイトルならば高精度の文字認識系(1)106を選択し、タイトルでなければ高速の文字認識系(2)108を選択する。
【0022】
図4に示した文書画像の場合、領域1は文字認識対象領域であり、その属性が「タイトル」であるので、高精度・低速の文字認識系(1)106が選択され、それを用いて文字認識処理が行われる。領域2の属性は本文であるので、高速の文字認識系(2)108が選択される。領域(3)は図の領域であるので、文字認識の対象とならない。領域(4)は属性が「フッタ」であるので高速の文字認識系(2)が選択される。このように、検索のためのキーワードとなるような誤認識を回避したいタイトル領域に対しては文字認識系(1)を用いることにより、高精度の文字認識結果を得られる。この高精度の文字認識では、低精度の文字認識に比べて1文字当たりの処理時間は増加するが、一般にタイトル領域の文字数は少ないので全体の処理時間に及ぼす影響は小さい。そして、タイトル以外の領域は高速の文字認識が行われるため、全体として高速の文字認識が可能である。なお、例えば、タイトル領域のほかに、文字数の少ないヘッダやフッタのような領域にたいしても、高精度な文字認識系(1)を選択させるようにすることも可能である。
【0023】
《実施例2》 本発明の実施例2においては、文字認識対象領域の文字数が、文字認識系の選択基準として利用される。この文字数は、領域内の厳密な文字の個数である必要はなく、例えば、領域内の黒画素の連結成分の個数でよい。このような文字数の検出は、文字認識処理の前に容易に算出可能である。文字認識部104の系選択部110は、レイアウト解析で検出された領域内の文字数を選択基準として、文字認識対象領域に対する文字認識処理に用いる文字認識系の選択を行う。すなわち、文字認識対象領域の文字数が所定の閾値より少ないか調べ、閾値より少ないならば高精度の文字認識系(1)106を選択し、閾値以上ならば高速の文字認識系(2)108を選択する。
【0024】
ここで、各領域について図4に示すような文字数が検出されたとして、文字数の閾値を例えば16とした場合、各文字認識対象領域に対する文字認識系の選択は次のようになる。領域1については、その文字数が10であり、閾値の16よりも少ないので、文字認識系(1)106が選択され、高精度の文字認識が行なわれる。領域1のような文字数の少ない領域は、キーワードとして利用される可能性が高いが、このように高精度の文字認識系を利用するため、誤認識を回避することができる。領域2と領域4については、その文字数が閾値の16以上であるので、高速の文字認識系(2)108が選択され、高速の文字認識が行なわれる。このように文字数が多い領域は高速の文字認識が行われ、1文字あたりの処理時間が大きい高精度な文字認識は文字数が少ない領域に対してのみ行われるため、全体として高速の文字認識が可能である。
【0025】
《実施例3》 本発明の実施例3においては、文字認識対象領域の文字のサイズが文字認識系の選択基準として利用される。この文字のサイズは、領域内の厳密な文字のサイズである必要はなく、例えば、領域内の黒画素連結成分の幅と高さの最大値を検出し、その最大の幅と高さを持つ矩形の面積(画素数)を文字のサイズとすることができる。このような文字サイズの検出は、文字認識処理の前に容易に算出可能である。文字認識部104の系選択部110は、レイアウト解析で検出された領域内の文字サイズを選択基準として、文字認識対象領域に対する文字認識処理に用いる文字認識系の選択を行う。すなわち、文字認識対象領域の文字サイズ(画素数)が所定の閾値以上であるか調べ、閾値以上ならば高精度の文字認識系(1)106を選択し、閾値未満ならば高速の文字認識系(2)108を選択する。
【0026】
ここで、各領域について図4に示すような文字サイズ(画素数)が検出されたとして、文字サイズの閾値を例えば100とした場合、各文字認識対象領域に対する文字認識系の選択は次のようになる。領域1については、その文字サイズが128画素であり、閾値の100画素以上であるので、文字認識系(1)106が選択され、高精度の文字認識が行なわれる。領域1のような文字サイズの大きな領域内の文字列は、一般にキーワードとして利用される可能性が高く誤認識を避ける必要性が高いが、高精度の文字認識系を利用することにより誤認識を回避することができる。領域2と領域4については、その文字サイズが閾値の100画素未満であるので、高速の文字認識系(2)108が選択され、高速の文字認識が行なわれる。領域3は図領域であって文字認識処理の対象とならない。このように文字サイズの小さな領域は高速の文字認識が行われ、1文字あたりの処理時間が大きい高精度な文字認識は文字サイズが大きな領域に対してのみ行われるため、全体として高速の文字認識が可能である。
【0027】
なお、文字サイズに関する閾値を、文書毎に適応的に決定してもよい。例えば、文書画像上の文字のサイズのヒストグラムを作成し、このヒストグラムに基づいて、適当な文字数に対して高精度な文字認識処理が行われるように、文字サイズに関する閾値を決定してもよい。
【0028】
《実施例4》 本発明の実施例4においては、文字認識対象領域の文字の色が、文字認識系の選択基準として利用される。一般的に、文字に特異な色の付けられている領域には、検索のためのキーワードとして利用されるような文字列が記載されている可能性が高く、その誤認識をできる限り回避したい。文字認識部104の系選択部110は、レイアウト解析で検出された領域内の文字色を選択基準として、文字認識対象領域に対する文字認識処理に用いる文字認識系の選択を行う。すなわち、文字認識対象領域の文字色が、特異な文字色であるか調べ、特異な文字色ならば高精度の文字認識系(1)106を選択し、特定な文字色でないならば高速の文字認識系(2)108を選択する。
【0029】
ここで、各領域について図4に示すような文字色が検出されたとして、特異でない文字色を黒とした場合、各文字認識対象領域に対する文字認識系の選択は次のようになる。領域1と領域4については、その文字色が青又は緑であり、これは特異な文字色であるので、文字認識系(1)106が選択され、高精度の文字認識が行なわれる。特異な文字色が用いられた領域内の文字列は、キーワードとして利用される可能性が高いが、このように高精度の文字認識系を利用するため、誤認識を回避することができる。領域2については、その文字色が黒で特異な文字色ではないため、高速の文字認識系(2)108が選択され、高速の文字認識が行なわれる。領域3は図領域であって文字認識処理の対象とならない。このように、1文字あたりの処理時間が大きい高精度な文字認識は特異な文字色が用いられた領域に対してのみ行われ、特異でない文字色が用いられた領域に対しては高速な文字認識が行われるため、全体として高速の文字認識が可能である。
【0030】
なお、ここでは、黒以外の色を特異な文字色としたが、特異な文字色(あるいは、特異でない文字色)を文書毎に適応的に決定してもよい。例えば、文書画像上の文字色の分布データを収集し、この分布データに基づいて、文字数の少ない1色又は複数色を特異な文字色として(あるいは、それ以外の文字色を特異でない文字色として)選び、その特異な文字色が用いられた領域に対して高精度な文字認識処理を行ってもよい。
【0031】
《実施例5》 本発明の実施例5においては、文字認識対象領域の属性、文字数、文字サイズ及び文字色の情報から、文字認識対象領域の重要度を総合的に評価し、その重要度を文字認識系の選択基準として用いる。すなわち、文字認識部104の系選択部110は、レイアウト解析部102から与えられた文字認識対象領域の属性、文字数、文字サイズ及び文字色から総合的に、その領域の重要度を評価し、重要度が高い場合には高精度の文字認識系(1)106を選択し、そうでない場合には高速の文字認識系(2)108を選択する。重要度の評価は、例えば、
(1)属性がタイトルならば50点、タイトルでなければ0点
(2)文字数が20以上ならば0点、20未満ならば20点
(3)文字サイズが18級以上ならば15点、18級未満ならば0点
(4)文字色が黒ならば0点、黒以外ならば20点
というように各項目のスコアを求め、4項目のスコアの合計を重要度と評価することができる。そして、その重要度(スコア合計)が例えば35点以上ならば重要度が高いと判断する。文字数や文字サイズに関しては、計算式を用いてスコアを求めることも可能である。例えば文字サイズに関しては、その級数をNとした場合に、そのスコアをNとするような方法を用いてもよい。
【0032】
なお、文字認識対象領域の属性、文字数、文字サイズ、文字色などから選択した2つ以上の項目の情報を用い、同様の方法で領域の重要度を総合的に評価して文字認識系を選択することも可能である。
【0033】
【発明の効果】
本発明によれば、誤認識を回避したい領域には認識精度を優先した文字認識系を利用し、ある程度の誤認識が許容されるような領域に対しては処理速度を優先した文字認識系を利用するというように、個々の文字認識対象領域毎に文字認識系を使い分けることによって、認識精度と処理速度を両立させることが可能になる。例えば、文字認識結果を検索用キーワード等として利用される可能性が高いタイトル等の特定の領域や、拡大文字や特異な文字色が用いられたような領域に対しては、認識精度を優先した文字認識系を利用して所要の高い認識率を達成する一方で、それ以外の領域に対しては処理速度を優先した文字認識系を利用することにより、全体として高速処理を実現することが可能になる。
【図面の簡単な説明】
【図1】本発明による文書画像処理装置のブロック構成例を示すブロック図である。
【図2】クライアント/サーバー・システム上に構築した本発明による文書画像処理装置のブロック構成例を示すブロック図である。
【図3】文字認識系の処理速度と認識率の関係を説明する図である。
【図4】文書画像とそのレイアウト解析結果の一例を示す図である。
【図5】本発明による文書画像処理装置の処理フロー例を示すフローチャートである。
【符号の説明】
100 画像入力部
102 レイアウト解析部
104 文字認識部
106 文字認識系(1)
108 文字認識系(2)
110 系選択部
112 文字認識用辞書
114 言語辞書
116 サーバー
118 クライアント
120 ネットワーク

Claims (7)

  1. 入力された文書画像をレイアウト解析して、文字認識対象領域、その他の領域に分類すると共に、文字認識対象領域について、当該文字認識対象領域を特定する情報を取得するステップと、
    前記文字認識対象領域について、当該文字認識対象領域を特定する情報に基づいて、高精度で低速の第1の文字認識系あるいは低精度で高速の第2の文字認識系を選択するステップと、
    前記文字認識対象領域に対して、前記選択された第1の文字認識系あるいは第2の文字認識系を適用して文字認識処理を行うステップと、
    を有することを特徴とする文書画像処理方法。
  2. 文字認識対象領域を特定する情報は、タイトル、ヘッダ、本文を示す属性、文字数、文字の大きさ、あるいは文字色の情報からなり、
    文字認識系を選択するステップは、文字認識対象領域の前記属性、文字数、文字の大きさ、あるいは文字色の情報に基づいて、低速だが高精度の第1の文字認識系あるいは低精度だが高速の第2の文字認識系を選択することを特徴とする請求項1記載の文書画像処理方法。
  3. 文字認識対象領域を特定する情報は、タイトル、ヘッダ、本文を示す属性、文字数、文字の大きさ、文字色の少なくとも2項目以上の情報からなり、
    文字認識系を選択するステップは、文字認識対象領域の前記属性、文字数、文字の大きさ、文字色の少なくとも2項目以上の情報から当該文字認識対象領域の重要度を総合的に評価し、該評価した重要度に基づいて、低速だが高精度の第1の文字認識系あるいは低精度だが高速の第2の文字認識系を選択することを特徴とする請求項1記載の文書画像処理方法。
  4. 入力された文書画像をレイアウト解析して、文字認識対象領域、その他の領域に分類すると共に、文字認識対象領域について、当該文字認識対象領域を特定する情報を取得する手段と、
    前記文字認識対象領域について、当該文字認識対象領域を特定する情報に基づいて、高精度で低速の第1の文字認識系あるいは低精度で高速の第2の文字認識系を選択する手段と、
    前記文字認識対象領域に対して、前記選択された第1の文字認識系あるいは第2の文字認識系を適用して文字認識処理を行う手段と、
    を有することを特徴とする文書画像処理装置。
  5. 文字認識対象領域を特定する情報は、タイトル、ヘッダ、本文を示す属性、文字数、文字の大きさ、あるいは文字色の情報からなり、
    文字認識系を選択する手段は、文字認識対象領域の前記属性、文字数、文字の大きさ、あるいは文字色の情報に基づいて、低速だが高精度の第1の文字認識系あるいは低精度だが高速の第2の文字認識系を選択することを特徴とする請求項4記載の文書画像処理装置。
  6. 文字認識対象領域を特定する情報は、タイトル、ヘッダ、本文を示す属性、文字数、文字の大きさ、文字色の少なくとも2項目以上の情報からなり、
    文字認識系を選択する手段は、文字認識対象領域の前記属性、文字数、文字の大きさ、文字色の少なくとも2項目以上の情報から当該文字認識対象領域の重要度を総合的に評価し、該評価した重要度に基づいて、低速だが高精度の第1の文字認識系あるいは低精度だが高速の第2の文字認識系を選択することを特徴とする請求項4記載の文書画像処理装置。
  7. 請求項1乃至3のいずれか1項に記載の文書画像処理方法の各ステップをコンピュータに実行させるためのプログラムが記録されたことを特徴とするコンピュータ読み取り可能記録媒体。
JP21531499A 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体 Expired - Fee Related JP4055976B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21531499A JP4055976B2 (ja) 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21531499A JP4055976B2 (ja) 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001043316A JP2001043316A (ja) 2001-02-16
JP4055976B2 true JP4055976B2 (ja) 2008-03-05

Family

ID=16670272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21531499A Expired - Fee Related JP4055976B2 (ja) 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP4055976B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065994A (ja) * 2005-08-31 2007-03-15 Ricoh Co Ltd 文書ocr実行装置
JP2010033605A (ja) * 2009-11-10 2010-02-12 Ricoh Co Ltd 情報処理装置及び情報処理プログラム
JP5853488B2 (ja) * 2011-08-19 2016-02-09 富士ゼロックス株式会社 情報処理装置およびプログラム
JP6503926B2 (ja) 2015-06-29 2019-04-24 富士ゼロックス株式会社 プログラム及び情報処理装置
JP7095346B2 (ja) * 2018-03-22 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
WO2020194576A1 (ja) * 2019-03-27 2020-10-01 三菱電機ビルテクノサービス株式会社 設備機器情報収集システム

Also Published As

Publication number Publication date
JP2001043316A (ja) 2001-02-16

Similar Documents

Publication Publication Date Title
US7627176B2 (en) Apparatus, method, and computer program for analyzing document layout
KR102403964B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
US7065521B2 (en) Method for fuzzy logic rule based multimedia information retrival with text and perceptual features
EP2172856A2 (en) Image processing apparatus, image processing method and program
US11900644B2 (en) Document image analysis apparatus, document image analysis method and program thereof
KR101782589B1 (ko) 이미지에 포함된 텍스트를 검출하는 방법, 장치 및 컴퓨터 판독 가능한 기록매체
JPH11161681A (ja) 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体
KR102399508B1 (ko) 레이아웃 분석 방법, 판독 보조 장치, 회로, 및 매체
JPH1125113A (ja) 画像検索装置,画像検索用キーテキストの生成方法,並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000182064A (ja) ドキュメント処理システム及びインデックス情報獲得方法
KR20210050139A (ko) 이미지의 유사도 계산 장치 및 방법
JP2004341940A (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
CN111612004A (zh) 一种基于语义内容的图像裁剪方法及装置
JP4055976B2 (ja) 文書画像処理方法、文書画像処理装置及び記録媒体
US9049400B2 (en) Image processing apparatus, and image processing method and program
JPH11184894A (ja) 論理要素抽出方法および記録媒体
JP2010231637A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2000163576A (ja) 画像検索方法及びその実施装置並びにその処理プログラムを記録した媒体
JP3912463B2 (ja) 論理構造抽出装置及び論理構造抽出方法
JP6778625B2 (ja) 画像検索システム、画像検索方法及び画像検索プログラム
JPH08263522A (ja) 画像検索方法
JPH11238072A (ja) 文書保管装置
JP5046241B2 (ja) 画像処理装置、画像処理方法およびプログラム
JPH10198683A (ja) 文書画像分類方法
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees