JP2001043316A - 文書画像処理方法、文書画像処理装置及び記録媒体 - Google Patents

文書画像処理方法、文書画像処理装置及び記録媒体

Info

Publication number
JP2001043316A
JP2001043316A JP11215314A JP21531499A JP2001043316A JP 2001043316 A JP2001043316 A JP 2001043316A JP 11215314 A JP11215314 A JP 11215314A JP 21531499 A JP21531499 A JP 21531499A JP 2001043316 A JP2001043316 A JP 2001043316A
Authority
JP
Japan
Prior art keywords
character recognition
character
target area
area
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11215314A
Other languages
English (en)
Other versions
JP4055976B2 (ja
Inventor
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP21531499A priority Critical patent/JP4055976B2/ja
Publication of JP2001043316A publication Critical patent/JP2001043316A/ja
Application granted granted Critical
Publication of JP4055976B2 publication Critical patent/JP4055976B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字認識対象領域に対する文字認識処理を含
む文書画像処理において、文字認識率と処理速度を両立
させる。 【解決手段】 レイアウト解析部102は文書上の各文
字認識対象領域の属性、文字数、文字サイズ、文字色を
文字認識部104に提供する。文字認識部104の系選
択部110は、各文字認識対象領域の属性や、文字数、
文字サイズ、文字色の1つ又は複数の情報に基づいて、
誤認識を回避したい領域に対しては高精度な文字認識系
(1)106を選択し、それ以外の領域に対しては高速
な文字認識系(2)108を選択する。文字認識部10
4は、各文字認識対象領域に対し、系選択部110によ
り選択された文字認識系を用いて文字認識書を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像処理の分
野に係り、特に、文書画像上の文字の領域に対する文字
認識処理を含む文書画像処理の分野に関する。
【0002】
【従来の技術】特開平10−198705号公報には、
文書画像を見出し(タイトル)、本文、写真、表等に領
域分割し、見出しの領域と本文の領域に対して文字認識
を行う技術が開示されている。特開平8−87528号
公報には、文書構造ごとに文字パターンの抽出を行い、
文字認識結果を文書構造と対応付けして蓄積する技術が
開示されている。また、特開平10−177641号公
報には、文書画像からテキスト領域を抽出して文字認識
を行い、認識結果から選択した文字列を文書画像の検索
のためのキーワードとして保存するが、その際に、文字
の相対的サイズを計算してキーワードに対応付けて保存
しておき、キーワード検索を行った場合に、キーワード
に対応した文字の相対的サイズを検索結果の重み付けに
利用する技術が開示されている。
【0003】
【発明が解決しようとする課題】例えば前記特開平10
−177641号公報に述べられているように、文字認
識結果を検索用のキーワードとして利用するような文書
画像処理においては、高い認識率が望まれる。しかし、
これまでに実用化されている各種の文字認識系では、高
い文字認識率を達成しようとすると処理時間が増加する
傾向が一般に認められるため、やみくもに高認識率を得
ようとすることは、処理速度が低下するため現実的では
ない。
【0004】よって、本発明の目的は、文書画像上の文
字認識対象領域に対する文字認識処理を含む文書画像処
理において、文字認識精度と処理速度を両立させること
にある。
【0005】
【課題を解決するための手段】文書のレイアウト構造に
着目すると、文字認識の対象となる領域を、誤認識を極
力排除したい領域と、多少の誤認識が許容される領域と
に分けて扱ってよい場合が多い。例えば、文字認識結果
を検索用キーワードとして利用することを想定した文書
画像処理の場合、文書画像上のタイトル領域のような特
定の領域は、その文字認識結果がキーワードとして利用
される可能性が高いであろうから、誤認識を極力排除し
たい(文字認識結果の重要性が高い)領域であろう。ま
た、タイトル領域のような、文書の内容に関連した重要
な語句が記載された領域は、領域内の文字数が比較的少
ないことが多い。さらに、キーワードとして利用される
ような重要な語句は、拡大文字や色つき文字で記載され
ることも多い。
【0006】本発明は、そのような点に着目して前記目
的を達成しようとするものであり、その主たる特徴は、
文書画像上の個々の認識対象領域毎に、その文字認識処
理に用いる文字認識系を複数種類の文字認識系の中から
選択することであり、また、文字認識対象領域のレイア
ウト構造上の属性や、領域内の文字数、文字の大きさ、
文字色を文字認識系の選択基準として利用することであ
る。
【0007】
【発明の実施の形態】以下、添付図面を参照し、本発明
の実施の形態を説明する。なお、説明の繰り返しを避け
るため、添付図面中の複数の図面において、同一部分又
は対応部分には同一の参照符号又は同様の参照符号を用
いる。
【0008】図1に、本発明による文書画像処理装置の
ブロック構成の一例を示す。ここに示す文書画像処理装
置は、画像入力部100、レイアウト解析部102、文
字認識部104、文字認識処理のために参照される文字
認識用辞書112及び言語辞書114から構成される。
文字認識用辞書112は1文字単位の文字認識のための
辞書であり、言語辞書114は1文字単位の文字認識結
果に対する後処理のために利用される単語等の言語知識
を格納した辞書である。画像入力部100は、イメージ
スキャナ等の画像入力機器を利用して文書原稿をスキャ
ンし、その画像データを入力したり、記録媒体に予め記
憶されている文書画像データを入力したり、あるいは、
通信回線を介して外部より文書画像データを取り込んだ
りする部分である。なお、入力された文書画像データ
や、それに対する処理の過程で発生するデータを記憶す
るための記憶装置も当然に存在するが、図中には明示さ
れていない。
【0009】レイアウト解析部102は、画像入力部1
00によって入力された文書画像に対するレイアウト解
析を行い、文書画像上の領域を文字認識対象領域(文字
の領域)と、それ以外の図又は表の領域とに分類し、文
字認識対象領域については、そのレイアウト構造上の属
性であるヘッダ、フッタ、タイトル、本文等の識別も行
う。また、文字認識対象領域については、必要に応じ
て、領域内の文字数、文字の大きさ、文字色も求める。
本発明においては、レイアウト解析によって得られた文
字認識対象領域の属性、文字数、文字の大きさ、文字色
の情報は、文字認識対象領域に対する文字認識処理に使
用する文字認識系の選択のために利用される。すなわ
ち、レイアウト解析部102は、文書画像上の各文字認
識対象領域を抽出する手段と、各文字認識対象領域に関
し文字認識系の選択基準となる情報を取得するための手
段とを含んでいる。
【0010】レイアウト解析に関しては、前記公開特許
公報にも見られるように数多くの手法が提案されてい
る。本発明においても、そのような公知の手法を利用し
得る。例えば、扱う文書のレイアウトが固定している場
合には、予め用意されたフォーマット情報中に指定され
ている座標値から、ヘッダ、タイトル、本文、フッタな
どの領域とその属性を識別するような、よく知られた手
法を利用し得る。フォーマットの異なる複数種類の文書
を扱う場合には、例えば前記特開平10−198705
号公報に述べられているように、文字サイズなどに基づ
いて文書の種類を特定したうえで、その種類の文書に対
応したフォーマット情報を利用して文書画像上の領域と
属性の識別を行うような手法を利用してよい。
【0011】図4に、入力された文書画像とそのレイア
ウト解析結果の一例を示す。なお、より複雑なレイアウ
ト解析を行って、図4に示す領域3のような図や表の領
域の内部にある文字の領域なども独立した領域として抽
出するようにしてもよい。
【0012】本発明によれば、文字認識部104は、複
数種類の文字認識系と、それら複数の文字認識系の中か
ら、個々の文字認識対象領域毎に、文字認識処理に使用
するための文字認識系を選択する系選択部を具備する。
ここに示す例では、文字認識系(1)106と文字認識
系(2)108の2種類の文字認識系と、個々の文字認
識対象領域毎に、その文字認識処理に使用するための文
字認識系として文字認識系(1)106又は文字認識系
(2)108を選択する系選択部110を具備する。こ
こでは、図3に示すように、一方の文字認識系(1)1
06は認識率は高いが低速のもの、もう一方の文字認識
系(2)108は高速であるが認識率が低いものである
として説明する。
【0013】このような本発明による文書画像処理装置
は、専用のハードウェアとして実現してもよいし、一般
的な構成のコンピュータ上でソフトウェアによって実現
してもよい。後者の場合、レイアウト解析部102や文
字認識部104の機能をコンピュータ上で実現させるた
めのプログラム、換言すれば、本発明による文書画像処
理方法の処理ステップを実行させるためのプログラム
が、コンピュータのメモリにロードされてCPUにより
実行される。そのようなプログラムが記録されたフロッ
ピー(登録商標)ディスク、CD−ROM、RAM、R
OM等の記録媒体も本発明に包含される。
【0014】なお、処理対象となる文書の種類はユーザ
毎に異なる場合が多い。文書の種類が異なると、それに
用いられるフォントや語句などに違いがある。したがっ
て、複数のユーザが想定される場合には、文字認識用辞
書112及び言語辞書114をユーザ別に用意する構成
にすると、文字認識精度の面で一般に有利である。
【0015】また、本発明による文書画像処理装置は、
その一部の構成要素間をネットワークを介して接続する
ような構成としてもよい。例えば図2に示すように、ク
ライアント/サーバー・システム上に本発明による文書
画像処理装置を構築し、サーバー116とネットワーク
120を介して接続される各クライアント118に、ユ
ーザ別の文字認識用辞書112及び言語辞書114を配
置し、全ユーザに利用される文字認識部104とレイア
ウト解析部102をサーバー116に配置するような構
成が可能である。このようにすると、各ユーザーが、そ
の扱う文書の種類に応じた最適な文字認識用辞書112
及び言語辞書114を文字認識処理に利用することが可
能になるとともに、文字認識部104の機能向上など
は、文字認識部104そのもの、又は、そのためのプロ
グラムの更新だけで対応でき、多くのユーザが最新の文
字認識部104を利用できるなどのメリットがある。な
お、図2においては、画像入力部100がクライアント
118側に設けられているが、サーバー116側にも画
像入力部を配置してもよい。
【0016】次に、上に述べたような本発明による文書
画像処理装置において実行される文書画像処理の内容を
図5のフローチャートを参照して説明する。
【0017】まず、画像入力部100によって文書画像
が入力される(テップ200)。次に、レイアウト解析
部102において、入力された文書画像に対するレイア
ウト解析が行われる(ステップ201)。このレイアウ
ト解析によって、文書画像上の文字認識対象領域、図領
域、表領域の分類が行われるとともに、各文字認識対象
領域に関して、文字認識系の選択基準として利用される
情報が得られる。この情報としては、前述のように、各
文字認識対象領域の属性(ヘッダ、フッタ、タイトル、
本文等の別)、文字数、文字の大きさ、文字色などであ
る。ただし、その全てを必ずしも得る必要はなく、ステ
ップ204で必要な情報だけを得れば足りる。
【0018】レイアウト解析が終了すると、レイアウト
解析部102において、文書画像上の1つの領域を選択
し(ステップ202)、その領域が図又は表の領域であ
るか調べる(ステップ203)。その領域が図領域又は
表領域であるとき、つまり、その領域が文字認識対象領
域でないときには、レイアウト解析部102はステップ
202に戻って次の領域を選択する。
【0019】選択した領域が図領域でも表領域でもない
とき、すなわち、その領域が文字認識対象領域であると
きには、レイアウト解析部102は、文字認識部104
に対し、その領域に関する文字認識系の選択基準として
の情報を通知するとともに文字認識を指示する。文字認
識部104の系選択部110は、通知された文字認識系
選択基準としての情報に基づいて、その文字認識対象領
域に対し使用すべき文字選択系を選択する(ステップ2
04)。そして、文字認識部104は、系選択部110
によって選択された文字認識系(1)106又は文字認
識系(2)108を使用して、その文字認識対象領域に
対する文字認識処理を実行する(ステップ205,20
6)。
【0020】このような処理が、レイアウト解析処理に
より抽出された領域について順次行われ、全ての領域に
対する処理が終わると(ステップ208,yes)、文
字認識処理結果及びレイアウト解析結果が出力される
(ステップ209)。この出力データは、例えば、文書
のデータベース化やその検索などに利用される。
【0021】《実施例1》 本発明の実施例1において
は、文字認識対象領域の属性が文字認識系の選択基準と
して利用される。すなわち、その領域が文字認識対象領
域であるときには、レイアウト解析部102は、文字認
識部104に対し、その文字認識対象領域の属性を通知
するとともに文字認識を指示する。文字認識部104に
おいては、系選択部110で文字認識対象領域の属性が
タイトルであるか調べ、タイトルならば高精度の文字認
識系(1)106を選択し、タイトルでなければ高速の
文字認識系(2)108を選択する。
【0022】図4に示した文書画像の場合、領域1は文
字認識対象領域であり、その属性が「タイトル」である
ので、高精度・低速の文字認識系(1)106が選択さ
れ、それを用いて文字認識処理が行われる。領域2の属
性は本文であるので、高速の文字認識系(2)108が
選択される。領域(3)は図の領域であるので、文字認
識の対象とならない。領域(4)は属性が「フッタ」で
あるので高速の文字認識系(2)が選択される。このよ
うに、検索のためのキーワードとなるような誤認識を回
避したいタイトル領域に対しては文字認識系(1)を用
いることにより、高精度の文字認識結果を得られる。こ
の高精度の文字認識では、低精度の文字認識に比べて1
文字当たりの処理時間は増加するが、一般にタイトル領
域の文字数は少ないので全体の処理時間に及ぼす影響は
小さい。そして、タイトル以外の領域は高速の文字認識
が行われるため、全体として高速の文字認識が可能であ
る。なお、例えば、タイトル領域のほかに、文字数の少
ないヘッダやフッタのような領域にたいしても、高精度
な文字認識系(1)を選択させるようにすることも可能
である。
【0023】《実施例2》 本発明の実施例2において
は、文字認識対象領域の文字数が、文字認識系の選択基
準として利用される。この文字数は、領域内の厳密な文
字の個数である必要はなく、例えば、領域内の黒画素の
連結成分の個数でよい。このような文字数の検出は、文
字認識処理の前に容易に算出可能である。文字認識部1
04の系選択部110は、レイアウト解析で検出された
領域内の文字数を選択基準として、文字認識対象領域に
対する文字認識処理に用いる文字認識系の選択を行う。
すなわち、文字認識対象領域の文字数が所定の閾値より
少ないか調べ、閾値より少ないならば高精度の文字認識
系(1)106を選択し、閾値以上ならば高速の文字認
識系(2)108を選択する。
【0024】ここで、各領域について図4に示すような
文字数が検出されたとして、文字数の閾値を例えば16
とした場合、各文字認識対象領域に対する文字認識系の
選択は次のようになる。領域1については、その文字数
が10であり、閾値の16よりも少ないので、文字認識
系(1)106が選択され、高精度の文字認識が行なわ
れる。領域1のような文字数の少ない領域は、キーワー
ドとして利用される可能性が高いが、このように高精度
の文字認識系を利用するため、誤認識を回避することが
できる。領域2と領域4については、その文字数が閾値
の16以上であるので、高速の文字認識系(2)108
が選択され、高速の文字認識が行なわれる。このように
文字数が多い領域は高速の文字認識が行われ、1文字あ
たりの処理時間が大きい高精度な文字認識は文字数が少
ない領域に対してのみ行われるため、全体として高速の
文字認識が可能である。
【0025】《実施例3》 本発明の実施例3において
は、文字認識対象領域の文字のサイズが文字認識系の選
択基準として利用される。この文字のサイズは、領域内
の厳密な文字のサイズである必要はなく、例えば、領域
内の黒画素連結成分の幅と高さの最大値を検出し、その
最大の幅と高さを持つ矩形の面積(画素数)を文字のサ
イズとすることができる。このような文字サイズの検出
は、文字認識処理の前に容易に算出可能である。文字認
識部104の系選択部110は、レイアウト解析で検出
された領域内の文字サイズを選択基準として、文字認識
対象領域に対する文字認識処理に用いる文字認識系の選
択を行う。すなわち、文字認識対象領域の文字サイズ
(画素数)が所定の閾値以上であるか調べ、閾値以上な
らば高精度の文字認識系(1)106を選択し、閾値未
満ならば高速の文字認識系(2)108を選択する。
【0026】ここで、各領域について図4に示すような
文字サイズ(画素数)が検出されたとして、文字サイズ
の閾値を例えば100とした場合、各文字認識対象領域
に対する文字認識系の選択は次のようになる。領域1に
ついては、その文字サイズが128画素であり、閾値の
100画素以上であるので、文字認識系(1)106が
選択され、高精度の文字認識が行なわれる。領域1のよ
うな文字サイズの大きな領域内の文字列は、一般にキー
ワードとして利用される可能性が高く誤認識を避ける必
要性が高いが、高精度の文字認識系を利用することによ
り誤認識を回避することができる。領域2と領域4につ
いては、その文字サイズが閾値の100画素未満である
ので、高速の文字認識系(2)108が選択され、高速
の文字認識が行なわれる。領域3は図領域であって文字
認識処理の対象とならない。このように文字サイズの小
さな領域は高速の文字認識が行われ、1文字あたりの処
理時間が大きい高精度な文字認識は文字サイズが大きな
領域に対してのみ行われるため、全体として高速の文字
認識が可能である。
【0027】なお、文字サイズに関する閾値を、文書毎
に適応的に決定してもよい。例えば、文書画像上の文字
のサイズのヒストグラムを作成し、このヒストグラムに
基づいて、適当な文字数に対して高精度な文字認識処理
が行われるように、文字サイズに関する閾値を決定して
もよい。
【0028】《実施例4》 本発明の実施例4において
は、文字認識対象領域の文字の色が、文字認識系の選択
基準として利用される。一般的に、文字に特異な色の付
けられている領域には、検索のためのキーワードとして
利用されるような文字列が記載されている可能性が高
く、その誤認識をできる限り回避したい。文字認識部1
04の系選択部110は、レイアウト解析で検出された
領域内の文字色を選択基準として、文字認識対象領域に
対する文字認識処理に用いる文字認識系の選択を行う。
すなわち、文字認識対象領域の文字色が、特異な文字色
であるか調べ、特異な文字色ならば高精度の文字認識系
(1)106を選択し、特定な文字色でないならば高速
の文字認識系(2)108を選択する。
【0029】ここで、各領域について図4に示すような
文字色が検出されたとして、特異でない文字色を黒とし
た場合、各文字認識対象領域に対する文字認識系の選択
は次のようになる。領域1と領域4については、その文
字色が青又は緑であり、これは特異な文字色であるの
で、文字認識系(1)106が選択され、高精度の文字
認識が行なわれる。特異な文字色が用いられた領域内の
文字列は、キーワードとして利用される可能性が高い
が、このように高精度の文字認識系を利用するため、誤
認識を回避することができる。領域2については、その
文字色が黒で特異な文字色ではないため、高速の文字認
識系(2)108が選択され、高速の文字認識が行なわ
れる。領域3は図領域であって文字認識処理の対象とな
らない。このように、1文字あたりの処理時間が大きい
高精度な文字認識は特異な文字色が用いられた領域に対
してのみ行われ、特異でない文字色が用いられた領域に
対しては高速な文字認識が行われるため、全体として高
速の文字認識が可能である。
【0030】なお、ここでは、黒以外の色を特異な文字
色としたが、特異な文字色(あるいは、特異でない文字
色)を文書毎に適応的に決定してもよい。例えば、文書
画像上の文字色の分布データを収集し、この分布データ
に基づいて、文字数の少ない1色又は複数色を特異な文
字色として(あるいは、それ以外の文字色を特異でない
文字色として)選び、その特異な文字色が用いられた領
域に対して高精度な文字認識処理を行ってもよい。
【0031】《実施例5》 本発明の実施例5において
は、文字認識対象領域の属性、文字数、文字サイズ及び
文字色の情報から、文字認識対象領域の重要度を総合的
に評価し、その重要度を文字認識系の選択基準として用
いる。すなわち、文字認識部104の系選択部110
は、レイアウト解析部102から与えられた文字認識対
象領域の属性、文字数、文字サイズ及び文字色から総合
的に、その領域の重要度を評価し、重要度が高い場合に
は高精度の文字認識系(1)106を選択し、そうでな
い場合には高速の文字認識系(2)108を選択する。
重要度の評価は、例えば、 (1)属性がタイトルならば50点、タイトルでなけれ
ば0点 (2)文字数が20以上ならば0点、20未満ならば2
0点 (3)文字サイズが18級以上ならば15点、18級未
満ならば0点 (4)文字色が黒ならば0点、黒以外ならば20点 というように各項目のスコアを求め、4項目のスコアの
合計を重要度と評価することができる。そして、その重
要度(スコア合計)が例えば35点以上ならば重要度が
高いと判断する。文字数や文字サイズに関しては、計算
式を用いてスコアを求めることも可能である。例えば文
字サイズに関しては、その級数をNとした場合に、その
スコアをNとするような方法を用いてもよい。
【0032】なお、文字認識対象領域の属性、文字数、
文字サイズ、文字色などから選択した2つ以上の項目の
情報を用い、同様の方法で領域の重要度を総合的に評価
して文字認識系を選択することも可能である。
【0033】
【発明の効果】請求項1記載の発明によれば、誤認識を
回避したい領域には認識精度を優先した文字認識系を利
用し、ある程度の誤認識が許容されるような領域に対し
ては処理速度を優先した文字認識系を利用するというよ
うに、個々の文字認識対象領域毎に複数種類の文字認識
系を使い分けることによって、認識精度と処理速度を両
立させることが可能になる。請求項2乃至12の各項記
載の発明によれば、文字認識結果を検索用キーワード等
として利用される可能性が高いタイトル等の特定の領域
や、拡大文字や特異な文字色が用いられたような領域に
対しては、認識精度を優先した文字認識系を利用して所
要の高い認識率を達成する一方で、それ以外の領域に対
しては処理速度を優先した文字認識系を利用することに
より、全体として高速処理を実現することが可能にな
る。請求項14記載の発明によれば、上に述べたような
文字認識精度と処理速度の両面で優れた文書画像処理を
一般的なコンピュータを利用して容易に実施できる。請
求項13記載の発明によれば、各ユーザーが、その扱う
文書の種類に応じた最適な辞書を利用できるようになる
とともに、認識処理の性能向上等はサーバー側での変更
のみによって対処し、その性能向上等の恩恵を複数のユ
ーザーが一斉に享受できる、等々の効果を得られる。
【図面の簡単な説明】
【図1】本発明による文書画像処理装置のブロック構成
例を示すブロック図である。
【図2】クライアント/サーバー・システム上に構築し
た本発明による文書画像処理装置のブロック構成例を示
すブロック図である。
【図3】文字認識系の処理速度と認識率の関係を説明す
る図である。
【図4】文書画像とそのレイアウト解析結果の一例を示
す図である。
【図5】本発明による文書画像処理装置の処理フロー例
を示すフローチャートである。
【符号の説明】
100 画像入力部 102 レイアウト解析部 104 文字認識部 106 文字認識系(1) 108 文字認識系(2) 110 系選択部 112 文字認識用辞書 114 言語辞書 116 サーバー 118 クライアント 120 ネットワーク

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 文書画像上の文字認識対象領域に対して
    文字認識処理を行う文書画像処理方法において、複数種
    類の文字認識系を用意し、個々の文字認識対象領域毎
    に、それに対する文字認識処理に用いる文字認識系を前
    記複数の文字認識系の中から選択することを特徴とする
    文書画像処理方法。
  2. 【請求項2】 文字認識対象領域に関するタイトル、ヘ
    ッダ、本文等の属性を文字認識系の選択基準として用い
    ることを特徴とする請求項1記載の文書画像処理方法。
  3. 【請求項3】 文字認識対象領域の文字数を文字認識系
    の選択基準として用いることを特徴とする請求項1記載
    の文字画像処理方法。
  4. 【請求項4】 文字認識対象領域の文字の大きさを文字
    認識系の選択基準として用いることを特徴とする請求項
    1記載の文字画像処理方法。
  5. 【請求項5】 文字認識対象領域の文字色を文字認識系
    の選択基準として用いることを特徴とする請求項1記載
    の文字画像処理方法。
  6. 【請求項6】 文字認識対象領域の属性、文字数、文字
    の大きさ、文字色などの2項目以上の情報から文字認識
    対象領域の重要度を総合的に評価し、評価した重要度を
    文字認識系の選択基準として用いることを特徴とする請
    求項1記載の文字画像処理方法。
  7. 【請求項7】 文書画像を入力するための第1手段と、
    この第1手段により入力された文書画像上の各文字認識
    対象領域に関し、文字認識系の選択基準となる情報を取
    得するための第2手段と、前記各文字認識対象領域に対
    する文字認識処理を行うための、複数種類の文字認識系
    を含む第3手段と、この第3手段による文字認識処理の
    ために参照される辞書と、前記各文字認識対象領域毎
    に、前記第2手段で取得された情報に基づいて前記複数
    種類の文字認識系の中から1つの文字認識系を選択する
    第4手段とを具備し、前記第3手段は各文字認識対象領
    域に対し、前記第4手段により選択された文字認識系を
    用いて文字認識処理を行うことを特徴とする文書画像処
    理装置。
  8. 【請求項8】 前記第2手段は、各文字認識対象領域に
    関し、タイトル、ヘッダ、本文等の属性を文字認識系の
    選択基準となる情報として取得することを特徴とする請
    求項7記載の文書画像処理装置。
  9. 【請求項9】 前記第2手段は、各文字認識対象領域に
    関し、領域内の文字数を文字認識系の選択基準となる情
    報として取得することを特徴とする請求項7記載の文書
    画像処理装置。
  10. 【請求項10】 前記第2手段は、各文字認識対象領域
    に関し、領域内の文字の大きさを文字認識系の選択基準
    となる情報として取得することを特徴とする請求項7記
    載の文書画像処理装置。
  11. 【請求項11】 前記第2手段は、各文字認識対象領域
    に関し、領域内の文字色を文字認識系の選択基準となる
    情報として取得することを特徴とする請求項7記載の文
    書画像処理装置。
  12. 【請求項12】 前記第2手段は、各文字認識対象領域
    に関し、タイトル、ヘッダ、本文等の属性、領域内の文
    字数、領域内の文字の大きさ、領域内の文字色などの2
    項目以上の情報を取得し、前記第4手段は、前記第2手
    段により取得された2項目以上の情報から文字認識対象
    領域の重要度を総合的に評価し、評価した重要度に基づ
    いて前記複数種類の文字認識系から1つの文字認識系を
    選択することを特徴とする請求項7記載の文書画像処理
    装置。
  13. 【請求項13】 クライアント/サーバー・システムの
    サーバー側に前記第2手段、第3手段及び第4手段を設
    け、クライアント側にユーザ別の前記辞書を設けてなる
    ことを特徴とする請求項7乃至12のいずれか1項記載
    の文書画像処理装置。
  14. 【請求項14】 文書画像上の各文字認識対象領域に関
    し、文字認識系の選択基準となる1項目以上の情報を取
    得する第1ステップと、文字認識対象領域毎に、前記第
    1ステップにより取得された情報に基づいて複数種類の
    文字認識系の中から1つの文字認識系を選択する第2ス
    テップと、各文字認識対象領域に対し、前記第2ステッ
    プにより選択された文字認識系を用いて文字認識処理を
    行う第3ステップとを含む文書画像処理をコンピュータ
    に実行させるためのプログラムが記録されたことを特徴
    とするコンピュータ読み取り可能記録媒体。
JP21531499A 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体 Expired - Fee Related JP4055976B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21531499A JP4055976B2 (ja) 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21531499A JP4055976B2 (ja) 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001043316A true JP2001043316A (ja) 2001-02-16
JP4055976B2 JP4055976B2 (ja) 2008-03-05

Family

ID=16670272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21531499A Expired - Fee Related JP4055976B2 (ja) 1999-07-29 1999-07-29 文書画像処理方法、文書画像処理装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP4055976B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065994A (ja) * 2005-08-31 2007-03-15 Ricoh Co Ltd 文書ocr実行装置
JP2010033605A (ja) * 2009-11-10 2010-02-12 Ricoh Co Ltd 情報処理装置及び情報処理プログラム
JP2013041535A (ja) * 2011-08-19 2013-02-28 Fuji Xerox Co Ltd 情報処理装置およびプログラム
US9766840B2 (en) 2015-06-29 2017-09-19 Fuji Xerox Co., Ltd. Non-transitory computer readable medium, information processing apparatus, and information processing method setting character recognition accuracy
JP2019168855A (ja) * 2018-03-22 2019-10-03 富士ゼロックス株式会社 情報処理装置及びプログラム
WO2020194576A1 (ja) * 2019-03-27 2020-10-01 三菱電機ビルテクノサービス株式会社 設備機器情報収集システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065994A (ja) * 2005-08-31 2007-03-15 Ricoh Co Ltd 文書ocr実行装置
JP2010033605A (ja) * 2009-11-10 2010-02-12 Ricoh Co Ltd 情報処理装置及び情報処理プログラム
JP2013041535A (ja) * 2011-08-19 2013-02-28 Fuji Xerox Co Ltd 情報処理装置およびプログラム
US9766840B2 (en) 2015-06-29 2017-09-19 Fuji Xerox Co., Ltd. Non-transitory computer readable medium, information processing apparatus, and information processing method setting character recognition accuracy
JP2019168855A (ja) * 2018-03-22 2019-10-03 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7095346B2 (ja) 2018-03-22 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
WO2020194576A1 (ja) * 2019-03-27 2020-10-01 三菱電機ビルテクノサービス株式会社 設備機器情報収集システム

Also Published As

Publication number Publication date
JP4055976B2 (ja) 2008-03-05

Similar Documents

Publication Publication Date Title
JP4443443B2 (ja) 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法
JPH11161681A (ja) 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体
US20110078176A1 (en) Image search apparatus and method
JP2004348591A (ja) 文書検索方法及び装置
JPH1125113A (ja) 画像検索装置,画像検索用キーテキストの生成方法,並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11238098A (ja) 文字列抽出装置及びパターン抽出装置
KR101549792B1 (ko) 문서 자동 작성 장치 및 방법
JP2006155588A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
KR20220008224A (ko) 레이아웃 분석 방법, 판독 보조 장치, 회로, 및 매체
KR20210050139A (ko) 이미지의 유사도 계산 장치 및 방법
JP2004341940A (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
JP2006318219A (ja) 類似スライド検索プログラム及び検索方法
JP4055976B2 (ja) 文書画像処理方法、文書画像処理装置及び記録媒体
JP2005107931A (ja) 画像検索装置
JP2000163576A (ja) 画像検索方法及びその実施装置並びにその処理プログラムを記録した媒体
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JPH08263522A (ja) 画像検索方法
JP4952079B2 (ja) 画像処理装置、方法及びプログラム
JP5046241B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2002298083A (ja) 文字色抽出装置、文字色抽出方法、文字色抽出用のコンピュータプログラムを格納する記憶媒体及び文字色抽出用のコンピュータプログラム
JP6121030B1 (ja) 画像検索装置、画像検索方法、画像検索プログラム、索引データ生成装置、索引データ生成方法および索引データ生成プログラム
JPH06168129A (ja) 知識抽出装置
JP2000259847A (ja) 情報検索方法、装置および記録媒体
US20240037449A1 (en) Teaching device, teaching method, and computer program product
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees