JP2001056840A - 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 - Google Patents

文字認識方法、文字認識装置、文書画像処理システム及び記録媒体

Info

Publication number
JP2001056840A
JP2001056840A JP11232265A JP23226599A JP2001056840A JP 2001056840 A JP2001056840 A JP 2001056840A JP 11232265 A JP11232265 A JP 11232265A JP 23226599 A JP23226599 A JP 23226599A JP 2001056840 A JP2001056840 A JP 2001056840A
Authority
JP
Japan
Prior art keywords
character
image
recognition
recognized
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11232265A
Other languages
English (en)
Other versions
JP3985926B2 (ja
Inventor
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP23226599A priority Critical patent/JP3985926B2/ja
Publication of JP2001056840A publication Critical patent/JP2001056840A/ja
Application granted granted Critical
Publication of JP3985926B2 publication Critical patent/JP3985926B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 キャッシュ処理を利用する、独立性の高い高
速高精度の文字認識モジュールを実現する。 【解決手段】 文字認識モジュール102のキャッシュ
処理部108は、基本的には、キャッシュのための記憶
容量を減らすため、文字画像の文字座標と認識結果をキ
ャッシュ記憶部112に保存するが、一部の文字画像に
ついては文字画像そのものも保存する。1つの認識対象
領域を指定されて文字認識モジュール102が起動され
た場合、文字認識処理に先立って、文書同一性判定部1
03において、キャッシュ記憶部112に保存されてい
る文字画像と同一の画像が、文書画像記憶部114内の
文書画像の同じ位置に存在しないときには文書画像が同
一でないと判断してキャッシュ記憶部112の内容を破
棄する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像処理の分
野に係り、特に、文字認識処理に関する。
【0002】
【従来の技術】文字認識系においては、一般に、高い認
識率を得ようとすると非常に複雑な特徴抽出やマッチン
グ処理を用いるため、処理に時間がかかるという問題が
ある。この処理時間の問題を解決する1つの手法とし
て、特開平7−72906号公報に述べられているよう
なキャッシュ処理を行う方法がある。同公報には、2つ
の方法が開示されている。その1つは、認識処理を終わ
った文字画像そのものを認識結果とともに保存してお
き、認識しようとする文字画像を保存されている認識済
みの文字画像と比較し、同一とみなせる認識済み文字画
像が見つかったときには、その認識済み文字画像に対応
して保存されている認識結果を、そのまま認識結果とし
て用いる方法である。もう1つは、認識処理を終わった
文字画像の簡易特徴量を認識結果とともに保存してお
き、認識しようとする文字画像の簡易特徴量と保存され
ている簡易特徴量とを比較し、同一とみなせる簡易特徴
量が見つかったときには、その簡易特徴量に対応して保
存されている認識結果を、そのまま認識結果として用い
る方法である。
【0003】
【発明が解決しようとする課題】同じ文字画像が再度出
現しないとキャッシュ処理の効果はないため、キャッシ
ュ処理の効果を期待するためには、ある程度の文字数を
キャッシュ処理の対象にする必要がある。しかし、文字
画像そのものはデータ量が一般にかなり大きく、例え
ば、48×43画素の文字画像では、1画素を1ビット
で表現すると258バイトものデータ量となる。したが
って、前述の文字画像そのものを保存する方法には、キ
ャッシュ処理に必要な記憶容量がかなり大きくなるとい
う問題がある。文字認識処理の場合、パターン辞書や言
語辞書のように記憶量量を多く必要とするデータもある
ため、キャッシュ処理に必要な記憶容量はできるだけ少
ないことが好ましい。このような文字画像そのものを保
存する方法に比べれば、前述の簡易特徴量を保存する方
法はキャッシュ処理のための記憶容量をかなり減らすこ
とが可能である。しかし、簡易特徴量は文字画像の特徴
の一部を表現したものにすぎず、異なった文字画像の間
で簡易特徴量が一致してしまう可能性が大きいため、文
字画像そのものを保存する方法に比べ信頼性が低いとい
う問題がある。
【0004】よって、本発明の1つの目的は、以上に述
べた従来のキャッシュ処理に関わる2つの問題点を解決
することにある。
【0005】また、一般的に、各種装置又はシステムを
開発する場合、各処理をモジュール化することが開発効
率の観点から好ましい。文書画像処理においても同様
で、技術的な成熟度が増し処理内容が複雑になるにつ
れ、文書画像処理に用いられる各処理のモジュール化は
必須の課題となりつつある。
【0006】文書画像処理において文字認識処理がモジ
ュール化された場合、その文字認識モジュール(ハード
ウェア・モジュール又はプログラム・モジュール)の処
理単位は、1つの文書画像の全体ではなく、その部分で
ある可能性が高い。例えば、レイアウト解析等の処理に
よって、文書画像から個々の記事、カラムといった認識
対象領域が抽出され、それぞれの領域毎に、その座標を
指定して文字認識モジュールが呼び出される可能性が高
い。
【0007】この場合、個々の認識対象領域に含まれる
文字数は、一般に1つの文書画像の全体に含まれる文字
数よりかなり少ないため、個々の認識対象領域をキャッ
シュ処理の単位とした場合、キャッシュ処理の対象とな
る文字数が不足し、キャッシュ処理の効果を十分に期待
できない心配がある。したがって、文字認識処理がモジ
ュール化された場合も、個々の認識対象領域ではなく1
つの文書画像の全体を対象としたキャッシュ処理が行わ
れるのが望ましい。
【0008】よって、本発明のもう1つの目的は、文字
認識処理がモジュール化された場合のように、認識対象
領域毎に文字認識処理を行う環境で、キャッシュ処理の
ために必要な記憶容量の増加を回避しつつ、文書画像単
位でのキャッシュ処理を可能にすることにある。本発明
の他の目的は、独立性の高い高速・高精度の文字認識モ
ジュールを提供することにある。
【0009】
【課題を解決するための手段】本発明の1つの主要な特
徴は、キャッシュ処理において、文字画像そのものでは
なく、文書画像上での文字画像の座標(文字座標)をキ
ャッシュ記憶手段に保存しておき、文書画像記憶手段に
記憶されている文字画像上の、キャッシュ記憶手段に保
存されている文字座標の位置にある画像と、文字認識し
ようとする文字画像とを比較することにより、認識しよ
うとする文字画像と同一とみなされる認識済み文字画像
を見つけることである。
【0010】文字座標として、文字画像の外接矩形の対
向した2コーナーの座標を用いるものとして、各コーナ
ーのx座標、y座標をそれぞれ2バイト、計4バイトで
表現したとしても、1文字分のキャッシュに必要な記憶
容量は8バイトで済む。48×43画素の大きさの文字
画像そのものをキャッシュする場合、1画素を1ビット
で表現したとしても258バイトが必要である。したが
って、文字座標をキャッシュ記憶手段に保存する方法
は、キャッシュ処理に必要な記憶容量を大幅に削減でき
る。しかも、比較は文字画像間で行うので、文字画像の
簡易特徴量を用いる方法のような信頼性低下の問題はな
いため、文字画像そのものをキャッシュする方法と同様
に高精度の文字認識処理が可能である。
【0011】このような文字座標をキャッシュする手法
では、現在のキャッシュデータが得られた際に処理され
た文書画像と、これから認識しようとする文字画像が含
まれている文書画像とが同一であることが当然の前提と
なる。1つの文書画像を処理の単位とする環境では、新
しい文書画像に対する処理の開始段階で、それまでのキ
ャッシュデータをクリアすることで、その条件を容易に
満たすことができ、また、キャッシュ処理の対象文字数
も十分に多くなるため、キャッシュ処理の十分な効果を
期待できる。
【0012】一方、文字認識処理をモジュール化し、文
書画像の個々の認識対象領域毎に文字認識モジュールを
起動するような環境では、文字認識処理の単位は1つの
文書画像の全体ではなく個々の認識対象領域である。し
かして、本発明のもう1つの主要な特徴は、そのような
文書画像の個々の認識対象領域を処理の単位とするよう
な環境においても、1つの文書画像を単位としたキャッ
シュ処理を可能にするため、文書画像記憶手段に記憶さ
れている文書画像の個々の認識対象領域に対する認識処
理に先立ち、認識対象領域が含まれている現在の文書画
像(文書画像記憶手段に記憶されている文書画像)が、
キャッシュ記憶手段の記憶内容が得られた際に処理され
た文書画像と同一であるか判定し、同一でないと判定し
たときにはキャッシュ記憶手段を初期化することであ
る。
【0013】好ましい態様によれば、一部の文字画像に
ついて、文字画像そのものも文字座標とともにキャッシ
ュ記憶手段に保存しておき、文書画像記憶手段に記憶さ
れている文書画像において、キャッシュ記憶手段に保存
された文字画像と同じ画像が、その文字画像の文字座標
の位置に存在するときに文書画像が同一であると判定
し、そうでないときに文書画像が同一でないと判定す
る。全くランダムに白画素と黒画素が配置された100
画素の画像が、異なった2つの文書画像上の同じ位置に
偶然現れる確率は2の100乗分の1であるから、保存
されている文字画像と同一とみなされる画像が同じ位置
にあるときには同一の文書画像であると判断して実用上
支障はない。ただし、文書画像においては、異なる文書
画像の同じ位置に同じ形状の文字画像が存在する可能性
はそれより高くなる傾向があるので、文書画像の同一性
の判定に利用するためにキャッシュ記憶手段に保存する
文字画像を選ぶ何らかの基準を用意するのが一般に好ま
しい。
【0014】このような文書画像の同一性判定方法は、
文字認識モジュールを呼び出す制御モジュール側から文
書画像の同一性を示す何らかの情報を文字認識モジュー
ルに与える方法に比べ、文字認識モジュールの独立性確
保の観点から有利である。また、後者の方法では誤った
情報が与えられた場合に認識精度が大幅に悪化する危険
があるが、それも回避できる。
【0015】以上に述べた本発明の特徴と、その他の特
徴について、以下の説明において詳細に説明する。
【0016】
【発明の実施の形態】以下、添付図面を参照し、本発明
の実施の形態を説明する。なお、説明の繰り返しを避け
るため、添付図面中の複数の図面において同一部分又は
対応部分には同一の参照符号又は同様の参照符号を用い
る。
【0017】図1に、本発明の一実施形態である文書画
像処理システムのブロック構成の一例を示す。ここに示
す文書画像処理システムは、文書画像処理のための前処
理、レイアウト解析、文字認識処理の各処理がモジュー
ル化されたもので、それぞれの処理モジュールとして前
処理モジュール100、レイアウト解析モジュール10
1、文字認識モジュール102を備え、また、それら各
モジュールの実行を制御するための制御モジュール11
6を備える。また、文字認識モジュール102によって
利用される文字認識用辞書110、言語辞書111及び
キャッシュ記憶部112、処理すべき文書画像を入力す
る画像入力部113、入力された文書画像を記憶するた
めの文書画像記憶部114を備えている。
【0018】画像入力部113は、イメージスキャナ等
の画像入力機器を利用して文書原稿をスキャンしその画
像を入力したり、記録媒体に予め記憶されている文書画
像を取り込んだり、あねいは、通信回線を介して外部よ
り文書画像を取り込んだりする部分である。
【0019】文字認識用辞書110は文字画像の特徴量
を用いた1文字単位の文字認識のためのパターン辞書で
ある。言語辞書111は1文字単位の文字認識処理の結
果に対する後処理のために利用される単語等の言語知識
を格納した辞書である。
【0020】文書画像記憶部114に新しい文書画像が
格納されると、制御モジュール116によって前処理モ
ジュール100が起動される。この前処理モジュール1
00は、起動されると、文書画像記憶部114に記憶さ
れている文書画像に対し、ノイズ除去や傾き補正などの
前処理を施す部分である。このモジュールは、場合によ
っては省略し得る。
【0021】この前処理が終了すると、制御モジュール
116によって、レイアウト解析モジュール101が起
動される。このレイアウト制御モジュール101は、前
処理後の文書画像を認識対象領域(文字の領域)と、そ
れ以外の図又は表の領域とに分類する。このような領域
分割については、文書画像中の連結成分を囲む最小矩形
を求め、大きな矩形の領域を図や表の領域とし、残りの
小さな矩形の集まった領域を認識対象領域とする等、様
々な手法が知られている。本発明においても、そのよう
な公知の手法を利用し得る。
【0022】文字認識処理に関連しては、認識対象領域
を抽出するのみで十分であるが、認識結果を文書の構造
と関連付けるような処理まで考慮する場合には、認識対
象領域について、そのレイアウト構造上の属性であるヘ
ッダ、フッタ、タイトル、本文等の識別等も行う。この
ようなレイアウト解析に関しては、特開平5−2580
98号公報、特開平8−87528号公報、特開平10
−177641号公報、特開平10−198705号公
報等に見られるように数多くの手法が提案されている。
本発明においても、そのような公知の手法を利用し得
る。例えば、扱う文書のレイアウトが固定している場合
には、予め用意されたフォーマット情報中に指定されて
いる座標値から、ヘッダ、タイトル、本文、フッタなど
の領域とその属性を識別するような、よく知られた手法
を利用し得る。フォーマットの異なる複数種類の文書を
扱う場合には、例えば前記特開平10−198705号
公報に述べられているように、文字サイズなどに基づい
て文書の種類を特定したうえで、その種類の文書に対応
したフォーマット情報を利用して文書画像上の領域と属
性の識別を行うような手法を利用してよい。
【0023】文書画像の例と、そのレイアウト解析結果
の例を、図2及び図3に模式化して示す。
【0024】レイアウト解析モジュール101によるレ
イアウト解析が終了した後、あるいはレイアウト解析処
理の途中から、制御モジュール116は、抽出された1
つの認識対象領域の座標を指定して文字認識モジュール
102を起動する。起動された文字認識モジュール10
2は、指定された認識対象領域に対する文字認識処理を
行うが、その処理内容については後述する。
【0025】文字認識モジュール102は、機能的に分
割すると、文書画像記憶部114に記憶されている文書
画像と、キャッシュ記憶部112に保存されている現在
のキャッシュデータが得れらた時に処理された文書画像
との同一性を認識対象領域毎に判定する文書同一性判定
部103、文字画像の切り出しを行う文字切り出し部1
04、切り出された認識対象の文字画像とキャッシュさ
れた文字画像との比較を行い、認識対象の文字画像と同
一とみなされる認識済み文字画像を見つける文字画像比
較部105、認識対象の文字画像の特徴量を抽出し、そ
の特徴量と文字認識用辞書110に格納されている特徴
量とのマッチングを行って1文字単位の文字認識を行う
文字認識部106、文字認識部106による認識結果に
対する後処理を行う後処理部107、キャッシュ処理を
行うためのキャッシュ処理部108、及び、それら各部
の動作の制御及び文字認識結果の確信度の計算等を行う
制御部109から構成されている。
【0026】キャッシュ記憶部112はキャッシュデー
タの保存のための記憶部であり、キャッシュ処理部10
8によって、文字画像の文字座標と認識結果(一部の文
字画像について、文字画像そのものも)が対応付けられ
て書き込まれる。文書同一性判定部103で文書画像が
同一でないと判定された時にキャッシュ記憶部112は
制御部109により初期化されるが、文書画像が同一と
判定される間はキャッシュ記憶部112の記憶内容は保
存される。
【0027】図4に文字認識ジュール102の処理フロ
ーの一例を示す。以下、この処理フローに沿って文字認
識モジュールにおける処理内容を説明する。
【0028】文字認識モジュール102は、制御ジュー
ル116によって1つの認識対象領域の座標を指定され
て起動されると、まず、指定された座標を用いて文書画
像記憶部114より1つの認識対象領域の画像を取り込
む(ステップ200)。なお、画像を取り込まず、文書
画像記憶部114上の指定された認識対象領域の画像を
そのまま処理に用いることも可能であるが、その場合、
処理途中に文書画像記憶部114の書き換えを禁止する
等の制御を行わないと処理エラーが起きる危険がある。
【0029】次に、文書同一性判定部103において、
キャッシュ記憶部112に保存されている現在のキャッ
シュデータが得られた時に処理された文書画像と、目下
処理しようしている認識対象領域が含まれている文書画
像、すなわち文書画像記憶部114に現在記憶されてい
る文書画像とが同一であるか否かを判定する(ステップ
201)。好ましい態様では、この文書画像の同一性判
定は次のようにして行われる。まず、キャッシュ記憶部
112に文字画像(認識済みの文字画像)が記憶されて
いるか調べ、文字画像が記憶されているならば、その文
字画像と、それに対応して記憶されている文字座標をキ
ャッシュ記憶部112より取り込む。次に、文書画像記
憶部114に記憶されている文書画像上の、その文字座
標の位置にある画像を取り込む。そして、文書画像から
取り込んだ画像と、キャッシュ記憶部112より取り込
んだ文字画像とを比較し、それらが同一の画像とみなせ
るならば同一の文書画像であると判定し、そうでなけれ
ば同一の文書画像ではないと判定する。比較ができない
場合、つまりキャッシュ記憶部112に文字画像がまっ
たく記憶されていない場合には、安全のため同一でない
と判定する。
【0030】なお、キャッシュ記憶部112に2つ以上
の文字画像が保存されている場合、その2つ又はそれ以
上の文字画像に関する画像比較がすべて一致したとき
に、文書画像を同一と判定すれば、より高い判定精度を
期待できる。ただし、1つの文字画像に関してのみ画像
比較を行い、その一致をもって文書画像が同一であると
判定しても、相当に高精度の判定が可能であることは前
述の通りである。
【0031】なお、制御モジュール116側で、文書画
像の入れ替わりを管理し、文字認識モジュール102を
呼び出す際に、それ以前に処理された文書画像と同一で
あるか否かの情報を文字認識モジュール102に与え、
この情報に基づいて文書同一性判定部103が文書画像
の同一性を判断する方法も可能である。しかし、このよ
うな方法は、制御モジュール116における制御が複雑
になるとともに、誤った情報が文字認識モジュール10
2に与えられた場合に認識精度が大きく悪化する危険が
ある。文字画像の比較によって文書画像の同一性を判定
する方法は、そのような問題を解決できるとともに、文
字認識モジュール102の独立性確保の観点からも有利
である。
【0032】文書画像の同一性判定のための画像比較に
はどのような手法を利用しても構わないが、例えば米国
特許第5,303,313号に示されているような、2
つの画像間で、エッジのずれや黒画素数の差等の複数項
目のテストを行い、1つの項目のテストで合格すると1
票を投じるという投票操作を実行し、得票数が所定値を
越えた場合に、それら2つの画像を同一と判断する手法
を利用可能である。後述する文字画像比較部105にお
ける文字画像の比較においても、同様の手法を利用して
よい。
【0033】さて、文書同一性判定部103で文書画像
が同一でないと判定されたときには(ステップ202,
No)、制御部109によりキャッシュ記憶部112が
初期化される(ステップ203)。すなわち、異なった
文書画像の処理には現在のキャッシュデータは利用でき
ないため、それが破棄される。
【0034】次に、文字切り出し部104において、モ
ジュール内に取り込まれた認識対象領域の画像から文字
画像(文字画像の候補)を1文字単位で切り出す(ステ
ップ204)。この文字切り出しについては様々な手法
が知られており、そのどのような手法を利用してもよ
い。例えば、行方向の射影等を利用して行の切り出しを
行い、切り出した各行の垂直な方向の射影等を利用して
行内の文字を切り出すような方法や、黒画素の連結成分
を抽出し、1文字とみなし得る単独の連結成分、あるい
は複数の連結成分の塊を文字画像として切り出すような
方法を利用し得る。ここで切り出された文字画像(候
補)が認識対象の文字画像となる。以下の処理は1文字
ずつの繰り返し処理である。
【0035】まず、文字画像比較部105において、キ
ャッシュ記憶部112に記憶されている認識済み文字画
像の文字座標を読み出し、この文字座標の位置にある画
像を文書画像記憶部114より取り込み、その画像を認
識対象の文字画像と比較することにより、認識対象の文
字画像と同一とみなされる認識済み文字画像を見つける
(ステップ205)。認識対象の文字画像と同一とみな
される認識済み文字画像がみつかったならば(ステップ
206,Yes)、制御部109により、その認識済み
文字画像の文字座標と対応付けられてキャッシュ記憶部
112に記憶されている認識結果(文字認識部106に
よる1文字単位の認識結果)が、そのまま認識対象の文
字画像に対する認識結果として取り出され(ステップ2
07)、後処理部107に与えられる。後処理部107
では、与えられた認識結果に対する後処理を行う(ステ
ップ208)。後処理には様々な手法が知られており、
本発明にいても任意の公知の手法を利用できる。例え
ば、文字認識部106では文字画像の特徴量を抽出する
前に文字画像の正規化を行うのが一般的であるから、抽
出した特徴量だけでは区別が困難な類似文字が少なくな
い。このような類似文字を識別するために有効な後処理
の手法として、特開平6−176196号公報に開示さ
れているように、文字画像の行内における相対的な大き
さ(同公報に述べられている縦横比、面積比、上空白比
など)を利用して認識結果を修正する後処理法を利用で
きる。また、このような文字単位の後処理の後に、認識
結果の文字コードの組み合わせと言語辞書111に格納
されている単語とを照合し、もっともらしい文字コード
の組み合わせを上位の候補とするような後処理を利用で
きる。また、このような後処理の結果に基づいて、文字
切り出しの段階で切り出された前後の文字画像(候補)
のうちで、文字らしい画像だけを最終的に文字画像とし
て選択する、いわゆるパス選択処理を行ってもよい。こ
のような後処理を終わると、ステップ205に戻り次の
文字画像に対する処理が実行される。
【0036】文字画像比較部105で、認識対象の文字
画像と同一とみなされる認識済み文字画像がみつからな
かった場合(ステップ206,No)、文字認識部10
6で、その認識対象の文字画像の特徴量(例えば公知の
多層方向ヒストグラムによる特徴量)を抽出し、その特
徴量と文字認識用辞書110に格納されている特徴量と
のマッチングを行うことにより認識結果を得る(ステッ
プ209)。この認識結果に対し、前述のような後処理
が後処理部107で実行される(ステップ210)。次
に、この文字画像に対し、キャッシュ処理部108によ
るキャッシュ処理が行われる(ステップ211〜21
4)。
【0037】キャッシュ処理部108においては、ま
ず、制御部109で算出された、その文字画像に対する
認識結果の確からしさ(確信度)が高いか否かを判定し
(ステップ211)、確信度が低いときには、その文字
画像をキャッシュ処理の対象から除外する。なお、確信
度の求め方は種々提案されている。例えば、特開平7−
72906号公報に述べられているように、文字認識用
辞書110とのマッチングで得られた第1位候補の辞書
との距離の逆数や、第1位候補と第2位候補の辞書との
距離の比を確信度とする方法、特開平5−35917号
公報に述べられているように、文字認識用辞書110と
のマッチングで得られた第1位候補の辞書との距離を文
字画像の総輪郭数で除した値を確信度とする方法といっ
た比較的単純な方法を用いることができる。これらの確
信度は、文字認識用辞書122とのマッチング結果に対
する確信度であるが、例えば特開平5−182014号
公報に述べられているように、文字切り出し、文字認識
用辞書110とのマッチング、後処理の各段階で得られ
た情報を総合して確信度を計算する方法を用いることも
できる。
【0038】ステップ211で確信度が高いと判定され
た場合には、その文字画像そのものも保存すべきか否か
の判定を行う(ステップ212)。保存すべきでないと
判定した場合には、その文字画像の文字座標と認識結果
だけを対応付けてキャッシュ記憶部112に書き込み
(ステップ213)、保存すべきであると判定した場合
には、その文字画像そのものも、文字座標及び認識結果
と対応付けてキャッシュ記憶部112に書き込む(ステ
ップ214)。ステップ211で確信度が低いと判定し
た場合には直ちに、ステップ211で確信度が高いと判
定した場合はステップ213又はステップ214の実行
後にステップ205に戻り、次の文字画像に対する処理
が繰り返される。
【0039】以上の1文字単位の処理が繰り返され、認
識対象領域から切り出された全ての文字画像が処理済み
となると(ステップ215,Yes)、制御部109は
最終的な認識結果を外部の記録媒体やディスプレイ等へ
出力し(ステップ216)、1つの認識対象領域に対す
る文字認識処理を終了する。
【0040】ここで、ステップ212の判定基準につい
て説明する。この判定基準は、その文字画像が文書同一
性判定に用いるために相応しい文字画像であるか否かで
あり、具体的には次に述べるような基準を用いる得る。
【0041】(a)文字画像の複雑さが所定の程度を越
えること。あまりに単純な文字画像は、別の文書画像の
同じ位置の画像と比較した時に偶然一致する危険があ
る。したがって、キャッシュ記憶部112に保存する文
字画像は、ある程度以上の複雑さを持つ文字画像に限定
するとよい。文字画像の複雑さの尺度としては、輪郭長
や黒画素数などの図形の形状的な特徴から算出される値
や、書籍『画像認識の基礎[II] 第1版』(株式会社
オーム社)の第198頁から第199頁に述べられてい
るような、文字画像のエネルギー、エントロピー、相関
等の統計的な尺度を用いることができる。例えば、文字
画像の輪郭長を2乗した値を黒画素数で除した値Cを尺
度として用い、この値Cがある閾値(例えば2.5)を
越えた場合に、その文字画像も保存すべきと判定する。
なお、この閾値を固定した場合に、1つも文字画像が保
存されなかったり、逆に必要以上に多くの文字画像が保
存されてしまい、キャッシュデータ量が過大になるとい
った不都合が心配されるときには、図4のフローチャー
トには明示しないが、キャッシュ処理の対象となった文
字画像とキャッシュ記憶部112に保存されている文字
画像の間で複雑さを比較し、キャッシュ処理対象の文字
画像より単純な文字画像がキャッシュ記憶部112に保
存されているならば、その単純な文字画像を削除し、そ
れに代えてキャッシュ処理対象の文字画像をキャッシュ
記憶部112に書き込むことにより、複雑さの順に選ば
れた所定個数の文字画像がキャッシュ記憶部112に残
るようにしてもよい。
【0042】(b)文字画像の大きさが、ある範囲内で
あること。小さすぎる文字画像を文書同一性判定に用い
ると、異なる文書画像においても画像の比較で誤って一
致がとれる可能性が高くなる。逆に、大きすぎる文字画
像は、そのデータ量が大きくなるため保存するのは好ま
しくない。したがって、例えば文字画像の外接矩形の面
積が、ある下限閾値を越え、かつ、ある上限閾値より小
さい場合にのみ、その文字画像を保存するのがよい。な
お、文字画像の面積に加えて、文字画像の外接矩形の縦
横比も判断の基準として利用することも有効である。す
なわち、縦横比が極端に小さいか大きい文字画像は、線
分等との比較で一致する可能性があるが、縦横比を基準
に加えれば、そのような文字画像の保存を避けることが
できる。
【0043】(c)文字画像の色が特異であること。あ
る文書画像上の特異な色の文字画像は、別の文字画像の
同じ位置に存在する可能性は小さいため、文書同一性判
定に用いるのに適当である。最も簡単には、黒以外の色
の文字画像について、文字画像そのものを保存するよう
な方法を用いることができる。処理はすこし複雑になる
が、文字画像の色の分布をとり、出現頻度の低い特定の
色の文字画像を保存するような方法も可能である。
【0044】(d)認識結果が特定の文字コードである
こと。例えば、漢数字の一の文字画像は、漢数字の三の
ような他の文字画像の一部分であったり、罫線などの線
分と同一とみなされる可能性があるので、文書同一性判
定に利用するには適当でない。したがって、このような
他の文字や図形の一部となり得る文字コードや、形状の
似た文字が多い文字コードが認識結果となった文字画像
はキャッシュ記憶部112には保存しない、とする方法
を利用し得る。なお、文書同一性判定にどのような画像
比較手法を利用するかによって、文字画像を保存するの
が不適当な文字コードも異なる。
【0045】(e)出現頻度が低いこと。出現頻度が高
い文字画像は、異なる文書画像の同じ位置に偶然出現す
る可能性も高くなるため、文書同一性判定に用いる文字
画像としては適当でない。そこで、キャッシュ記憶部1
12に保存する文字画像を、出現頻度が低い文字画像だ
けに限定してもよい。なお、その具体例を図5に関連し
て後述する。
【0046】(f)文字画像の複雑さ、大きさ、色、認
識結果、出現頻度などの2項目以上の尺度の総合評価が
高いこと。例えば、文字画像が十分に複雑ならば何点、
そうでなければ0点、文字画像の大きさが所定の範囲内
ならば何点、範囲外ならば0点、文字画像の色が特異色
ならば何点、そうでなければ0点というように、尺度毎
のスコアを求め、評価する2項目以上の尺度のスコアの
合計を総合評価とし、総合評価が所定の値を越えた文字
画像のみを保存する方法である。
【0047】なお、文書画像の同一性判定のための文字
画像は1個ないし数個あれば十分であるから、キャッシ
ュ記憶部112に所定個数の文字画像が書き込まれた時
点で、それ以降のキャッシュ処理では文字画像そのもの
の書き込みを行わないようにすることも可能である。
【0048】次に、図2に示す文書画像の各認識対象領
域を順次処理し、続いて図3に示す文書画像の各認識対
象領域を処理する場合について説明する。
【0049】図2に示す文書画像の[領域1−1]の座
標を指定して文字認識モジュール102が起動される。
この領域は新たな文書画像上の認識対象領域であるか
ら、文書同一性判定部103は画像比較で一致がとれな
いので、文書画像が同一でないと判定する(ステップ2
01)。したがって、キャッシュ記憶部112は初期化
される(ステップ203)。続いて[領域1−1]内の
文字画像が切り出され、1文字ずつ処理されていく。こ
の認識対象領域には同じ文字画像が繰り返し出現しない
ので、領域内の文字画像の中で、認識結果の確信度が高
く、前述した文字画像保存の判定基準を満たす文字画像
については、文字画像と文字座標と認識結果がキャッシ
ュ記憶部112に保存され、認識結果は高いが判定基準
を満たさない文字画像については文字座標と認識結果が
キャッシュ記憶部112に保存される(ステップ20
6,ステップ209〜214)。
【0050】次に、[領域1−2]の座標を指定して文
字認識モジュール102が起動される。この場合は、
[領域1−1]の処理時にキャッシュ記憶部112に保
存された文字画像と同じ画像が文書画像の同じ位置に存
在するので、文書同一性判定部103で同一文書画像で
あると判定され、したがってキャッシュ記憶部112に
保存されているキャッシュデータは破棄されることはな
い。続いて、[領域1−2]内の文字画像が切り出さ
れ、1文字ずつ処理される。この処理において、それま
でに認識済みでキャッシュ記憶部112に文字座標と認
識結果が保存されている文字画像と同じ文字画像が認識
対象となった場合、文字画像比較部105で、その認識
済み文字画像が見つかり、その認識結果がキャッシュ記
憶部112から取り出され、認識対象の文字画像に対す
る認識結果として用いられ、文字認識部106による文
字認識はスキップされる。また、この認識対象の文字画
像はキャッシュ処理の対象外となる。
【0051】以下同様にして、図2に示す文書画像の
[領域1−3]、[領域1−4]、[領域1−5]、
[領域1−6]の文字認識処理が実行されるが、それら
の認識対象領域は同じ文書画像上の領域であるからキャ
ッシュ記憶部112内のキャッシュデータは破棄されな
い。
【0052】次に、図3に示す文書画像が入力されてレ
イアウト解析が行われ、その[領域2−2]の座標が指
定されて文字認識モジュール102が起動されたとす
る。前の文書画像の例えば[領域1−1]内の文字画像
がキャッシュ記憶部112に保存されているものとする
と、その文字画像の位置は、図3の文書画像の図領域で
ある[領域2−1]の内部にあたるため、文書同一性判
定部103での画像比較が一致しないことは明らかであ
り、文書画像が同一でないと判定される結果、キャッシ
ュ記憶部112が初期化され、それまでのキャッシュデ
ータは破棄される。次の[領域2−3]、[領域2−
4]では、同一の文書画像と判定されるため、キャッシ
ュ記憶部112の初期化は行われない。
【0053】文字認識モジュール102の処理フローの
別の一例を図5に示す。図5において、図4中のステッ
プと同じ番号のステップは同じ内容の処理ステップであ
るので説明を割愛する。図4に示した処理フローとの相
違点は、キャッシュ処理部108による処理(ステップ
300〜303)だけであるので、それについて以下に
説明する。
【0054】キャッシュ処理部108においては、認識
対象となった文字画像に対する認識結果の確信度が高い
場合(ステップ211,Yes)、その文字画像に関す
る文字画像比較(ステップ205)で同一とみなされる
認識済み文字画像が見つかったか否かを確認し(ステッ
プ300)、同一の認識済み文字画像が見つからなかっ
たときには、その認識対象となった文字画像そのもの、
その文字座標、及びその認識結果を対応付けてキャッシ
ュ記憶部112に書き込む(ステップ301)。同一と
みなされる認識済み文字画像が見つかったときには(ス
テップ300,Yes)、その認識済み文字画像そのも
のがキャッシュ記憶部112に保存されているか調べ
(ステップ302)、保存されているならば、その文字
画像をキャッシュ記憶部112から削除する(ステップ
303)。ただし、削除されるのは文字画像だけであ
り、その文字座標と認識結果はキャッシュ記憶部112
に残される。
【0055】このように、ここに示す処理フローの例で
は、キャッシュされた文字画像と一致しなかった文字画
像については、認識結果の確信度が低くない限り、一
旦、文字画像そのものもキャッシュ記憶部112に保存
し、その後に、その文字画像と同じ文字画像が認識対象
となったときには削除するわけである。すなわち、出現
回数が1回の文字画像のみを保存し、2回以上出現する
文字画像は保存しないということであり、これは前述の
出現頻度を基準として文字画像そのものを保存するか否
かを判断する方法の一例である。このように出現頻度が
低い文字画像をキャッシュ記憶部112に保存し、文書
同一性判定で利用すると、異なる文書画像において偶然
同じ位置に同じ文字画像が存在することによる誤判定の
可能性が低くなる利益があることは前述した通りであ
る。
【0056】以上に説明した本発明の文書画像システム
は、コンピュータ上でソフトウエアにより実現すること
もできる。すなわち、前処理モジュール100、レイア
ウト解析モジュール101、文字認識ジュール102、
制御モジュール116に対応するプログラム・モジュー
ル(便宜、同じ参照番号100,101,102,11
6で表す)、さらに文字認識用辞書110、言語辞書1
11がコンピュータのメモリにロードされる。文書画像
記憶部114、キャッシュ記憶部112としてはメモリ
の一部領域が用いられる。文書画像が入力されると、制
御モジュール116が前処理モジュール100を呼び出
し、前処理を実行させる。これが終わると、制御モジュ
ール116はレイアウト解析モジュール101を呼び出
し、レイアウト解析処理を実行させる。このレイアウト
解析処理が終了した後、あるいは、その処理中に、制御
モジュール116は、抽出された1つの認識対象領域の
座標を指定して文字認識モジュール102を呼び出し、
その認識対象領域に対する文字認識処理を実行させる。
1つの認識対象領域に対する処理の終了後、別の未処理
の認識対象領域がある場合には、その1つの認識対象領
域の座標を指定して文字認識モジュール102を再度呼
び出して、その認識対象領域に対する文字認識処理を実
行させる。このようにして、コンピュータ上で一連の文
書画像処理が遂行される。各プログラム・モジュール
は、例えば、それが記録されたフロッピーディスク、C
D−ROM、メモリカード等の記録媒体から読み込まれ
たり、通信回線を通じて取り込まれたりする。そのよう
なプログラム・モジュール、例えば図4又は図5にフロ
ーチャートとして示された文字認識処理のための各ステ
ップをコンピュータに実行させるためのプログラム・モ
ジュールが記録されたフロッピーディスク、CD−RO
M、半導体ROM、半導体RAM等の記録媒体も本発明
に包含される。
【0057】また、本発明による文書画像処理システム
は、ネットワークが介在するような形態もとり得る。そ
のような文書画像処理システムをサーバー/クライアン
ト・システム上に構築する例を図6によって説明する。
図6において、400はサーバー・コンピュータであ
り、このサーバー・コンピュータ400にネットワーク
(LAN又はWAN)402を介して複数のクライアン
ト・コンピュータ404が接続される。サーバー・コン
ピュータ400は、CPU410、メモリ411、補助
記憶装置412、ネットワーク通信制御部413等から
なる一般的な構成のコンピュータで構わない。また、各
クライアント・コンピュータ404も、CPU420、
メモリ421、補助記憶装置422、ネットワーク通信
制御部423等からなる一般的な構成のもので構わな
い。ただし、各クライアント・コンピュータ404は、
画像入力部113としてのメージ・スキャナ414など
も備えることになろう。サーバー・コンピュータ400
には、例えばその補助記憶装置412上に、文書画像処
理のための前処理モジュール100、レイアウト解析モ
ジュール101、文字認識ジュール102、及び制御モ
ジュール116が置かれる。
【0058】各クライアント・コンピュータ404に
は、そのユーザ専用の文字認識用辞書110と言語辞書
111が、例えばその補助記憶装置422上に置かれ
る。文書画像処理に必要な文書画像記憶部114及びキ
ャッシュ記憶部112も、各クライアント・コンピュー
タ404に置かれるが、それ専用のメモリ等を用意する
のではなく(そのようにしても構わないが)、それらが
必要な時に、メモリ421上に文書画像記憶部114及
びキャッシュ記憶部112としての記憶域が動的に確保
されるのが一般的であろう。
【0059】各クライアント・コンピュータ404にお
いては、ネットワーク402を介して、サーバー・コン
ピュータ400から文書画像処理のための各モジュール
100〜102,116をダウンロードしてメモリ42
1に展開し動作させることによって、イメージスキャナ
424等から入力した文書画像に対する処理を実行する
ことができる。この際、そのクライアント・コンピュー
タ404のユーザに専用の文字認識用辞書110及び言
語辞書111と、キャッシュ記憶部112が利用される
ことになる。
【0060】このようなシステム形態には、次のような
利点がある。その1つは、サーバー・コンピュータ40
0側で文書画像処理のプログラム・モジュール100〜
102,116を最新のもに更新するだけで、全てのク
ライアント・コンピュータ404のユーザが最新のプロ
グラム・モジュール100〜102,116を利用して
文書画像処理を行うことができることである。もう1つ
の利点、各クライアント・コンピュータ404のユーザ
が、専用の文字認識用辞書110及び言語辞書111を
文字認識処理に利用できるとである。ユーザによって文
書中に用いるフォントの種類や語句等に違いがある場
合、ユーザ専用の辞書を利用すると認識率の向上を期待
できる。
【0061】このように、サーバー・コンピュータ40
0から各プログラム・モジュール100〜102,11
6をダウンロードすることにより、各クライアント・コ
ンピュータ404上に図1に示したような文書画像処理
システムを構築し、サーバー・コンピュータ400から
切り離された状態で文書画像処理を実行する形態は、W
ANを介してサーバー/クライアント間が接続されるよ
うな環境に一般に好適であろう。
【0062】しかし、LANを介してサーバー/クライ
アント間が接続されるような環境では、次に述べるよう
なシステム形態も有効であろう。以下、図6を援用して
説明する。各クライアント・コンピュータ404側で、
文書画像処理が必要となった場合に、イメージ・スキャ
ナ424等を用いて文書画像を入力したうえで、サーバ
ー・コンピュータ400に対して文書画像処理要求を発
行し、文書画像を送信する。サーバー・コンピュータ4
00側では、文書画像処理要求を受け付けると、メモリ
411上に文書画像記憶域(文書画像記憶部114に相
当)とキャッシュ記憶域(キャッシュ記憶部112に相
当)を確保し、受信した文書画像を文書画像記憶域に格
納するとともに、各プログラム・モジュール100〜1
02,116をメモリ411にロードし文書画像処理を
開始する。この際、要求元のクライアント・コンピュー
タ404に置かれている文字認識用辞書110及び言語
辞書111が文字認識処理に利用される。すなわち、サ
ーバー・コンピュータ400側で、ネットワーク402
を介してそれらの辞書を逐次参照するか、あるいは、そ
れら辞書の内容を予めネットワーク402を介してメモ
リ411に取り込んだ上で参照する。文字認識用辞書1
10や言語辞書111のデータ量はかなり大きいが、ネ
ットワーク402がLANであるような環境では、その
ような大量のデータをサーバー・コンピュータ400へ
転送したり、あるいは、クライアント・コンピュータ4
04側にある辞書をサーバー・コンピュータ400側か
ら逐次参照することは必ずしも非実用的ではない。文書
画像処理が終了すると、処理結果が発行元のクライアン
ト・コンピュータ404へ返される。
【0063】このような文書画像処理をサーバー・コン
ピュータ400側で実行させるシステム形態は、先に述
べたシステム形態の場合と同様の利益を得られるほか
に、サーバー・コンピュータ400として高性能なコン
ピュータを用いれば、その高い性能を各クライアント・
コンピュータ404のユーザが文書画像処理に利用でき
るという利点もある。
【0064】
【発明の効果】以上の詳細な説明から明らかなように、
請求項1乃至11、請求項13乃至16の各項記載の発
明によれば、キャッシュ処理のために必要な記憶容量の
増大を避けることができるとともに、文字画像間の比較
によって認識しようとする文字画像と同一の認識済み文
字画像を探すため、文字画像の簡易特徴量を用いる方法
の問題点であった信頼性の低下も避けられる。請求項2
乃至11の各項記載の発明によれば、文字認識処理をモ
ジュール化した環境においても、1文書画像を単位とし
たキャッシュ処理を行って高速かつ高精度な文字認識処
理が可能となる。請求項3又は10記載の発明によれ
ば、文字認識処理をモジュール化した場合に、そのモジ
ュールに対し外部から文書画像の同一性を指示する情報
を与えることなく、モジュール内部で文書画像の同一性
を判断して必要なキャッシュデータの廃棄を行うことが
できるため、独立性の高い文字認識モジュールを実現可
能である。請求項4乃至10の各項記載の発明によれ
ば、適切な文字画像を文書画像の同一性判定に用いるこ
とができるため、確実な文書画像同一性判定が可能にな
る。請求項10記載の発明によれば、認識結果が不確か
な文字画像がキャッシュされることによる認識エラーの
発生を回避できる。請求項11記載の発明によれば、請
求項1乃至10の各項記載の発明を一般的なコンピュー
タを利用して容易に実施可能になる。請求項14又は1
5記載の発明によれば、文字認識処理のモジュール化に
適した高速かつ高精度な文字認識装置を実現できる。請
求項17乃至20の各項記載の発明によれば、文書画像
処理のための各処理をモジュール化した高精度の文書画
像処理システムを実現できる。請求項19又は20記載
の発明によれば、第1のコンピュータ側で文書画像処理
用モジュールを最新のもに更新するだけで、第1のコン
ピュータにネットワーク経由で接続される全ての第2の
コンピュータのユーザが最新の文書画像処理用モジュー
ルを利用可能となり、また、第2のコンピュータの各ユ
ーザが専用の辞書を文字認識処理に利用可能となる。請
求項20記載の発明によれば、高性能のコンピュータを
第1のコンピュータとして用いれば、その高い性能を全
ての第2のコンピュータのユーザが文書画像処理に利用
できる、等々の効果を得られる。
【図面の簡単な説明】
【図1】本発明による文書画像処理システムのブロック
構成の一例を示すブロック図である。
【図2】文書画像とそのレイアウト解析結果の一例を模
式的に示す図である。
【図3】文書画像とそのレイアウト解析結果の他の一例
を模式的に示す図である。
【図4】本発明による文字認識モジュールの処理フロー
の一例を示すフローチャートである。
【図5】本発明による文字認識モジュールの処理フロー
の他の一例を示すフローチャートである。
【図6】クライアント/サーバー・システム上に構築さ
れた本発明による文書画像処理システムを説明するため
のブロック図である。
【符号の説明】
100 前処理モジュール 101 レイアウト解析モジュール 102 文字認識モジュール 103 文書同一性判定部 104 文字切り出し部 105 文字画像比較部 106 文字認識部 107 後処理部 108 キャッシュ処理部 110 文字認識用辞書 111 言語辞書 112 キャッシュ記憶部 113 画像入力部 114 文書画像記憶部 116 制御モジュール 400 サーバー・コンピュータ 402 ネットワーク 404 クライアント・コンピュータ

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 文書画像記憶手段に記憶されている文書
    画像から文字画像を切り出すステップ、 このステップで切り出された認識対象の文字画像と、前
    記文書画像記憶手段に記憶されている文書画像上の、キ
    ャッシュ記憶手段に記憶されている文字座標の位置にあ
    る画像とを比較し、認識対象の文字画像と同一とみなさ
    れる認識済み文字画像を見つけるステップ、 この比較ステップで認識対象の文字画像と同一とみなさ
    れる認識済み文字画像が見つからないときには、認識対
    象の文字画像に対し文字認識を行って認識結果を得るス
    テップ、 この文字認識ステップで得られた認識結果と認識対象の
    文字画像の文字座標とを対応付けて前記キャッシュ記憶
    手段に書き込むキャッシュ処理ステップ、 前記比較ステップで認識対象の文字画像と同一とみなさ
    れる認識済み文字画像が見つかったときには、その認識
    済み文字画像に関し前記キャッシュ記憶手段に記憶され
    ている認識結果を、認識対象の文字画像に対する認識結
    果として取り出すステップを有することを特徴とする文
    字認識方法。
  2. 【請求項2】 文書画像記憶手段に記憶されている文書
    画像の個々の認識対象領域毎に文字認識処理を行う文字
    認識方法であって、 各認識対象領域に対する文字認識処理の開始に先だっ
    て、 前記文書画像記憶手段に記憶されている文書画像が、キ
    ャッシュ記憶手段の記憶内容が得られた際に処理された
    文書画像と同一であるか否かを判定する文書同一性判定
    ステップ、 この文書同一性判定ステップで同一でないと判定された
    ときに、前記キャッシュ記憶手段を初期化するステッ
    プ、 各認識対象領域に対する文字認識処理において、 前記文書画像記憶手段に記憶されている文書画像から認
    識対象領域の文字画像を切り出すステップ、 このステップで切り出された認識対象の文字画像と、前
    記文書画像記憶手段に記憶されている文書画像上の、前
    記キャッシュ記憶手段に記憶されている文字座標の位置
    にある画像とを比較し、認識対象の文字画像と同一とみ
    なされる認識済み文字画像を見つけるステップ、 この比較ステップで認識対象の文字画像と同一とみなさ
    れる認識済み文字画像が見つからないときに、認識対象
    の文字画像に対し文字認識を行って認識結果を得るステ
    ップ、 この文字認識ステップで得られた認識結果と認識対象の
    文字画像の文字座標とを対応付けて前記キャッシュ記憶
    手段に書き込むキャッシュ処理ステップ、 前記比較ステップで認識対象の文字画像と同一とみなさ
    れる認識済み文字画像が見つかったときに、その認識済
    み文字画像に関し前記キャッシュ記憶手段に記憶されて
    いる認識結果を、認識対象の文字画像に対する認識結果
    として取り出すステップ、を有することを特徴とする文
    字認識方法。
  3. 【請求項3】 前記キャッシュ処理ステップで一部の認
    識済み文字画像そのものも文字座標とともに前記キャッ
    シュ記憶手段に書き込み、前記文書同一性判定ステップ
    では、前記キャッシュ記憶手段に文字座標と対応付けら
    れて記憶されている文字画像と同一の画像が、前記文書
    画像記憶手段に記憶されている文書画像上の当該文字座
    標の位置に存在するときに文書画像が同一であると判定
    し、そうでないときに同一でないと判定することを特徴
    とする請求項2記載の文字認識方法。
  4. 【請求項4】 前記キャッシュ処理ステップで文字画像
    そのものを前記キャッシュ記憶手段に書き込むか否か
    を、その文字画像の複雑さに基づいて決定することを特
    徴とする請求項3記載の文字認識方法。
  5. 【請求項5】 前記キャッシュ処理ステップで文字画像
    そのものを前記キャッシュ記憶手段に書き込むか否か
    を、その文字画像の大きさに基づいて決定することを特
    徴とする請求項3記載の文字認識方法。
  6. 【請求項6】 前記キャッシュ処理ステップで文字画像
    そのものを前記キャッシュ記憶手段に書き込むか否か
    を、その文字画像の色に基づいて決定することを特徴と
    する請求項3記載の文字認識方法。
  7. 【請求項7】 前記キャッシュ処理ステップで文字画像
    そのものを前記キャッシュ記憶手段に書き込むか否か
    を、その文字画像に対する認識結果に基づいて決定する
    ことを特徴とする請求項3記載の文字認識方法。
  8. 【請求項8】 前記キャッシュ処理ステップで文字画像
    そのものを前記キャッシュ記憶手段に書き込むか否か
    を、その文字画像の出現頻度に基づいて決定することを
    特徴とする請求項3記載の文字認識方法。
  9. 【請求項9】 前記キャッシュ処理ステップで文字画像
    そのものを前記キャッシュ記憶手段に書き込むか否か
    を、その文字画像の複雑さ、大きさ、色、認識結果等の
    2項目以上の尺度の総合評価に基づいて決定することを
    特徴とする請求項3記載の文字認識方法。
  10. 【請求項10】 文書画像記憶手段に記憶されている文
    書画像の個々の認識対象領域毎に文字認識処理を行う文
    字認識方法であって、 各認識対象領域に対する文字認識処理の開始に先だっ
    て、 キャッシュ記憶手段に文字座標と対応付けられて記憶さ
    れている文字画像と、前記文書画像記憶手段に記憶され
    ている文書画像上の当該文字座標の位置に存在する画像
    とが同一であるか否かを判定するステップ、 このステップで同一の画像でないと判定されたときに、
    前記キャッシュ記憶手段を初期化するステップ、 各認識対象領域に対する文字認識処理において、 前記文書画像記憶手段に記憶されている文書画像から認
    識対象領域の文字画像を切り出すステップ、 このステップで切り出された認識対象の文字画像と、前
    記文書画像記憶手段に記憶されている文書画像上の、前
    記キャッシュ記憶手段に保存されている文字座標の位置
    にある画像とを比較し、認識対象の文字画像と同一とみ
    なされる認識済み文字画像を見つけるステップ、 この比較ステップで認識対象の文字画像と同一とみなさ
    れる認識済み文字画像が見つかったときに、その認識済
    み文字画像に関し前記キャッシュ記憶手段に記憶されて
    いる認識結果を、認識対象の文字画像に対する認識結果
    として取り出すステップ、 前記比較ステップで同一とみなされる認識済み文字画像
    が見つからなかった認識対象の文字画像に対して文字認
    識を行って認識結果を得るステップ、 前記比較ステップで同一とみなされる認識済み文字画像
    が見つからなかった認識対象の文字画像そのものと、そ
    の文字座標と、当該認識対象の文字画像に対し前記文字
    認識ステップで得られた認識結果とを対応付けて前記キ
    ャッシュ記憶手段に書き込み、前記比較ステップで認識
    対象の文字画像と同一とみなされた認識済み文字画像そ
    のものを前記キャッシュ記憶手段から削除するキャッシ
    ュ処理ステップ、を有することを特徴とする文字認識方
    法。
  11. 【請求項11】 認識結果の確信度が低い文字画像は前
    記キャッシュ処理ステップの処理対象から除外されるこ
    とを特徴とする請求項1乃至10のいずれか1項記載の
    文字認識方法。
  12. 【請求項12】 請求項1乃至11のいずれか1項記載
    の文字認識方法の各ステップをコンピュータに実行させ
    るためのプログラムが記録されたことを特徴とするコン
    ピュータ読み取り可能記録媒体。
  13. 【請求項13】 文書画像記憶手段に記憶されている文
    書画像から文字画像を切り出す文字切り出し手段、 この文字切り出し手段により切り出された認識対象の文
    字画像と、前記文書画像記憶手段に記憶されている文書
    画像上の、キャッシュ記憶手段に記憶されている文字座
    標の位置にある画像とを比較し、認識対象の文字画像と
    同一とみなされる認識済み文字画像を見つける文字画像
    比較手段、 この文字画像比較手段により認識対象の文字画像と同一
    とみなされる認識済み文字画像が見つかったときに、そ
    の認識済み文字画像に関して前記キャッシュ記憶手段に
    記憶されている認識結果を、認識対象の文字画像に対す
    る認識結果として取り出す手段、 前記文字画像比較手段によって同一とみなされる認識済
    み文字画像が見つからなかった認識対象の文字画像に対
    し文字認識を行って認識結果を得る文字認識手段、 この文字認識手段によって得られた認識結果と認識対象
    の文字画像の文字座標とを対応付けて前記キャッシュ記
    憶手段に書き込むキャッシュ処理手段を具備することを
    特徴とする文字認識装置。
  14. 【請求項14】 文書画像記憶手段に記憶されている文
    書画像の個々の認識対象領域毎に文字認識処理を行う文
    字認識装置であって、 各認識対象領域に対する文字認識処理の開始に先だっ
    て、 前記文書画像記憶手段に記憶されている文書画像が、キ
    ャッシュ記憶手段の記憶内容が得られた際に処理された
    文書画像と同一であるか否かを判定する文書同一性判定
    手段、 この文書同一性判定手段により同一でないと判定された
    ときに前記キャッシュ記憶手段を初期化する手段、 各認識対象領域に対する文字認識処理において、 前記文書画像記憶手段に記憶されている文書画像から認
    識対象領域の文字画像を切り出す手段、 この手段により切り出された認識対象の文字画像と、前
    記文書画像記憶手段に記憶されている文書画像上の、前
    記キャッシュ記憶手段に記憶されている文字座標の位置
    にある画像とを比較し、認識対象の文字画像と同一とみ
    なされる認識済み文字画像を見つける文字画像比較手
    段、 この文字画像比較手段により認識対象の文字画像と同一
    とみなされる認識済み文字画像が見つかったときに、そ
    の認識済み文字画像に関し前記キャッシュ記憶手段に記
    憶されている認識結果を、認識対象の文字画像に対する
    認識結果として取り出す手段、 前記文字画像比較手段によって同一とみなされる認識済
    み文字画像が見つからなかった認識対象の文字画像に対
    し、文字認識を行って認識結果を得る文字認識手段、 この文字認識手段によって得られた認識結果と認識対象
    の文字画像の文字座標とを対応付けて前記キャッシュ記
    憶手段に書き込むキャッシュ処理手段、を具備すること
    を特徴とする文字認識装置。
  15. 【請求項15】 前記キャッシュ処理手段は一部の認識
    済み文字画像そのものも文字座標とともに前記キャッシ
    ュ記憶手段に書き込み、前記文書同一性判定手段は前記
    キャッシュ記憶手段に文字座標と対応付けられて記憶さ
    れている文字画像と同一の画像が、前記文書画像記憶手
    段に記憶されている文書画像上の当該文字座標の位置に
    存在するときに文書画像が同一であると判定し、そうで
    ないときに同一でないと判定することを特徴とする請求
    項14記載の文字認識装置。
  16. 【請求項16】 文書画像記憶手段に記憶されている文
    書画像の個々の認識対象領域毎に文字認識処理を行う文
    字認識装置であって、 各認識対象領域に対する文字認識処理の開始に先だっ
    て、 キャッシュ記憶手段に文字座標と対応付けられて記憶さ
    れている文字画像と、前記文書画像記憶手段に記憶され
    ている文書画像上の当該文字座標の位置にある画像とが
    同一であるか否かを判定する手段、 この判定の手段で同一の画像でないと判定されたとき
    に、前記キャッシュ記憶手段を初期化する手段、 各認識対象領域に対する文字認識処理において、 前記文書画像記憶手段に記憶されている文書画像から認
    識対象領域の文字画像を切り出す手段、 この手段により切り出された認識対象の文字画像と、前
    記文書画像記憶手段に記憶されている文書画像上の、前
    記キャッシュ記憶手段に記憶されている文字座標の位置
    にある画像とを比較し、認識対象の文字画像と同一とみ
    なされる認識済み文字画像を見つける文字画像比較手
    段、 この文字画像比較手段により同一とみなされる認識済み
    文字画像が見つかったときに、その認識済み文字画像に
    関し前記キャッシュ記憶手段に記憶されている認識結果
    を、認識対象の文字画像に対する認識結果として取り出
    す手段、 前記文字画像比較手段により同一とみなされる認識済み
    文字画像が見つからなかった認識対象の文字画像に対し
    文字認識を行って認識結果を得る文字認識手段、 前記文字画像比較手段により同一とみなされる認識済み
    文字画像が見つからなかった認識対象の文字画像そのも
    のと、その文字座標と、当該認識対象の文字画像に対し
    前記文字認識手段で得られた認識結果とを対応付けて前
    記キャッシュ記憶手段に書き込み、前記文字画像比較手
    段により認識対象の文字画像と同一とみなされた認識済
    み文字画像そのものを前記キャッシュ記憶手段から削除
    するキャッシュ処理手段、を具備することを特徴とする
    文字認識装置。
  17. 【請求項17】 文書画像記憶手段と、キャッシュ記憶
    手段と、前記文書画像記憶手段に記憶されている文書画
    像の認識対象領域を抽出する手段と、請求項14、15
    又は16記載の文字認識装置と、前記認識対象領域の抽
    出手段を起動して前記文書画像記憶手段に記憶されてい
    る文書画像の認識対象領域を抽出させ、抽出された個々
    の認識対象領域毎に、領域の座標を指定して前記文字認
    識装置を起動し指定された認識対象領域に対する文字認
    識処理を行わせる制御手段とを具備することを特徴とす
    る文書画像処理システム。
  18. 【請求項18】 コンピュータ上に、文書画像記憶手
    段、キャッシュ記憶手段、文字認識処理のための辞書、
    文書画像の認識対象領域を抽出する処理を行う第1のプ
    ログラム・モジュール、請求項2乃至11のいずれか1
    項記載の文字認識方法の各ステップを実行するための第
    2のプログラム・モジュール、前記第1及び第2のプロ
    グラム・モジュールの実行を制御する第3のプログラム
    ・モジュールを置き、 前記第3のプログラム・モジュールにより前記第1のプ
    ログラム・モジュールを呼び出して前記文書画像記憶手
    段に記憶されている文書画像の認識対象領域の抽出を行
    わせ、抽出された個々の認識対象領域毎に、前記第3の
    プログラム・モジュールにより領域の座標を指定して前
    記第2のプログラム・モジュールを呼び出し、前記文書
    画像記憶手段に記憶されている文書画像の指定され認識
    対象領域に対する文字認識処理を行わせることを特徴と
    する文書画像処理システム。
  19. 【請求項19】 第1のコンピュータに、文書画像の認
    識対象領域を抽出する処理を行うための第1のプログラ
    ム・モジュール、請求項2乃至11のいずれか1項記載
    の文字認識方法の各ステップを実行するための第2のプ
    ログラム・モジュール、前記第1及び第2のプログラム
    ・モジュールの実行を制御する第3のプログラム・モジ
    ュールを置き、 前記第1のコンピュータとネットワークを介して接続さ
    れる複数の第2のコンピュータのそれぞれに、文書画像
    記憶手段、キャッシュ記憶手段、文字認識処理のための
    辞書を置き、 前記第2のコンピュータにおいて、前記第1のコンピュ
    ータより前記第1、第2及び第3のプログラム・モジュ
    ールをダウンロードし、前記第3のプログラム・モジュ
    ールにより前記第1のプログラム・モジュールを呼び出
    して前記文書画像記憶手段に記憶されている文書画像の
    認識対象領域の抽出を行わせ、抽出された個々の認識対
    象領域毎に、前記第3のプログラム・モジュールにより
    領域の座標を指定して前記第2のプログラム・モジュー
    ルを呼び出し、前記文書画像記憶手段に記憶されている
    文書画像の指定された認識対象領域に対する文字認識処
    理を行わせることを特徴とする文書画像処理システム。
  20. 【請求項20】 第1のコンピュータに、文書画像の認
    識対象領域を抽出する処理を行うための第1のプログラ
    ム・モジュール、請求項2乃至11のいずれか1項記載
    の文字認識方法の各ステップを実行するための第2のプ
    ログラム・モジュール、前記第1及び第2のプログラム
    ・モジュールの実行を制御する第3のプログラム・モジ
    ュール、文書画像記憶手段、キャッシュ記憶手段を置
    き、 前記第1のコンピュータとネットワークを介して接続さ
    れる複数の第2のコンピュータのそれぞれに文字認識処
    理のための辞書を置き、 前記第2のコンピュータより前記第1のコンピュータに
    対し文書画像処理要求を発行するとともに文書画像を送
    信し、 前記第1のコンピュータにおいて、文書画像処理要求元
    の前記第2のコンピュータから受信した文書画像を前記
    文書画像処理手段に格納し、前記第3のプログラム・モ
    ジュールにより前記第1のプログラム・モジュールを呼
    び出して前記文書画像記憶手段に記憶されている文書画
    像の認識対象領域の抽出を行わせ、これにより抽出され
    た個々の認識対象領域毎に、前記第3のプログラム・モ
    ジュールにより領域の座標を指定して前記第2のプログ
    ラム・モジュールを呼び出し、前記文書画像記憶手段に
    記憶されている文書画像の指定された認識対象領域に対
    する文字認識処理を行わせ、この文字認識処理の際に文
    書画像処理要求元の前記第2のコンピュータに置かれて
    いる前記辞書が利用されることを特徴とする文書画像処
    理システム。
JP23226599A 1999-08-19 1999-08-19 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 Expired - Fee Related JP3985926B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23226599A JP3985926B2 (ja) 1999-08-19 1999-08-19 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23226599A JP3985926B2 (ja) 1999-08-19 1999-08-19 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001056840A true JP2001056840A (ja) 2001-02-27
JP3985926B2 JP3985926B2 (ja) 2007-10-03

Family

ID=16936551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23226599A Expired - Fee Related JP3985926B2 (ja) 1999-08-19 1999-08-19 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体

Country Status (1)

Country Link
JP (1) JP3985926B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006235432A (ja) * 2005-02-28 2006-09-07 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム
JP2009246807A (ja) * 2008-03-31 2009-10-22 Nec Corp 受信文書の言語判別方法及び受信文書翻訳システム並びにその制御プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006235432A (ja) * 2005-02-28 2006-09-07 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム
JP2009246807A (ja) * 2008-03-31 2009-10-22 Nec Corp 受信文書の言語判別方法及び受信文書翻訳システム並びにその制御プログラム

Also Published As

Publication number Publication date
JP3985926B2 (ja) 2007-10-03

Similar Documents

Publication Publication Date Title
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP2973944B2 (ja) 文書処理装置および文書処理方法
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
KR100487386B1 (ko) 부수 모델에 기초한 초서체 한자 수기 주석의 검색법
US20020114515A1 (en) Character string recognition apparatus, character string recognizing method, and storage medium therefor
JPH0772906B2 (ja) 文書認識装置
JP3216800B2 (ja) 手書き文字認識方法
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP2002063548A (ja) 手書き文字認識方法
JPH11272800A (ja) 文字認識装置
CN112560849A (zh) 基于神经网络算法的文理分割方法及系统
JP2000090117A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JPH07282193A (ja) 表を含む帳票処理装置
JP2004046723A (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2000137728A (ja) 文書解析装置及びプログラム記録媒体
JP2001283157A (ja) 単語認識方法および単語認識プログラム
JP2000259847A (ja) 情報検索方法、装置および記録媒体
JPH06223121A (ja) 情報検索装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP2906758B2 (ja) 文字読取装置
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JPH051512B2 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100720

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110720

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120720

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120720

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130720

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees