JP2879800B2

JP2879800B2 - 電子走査ピクチャの背景除去方法

Info

Publication number: JP2879800B2
Application number: JP8533682A
Authority: JP
Inventors: ブリュークマン、ヴインフリート; シュレーダー、ホルスト
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1995-05-09
Filing date: 1995-05-09
Publication date: 1999-04-05
Anticipated expiration: 2014-04-05
Also published as: US6081626A; JPH09507942A; WO1996036008A1

Description

【発明の詳細な説明】技術分野本発明は、文書における背景情報からの前景情報の分
離に関する。

背景技術電子走査してディジタル化した文書において、画像ま
たは文字認識手順（光学式文字認識）を実行できるよう
にするために、初期の準備段階（画像前処理）で前景情
報を背景情報から分離することがしばしば必要である。
この状況では、前景からの情報はしばしば、文字認識の
ために考慮される実際の画像情報となるが、背景からの
情報は多くの場合に妨害効果があり、前景情報の誤認を
もたらす可能性さえある。ピクチャの背景からのデータ
が、前景情報の認識性能の低下に寄与することもよくあ
る。したがって、ピクチャまたは文字の認識の前に背景
情報を除去することが好ましい。多くの応用例では、文
字を表す前景からのデータを、後続の文字認識によって
好ましくはASCIIデータに変換する必要がある。

ピクチャ内の背景データはたいていの場合、ディジタ
ル化妨害要素（ノイズなど）と、フィルタ処理によって
除去することが不可能なディジタル化文書の構成要素
（埃、文字の断片、印影など）のグループからなる。後
続の処理段階においてできる限り良好な認識率を達成す
るには、画像処理手順の後に、画像データが後で文字認
識処理によって処理されるデータのみを含むことが好ま
しい。認識の前の画像橇が良好なほど、それだけ好まし
い認識結果を期待することができる。

多くの画像処理装置では、入力として、２進化白黒イ
メージなどのグレイ・スケール化したイメージを想定し
ている。電子走査した文書イメージを生成する場合、読
取装置（スキャナ）がしばしば使用され、それによって
所定の解像度（たとえば、200〜300画素／平方インチ）
で、多数のグレイ・スケール（たとえば、16または256
グレイ・スケール）のイメージが供給される。

例えば、スキャナの個々のレーザ素子間の特性の不均
衡など、文書が読み込まれるときに起こりうる一連の障
害のため、画像認識に悪影響を及ぼしうる一連の有力な
要因が早くもこの段階で生じる可能性がある。同様に、
文書の種類や品質自体もイメージ認識に決定的な影響を
及ぼす可能性がある。たとえば、存在していたカラー・
コントラストが、カラー・イメージからグレイ・スケー
ル・イメージに変換する間に失われる可能性がある。タ
イプ入力の場合も同様であるが、文書に手書き入力され
ている場合に、読取り可能度および認識能力は特に、書
き込まれるときに加えられる多少とも強い圧力などによ
って生じる、コントラストの度合いにも依存する。

一連の応用例では、たとえば使用する紙の量を削減す
るために、文字認識に加えてアーカイブ・ピクチャと呼
ばれるものを作成する必要がある。すなわち、２つのイ
メージを作成しなければならず、しかもできる限りスル
ープットを失わずにそれを行う必要ある。現在使用可能
な応用例では、認識装置用にも保存の目的でもこの目的
には白黒イメージが使用される。グレイ・スケールイメ
ージは、コンピュータ処理によって集中して圧縮及び解
凍する必要があり、したがって、白黒イメージより多く
のメモリを消費する。

文書を電子走査することによって文書の電子画像が得
られ、その中ではあらゆる画素に対してたとえば灰色
値、黒／白値、カラー値などのイメージ値が割り振られ
る。フィルタを使用することによって、これらの割振り
に影響を与えることができる。たとえば、しきい値フィ
ルタを使用すると、所定のしきい値より上または下にあ
るピクチャ値を電子イメージから除去することができ
る。したがって、たとえば画像処理手順に望ましくない
背景情報や妨害効果を除去することができる。

しかしながら、フィルタ処理によって除去されたイメ
ージ値は、その後の画像認識にもはや使用できないこと
になる。したがって、フィルタ処理によって意図せずに
除去された前景情報によって、後続の画像認識の結果が
歪曲する恐れがある。しきい値に応じて、多少とも情報
が失われることになる。したがって、しきい値の選択
は、画像認識の品質にとって最高の重要性を持つ。

グレイ・スケール・イメージから２進イメージを生成
するために、静的または動的変換アルゴリズムがしばし
ば使用される。より汚れの少ない背景を得るには、色フ
ィルタをしばしば使用し、あるいは適切な着色光で文書
を照射する。従来型のフィルタ操作（形態的など）が選
択した構造（水平または垂直方向の直線など）を除去す
るために使用され、特定の環境での特定の事象（文書の
種類）に合わせて調製される。

ピーター・ハーベレッカー（Peter Haberaecker）の
著書「Digital Image Processing（ディジタル画像処
理）」（Carl Hanser Verlag、Munich and Vienna、ISB
N 3−466−14442−０、1985年）によれば、画像前処理
手順にも適用することが可能な、画像処理のための一連
の手順が周知である。具体的に言うと、同書では近接位
置での操作（第８章）、灰色値の平滑化処理（第8.1
節）、差分演算子の使用（第8.2節）、ならびに動的し
きい値決定手順（第12.3節）が記載されている。

しきい値を決定するための最もよく知られている処理
の概要は、P.K.サフー（Sahoo）、S.ソルターニー（Sol
tani）、およびA.K.C.ウォン（Wong）の「A Surver of
Thresholding Techniques（しきい値技法の研究）」（C
omputer Vision、Graphics and Image Processing 41、
233−260、1980年）に記載されている。同書ではヒスト
グラム変換方式の間に区別を付け、それによってしきい
値ならびにしきい値計算アルゴリズムを決定するため
に、灰色値割振りのヒストグラムの形態を変化させる。

欧州特許EP−Ａ−0505729号には、通常の印刷品質の
文書の読取りを可能にする、イメージの２進化用システ
ムが記載されている。

しかしながら、電子文書から情報をフィルタ処理によ
って除去するすべての処理に共通している１つのことに
は、フィルタ処理によって画像認識に必要な情報が失わ
れる恐れがあるということである。

発明の開示本発明の目的は、前景情報と背景情報をできる限りう
まく分離することを可能にする、文書処理のための方法
を提供することである。

本発明の別の目的は、情報をできる限りうまく認識す
ることを可能にする、画像処理の前の文書の予備操作の
ための方法を提供することである。

本発明の目的は、独立請求項によって解決される。本
発明によるその他の有利な実施形態は、従属請求項に記
載されている。

本発明によれば、まず文書の少なくとも２つの電子イ
メージを、それぞれしきい値フィルタ処理など異なる種
類のフィルタ処理によって作成する。その意図は、基本
的に前景情報またはその断片しかイメージ内に保持され
ないようにイメージをフィルタ処理することである。こ
のイメージは、後続のピクチャ復元のための初期（オリ
ジナル）イメージとして機能する。復元の目的は、この
初期イメージ内の失われた前景情報をできる限り多く復
元することである。初期イメージより強さの低いフィル
タ処理された残りのイメージは、このピクチャ復元のた
めの基準（リファレンス）として機能する。なお、文書
のフィルタ処理されていないイメージまたは文書自体さ
えも基準イメージとして使用できることを理解された
い。

ピクチャ復元は、初期イメージ内の情報から開始さ
れ、初期イメージからの情報を初期イメージの情報に対
応する位置にある少なくとも１つの基準イメージからの
情報と比較して、初期イメージ内の情報を少なくとも１
つの基準イメージからの情報で補足することによって実
施される。なお、これらの補足を新規情報として初期イ
メージに組み込むことも、これとは別に初期イメージか
らの情報と共に新規結果イメージに記憶することもでき
る。

基準イメージからの補足情報の選択は、適切な選択方
式を用いて行われる。選択方式としては、一連の隣接点
の考慮、あるいは情報密度などの他の判定基準を使用す
ることが好ましい。選択方式として情報密度を使用した
場合、たとえば、指定された画素密度より大きいまたは
小さい場所にあるイメージ点しか再構築されないことに
なる。このようにして、個々の位置にある点を復元プロ
セスから除外することができる。選択方式として、情報
密度を隣接点の考慮などの他の選択方式と組み合わせて
使用することもできる。

隣接点の考慮の場合、初期イメージならびに各基準イ
メージ中で、初期イメージ内の情報内容を有する点（情
報点）の周囲に特定のサイズの個別領域を定義する。各
基準イメージの対応する領域内のイメージ点に加えて存
在する情報は、初期情報への補足としてまたは新規情報
として追加され、あるいは初期イメージからの情報と共
に放棄される。なお、その情報がフィルタ処理によって
元の文書から除去されているイメージ点は、何の情報内
容も伴わないイメージ点となることを理解されたい。

すべての情報点について情報点の周囲の個別領域のサ
イズを、均等にまたは（たとえば特定の情報密度に基づ
いて）適応的に決定することができる。領域のサイズお
よび形状を選択することによって、実行ごとの復元の程
度に影響を及ぼすことができる。狭い領域を選択した場
合（たとえば、情報点に直接隣接している点のみ），す
でに存在しているがフィルタ処理によって弱く表されて
いるイメージ内容が直接補足されることになる。厚さが
減らされているトレースは、このようにして増幅され
る。広すぎる領域を選択した場合、フィルタ処理によっ
てすでに除去されている可能性がある干渉点が、希望し
ないのに保持される可能性がある。

個々の応用例では、状況に応じて、初期イメージ内に
本来存在していた情報点のみを情報点と見なすことも、
あるいは補足によって新規情報として初期イメージ内に
取り込まれたイメージ点をも情報点として使用すること
も適切となり得る。後者の手順によって、断片化した線
のトレースを有利に復元することができるが、望ましく
ない領域が「復活」することも起こりうる。ただし、イ
メージ内に新たに補足された情報は、必ずしも新規情報
点を表す必要はない。

電子イメージのマスターとして、個別に色フィルタ処
理されたイメージなど元のイメージから誘導されたイメ
ージを使用することができる。これによって、多色イメ
ージの場合に、色コード化された情報をそれぞれの場合
に個別に復元する、あるいは異なる色の比較から復元の
ための適切な認識特徴を得ることが可能になる。

本発明に基づく処理によって、保存イメージならびに
走査処理による文字認識のためのイメージを作成するた
めのイメージを作成することが可能になる。これにはど
んな所望の種類のスキャナも使用することができるが、
ただし背景情報と前景情報との間に僅かでもグレイ・ス
ケールの差異が維持されていることが条件となる。本発
明に基づく処理によって、単純な未復元の白黒イメージ
と比べて認識率を大幅に向上させるこできる。一実施形
態では、文字ベースの認識率を75％から81％に向上させ
ることができる。

本発明に基づく処理は、好ましくは電子データ処理に
おいてプログラム（ソフトウェア）として実施すること
ができる。

図面の簡単な説明本発明をより詳しく説明するために、以下図面を参照
していくつかの実施形態について述べる。同じ機能を有
する要素については、同じ符号によって示す。

第1a図は、弱くフィルタ処理した文書の基準イメージ
の一部分を示す図である。

第1b図は、このようにして強くフィルタ処理した、前
景情報の断片、この場合は線のトレースしか含まない文
書の初期イメージの第1a図に対応する部分を示す図であ
る。

第2a図および第2b図は、３×３のイメージ点を含む復
元領域での隣接点復元を示す図である。

第3a図および第3b図は、一方は５×３のイメージ点を
含む復元領域、他方は４×３のイメージ点を含む復元領
域での対応する隣接イメージ復元を示す図である。

第4a図ないし第4f図は、連続した復元処理を順番に示
す図である。

第5a図ないし第5d図は、本発明の一応用例を示す図で
ある。

発明を実施するための最良の形態本発明による前景情報と背景情報の分離の一実施形態
では、文書からそれぞれ異なる情報内容を有する２つの
電子イメージをまず作成する。これは、文書のグレイ・
スケール・イメージから作成される。相異なるしきい値
を有する２つの白黒イメージを生成することによって実
施することが好ましい。第１の白黒イメージは、基本的
にもはやどんな背景データも含まず、第２の白黒イメー
ジは、基本的にすべてのイメージ・データを含む、すな
わち背景データも含む。たとえば、第１の白黒イメージ
に約50％の初期静的しきい値を適用することができ、言
い換えれば、最大グレイ値の約50％のグレイ値を有する
情報は消失することになる。それに対して、第２の白黒
イメージには、約90％の第２静的しきい値を使用するこ
とができる。しかし、動的しきい値を使用する方が有利
である。第２の白黒イメージは、しきい値によるフィル
タ処理をしなくても直接使用することもできることを理
解されたい。

しかし、第１の白黒イメージ（基本的に背景データを
含まない）を生成するときに、前景に属し文字認識に必
要であろう一部のデータが消失することも起こりうる。
このとき第１の白黒イメージが、このイメージ内の消失
した前景情報をできる限り多く復元する目的でイメージ
復元処理用の初期イメージとして使用される。第２の白
黒イメージは、このための基準イメージとして機能す
る。以下説明するように、イメージ復元には隣接点考慮
を使用することが好ましい。

隣接点考慮は、基本的に前景情報またはその断片を表
す初期イメージ内の情報を基準とし、この初期イメージ
の情報を基準イメージからの対応する情報と比較すると
いう原理に基づいており、初期イメージからの情報を、
適切な比較方式を用いて基準イメージからの情報で補足
することができる。このようにして、初期イメージ内に
もはや存在しない情報を再び復元することができる。

隣接点考慮の場合、初期イメージ内の情報内容（情報
点）を有する所定のサイズの個別領域が、初期イメージ
ならびに基準イメージのどちらにおいても適切な方法で
配置される。基準イメージの特定の対応領域内に存在す
るが初期イメージ内には存在しない情報は、新規情報と
して初期イメージへの補足として追加されるか、あるい
はたとえば新規に得られる結果イメージ内に初期イメー
ジからの情報と共に保管される。なお、その情報が（し
きい値）フィルタ処理によって元の文書から除去されて
いるイメージ点は、どんな情報内容も含まないイメージ
点を表すことを理解されたい。

すべての情報点について、情報点に関する個別の領域
のサイズを均等にまたは（たとえば個別の情報密度に基
づいて）適応的に決定することができる。個々の応用例
に関して、初期イメージ内に本来存在していた点のみを
情報点とみなすこと、あるいは初期イメージに新規情報
として組み込まれたイメージ点を情報点として使用する
ことも、より適切となり得る。

復元処理を１つのイメージまたは部分イメージについ
て数回反復できるようにするために、必要となる２回目
の実行には作成されたばかりのイメージを使用する。前
述の処理全体にわたって起こりうる望ましくない背景デ
ータの復元を抑制するには、余り広い領域を選択しない
ことによって、復元中に基準イメージからの孤立したイ
メージ点を無視できるようにすることが好ましい。ただ
し、それが必要なのは、イメージに対する初期サイクル
の間だけである。というのは、孤立したイメージ点はそ
の段階ですでに除去されているからである。

本発明は、白黒イメージの使用に限定されるものでは
なく、個々に異なる情報内容を有するどんな所望のイメ
ージも使用可能であることを理解されたい。２つのイメ
ージの代わりに追加のイメージを使用することも可能で
あり、それによって水平線や垂直線、背景パターンなど
任意のイメージ特性を抽出し、後で所望の結果イメージ
に復元したりそれと合成することができる。

以下隣接点処理プロセスの一実施形態を示す。本発明
の可能な応用例の１つを例示するために、イメージ点B
2、C2、B3、C4、B5はトレースを表し、イメージ点F1お
よびE3は文書の偶発的な汚れを反映するものとすること
に留意されたい。第1a図に、文書は示さず、弱くフィル
タ処理された文書の基準イメージの部分10を示す。第1b
図には、前景情報の断片、この場合はトレースのみが含
まれるように強くフィルタ処理された、同文書の初期イ
メージの対応する部分100を示す。

図の座標ＡないしＦはイメージ点の水平位置を、座標
１ないし５はイメージ点の垂直位置をそれぞれ表す。第
1a図を見るとわかるが、基準イメージの部分10にはイメ
ージ点F1、B2、C2、B3、E3、C4、B5が含まれている。次
に、第1b図中の初期イメージの対応する部分100にはイ
メージ点B2およびC4しか含まれていない。イメージ点F
1、C2、B3、E3、B5は、対応するフィルタ処理によって
除去されている。

次に、第1b図の初期イメージの各イメージ点の周囲
に、情報項目すなわち部分10と部分100の両方中の情報
点B2およびB5を含む個々の復元領域をとる。以降の手順
において、情報点を“x"でマークして復元領域をより識
別しやすくする。第２図に、３×３のイメージ点を含む
復元範囲での隣接点の復元を示す。第３図には、一方は
５×５のイメージ点の復元範囲、またもう一方は４×３
のイメージ点の復元範囲での対応する隣接点復元を示
す。

第2a図を見るとわかるが、３×３のイメージ点を含む
復元範囲は、情報点B2の周囲のイメージ点C2およびB3を
包含している。これとは対照的に、同様に３×３のイメ
ージ点を含む情報点C4の周囲の復元範囲は、イメージ点
B3およびB5を包含している。新たに復元されたイメージ
点としてのこれらのイメージ点C2、B3、B5は、第2b図に
従って初期イメージに組み込まれるか、あるいは情報点
B2およびC4と共に別に保管される。第2a図および第2b図
を見るとわかるが、３×３のイメージ点を含む復元領域
を選択することによって、トレースB2、C2、B3、C4、B5
がすべて復元でき、これとは対照的に、遠く離れた位置
にあるイメージ点F1およびE3（偶発的な汚れなど）はフ
ィルタ処理によって除去されている。

第3a図を見るとわかるが、情報点B2の周囲の４×３の
イメージ点を含む復元領域も同様に、イメージ点C2およ
びB3を包含している。これとは対照的に、情報点C4の周
囲の５×３のイメージ点を含む復元領域は、イメージ点
B3およびB5だけでなく、この場合は情報点E3も包含して
いる。その結果、第２図の領域よりも広い復元領域が選
択されるために、トレースB2、C2、B3、C4、B5だけでな
く、直接隣接していないイメージ点E3も復元され、新た
に復元されたイメージ点は第3b図に従って初期イメージ
に組み込むか、あるいは情報点B2およびC4と共に別に保
管することができる。

復元領域のサイズの選択が重要な役割を果たすこと
は、第２図および第３図の例を見れば明らかである。し
かしながら、本発明による方法を使用すると、文書の主
な情報に直接隣接した位置にない、発生しうる個々の汚
れが、復元領域が比較的広い場合でも十分に抑制できる
ことも強調しておきたい。

新規に復元されたイメージ点が初期イメージに組み込
まれ、従って次の復元処理するための新規初期イメージ
を形成する場合は、相互に関係するトレースを特に復元
することができて有利である。この連続復元は、例え
ば、初期イメージ中に存在した全ての情報点の復元が一
回の初期ステップで同時に実行でき、かつ新たに捕捉さ
れた情報が初期イメージに書き込まれるように実行する
ことができる。この補足された初期イメージは新規の情
報点を表し、その後次の復元段階のための初期イメージ
として機能することができ、以下同様である。この状況
で、前の復元段階から新たに得られた情報点がある場合
にのみ、新たな復元段階をその都度実行する必要がある
ことを理解されたい。第4a図ないし第4f図に、このよう
な連続した復元を順番も示す。

第4a図に基準イメージを、第4b図にそれに対応する初
期イメージをそれぞれ示す。第4c図に示したように、第
4b図からの情報点を開始点とし、個別の情報点の周囲の
３×３のイメージ点を含む復元領域で初期復元を実行す
る。このようにして捕捉されたイメージ点を初期イメー
ジに書き込み、このようにして得られた元の初期イメー
ジが修正されたものを新規の初期イメージとして使用す
る（第4d図）。新たに捕捉された情報点に基づく次の情
報段階では、さらに情報点が与えられ（第4e図）、それ
も初期イメージに書き込まれる（第4f図）。第4f図に示
したイメージは、連続した復元の結果である。この状況
で、イメージ点F2、E3、D2、D3、C4、D5、E5、E6、D7、
C8、B7から形成される関連するトレースは完全に再構築
されているが、点A2、H5、F9、I9などの個々の点は再構
築されず、すなわち除去されていることに留意された
い。

たとえば、元の情報点（コーナ点など）から復元が開
始する形で、別の連続する復元を実施することができ
る。第１情報点の周囲での復元によって捕捉された情報
は、初期イメージに直接書き込まれる。その場合、補足
されたイメージ点がこのとき新たな情報点を表してい
る、この補足された初期イメージが、次の情報点のため
の初期イメージとして機能する。したがって、たとえば
行ごとに再帰的に復元を実行することができる。この状
況において、必要ならば、この行ごとの処理を数回反復
して実行する必要があることを理解されたい。

第5a図ないし第5d図に、本発明の応用例を示す。第5a
図に、本発明による復元処理のための文書を示す。第5b
図は、第5a図の文書を約90％のしきい値でフィルタ処理
した、２進化された白黒イメージを示している。これは
復元のための基準イメージとして機能するものである。
第5c図は、約50％のしきい値でフィルタ処理することに
よって第5a図の文書を２進化した白黒イメージを示して
いる。これは復元のための初期イメージとして機能す
る。第5d図は、基準イメージを用いて実行された初期イ
メージの復元の結果を示している。このことからわかる
ように、本発明による処理によって、前景情報と背景情
報の適切な分離が可能となり、それによって後続の画像
処理段階を首尾よく実行することが可能になる。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭57−121371（ＪＰ，Ａ) 特開昭61−255486（ＪＰ，Ａ) 特開平３−188587（ＪＰ，Ａ) 特公昭49−32019（ＪＰ，Ｂ１) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06K 9/00 - 9/82

Claims

(57)【特許請求の範囲】

【請求項１】文書において前景情報を背景情報から分離
するための方法であって、第１段階で、異なるフィルタ処理を使用して文書から少
なくとも２つのイメージが生成され、そのイメージの１
つが前景情報またはその部分のみを残すような形でフィ
ルタ処理され、このイメージがイメージ復元のための初
期イメージを構成し、前記少なくとも２つのイメージの
うち前記イメージの１つ以外のイメージがイメージ復元
のための基準イメージを構成し、第２段階で、イメージ復元が、初期イメージ内で失われ
た前景情報ができる限り多く復元されるような形で実施
され、イメージ復元が、初期イメージ内の情報から開始
して、初期イメージ内の情報を基準イメージ内の情報と
比較して、初期イメージ内の情報を基準イメージ内の情
報で補足することによって実施され、第２段階における補足が、第２段階において初期イメー
ジからの情報と共に新規結果イメージに保管されること
を特徴とする、前記方法。
【請求項２】基準イメージが文書のフィルタ処理されて
いないイメージであることを特徴とする、請求項１に記
載の方法。
【請求項３】フィルタ処理がしきい値フィルタ処理であ
ることを特徴とする、請求項１又は２に記載の方法。