JPH1075351A - テキストのバイナリー画像から抽出されたシンボルを比較する方法 - Google Patents

テキストのバイナリー画像から抽出されたシンボルを比較する方法

Info

Publication number
JPH1075351A
JPH1075351A JP9135587A JP13558797A JPH1075351A JP H1075351 A JPH1075351 A JP H1075351A JP 9135587 A JP9135587 A JP 9135587A JP 13558797 A JP13558797 A JP 13558797A JP H1075351 A JPH1075351 A JP H1075351A
Authority
JP
Japan
Prior art keywords
symbol
bitmap
image
symbols
symbol image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9135587A
Other languages
English (en)
Other versions
JP4098845B2 (ja
Inventor
J Rutsukuritsuji William
ウイリアム・ジェイ・ルックリッジ
P Futsutenrotsuchiyaa Daniel
ダニエル・ピー・フッテンロッチャー
W Jiyakuisu Eric
エリック・ダブリュー・ジャクィス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH1075351A publication Critical patent/JPH1075351A/ja
Application granted granted Critical
Publication of JP4098845B2 publication Critical patent/JP4098845B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 テキストのバイナリー画像から抽出されたシ
ンボルを等価クラスに分類するために比較する方法を提
供する。 【解決手段】a)シンボル画像の前記第1ビットマップ
に関してトポロジー保存式の拡張表示を生成し;b)シ
ンボル画像の前記第1ビットマップの前記トポロジー保
存式拡張表示をシンボル画像の前記第2ビットマップと
比べて、整合性が存在するかどうかを決定し;c)整合
性が存在する場合には、シンボル画像の前記第2ビット
マップのトポロジー保存式拡張表示を生成し;d)シン
ボルの前記第2ビットマップの前記トポロジー保存式拡
張表示をシンボル画像の前記第1ビットマップと比べ
て、整合性が存在するかどうかを決定し;e)整合性が
存在する場合には、シンボル画像の前記第1ビットマッ
プがシンボル画像の前記第2ビットマップに整合するこ
とを表示する各ステップから構成される比較方法。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストの走査画
像の処理の分野に関するものであり、より詳細には、テ
キストの前記走査画像から抽出されたシンボルを等価ク
ラスに分類するために比較することに関する。
【0002】
【従来の技術】テキストの走査画像を操作することは、
当たり前のことになった。テキストの走査画像は、テキ
ストを包含する媒体のビットマップ表示である。画像圧
縮及び光学的文字認識(OCR)のような画像処理作業
を実行する所定のアプリケーションは、シンボルを等価
クラスにグルーピングすることによって実行されること
が可能である。言い換えれば、類似の形状を有するシン
ボルが識別されるのである。シンボルのこのグルーピン
グは、シンボル分類法とも呼ばれる。画像圧縮の場合、
このグルーピングは、当該形状が位置決めされるべき媒
体の上における位置を表示する位置情報と共に当該グル
ープが形状(例えば文字又は数字)の単一事例によって
表示されることを許容する。OCRの場合には、グルー
ピングは、事例が特定の文字であることを表示する。
【0003】シンボル整合性に基づく画像圧縮の具体例
は、1994年4月12日に発行されたマーク他(Mark
et al)の「画像の圧縮のための方法並びに装置(Meth
od and Apparatus For Compression Of Images)」とい
うタイトルの米国特許第5,303,313号(’31
3号特許)において説明されている。’313号特許で
は、画像は、シンボル整合化に先立って「事前圧縮(Pr
ecompressed)」される。’313号特許は、そのよう
な圧縮のためにラン長さの符号化を使用することを説明
する。シンボルは、ラン長さの表示から抽出される。投
票機構が、シンボル整合性の精度を改善するために、複
数の類似性テストと共に使用される。’313号特許
は、更に、テンプレートがシンボル整合性に基づいて修
正され得るようにしたテンプレート合成機構をも開示す
る。
【0004】シンボル整合化に関するもう1つの技術
は、ハウスドルフ方式として知られている。ハウスドル
フ方式は、距離測定技術を使用するものであり、フッテ
ンロクサー他(Huttenlocher et al)によって、199
1年6月の「ハウスドルフ距離を使用する画像比較(Co
mparing Images Using the Hausdorff Distance)」
(TR91−1211号)、及び1992年12月の
「ハウスドルフ距離を使用する画像比較のためのマルチ
解像技術(A Multi-Resolution Technique for Compari
ng Images Using the Hausdorff Distance)」(TR9
2−1321号)において説明されている。これらは、
両者とも、コーネル大学のコンピュータ科学学部(Depa
rtment of Computer Science, Cornell University)に
よって発行されたものである。ハウスドルフ距離は、バ
イナリー画像を比較するために使用されることが可能で
ある点集合を比較するための手段である。詳細には、任
意の2つの有限点集合A及びBとすれば、ハウスドルフ
距離は、以下のように定義される: H(A,B)=max(h(A,B),h(B,A)) その場合に、 そして、|a−b|は、2つの任意の点a及びbの間の
距離である。
【0005】関数h(A,B)は、Aの各々の点をBの
最も近い点に対するその距離に基づいてランク付けし、
最大にランク付けされるそのような点(最も整合しない
点)が、その距離の値を指定する。従って、h(A,
B)=δ(デルタ)である場合、これは、Aの各々の点
がBの所定の点の距離δの範囲内にあることを意味す
る。関数H(A,B)は、2つの非対称距離の最大値で
あり、従って、H(A,B)=δである場合、これは、
Aの各々の点がBの所定の点のδの範囲内にあって、逆
もまた同じであることを意味する。ハウスドルフ距離
は、このようにして、δの値が大きくなるにつれて画像
の間の類似性が小さくなることを表示するものであり、
2つのバイナリー画像(即ち有限点集合)の間の類似性
の基準を提供するのである。
【0006】ハウスドルフ距離に由来するもう1つの技
術は、シンボルが比較されているとき、シンボルを拡張
することである。シンボルの拡張は、各々の「オン」ピ
クセルを1組(概ね小さな)の「オン」ピクセルに置換
することによって構成される。画像をもう1つの画像と
比較する前に、画像を半径1(4個の直接的な隣接物)
又は半径1.5(8個の直接的な隣接物)の円板によっ
て拡張することによれば、量子化の影響は、最小化され
ることが可能である。
【0007】
【発明が解決しようとする課題】そのような拡張を使用
するビットマップ比較に関する1つの技術が、ここで説
明される。任意の2つの画像ビットマップが与えられ、
それらをA及びBと呼び、半径δの円板によるBの拡張
をBδと呼び、A及びBδの論理積内における「オン」
ピクセルの個数をカウントし、Aの「オン」ピクセルの
個数によって割算するものとする。この比率が大きくな
れば、Bに対するAの整合性がより良好になる(1.0
が完全な整合性を示す)のである。
【0008】
【課題を解決するための手段】テキストのバイナリー画
像から抽出されたシンボルを等価クラスに分類するため
に比較する方法並びに装置が開示される。等価クラスへ
のシンボルの分類は、画像圧縮及び光学的文字認識のよ
うな画像処理作業を可能とするために使用される。本発
明は、シンボル整合化プロセスの間に発生する不正確な
比較によって引き起こされるエラーの個数を最小化しよ
うと努めるものである。そのようなエラーは、典型的に
は、走査プロセスの間に発生する量子化の影響の故に発
生する可能性がある。量子化の影響は、典型的には、ピ
クセルが黒から白に変化するシンボルの境界線に沿って
エラーを発生させることになる。
【0009】本発明は、ビットマップの類似性を比較す
るハウスドルフ類似方式に基づくものである。ビットマ
ップAの中に包含されたシンボル及びビットマップBの
中に包含されたシンボルを考慮するものとする。関係す
る内容は、ビットマップAの中に包含されたシンボルが
ビットマップBの中に包含されたシンボルと整合するか
どうかということである。本発明のシンボル整合化ステ
ップは、以下の通りに構成される: ビットマップAの
中に包含されたシンボルの拡張表示を包含する第1の比
較ビットマップを作成し、ビットマップBの中に包含さ
れたシンボルのサイズに基づいて第1のエラー許容値を
決定し、ビットマップBの中に包含されたシンボルが第
1エラー許容値の閾値内において第1比較ビットマップ
の中に包含される拡張されたシンボルの中に納まるかど
うか、更に過剰なエラー密度が存在しないかどうかを決
定し、それが肯定である場合には、ビットマップBの中
に包含されたシンボルの拡張表示を包含する第2の比較
ビットマップを作成し、ビットマップAの中に包含され
たシンボルのサイズに基づいて第2のエラー許容値を決
定し、ビットマップAの中に包含されたシンボルが第2
エラー許容値の閾値内において第2比較ビットマップの
中に包含される拡張されたシンボルの中に納まるかどう
か、更に過剰なエラー密度が存在しないかどうかを決定
し、両者が適合して過剰なエラー密度が存在しない場合
には、ビットマップAがビットマップBに整合すること
を表示するのである。最後に、整合性が決定されると
き、ビットマップの一方を他方に対してシフトさせるこ
とによって「最適整合性」位置を発見し、最もエラーが
少ない位置を識別することになる。
【0010】上述したように、量子化の影響は、シンボ
ルの境界線に沿ってエラーを導入する可能性がある。そ
のような量子化エラーは、2つの様式で処理される:
1)トポロジー保存式の拡張の使用と、2)非線形のエ
ラー許容値機構の使用という2つの様式である。トポロ
ジー保存式拡張は、シンボルは「肥大化」されるがシン
ボルの局所的なトポロジー(即ち連続性)は変更されな
いものである。そのような拡張は、「オン」ピクセルに
隣接する「オフ」ピクセルに1組の局所的なルールを適
用することによって実行される。非線形エラー許容値機
構は、小さなシンボルはエラーを少ししか提供しないか
又は全く提供しないが、大きなシンボルは釣り合った大
量のエラーを提供するはずであるというアイデアに従う
ものである。
【0011】
【発明の実施の形態】図1は、本発明を利用することが
可能であるアプリケーションによって実行されるステッ
プを示すフローチャートである。図2は、本発明の現在
の好適な実施例のシンボル比較及び等価クラス分類にお
いて使用されるシンボルの辞書のためのデータ構造のブ
ロック表示である。図3は、本発明の現在の好適な実施
例において実行され得るシンボル比較及び等価クラス分
類の過程において図2のシンボル辞書を使用するために
実行されるステップを示すフローチャートである。図4
は、本発明の現在の好適な実施例において実行され得る
ビットマップの中に包含されたシンボルの整合化のため
のフローチャートである。図5は、エラー許容値とシン
ボルのサイズの間の関係を示すダイヤグラムである。図
6は、本発明の現在の好適な実施例における隣接ピクセ
ルのアイデアを示すダイヤグラムである。図7は、「オ
ン」ピクセルに隣接する「オフ」ピクセルが「オン」さ
れないときの「例外的な」ピクセルの構成を示す。図8
は、図7の構成における「オフ」ピクセルであるが、そ
れにも関わらず「オン」されるようにした、図7の例外
に対する例外を示す。図9は、本発明の現在の好適な実
施例が利用されることが可能であるコンピュータベース
のシステムのブロックダイヤグラムである。
【0012】テキストのバイナリー画像から抽出された
シンボルを等価クラスに分類するために比較する方法並
びに装置が開示される。本発明は、光学的文字認識(O
CR)データ暗号化又は画像圧縮のような種々のアプリ
ケーションにおいて使用されることが可能である。その
ようなアプリケーションは、総合的な画像処理システム
の一部として、或いはスタンドアロン型のアプリケーシ
ョンとして提供されることも可能である。本発明の現在
の好適な実施例は、テキスト画像データ圧縮を実行する
ためのコンピュータベースのシステムにおいて機能する
ソフトウェアとして実行される。そのようなソフトウェ
アは、磁気ハード・ディスク又はディスケット、CD−
ROMのような光学ディスク、記憶媒体を有するPCM
CIAカードなどのような適当な記憶媒体に分散される
か又は常駐するものであることも可能である。
【0013】以下の用語及びそれらの意味は、本文の説
明において使用されるものである:
【0014】画像とは、媒体のマーキング又は外観を指
す。
【0015】画像データとは、画像を再現するために使
用されることが可能である画像表示を指す。
【0016】等価クラスとは、画像の外観を不都合な様
式で変化させることなく互いに置換され得るようにし
た、画像の中に見出される1組のシンボルである。
【0017】等価クラスの標本は、画像が圧縮解除され
又はその他の方法で再現されるとき、等価クラスのあら
ゆる要素に置換されることになる、ビットマップであ
る。
【0018】抽出されたシンボル又はシンボルは、画像
データから獲得された媒体の上におけるマーキングのビ
ットマップ、ラン長さ又はその他の標準的な符号化の形
態にある画像表示である。
【0019】シンボル辞書又は辞書は、等価クラスを組
織化し維持するために使用される構造であり、画像が圧
縮解除され又はその他の方法で再現されるときばかりで
なく、分類プロセスにおいても使用される。
【0020】現在の好適な実施例のシステムは、等価ク
ラスのリスト(辞書とも呼ばれる)を利用し維持するも
のである。抽出されたシンボルは、それが既存の等価ク
ラスに追加されるべきであるかどうかを決定するため
に、等価クラスの標本と比較される。整合性が存在しな
い場合には、新しい等価クラスが、抽出されたシンボル
に従って標本として作成される。
【0021】上述したように、本発明は、様々なアプリ
ケーションにおいて使用されることが可能である。図1
は、本発明を利用するアプリケーションの一般的なステ
ップを説明するフローチャートである。先ず、ステップ
101で、画像データを作成するために、原稿が走査さ
れる。その画像データは、典型的には、画像のビットマ
ップ表示である。以下で説明されるように、走査ステッ
プは、エラー又はノイズを導入する可能性がある量子化
の影響を有するものである。続いて、ステップ102で
は、テキスト及び画像の画像クリーンアップ又はセグメ
ント分割のような種々の演算が、画像データに関して実
行され得ることになる。本発明によって処理されるもの
は、テキスト部分である。画像データのテキスト部分
は、続いて、ステップ103において、各々のピクセル
が単一ビットで表現される表示を作成するために、例え
ば所定の閾値化技術によって、バイナリー表示に変換さ
れる。「黒」即ち「オン」のピクセルは、典型的には、
二進法の値1によって表現され、一方、「白」即ち「オ
フ」のピクセルは、二進法の0として表現される。シン
ボル分類が始まるのは、このポイントである。
【0022】先ず、ステップ104で、新しい個別的な
シンボルがテキスト画像データから抽出される。現在の
好適な実施例では、この抽出は、バイナリー画像の接続
要素分析によって行われることになる。接続要素分析
は、典型的には、隣接するものであり従ってシンボルを
形成している「黒」即ち「オン」のピクセルの集合を発
見するプロセスである。当該分野では接続要素分析を実
行するための様々な技術が知られており、いかなる技術
であっても本発明において適切に使用されることにな
る。抽出されたシンボルは、上部左側のコーナーを原点
とする座標系における境界設定ボックスによって表現さ
れる。境界設定ボックスは、抽出されたシンボルのピク
セルから構成されるバイナリー値を内容とする。続い
て、抽出されたシンボルは、ステップ105において、
抽出されたシンボルの物理的寸法と同じであるか又は類
似するものである、シンボル辞書内に記憶されている先
に抽出されたいずれかのシンボルに整合するかどうかが
決定される。その物理的寸法は、典型的には、そのシン
ボルを内包する境界設定ボックスによって表現される。
分類プロセスの心臓部が、この比較ステップである。整
合性が見出される場合、抽出されたシンボルは、ステッ
プ106において、整合したシンボルの等価クラスに追
加される。新しいシンボルがいずれの等価クラスにも納
まらない場合には、ステップ107において、新しい等
価クラスが作成される。現在の好適な実施例では、既存
のクラスに追加されるシンボルの正確な形状は、以下で
説明されるように収容プロセスを保留してセーブされ
る。104から107までのステップは、その後、ステ
ップ108において、画像内におけるすべてのシンボル
に関して繰り返される。
【0023】現在の好適な実施例で実行されるようなシ
ンボル分類のプロセスは、図2及び図3を参照して説明
される。図2は、現在の好適な実施例の整合化プロセス
において使用される、本文ではシンボル辞書と呼ばれる
データ構造のブロック表示である。図2を参照すると、
テーブル201は、シンボルの境界設定ボックスの寸法
によってインデックスを付けられる内容を有する。例え
ばテーブル・エントリー204のような各々のテーブル
・エントリーは、連結式データ構造によって連結される
1つ又はそれ以上の等価クラス202を指示する(即ち
指し示す)ものであることが可能である。各々の等価ク
ラス202は、当該クラスの中のシンボル203に関す
る事例のもう1つの連結式リストによって構成される。
シンボルの各々の事例は、事例が見出され得る媒体の上
における位置情報を内包するデータ構造、事例のビット
マップ、及び「最適整合位置」を識別する情報によって
表現される。以下で詳細に説明されるように、最適整合
位置は、事例がクラスの標本と最適に整合する実行可能
なシフト位置を表示する。
【0024】現在の好適な実施例において、テーブル2
01は、ハッシュテーブルである。ハッシュテーブル
は、ハッシュテーブルのサイズを基準として応答する任
意の関数を使用して「多数から少数への」マッピングが
行われる周知の構造である。この特性は、同じ寸法のも
のであるシンボルの連結リストを維持し且つそれにアク
セスするために使用される。連結リストは、リスト内の
節点の事例がリスト内における次の節点を指し示す周知
の構造である。図2において説明されたデータ構造は、
本発明の範囲を限定するものとしては意図されていない
ことが留意されるべきである。等価クラスの機構及びそ
れに対する比較を維持するための代替的なデータ構造の
使用は、本発明の精神及び範囲から引き離すことにはな
らない。
【0025】図2において説明されたシンボル辞書は、
潜在的なシンボル整合性の照合を可能にするために使用
されるダイナミックな構造である。図3のフローチャー
トは、シンボル辞書の使用に関して整合化プロセスを説
明するものである。先ず、ステップ301では、ハッシ
ュ関数が、潜在的な整合性を内包するハッシュテーブル
・エントリーを発見するために、抽出されたシンボルの
寸法(即ち幅及び高さ)に関して実行される。このエン
トリーは、ステップ302において、チェックすべき等
価クラスが存在するかどうかを決定するために審査を受
ける。そのエントリーは、それが空ではなく、連結リス
トが先行する整合化の試みにおいて既に完全にトラバー
スされていない場合には、検査するための等価クラスを
有する。等価クラスが識別されると、続いて、ステップ
303において、抽出されたシンボルと等価クラスの標
本が整合するかどうかが決定される。等価クラスの標本
は、1)等価クラスが作成される原因となったシンボル
であるか、又は2)等価クラスを「収容(committin
g)」する過程で作成される平均的なシンボル(以下で
説明される)のいずれかである。シンボル比較の細部
は、以下で詳細に説明される。いずれにせよ、連結リス
ト内の標本の1つとの整合性が生じる場合には、続い
て、そのシンボルは、ステップ304において、対応す
る等価クラスに追加される。シンボルを等価クラスに追
加することは、それを等価クラスのデータ構造に追加す
ることを必然的に伴う。整合性が生じない場合には、連
結リストが、ステップ305において、更にトラバース
され、ステップ302によって比較すべきもう1つの等
価クラスが存在するかどうかの決定が為される。
【0026】現在のシンボルテーブル・エントリーに関
して連結リスト内に等価クラスがもはや存在しない場
合、ステップ306において、すべての類似サイズの等
価クラスがチェックされたかどうかを決定するためのチ
ェックが為される。それらがチェックされていない場合
には、ハッシュテーブル・エントリーを決定するために
使用されたサイズパラメータは、類似サイズのものに修
正され、ステップ301によって新しいテーブル・エン
トリーがアクセスされる。すべての類似サイズの等価ク
ラスがチェックされていた場合には、ステップ307に
よって新しい等価クラスが作成される。この新しい等価
クラスは、抽出されたシンボルのオリジナルのサイズに
対応するテーブル・エントリーの連結リスト内における
シンボル辞書の中に配置される。
【0027】シンボル分類の過程において実行される2
つのその他のステップは、シンボル辞書管理として考察
されることが可能である。一方は収容であり、もう一方
は等価クラスの併合である。収容は、抽出されたシンボ
ルの所定の個数(例えば10個)が等価クラスの一部に
なるときに呼び出されるプロセスである。収容プロセス
は、平均的な等価クラスの標本が最終決定され、即ちそ
のクラスを表示するビットマップが収容されることにな
る、プロセスである。このステップの前には、等価クラ
スの標本は、単にそのクラスを作成する原因となった第
1のシンボルであるに過ぎなかったのである。平均的な
クラス標本は、そのクラス内におけるすべてのシンボル
に関するより正確な表示である。これは、クラスの要素
であるシンボルを表示するビットマップを「平均化」す
ることによって獲得される。平均化は、異なったピクセ
ル位置の各々において「オン」ピクセルを有する(それ
らの「最適整合」位置合わせにおける)クラスの要素の
個数のカウントを内容とするヒストグラムを維持するこ
とによって達成される。標本は、このヒストグラムを閾
値化することによって生成される。即ち、最終的な標本
において、対応するピクセル位置が所定の閾値を越える
場合に、ピクセルが「オン」になる。閾値は、標本内に
おける「オン」ピクセルの個数がクラスの要素内におけ
る「オン」ピクセルのメジアン数値に可能な限り近いよ
うにして選択される。
【0028】一旦、最終的な標本が生成されると、すべ
てのシンボルは、それらが平均的なクラス標本に整合す
ることを確認するためにチェックを受ける。このチェッ
クは、上述したものと同じ判定基準を使用する。平均的
なクラス標本に整合しないそれらのシンボルは、等価ク
ラスから取り除かれ、新たに抽出されたシンボルとして
処理される(即ち、それらは既存の等価クラスなどに対
して整合化される)。
【0029】より正確なクラス標本を提供する以外に
も、平均化は、クラスの要素のビットマップによって占
有されるメモリ資源を解放することによって総合的な比
較プロセスを促進するものである。
【0030】併合は、等価クラスの標本が比較されて、
それらが併合される(即ち結合される)ことが可能かど
うかを決定するプロセスである。併合は、それが等価ク
ラスの総数を削減するので、望ましいことである。等価
クラスの個数を削減することは、結果としてパフォーマ
ンスを改善する。現在の好適な実施例では、併合は、す
べてのシンボルが処理されて等価クラスが作成された後
に第2のパスとして生じる。しかしながら、それは、当
該プロセスにおける様々なチェックポイントにおいて
(例えばマルチページ文書の各々のページが処理された
後に)実行されることも可能である。その併合プロセス
は、上述の整合化プロセスがクラス標本の集合に適用さ
れ、それらの標本が整合する場合に2つのクラスが結合
されるというものであるに過ぎない。
【0031】等価クラスの収容及び併合のプロセスは、
以下に説明される画像圧縮/圧縮解除の実施例に特に関
連するものである。
【0032】上述したように、シンボルの整合化は、分
類プロセスの心臓部である。現在の好適な実施例の整合
化技術は、改良されたハウスドルフ類似の方式である。
2つのシンボルの比較は、両方向性である。2つのビッ
トマップA及びBが、同じ形状の2つの事例をそれらが
表示しているかどうかを決定するために比較されること
を想定するものとする。各々のビットマップは、「オ
フ」(「白い」点)である背景の点に対してオン(「黒
い」点)にされる数多くの点を内包する。
【0033】整合化の目的のため、2つの新しいビット
マップが、オリジナルのビットマップの拡張したバージ
ョンであるAδ及びBδとして計算される。現在の好適
な実施例では、その拡張は、トポロジー保存式である。
即ち、局所的な連続性はオリジナルと同じであるが、シ
ンボルの境界線が僅かに肥大化されるのである。そのよ
うな拡張のための好適な技術は、以下で詳細に説明され
る。拡張したバージョンは、シンボルの境界線を混乱さ
せる可能性がある量子化及びその他の影響から生じる妥
当な「ノイズ」に関して許容範囲を提示するものであ
る。続いて、A内における黒い点の大部分がBδの形状
の内部に位置するかどうか、更にB内における黒い点の
大部分が形状Aδの内部に位置するかどうかを確認する
テストが行われる。これらのテストの両方に合格する
と、A及びBは、同じ形状を表示する(即ちそれらは整
合する)ものであると結論される。
【0034】このテストの背後の合理性は、A及びBが
同じシンボルを表示する(即ち同じ形状を有する)なら
ば、それらの境界線が(大部分に関して)整合するはず
であるという印刷及び走査プロセスのモデルにある。し
かしながら、走査プロセスは所定密度における点のサン
プリングの1つであるので、各々のシンボルの境界線は
サンプリングを実行するピクセル・グリッドの故に1つ
又は2つのピクセルだけシフトされてしまうかもしれな
い。従って、Aの境界線がBの境界線に接近して位置す
るならば、AはBδ(それは1ビット肥大しているの
で)の内部に位置することになり、逆もまた同じである
ことになる。一方の方向のみを使用することは、1つの
シンボルが他のシンボルの部分集合と似ているとき、例
えば文字「O」及び文字「Q」のような場合、間違った
整合性を算出する可能性があるので、両方向のテストが
必要であると留意されるべきである。
【0035】比較が為される様式は、以下の具体例を参
照して説明される。この具体例において、ビットマップ
Aは、ビットマップBに対して比較される。即ち、Bが
所定の許容範囲内でAの内部に納まるか?である。これ
が肯定で答えられ得る場合には、「他の」側面、即ちA
がBの内部に納まるか?に関して同じステップが実行さ
れる。整合性を決定する各ステップは、図4のフローチ
ャートにおいて説明される。簡潔さのために、比較の一
方の側面のみが説明されている。図4を参照すると、ス
テップ401では、トポロジー保存式の拡張が、ビット
マップA内のシンボルの拡張表示(拡張ビットマップA
と呼ばれる)を作成するために、ビットマップAにおい
て実行される。そのような拡張を実行するステップは、
以下で詳細に説明される。続いて、ステップ402で
は、拡張ビットマップA及びビットマップBに関してエ
ラービットマップが計算される。エラービットマップ
は、拡張ビットマップAの中には存在しないビットマッ
プB内における「オン」ピクセルを表示する。現在の好
適な実施例において、エラービットマップは、拡張ビッ
トマップAに関するものであり、先ず拡張ビットマップ
Aの値を逆転させ(即ち1を0に変換し、逆もまた同じ
く変換する)、続いてビットマップBとの論理積関数を
実行することによって計算される。その結果、1の値を
有するエラーピクセルは、ビットマップBが拡張ビット
マップAの内部に納まらないことを表示する。更に、各
々のビットマップは、その原点が上部左側のコーナーに
位置するようにして表示されることが留意されるべきで
ある。この位置合わせに基づいて、論理積が対応するピ
クセルにおいて実行されるのである。本文において生成
されるエラービットマップが、先行技術のエラービット
マップ(典型的には2つのビットマップの排他的論理
和)とは異なっていることもまた注目に値する。排他的
論理和は、ビットマップBが拡張ビットマップAの内部
に納まらない場合だけでなく、拡張ビットマップAがビ
ットマップBにオーバーラップしない場合にも、値1の
エラーピクセルを作成するので、単純な排他的論理和
は、本発明では機能しないことになる。1の値を有する
エラービットマップ内におけるエラーピクセルの個数
は、続いて、ステップ403において、エラーカウント
を算出するようにカウントされる。
【0036】続いて、ステップ404では、エラー許容
値が、ビットマップBの中に内包されるシンボルのサイ
ズに基づいて決定される。このエラー許容値は、ノイズ
の影響及びその他の量子化の影響を考慮に入れてエラー
の閾値を定義する。現在の好適な実施例では、エラー許
容値は、小さなシンボルには許容値が全く存在せず、大
きなシンボルには釣り合った大きな許容値が存在すると
いう特性を有する非線形の関数に基づいて決定される。
エラー許容値の計算は、以下で詳細に説明される。続い
て、ステップ405では、エラーカウントが、計算され
たエラー許容値より大きいかどうかが決定される。エラ
ーカウントがそのエラー許容値より大きい場合、ビット
マップBは、その許容された範囲内において拡張ビット
マップAの内部には納まらず、ステップ406で示され
るように、整合は存在しない。その他の場合には、エラ
ーカウントは、ステップ407において、エラー密度限
界に対して比較される。エラー密度限界は、「オン」エ
ラーピクセルの接近したグルーピングを識別するための
閾値である。現在の好適な実施例において、エラー密度
限界は、3である。エラーピクセル及びエラー密度限界
に関わるチェック(以下に説明される)に合格すると、
ステップ408で示されるように、整合性が存在する。
即ち、ビットマップBは、拡張ビットマップAの内部に
納まる。続いて、処理は、ステップ413に進んで、最
適整合位置を決定することになる(以下でより詳細に説
明される)。
【0037】エラーカウントがエラー密度限界より大き
い場合には、エラー密度チェックが実行される。ここで
は、ステップ402で計算されたエラービットマップ
が、ステップ409において、「オン」エラーピクセル
の過剰なグルーピングを検出すべく、3×3平方増分に
おける検査を受ける。ステップ410では、いずれかの
3×3平方がエラー密度限界を超過するかどうかの決定
が為される。いずれかの3×3平方がエラー密度限界を
超過する場合、ステップ411で示されるように、整合
性は存在しない。いかなる3×3平方もエラー密度限界
を超過しないと決定される場合には、ステップ412で
示されるように、整合性が存在することになる。
【0038】両方の方向がテストされ整合性が決定され
ると、シンボル分類の実施例は、ステップ413におい
て「最適整合」位置が識別されるように決定されたこと
になる。「最適整合」位置は、2つのビットマップが比
較されるときに最も少ないエラーを算出する等価クラス
の標本に対する位置として定義される。上述したよう
に、各々のビットマップは、上部左側のコーナーを原点
として有する座標系において方向付けされている。図4
に関して説明された比較は、各々のビットマップの原点
が完全に位置合わせされるものと想定して実行される。
しかしながら、この位置合わせは、最適の整合性を算出
しないかもしれないのである。現在の好適な実施例で
は、抽出されたシンボルに対応するビットマップは、大
部分の「オン」ピクセルが位置合わせされる位置を見出
すべく、原点及び整合したビットマップに対してシフト
される。これは、2つのビットマップをシフトさせ、そ
れらの間で論理積関数を実行し、その結果における「オ
ン」ピクセルの個数をカウントすることによって実行さ
れる。大部分の「オン」ピクセルを備えてシフトされた
位置が、「最適整合」位置なのである。この位置は、ビ
ットマップと共にセーブされる。この最適整合位置を識
別することは、等価クラスが収容されるときにそれが等
価クラスの最も正確な「最終的」表示の生成を容易にす
るので、好都合である。
【0039】走査プロセスにおいて導入される量子化の
影響の故に、シンボルを比較するとき、所定の量のエラ
ーは、容認されるものとして決定される。現在の好適な
実施例では、エラー許容値は、文字のサイズに関して非
線形である。A及びBが小さなシンボル(例えば1イン
チ当り300ドットで走査される6ポイントの文字)を
内容とするビットマップである場合には、それらが、両
方向のテストに厳格に合格しなければならない、即ち、
Aのいかなるピクセルも拡張Bの外部には全く存在せ
ず、Bのいかなるピクセルも拡張Aの外部には全く存在
すべきではないと主張することは、合理的である。逆
に、A及びBが大きなシンボル(例えば1インチ当り3
00ドットで走査される12ポイントの文字)を内容と
するビットマップである場合には、厳格な両方向のテス
トは、シンボル境界線の間の差もまたそれに比例して大
きくなり得るので、余りに厳格である可能性がある。そ
こで、大きなシンボルに関しては、Aの点のk 以外の
すべてが拡張Bの内部に位置し、且つBの点のk 以外
のすべてが拡張Aの内部に位置することを主張して、ゼ
ロではないエラー許容値が両方向のテストにおいて使用
されることになる。
【0040】上述したように、使用されるエラー許容値
は、A及びBの「サイズ」の関数であり、両方向テスト
の各々の側面に関して別個に計算される。シンボルの
「サイズ」は、ここでは、シンボル境界設定ボックスの
寸法によって単純に測定されるものではなく、シンボル
の境界線の長さ(それは「オフ」ピクセルに隣接してい
るシンボルのビットマップの「オン」ピクセルの個数で
ある)によって測定される。エラー許容値は、A(又は
B)のサイズが所定の閾値のシンボルサイズ(100ピ
クセル)以下である間は、ゼロに留まり、続いて、第2
の閾値サイズ(200ピクセル)までは、「ターゲッ
ト」エラー許容値に随伴する比率で増大し、その後、再
びエラー許容値が「ターゲット」比率に基づくようにし
た第3の閾値サイズ(300ピクセル)までは、2×比
率で増大することになる。
【0041】エラー許容値は、境界線ピクセルに対する
エラーピクセルの比率として定義される。エッジピクセ
ルの個数の3パーセントのエラー許容値は、このモデル
において使用されるとき、大部分の文書における妥当な
結果を提供するものであると実験的に決定された。しか
しながら、上述したように、線形のエラー許容値になっ
てしまうものを単純に使用することは、不十分である。
以下のルールは、現在の好適な実施例のエラー許容値の
非線形的な性質を説明するものである: (1) e(A)をA内におけるエッジ(境界線)黒ピ
クセルの個数とする。 (2) fを「ターゲット」エラー許容値、即ちエッジ
ピクセルの個数の3パーセント(直線の傾き)とする。 f*e(A)≦3ならば、エラー許容値は、0。3<f*
e(A)≦6ならば、エラー許容値は、f*e(A)−
3。6<f*e(A)ならば、エラー許容値は、MIN
(3+2*(f*e(A)−6),f*e(A))。
【0042】図5は、適用されたこれらのルールのグラ
フ表示である。図5を参照すると、水平軸501は、f
*e(A)の値を表わし、垂直軸502は、エラー許容
値を表わしている。線507は、シンボルサイズとエラ
ー許容値の間の関係をプロットするものである。上記の
ルールを適用すると、線507は、以下のような傾斜の
値を有する: (1) f*e(A)の値が0から3の場合、それは、
線分503で示されたように傾斜0を有する。 (2) f*e(A)の値が3から6の場合、それは、
線分504で示されたように傾斜1(即ち0.03のタ
ーゲットエラー許容値)を有する。 (3) f*e(A)の値が6から9の場合、それは、
線分505で示されたように傾斜2(即ちターゲットエ
ラー許容値の2倍)を有する。 (4) f*e(A)の値が9を越える場合、それは、
線分506で示されたように傾斜1を有する。
【0043】ここで、値3は、第1の閾値508を表わ
し、値6は、第2の閾値509を表わし、値9は、第3
の閾値510を表わしている。
【0044】エラー許容値を見積もるためにその他の関
数が使用されることも可能であるが、そのような関数
は、小さな形状に関しては、いかなるエラーも許容され
るべきではなく、大きな形状に関しては、より多くのエ
ラーが許容され得るという特性を有するものでなければ
ならない。
【0045】上述したように、整合化プロセスにおいて
生成される新しいビットマップ、即ちAδ及びBδは、
オリジナルのビットマップの拡張表示である。現在の好
適な実施例では、トポロジー保存式の拡張が実行され
る。トポロジー保存式拡張においては、不明瞭ではあっ
ても知覚的には重要である、形状の様相が保存される。
これは、文字「h」及び「b」を比較することによって
例証される。それらの総体的な形状は、「h」の底部に
おける間隙を除けば、全く同様である。単純に線を肥大
化させることは、「h」の底部における間隙を閉鎖し
て、拡張した「h」(その「h」は拡張した「b」の中
に明らかに納まることになる)の内部に「b」を納めて
しまうという結果を生じるかもしれない。これは、それ
らの形状を誤って整合させてしまうことになる。
【0046】トポロジー保存式拡張では、「オン」ピク
セルの局所的なトポロジーが検査を受け、「オフ」ピク
セルは、それを「オン」にすることがオリジナルのビッ
トマップの中に存在する小さな間隙又は孔を閉鎖しない
場合にのみ、拡張において「オン」にされる。従って、
拡張した「h」は、それでもなお底部における間隙を有
し、「b」は、この拡張した形状の境界線の内部には納
まらないのである。それらの形状がそのような小さな間
隙を内包しない場合には、この拡張は、通常の拡張と同
等なものである。
【0047】トポロジー保存式拡張技術は、任意の「オ
フ」ピクセルの拡張値を決定する1組の局所的なルール
によって構成される。各々の「オフ」ピクセルは、オリ
ジナルの未拡張のビットマップを参照して検分される。
そこで、実際には、作成されている拡張表示は、すべて
の「オン」ピクセルを直接的にコピーし、「オフ」ピク
セルのいずれのものが局所的なルールに基づいて「オ
ン」にされるべきであるかどうかを決定することによっ
て達成される。
【0048】図6から図8を参照して説明されるもの
は、1ピクセルだけ拡張(4個の連続隣接物)する場合
のルールである。同様のルールは、2つ又はそれ以上の
ピクセルだけ拡張するためにも使用されることになる。
実際に使用される拡張の量は、オリジナルの画像の印刷
密度及び走査密度を包含する様々なファクターに従属す
ることになる。とにかく、図6を参照すると、現在の好
適な実施例の拡張は、12個の隣接するピクセル(シン
ボル「?」によって夫々に指示される)の値に基づいて
任意の「オフ」ピクセル(シンボル「@」によって指示
される)をオンにするか否かを決定することによって機
能する。図6から理解され得るように、検査されるピク
セルの配列は、水平及び垂直の隣接物がピクセル2個分
の深さで検査され、対角線の隣接物がピクセル1個分の
深さで検査されるという基本的な特性を有する。
【0049】本発明のトポロジー保存式拡張方式の概略
的な原理は、その直接的な4個の隣接物(即ち水平方向
又は垂直方向の隣接物)の1つがオンである場合には、
この13個のピクセル隣接物の内部における局所的な連
続性を変更することにならない限り、中心のピクセルを
「オン」にするということである。以下のルールがこの
原理を実行するものとして決定された。簡潔さのため
に、左側の隣接物がオンである場合のみが説明される。
その他の場合は、これらのパターンの90度の回転によ
って獲得される(3個のその他の隣接物: 上側、右側
及び下側に対応する)。シンボル@は、拡張において
「オン」にされるべきか否かに関して検査を受けている
「オフ」ピクセルを指示するものであることが想起され
る。それらのルールを説明する図7及び図8において、
シンボルOは、隣接する「オフ」ピクセルを指示し、シ
ンボルXは、隣接する「オン」ピクセルを指示してい
る。
【0050】パターンX@は、即ち左側の隣接物が「オ
ン」ピクセルである場合は、それが図7で示された例外
ピクセル配列の1つであるときを除いて、「オン」を算
出する。隣接する所定個数のピクセルのみが例外を引き
起こすことが留意されるべきである。これらの場合、そ
の他のピクセルの値が何であるかは問題にならない。図
7で示された例外の各々は、評価されているピクセルに
隣接する可能性がある孔又は間隙を表わすものである。
しかしながら、図8は、図7の例外に対する例外を示し
ている。ピクセル隣接物が図8の配列の1つである場
合、評価されているピクセルは、「オン」にされる。
【0051】従って、総合的には、総計で48のテスト
に関して、夫々に、4つの例外と、それらの例外に対す
る7つの例外とを備えた4つのルール(左側、右側、上
側及び下側の4方向に関する)が存在する。現在の好適
な実施例では、これらのテストは、その成果(ピクセル
のオン又はオフ)に対する13ビット(「@」ピクセル
の廻りにおける隣接物)のテーブル・マッピング・パタ
ーンを構築するために使用される。
【0052】現在の好適な実施例では、ビットマップが
拡張されると、それは、走査されて、すべてのピクセル
位置が検査される。「オフ」ピクセルに遭遇すると、1
3個のピクセルの隣接物は、上述のような成果テーブル
の中に13ビットのインデックスを作成するために使用
される。検査されているピクセルは、その後、テーブル
の結果に応じて「オン」にされることになる。
【0053】実際において、この拡張方式は、先行技術
に関連して簡潔に説明されたハウスドルフのビットマッ
プ比較方式を大きく改良するものである。これは、小さ
な文字及び「微粒子」形状を備えたその他のトークンの
ビットマップに関して特に重要である。
【0054】上述したように、本発明は、好ましくは、
テキストの画像圧縮及び圧縮解除のためのシステムにお
いて具体化される。機械印刷されたテキストを内容とす
る走査画像は、等価クラスの中に見出されるシンボルを
グルーピングすることによって圧縮されることが可能で
ある。このシステムでは、シンボル分類器が使用され
て、抽出されたシンボルを独特な標本によって表示され
る等価クラスの中に分類する。作成される等価クラスの
個数は、抽出されたシンボルの総数よりも非常に少ない
ことになる。一旦、すべての抽出されたシンボルが等価
クラスに分類されてしまうと、圧縮された出力ストリー
ムが作成される。作成された出力ストリームは、標本の
ID/位置ペアを随伴する標本から構成される辞書によ
って構成される。
【0055】画像が圧縮解除されるとき、それらのペア
の各々は、識別された標本の事例が指定された位置に配
置されるようにして処理される。これは、オリジナルの
テキスト画像が再現されるまで、すべてのペアに関して
継続する。
【0056】以上の説明では、走査画像は、1インチ当
り300ドット(dpi)の解像度を有するスキャナを
使用して作成されるものと想定された。本文で説明され
た様々な閾値は、この解像度に基づいている。従って、
走査画像が300dpiとは異なる解像度を備えたスキ
ャナを使用して作成された場合、異なった閾値が使用さ
れ得ることが、当該分野の熟練技術者には明白であろ
う。例えば、テキストを形成する媒体が300dpiの
解像度を有するプリンタを使用して作成され、走査画像
を形成する媒体が600dpiの解像度を有するスキャ
ナを使用して作成された場合には、拡張値における更な
る修正もまた必要であるかもしれない。この場合には、
本文で説明されたピクセル1個分とは異なって、ピクセ
ル2個分までの拡張表示を作成することが必要になるか
もしれないのである。
【0057】本発明の現在の好適な実施例が使用される
ことが可能であるコンピュータベースのシステムは、図
9を参照して説明される。図9を参照すると、当該コン
ピュータベースのシステムは、バス901を介して連結
される多数のコンポーネントから構成される。ここに示
されたバス901は、本発明を分かりにくいものにしな
いために簡略化されている。バス901は、複数の並列
バス(例えばアドレス・バス、データ・バス及びステー
タス・バス)ばかりでなく、バスの階層(例えばプロセ
ッサ・バス、ローカル・バス及び入出力バス)から構成
されても構わない。とにかく、当該コンピュータシステ
ムは、更に、内部メモリ903(この内部メモリ903
は、典型的には、ランダムアクセス・メモリ又はリード
オンリー・メモリの組合せであることに留意すること)
からバス901を介して提供される命令を実行するため
のプロセッサ902をも含んで成る。そのような命令
は、好ましくは、図1、図3及び図4のフローチャート
において以上のように概説された処理ステップを実施
し、更に、図6から図8に関連して説明されたトポロジ
ー保存式拡張に関するルールをも実行するために、ソフ
トウェアにおいて実行されるものである。プロセッサ9
02及び内部メモリ903は、個別のコンポーネントで
あっても良いが、特定用途向け集積回路(ASIC)チ
ップのような単一の統合された装置であっても良い。更
に、プロセッサ902及び内部メモリ903の組合せ
は、本発明の機能性を実行するための回路構成をも含ん
で成る。
【0058】更に、バス901には、英数字入力を入力
するためのキーボード904、圧縮されたテキスト画像
のデータファイルのようなデータを記憶するための外部
記憶装置905、カーソルを操作するためのカーソル制
御装置906、及び視覚的出力を表示するためのディス
プレイ907が連結される。キーボード904は、典型
的には、標準的なクエーティ(QWERTY)キーボー
ドであることになるが、電話機のようなキーパッドであ
っても構わない。外部記憶装置905は、固定式である
か又は取外し可能である磁気的又は光学的なディスクド
ライブであっても良い。カーソル制御装置906は、典
型的には、所定の機能のパフォーマンスがそれによって
プログラムされることが可能であるボタン又はスイッチ
を付随して有することになる。バス901には、スキャ
ナ908もまた連結される。スキャナ908は、媒体の
ビットマップ表示(即ち走査された文書画像)を作成す
るための手段を提供する。
【0059】バス901に対して連結されることが可能
である光学的な要素は、プリンタ909、ファクシミリ
要素910及びネットワーク接続911を包含すること
になる。プリンタ909は、ビットマップ表示を印刷す
るために使用されることが可能である。ファクシミリ要
素910は、本発明を使用して圧縮された画像データを
送信するために使用される要素を内包することも可能で
ある。二者択一的に、ファクシミリ要素910は、本発
明を使用して圧縮された文書画像の圧縮解除のための要
素を包含することもまた可能である。ネットワーク接続
911は、画像データを内包するデータを受信及び/又
は送信するために使用されることになる。従って、本発
明によって利用される画像データは、走査プロセスを介
して、受信したファクシミリを経由して、或いはネット
ワークによって入手されることも可能である。
【図面の簡単な説明】
【図1】 本発明を利用することが可能であるアプリケ
ーションによって実行されるステップを示すフローチャ
ートである。
【図2】 本発明の現在の好適な実施例のシンボル比較
及び等価クラス分類において使用されるシンボルの辞書
のためのデータ構造のブロック表示である。
【図3】 本発明の現在の好適な実施例において実行さ
れ得るシンボル比較及び等価クラス分類の過程において
図2のシンボル辞書を使用するために実行されるステッ
プを示すフローチャートである。
【図4】 本発明の現在の好適な実施例において実行さ
れ得るビットマップの中に包含されたシンボルの整合化
のためのフローチャートである。
【図5】 エラー許容値とシンボルのサイズの間の関係
を示すダイヤグラムである。
【図6】 本発明の現在の好適な実施例における隣接ピ
クセルのアイデアを示すダイヤグラムである。
【図7】 「オン」ピクセルに隣接する「オフ」ピクセ
ルが「オン」されないときの「例外的な」ピクセルの構
成を示す。
【図8】 図7の構成における「オフ」ピクセルである
が、それにも関わらず「オン」されるようにした、図7
の例外に対する例外を示す。
【図9】 本発明の現在の好適な実施例が利用されるこ
とが可能であるコンピュータベースのシステムのブロッ
クダイヤグラムである。
【符号の説明】
201 テーブル、202 等価クラス、203 シン
ボル、204 テーブル・エントリー、901 バス、
902 プロセッサ、903 内部メモリ、904 キ
ーボード、905 外部記憶装置、906 カーソル制
御装置、907ディスプレイ、908 スキャナ、90
9 プリンタ、910 ファクシミリ要素、911 ネ
ットワーク接続
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ダニエル・ピー・フッテンロッチャー アメリカ合衆国 ニューヨーク州 14850 イサカ コムストック 314 (72)発明者 エリック・ダブリュー・ジャクィス アメリカ合衆国 カリフォルニア州 94114 サンフランシスコ #3 ウォル ターストリート 51

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 整合性を決定すべく、シンボル画像の第
    1ビットマップをシンボル画像の第2ビットマップと比
    較する方法であって: a) シンボル画像の前記第1ビットマップに関してト
    ポロジー保存式の拡張表示を生成し; b) シンボル画像の前記第1ビットマップの前記トポ
    ロジー保存式拡張表示をシンボル画像の前記第2ビット
    マップと比べて、整合性が存在するかどうかを決定し; c) 整合性が存在する場合には、シンボル画像の前記
    第2ビットマップのトポロジー保存式拡張表示を生成
    し; d) シンボルの前記第2ビットマップの前記トポロジ
    ー保存式拡張表示をシンボル画像の前記第1ビットマッ
    プと比べて、整合性が存在するかどうかを決定し; e) 整合性が存在する場合には、シンボル画像の前記
    第1ビットマップがシンボル画像の前記第2ビットマッ
    プに整合することを表示するようにした:各ステップか
    ら構成される前記比較方法。
  2. 【請求項2】 テキストのビットマップ表示からのシン
    ボルを整合化させる方法であって: a) テキストの前記ビットマップ表示からシンボル画
    像を抽出し; b) 以下のサブステップを実行することによって前記
    シンボル画像を潜在的な整合画像の等価クラスの標本と
    比較し: b1) 前記シンボル画像に関してトポロジー保存式の
    拡張表示を生成し; b2) 前記シンボル画像の前記トポロジー保存式拡張
    表示を前記標本と比べて、整合性が存在するかどうかを
    決定し; b4) 整合性が存在する場合には、前記標本のトポロ
    ジー保存式拡張表示を生成し; b5) 前記標本のトポロジー保存式拡張表示を前記シ
    ンボル画像と比べて、整合性が存在するかどうかを決定
    し; b6) 整合性が存在する場合には、前記シンボル画像
    が前記標本に整合することを表示するようにし: c) ステップb)が整合性を算出する場合には、前記
    シンボル画像を前記潜在的整合画像の等価クラスに追加
    し; d) ステップb)が整合性を算出しない場合には、す
    べての潜在的整合画像が比較されるか又は整合性が見出
    されるまで、すべての潜在的整合画像に関してステップ
    b)を繰返し; e) 前記シンボル画像がいかなる潜在的整合画像とも
    整合しない場合には、前記シンボル画像に関する新しい
    等価クラスを作成して辞書の中に記憶するようにした:
    各ステップから構成される前記整合化の方法。
JP13558797A 1996-05-30 1997-05-26 テキストのバイナリー画像から抽出されたシンボルを比較する方法 Expired - Fee Related JP4098845B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/655,546 US5835638A (en) 1996-05-30 1996-05-30 Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US655546 1996-05-30

Publications (2)

Publication Number Publication Date
JPH1075351A true JPH1075351A (ja) 1998-03-17
JP4098845B2 JP4098845B2 (ja) 2008-06-11

Family

ID=24629329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13558797A Expired - Fee Related JP4098845B2 (ja) 1996-05-30 1997-05-26 テキストのバイナリー画像から抽出されたシンボルを比較する方法

Country Status (2)

Country Link
US (1) US5835638A (ja)
JP (1) JP4098845B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6112208A (en) * 1997-08-25 2000-08-29 Fujitsu Limited Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
US6562077B2 (en) 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US6665841B1 (en) 1997-11-14 2003-12-16 Xerox Corporation Transmission of subsets of layout objects at different resolutions
US6748115B1 (en) * 1998-06-19 2004-06-08 Cvision Technologies Llc Perceptually lossless image compression
US6324555B1 (en) * 1998-08-31 2001-11-27 Adobe Systems Incorporated Comparing contents of electronic documents
US6295371B1 (en) 1998-10-22 2001-09-25 Xerox Corporation Method and apparatus for image processing employing image segmentation using tokenization
US7394573B1 (en) * 1999-04-14 2008-07-01 Xerox Corporation System for authenticating hardcopy documents
DE60005293T2 (de) * 2000-02-23 2004-07-01 Ser Solutions Inc. Methode und Vorrichtung zur Verarbeitung elektronischer Dokumente
US7024049B2 (en) * 2002-01-16 2006-04-04 Xerox Corporation Method and apparatus for improving image appearance
DE10228901A1 (de) * 2002-06-27 2004-01-15 Siemens Ag Verfahren und Vorrichtung zur Überprüfung der Formgenauigkeit von Objekten
EP1486904A1 (fr) * 2003-06-10 2004-12-15 STMicroelectronics S.A. Génération d'une image type reconstituée à partir d'un ensemble de plusieurs images représentant un même élément
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム
US7397584B2 (en) * 2004-09-28 2008-07-08 Xerox Corporation Encoding invisible electronic information in a printed document
KR100597004B1 (ko) * 2004-11-22 2006-07-06 삼성전자주식회사 심볼 사전 재배치 방식을 이용한 이진 영상 처리 장치 및방법
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US8068684B2 (en) * 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
US8229232B2 (en) * 2007-08-24 2012-07-24 CVISION Technologies, Inc. Computer vision-based methods for enhanced JBIG2 and generic bitonal compression
CN102402693B (zh) * 2010-09-09 2014-07-30 富士通株式会社 处理包含字符的图像的方法和设备
US8947736B2 (en) * 2010-11-15 2015-02-03 Konica Minolta Laboratory U.S.A., Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US9319556B2 (en) 2011-08-31 2016-04-19 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for authenticating printed documents that contains both dark and halftone text

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2905927A (en) * 1956-11-14 1959-09-22 Stanley F Reed Method and apparatus for recognizing words
US3133266A (en) * 1960-06-14 1964-05-12 Bell Telephone Labor Inc Automatic recognition of handwriting
US3295105A (en) * 1964-08-27 1966-12-27 Sylvania Electric Prod Scan control and normalization for a character recognition system
JPS5729745B2 (ja) * 1974-09-25 1982-06-24
US4155072A (en) * 1976-12-17 1979-05-15 Ricoh Company, Ltd. Character recognition apparatus
US4326190A (en) * 1978-08-30 1982-04-20 Borland David L Boundary trace slope feature detection system
US4410916A (en) * 1979-08-24 1983-10-18 Compression Labs, Inc. Dual mode facsimile coding system and method
US4400828A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Word recognizer
US4495644A (en) * 1981-04-27 1985-01-22 Quest Automation Public Limited Company Apparatus for signature verification
US4558461A (en) * 1983-06-17 1985-12-10 Litton Systems, Inc. Text line bounding system
US4864628A (en) * 1983-08-26 1989-09-05 Texas Instruments Incorporated Method of optical character recognition
US4701960A (en) * 1983-10-28 1987-10-20 Texas Instruments Incorporated Signature verification
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
US4641356A (en) * 1984-08-24 1987-02-03 Machine Vision International Corporation Apparatus and method for implementing dilation and erosion transformations in grayscale image processing
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
US4918740A (en) * 1985-10-01 1990-04-17 Palantir Corporation Processing means for use in an optical character recognition system
US4769716A (en) * 1986-10-17 1988-09-06 International Business Machines Corporation Facsimile transmission using enhanced symbol prototypes with precalculated front and back white spaces
JP3014097B2 (ja) * 1987-02-20 2000-02-28 株式会社日立製作所 輪郭追跡方法及びシステム
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
US4949281A (en) * 1987-04-23 1990-08-14 H. Berthold Ag Method and apparatus for generating and producing two-dimensional graphic object by polynominal parametric curves
US4809344A (en) * 1987-05-11 1989-02-28 Nippon Sheet Glass Co., Ltd. Apparatus for preprocessing of character recognition
JP2619429B2 (ja) * 1987-11-05 1997-06-11 グローリー工業株式会社 接触文字の分離方法
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition
US5214719A (en) * 1989-02-28 1993-05-25 Phoenix Imaging Computer-based system and method for character recognition
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word
US5142589A (en) * 1990-12-21 1992-08-25 Environmental Research Institute Of Michigan Method for repairing images for optical character recognition performing different repair operations based on measured image characteristics
US5303313A (en) * 1991-12-16 1994-04-12 Cartesian Products, Inc. Method and apparatus for compression of images
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法

Also Published As

Publication number Publication date
JP4098845B2 (ja) 2008-06-11
US5835638A (en) 1998-11-10

Similar Documents

Publication Publication Date Title
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
US5892842A (en) Automatic method of identifying sentence boundaries in a document image
US5848191A (en) Automatic method of generating thematic summaries from a document image without performing character recognition
JP3925971B2 (ja) 統合同値類の作成方法
US6377704B1 (en) Method for inset detection in document layout analysis
US5748809A (en) Active area identification on a machine readable form using form landmarks
US5539841A (en) Method for comparing image sections to determine similarity therebetween
EP1011064B1 (en) Image pattern detection method and apparatus
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US5687253A (en) Method for comparing word shapes
US5784487A (en) System for document layout analysis
US5854854A (en) Skew detection and correction of a document image representation
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US5850476A (en) Automatic method of identifying drop words in a document image without performing character recognition
US5828771A (en) Method and article of manufacture for determining whether a scanned image is an original image or fax image
EP0629078B1 (en) Apparatus for processing and reproducing image information
JP2006260274A (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5835634A (en) Bitmap comparison apparatus and method using an outline mask and differently weighted bits
CN101004792A (zh) 图像处理装置和方法,图像形成装置以及计算机程序产品
JP3977468B2 (ja) シンボル分類装置
US5592574A (en) Method and apparatus for expansion of white space in document images on a digital scanning device
US20080131000A1 (en) Method for generating typographical line
JP4227432B2 (ja) 画像処理方法
JP5049922B2 (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080314

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110321

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110321

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120321

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130321

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140321

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees