JPH07505024A - イメージ圧縮の方法および装置 - Google Patents

イメージ圧縮の方法および装置

Info

Publication number
JPH07505024A
JPH07505024A JP5510925A JP51092593A JPH07505024A JP H07505024 A JPH07505024 A JP H07505024A JP 5510925 A JP5510925 A JP 5510925A JP 51092593 A JP51092593 A JP 51092593A JP H07505024 A JPH07505024 A JP H07505024A
Authority
JP
Japan
Prior art keywords
template
image
symbol
symbols
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5510925A
Other languages
English (en)
Inventor
マーク,ピーター・ビー
シーバー,スチュアート・エム
Original Assignee
カーテシャン・プロダクツ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by カーテシャン・プロダクツ・インコーポレーテッド filed Critical カーテシャン・プロダクツ・インコーポレーテッド
Publication of JPH07505024A publication Critical patent/JPH07505024A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 イメージ圧縮の方法および装置 (技術分野) 本発明は、イメージの圧縮に関し、特にシンボル・マツチングを用いる圧縮方法 に関する。
(背景技術) 標準的な約215.9X279.4mm (8,5X11インチ)のページは、 300ドツト/インチ(約25.4mm)(DPI)における2進イメージとし て走査される時、s、ooo、oooビット以上の情報、即ち約1メガバイトを 含む。ファクシミリの微小モードの走査レートである200DPIで走査される 時、この同じページは、1メガバイトの略々2分の1の情報を含む。このような イメージを記憶するため必要な大きな容量の故に、ある種のイメージ圧縮は、典 型的にはイメージ記憶装置4および送信装置において実現される。
ファクシミリ伝送のための規格として広く用いられる2進イメージ圧縮のための 現在標準的な一方法は、CCITT−3規格である。これは、イメージのランレ ングス・コーディングのハフマン・コーディングに基く損失の少ない2進イメー ジ圧縮アルゴリズムである。CCITT−3規格は、典型的に、ランの長さにお ける第1次統計規則を勘案することにより大きさの順序によりイメージを圧縮す る。このため、300DP1のイメージは、1メガバイトから100キロバイト まで圧縮することができる。
シンボル・マツチングは、主として機械で印刷されたテキストからなる2進イメ ージに対する圧縮率を増すために使用することができる。このようなテキストは 、白いビクセルで囲まれた文字を表わす接続された黒いビクセルの多数の小さな 領域を特徴とする。典型的な文書は、少数の異なるタイプ・フェース(例えば、 タイムス(Times)およびヘルベチ力()Ielvctica))およびタ イプ・スタイル(例えば、プレーン(plain)、ボールド(bo I d)  、イタリックス)における大文字と小文字における英字の文字を表わす数百の 異なる文字を使用するに過ぎない。シンボル・マツチングを用いる圧縮技術にお いて、類似の文字がグループ化され、黒いピクセル列としてのそれらの記述はテ ンブレーに関してテンプレートのシーケンスとして表わされる。このように、表 示は原稿イメージよりはるかに少ないビットを含む。シンボル・マツチングを用 いて得ることができる圧縮量は、どれだけ多くの文字が一致させられるか、どの ようにテンプレートが表わされるか、また文字位置がどのように表わされるかに 依プロセス自体は、原稿イメージにエラーを導入する。−例は図1に示され、同 図は200DPlで走査された12ポイントのフーリエにおける字rbJの2つ の例を示している。前記エラー・ビクセルもまた示されている。シンボル・マツ チング方式が2進イメージ圧縮に著しく影響を及ぼすためには、2つの文字間の エラーは許されねばならないが、制限されねばならない。この目的のために、知 覚的な類似性に基く2つの文字のマツチングのある表記が必要となる。更にまた 、突合せ文字が全く同じものではないため、この突合せ文字からテンプレートを 定義する方法が要求される。このようなテンプレートはこれを定義するために使 用される全ての文字と同じ必ずしも同じではいため、テンプレートによる表示は 完全にイメージをコード化するもことはない。しかし、文字はテンプレートから 外観が僅かに変化するに過ぎないため、その差は知覚できない。
2進イメージ圧縮におけるシンボル・マツチングの成功は、2つの文字の類似性 がどのように判定されるか(文字がどのように突合せされるか)に著しく係わっ ている。文字間の大きなピクセル差を許容するマツチング法(matching me t r i c)は、置換エラーを生じ易い。例えば、図2に示されるよ うに、同じフォントおよびサイズのrbJの例とrhJの例とは、比較的小さな ビクセル・エラーを生じ得る。もしこれらが一致するならば、再構成されたイメ ージはエラーが多くなる。−ノj、マツチング法が厳し過ぎるならば、同じ文字 の多くの事例が突合せされず、圧縮はほとんど得られない。
2進イメージ圧縮におけるシンボル・マツチングの使用は、1974年に測る( R,N、AschcrおよびG、Nagy著[走査ディジタル化印刷テキストに おける高度の圧縮を達成する手段(A means For achicvin g a high degree or compaction on sca n−digiLtzed−printed LexL)J (IEEE Tra nsact 1nns on Computers、23 (11):1174 〜1179.1974年11月)参照)。それ以来、シンボル・マツチングを用 いる種々の圧縮システムが提案されてきた。(W、 K、Pra t を等の「 組合わせシンボル・マツチング・ファクシミリ・データ圧縮システム(Comb inedsymbnl matching facsimile data c ompression system)J (r’rocecdings nr  the IEEE、68 (7): 786〜796.1980年7月)、お ヨヒ米国特許第4゜091.424号、同第4.288.782号、同第4,4 10.916号、同第4.463.386号、同第4.499,499号および 同第4.606.069号参照)本発明は、実質的に改善されたマツチング・プ ロセス、ならびに圧縮率を増加する他の改善された特徴を用いる圧縮法である。
(発明の概要) 一般に、本発明は、下記のステップを含むイメージ圧縮法に対する種々の改善さ れた特徴を含んでいる。即ち、イメージにおけるシンボルを識別し、識別された 各シンボルにイメージにおけるその場所の表示を関連付け、識別された各シンボ ルをテンプレート・ライブラリからのテンプレートと比較して識別された各シン ボルを1つのテンプレートに突合せて、各テンプレートの表示と、イメージにお ける各シンボルに対する場所およびテンプレートに対する照合とを含むイメージ の圧縮された表示を生成するステップを含む。イメージは、典型的には2進ピク セル列イメージとして始まるが、本発明の方法は他のフォーマットで生じるイメ ージの圧縮にも適している。
1つの特質において、本発明は、第1のステップとして、イメージを予め圧縮す ることを特徴とする。例えば、2進ビクセル列イメージとして始まるイメージの 場合、ランレングス・コーディングが予備的圧縮ステップにおいて用いられる時 、シンボルは、同じ列あるいは同じか隣接する列内の少なくとも1つの黒いビク セルを持つ隣接行中の黒いビクセルの延長を関連付けることによって識別される 。
別の特質においては、本発明は、一致するテンプレートが新たなテンプレートと して見出されない各シンボルをライブラリに記憶することにより、イメージ圧縮 中のスクラッチ(scratch)からライブラリを生成し、これと一致する複 数のシンボルにより決定される表示により各テンプレートを定義することを特ル の黒いビクセルの分布により決定される黒いビクセルの一義的な空間的分布によ って定義される。前記分布は、例えば、シンボルの黒いビクセルの分布を平均化 することにより、あるいはテンプレートと一致する1つのシンボルで始めて、テ ンプレートと一致する他のシンボルにおける同じ場所のビクセルの予め定めた一 部がこれと一致しない場合にのみ、このシンボルにおけるビクセルを変更するこ とにより決定される。
別の特質においては、比較ステップは、エラー場所を識別し、エラー場所および シンボルとテンプレートの他の大域的特徴について複数のテストを実施し、1組 の予め定めたテスト・グループの少なくとも1つのグループの全てが通過される 場合にのみ、シンボルとテンプレートとの間の一致を宣言することを特徴とする 。2進ビクセル列イメージとして始まるイメージの場合は、エラー場所はシンボ ルあるいはテンプレートのいずれかのみであって両方ではない黒いビクセルを持 つエラー・ピクセル場所である。このエラー・ピクセル場所は、ランレングス・ コード化される。1つの適当なテストは、エラー・ビクセル場所における白いビ クセルを持つテンプレートまたはシンボルにおける各エラー・ピクセル場所と最 も近い黒いビクセルとの間の距離が予め定めた値より小さいかどうかである。別 のテストは、エラー・ピクセル場所の全ての隣接グループが予め定めたサイズお よび形状より小さいかどうかである。更に別のテストは、テンプレートとシンボ ルとの間の高さの差が、幅の差に対すると同様に、予め定めた値より小さいかど うかである。更に他のテストは、テンプレートにおける黒いビクセル数に対する シンボルにおける黒いビクセル数の比が予め定めた範囲内にあるかどうかである 。
更に他のテストは、テンプレートにおける黒いビクセル数およびシンボルにおけ る黒いビクセル数の最小値に対するエラー・ビクセル場所数の比が予め定めた値 より小さいかどうかである。更に他のテストは、テンプレートにおける白いビク セルに隣接する黒いビクセル数に対するエラー・ビクセル場所数の比が予め定め た値より小さいかどうかである。更に他のテストは、テンプレートに対するシン ボルの変位に対する全ての証拠が一貫しており、証拠がエラー・ビクセルおよび それらの隣接するビクセルの局部的な形態によって与えられるかどうかである。
本発明の斬新な特徴は、エラー・ビクセルの局部的形態のサイズ、形状および配 向に基く(先に述べた如き)テストの使用である。
他の特質において、本発明は、テンプレートに対する黒いビクセルの空間的分布 の境界により各テンプレートを表わすことを特徴とする。関連する特質において は、各テンプレートの表示は、テンプレートの外部境界を規定するためのフレー ム・テンプレートに対する照合と、テンプレートの内部境界を規定するためのア レーン、・テンプレート内の関連する位置を含む穴テンプレートのリストとを含 む。フレーム・テンプレートおよび穴テンプレートは、フレーム・テンプレート および穴テンプレートの境界の表示によって表わされる。
他の特質においては、本発明は、テンプレート特徴に従ってライブラリにおける テンプレートを指標付けすることを特徴とする。比較ステップは、この指標に従 って進行する。このように、一致しに(いテンプレートおよび特徴が一致を妨げ るテンプレートが考察される前に、特徴に基いて1つのシンボルと更に一致し易 いテンプレートがこのシンボルと比較される。
他の特質においては、本発明は、更なる圧縮を得るためにテンプレート表示の解 像度を低くすることを特徴とする。
望ましい実施態様においては、イメージの圧縮表示は、テンブレー1・・ストリ ームと、テンプレート照合ストリームと、行および列の位置ストリームとを含ん でいる。データ・ストリームへの情報の他の分割が可能である。これらストリー ムの少なくとも1つが更に圧縮されることが望ましい。
望ましい実施態様において、別の予め定めたサイズより大きい2つの領域間で予 め定めたサイズより小さいgA域を含むテンプレートが、1つ以上のテンプレー トへ分割される。更に、分割により形成される各テンプレートは、他のテンプレ ートに比較されてこれが一致する他のテンプレートとマージされることが望まし い。望ましい実施態様において、予め定めたサイズより小さいシンボルは排除さ れる。
望ましい実施態様において、2進イメージにおける各シンボルに対する場所の照 合は、所与のシンボルと先行するシンボルとの間の実際のオフセットと、所与の シンボルと先行するシンボルとにより規定されるシンボル対に対する標準的なオ フセットとの間の差によって表わされる。この標準的オフセットは、シンボル対 に対して最後に見出されたオフセットか、あるいはこのシンボル対に対して最も 頻繁に見出されたオフセットである。標準的オフセットと実際のオフセットとの 間の差は、2進イメージの解像度より低い解像度で決定される。
望ましい実施態様において、シンボルの読出し順序の近似が決定され、2進イメ ージの圧縮表示がこの読出し順序に従って生成される。この読出し順序は、1本 の線上のシンボルを見出してこれらシンボルを分類することにより決定すること ができる。1本の線を占める占めるは、この線に沿って探索するビームを用いる ことにより決定され、このビームのサイズは隣接する1つ以上のシンボルのサイ ズに従って変化する。ビームのサイズに対する垂直方向の境界が課される。
他の特質においては、本発明は、イメージ伝送システム(ファクシミリ・システ ムの如き)、イメージ・エンハンスメント・システム、あるいは先に述べたイメ ージ圧縮法により動作するイメージ記憶システムである。
本発明による圧縮は、例えば、8ページの300DPI文書に対するCCITT −3の25倍以−1−の圧縮率を達成することができる1、このため、各ページ は、生イメージの1メガバイトから本発明の方法による4キロバイトまで圧縮さ れる。
1つのテンプレート・ライブラリが全体にわたり使用されるので、圧縮率が文書 の長さと共に増加することを知ることが重要である。このように、本発明は、大 きな2進イメージを取扱うイメージ伝送あるいは記憶システムにとって特に利点 を有する。
(図面の簡単な説明) 図1は、2つの類似する文字がどのようにビクセル的に同一でないかを示す図、 図2は、2つの別個の文字がどのように僅かに小さなビクセル差を持つかを示す 図、 図3は、本発明の方法によるイメージ圧縮を用いるイメージ記憶システムのブロ ック図、 図4は、本発明の方法によるイメージ圧縮を用いるイメージ伝送システムのブロ ック図、 図5は、本発明によるイメージ圧縮システムにより実施されるステップを要約す るフローチャート、 図6は、ランレングス・コード化された2進イメージをシンボルに分割する方法 を示す図、 図7は、変位テストのための変位を推定するため使用されるエラーの構成を示す 図、 図8は、シンボルのテンプレートへの構成により達成可能なシンボル品質におけ る改善を示す図、 図9は、ビクセル列イメージのエツジをトレースすることによりシンボルを表示 する方法を示す図、 図10は、1つのフレームと少なくとも1つの穴として1つのシンボルを表示す る方法を示す図、 図11は、シンボルが同じ線−1−にない時に走査プロセスにおける傾斜がどの ようにシンボルを同じMl−に見せることができるかを示す図、図12は、その 時のシンボルの左または右に同じ線内のシンボルについて走査するためビームを 用いる方法を示す図である。
(実施例) 本発明の圧縮方法を用いるイメージ記憶システム10が、図3に示される。記憶 メモリー14を備えたプロセッサ12が、システム10の心臓部を形成している 。図示の如く、プロセッサ12は、イメージの表示を受入れるための少なくとも 1つのインターフェース16を含んでいる。この入力インターフェース16は、 例えば、イメージを生成するコンピュータに対する接続(connection )、あるいはイメージのハード・コピーからイメージの表示を捕捉するため使用 される走査装置に対する接続とである。プロセッサ12は、以下に更に述べる本 発明のイメージ圧縮方法の諸ステップを実行する。圧縮イメージは、記憶メモリ ーなくとも1つのインターフェース18へ再構成された表示を提供する。出力イ ンターフェース18は、例えば、イメージの処理および(または)表示のため使 用されるコンピュータに対する接続、あるいはイメージのハード・コピーを提供 するためのプリンタに対する接続である。望ましくは、出力インターフェース1 8は、入力インターフェース16から直接受取られたイメージと、記憶メモリー 14から呼出された再構成されたイメージとの両者を表示することができる。以 下に述べる理由のため、図3に示される記憶システムは、本発明のイメージ圧縮 システムがプロセッサ12に具現される時は、イメージ・エンハンスメント・シ ステムと見做すことができる。
本発明の圧縮方法を用いるイメージ伝送のためのシステムが、図4に示されてい る。イメージ伝送システl−の典型的な一例は、周知のファクシミリ伝送システ ムである。伝送端部においては、システム20が、少なくとも1つのインターフ ェース24を介してイメージの表示を受入れるメモリーを備えたプロセッサ22 を含む。ファクシミリ・システムにおいては、入力インターフェース24は、典 型的には、イメージのハード・コピーからのイメージの表示を捕捉するため使用 される走査装置に対する接続である。プロセッサ22は、以下に更に述べる本発 明の方法に従って入力イメージを圧縮する。プロセッサ22は更に、圧縮イメー ジを伝送するためのインターフェース26を含む。ファクシミリ・システムにお いては、出力インターフェース26は、典型的には、モデムを介する電話回線に 対する接続である。受取り端部においては、メモリーを備えた別のプロセッサ2 8が、イメージの伝送された圧縮表示を受入れるためのインターフェース3oを 含む。ファクシミリ・システムにおいては、入力インターフェース3oもまた、 典型的には電話回線に対する接続である。プロセッサ28は、本発明の方法に従 って圧縮された入力イメージを解除し、少なくとも1つのインターフェース32 にイメージの再構成された表示を提供する。ファクシミリ・システムにおいては 、出力インターフェース32は、典型的に、プリンタに対する接続である。
本発明によるイメージ圧縮システムは、イメージの表示を受入れて、このイメー ジをシンボルへ分割する。これらのシンボルは、文字(例えば、字、数など)あ るいは図形(例えば、ロゴ、チャートなど)を表わす。識別された各シンボルは 、テンプレートのライブラリに対して突合される。望ましい実施態様においては 、新たなシンボルが識別されると、テンプレート・ライブラリがスクラッチから 生成される。識別された各シンボルは、それまで生成されたテンプレートに対し て突合され、これが存在するならば、一致するテンプレート・グループへ追加さ れる。このシンボルがもし他のどれとも一致しなければ、これは新たなテンプレ ート・グループを形成して、後者のシンボルがこれと一致させられ得るようにこ のグループに対するテンプレートとして働く。全てのシンボルが一旦テンプレー ト・グループに分類されると、各テンプレートの表示が、望ましくはテンプレー ト・グループの全てではなくとも多数のメンバーの特徴に基いて構成される。
また、イメージにおける各シンボルの場所の表示(典型的には、行および列)お よびシンボルのテンプレート・グループが形成される。このため、典型的には4 つの情報ストリーム−テンプレート・ストリーム、テンプレート・コード・スト リーム、行位置ストーム、および列位置ストリームが、イメージの圧縮された表 示を構成する。情報のストリームへの他の分割もまた可能である。情報のストリ ームは、それぞれ更に圧縮されることが望ましい。
本発明の方法により圧縮されたイメージの解除は、簡単明瞭である。第1に、デ ータのストリームが圧縮プロセスの最終ステップとして更に圧縮されたならば、 これらのストリームが解除される。次いで、テンプレート・ライブラリがテンプ レート・ストリームから読出される。次に、テンプレート・コード・ストリーム が読出されると、テンプレート・コード・ストリームにおける各シンボルに対す るシンボル位置が、行位置ストームおよび列位置ストリームから決定され、テン プレートの表示が決定された位置にオーバーレイされる。
“本発明の望ましい実施態様によるイメージ圧縮のための諸ステップのフローチ ャートが図5に提示される。本方法のステップについては、順次取り−Lげる。
イメージの予@飲圧縮 イメージ圧縮システムの典型的な構成において、イメージは2進ビクセル列とし て提供され、黒いビクセルの結合された領域が文字、グラフィックス、などを表 わす。ピクセル列は、例えば、イメージをこのような形成で記憶するコンピュー タにより、あるいは2進イメージのハード・コピーをピクセル列に変換する走査 装置によって提供される。
先に述べた如き従来の2進イメージ圧縮システムは、このピクセル列について直 接作用する。、300DPI、即ち、約215.9X279.4mm (8,5 x11インチ)の2進イメージの場合は、ピクセル列を記憶するのに1メガバイ トのメモリーが要求され、このメモリーを走査するには数百ガロの動作が要求さ れる。このような負荷を軽減するため、本発明によれば、ピクセル列は、シンボ ル・マツチング・プロセスが開始される前に予め圧縮される。これは、著しい量 の記憶スペースならびに貴重な処理時間を節減する。予備的圧縮ステップは、圧 縮プロセス全体をスペースおよび時間において更に効率的にし、これは商業製品 にとっては重要な利点となる。
2進イメージのピクセル列表示を圧縮するための標準的な手法は、これをランレ ングス・コード化することである。これは、本発明の目的のためピクセル列を予 備的圧縮するのに非常に適する方法となる。2進イメージのランレングス・コー ド化表示をシンボルに分割するための手法は、次の項において述べる。
種々のランレングス・コード化法が、2進イメージの予備的圧縮のため用いられ る。例えば、ピクセル列表示は、Y軸表示に圧縮される。この手法によれば、イ メージにおける空でない各行(定数yの:ここではネーム)が、行の指標、およ び黒いビクセル領域に遭遇する最初のX座標の指標、前記領域が励起されるX座 標、黒いビクセル領域に入る第2のX座標、前記領域が励起されるX座標、など を整然と含むリストとしてコード化される。この表示は、ラスク走査プロセスに より有効に生成することができ、またシンボルのマツチングにより更に圧縮を行 うために非常に便利である。これは、水平帯域で生じる多数の白のスペースを含 むイメージ、例えば、1行おきのテキストの傾斜のないイメージに対する非常に コンパクトな表示となるという利点を有する。(y軸表示についてのこれ以上の 情報については、R,D、Merrill著[有効なコンピュータ探索のための 輪郭および領域の表示(Representations or cont。
urs and regions for e「[1cient comput er 5earch)J (CommunicaLtons or the A CM、16 (2):69−82.1973年211)参照)。以下本文におい ては、用語[ランレングス・コード化法]とは、ランレングス・コード化のいず れかのバリエーションを指す、。
他の予備的圧縮手法もまた適する。1つのこのような手法は、カッド・ツリー( quadtree)としてピクセル列を表わすことを含む。カッド・ツリーは、 2進イメージを階層的にコード化する。方形イメージは、北西、北東、南西およ び南東の四分象限と対応する4つのサブ領域へ分割される。1つの四分象限にお ける全てのビクセルが黒であるならば、対応するツリー・ノードが黒として記録 され、全てのビクセルが白ならば、ノードは白として記録される。四分象限が黒 と白の両ピクセルを含むならば、更なる細分割が必要となる。この場合、四分象 限はグレーとして記録され、循環的に更に細分割される。この表示は、テキスト ・イメージの如き黒または白の大きな連続する領域を持つイメージにはスペース 的に有効である。(カッド・ツリーのこれ以上の情報については、H,Same t著「カッド・ツリーおよび関連階層的データ構造(The quadtree and related hierarchical date 5truct ures)J (Computer 5urveys、16:1B7〜260. 1984年)参照)。
更に他の圧縮手法は、チェーン・コードを用いて境界を有効に表わすことを含む 。2進イメージは、イメージにおける各黒ビクセル領域に対する1組のチェーン ・コードとして表わすことができる。1つの領域に対するチェーン・コード波、 始点と、境界をトレースする4つまたは8つのコンパス方向に沿う一連の単位運 動の規定とからなっている。方向の最初の微分は、充分に平滑な領域を得るよう に表示を更に圧縮するために使用することができる。チェーン・コード表示が結 合された領域をピックアップするので、これはシンボル・マツチングを実行する イメージ表示として特に適当である。このチェーン・コード表示は、1つの領域 の面積を計算するために使用することができる、シンボル・マツチングにおいて  ゛重要である手順である。更にまた、領域のチェーン・コード表示は、マージ のために特に有効である。このように、混合グリッド・ファイル(下記参照)お よびチェーン・コード初期表示は、純粋なチェーン・コード表示へ有効に変換す ることができる。(チェーン・コードの更なる情報については、H,Freem an著[線描きイメージのコンピュータ処′+ylI(Computer pr ocesslng or 1ine drawing images)J (C omputer3urveys、6 (1): 57〜98.1974年3月) 参照。)グリッド・ファイルは、1つ以上の圧縮システムの利点をめるために使 用することができる。グリッド・ファイルは、2進イメージをXとyにおける規 則的あるいは非規則的な方形グリッドへ分けることにより作られる。各方形セク ションは次に、カッド・ツリーまたはチェーン・コードの如き他のある機構によ ってコード化される。このグリッドは、2進イメージの異なる領域に対するコー ディングの効率を最大化するように選定することができる。(グリッド・ファイ ルのこれ以上の情報については、J、Nievergelt等の[グリッド・フ ァイル:適合可能な対称的多重キー・ファイル構造(The grid fil e:An adapLible、symmetric、multikey fi lestructure)J (ACM Transactions on D aLabase SyStemS、9:3B−71,1984年)参照。)ビク セル列表示から予備的I(線表示へ2進イメーノを予備的圧縮するステップが、 2進イメージの提供者がこのような圧縮を既に行、っていたか、あるいは2進イ メージの提供者が自動的に圧縮表示を生じる(ピクセル列は即時ステップとして 生じない)場合には、要求されないことにr[目されたい。更にまた、2進イメ ージがビクセル列表示への表示圧縮において提供されるが、別の圧縮表示への変 換がシンボル・マツチングの目的のために選好されない場合がある。
44二2のシンポ西会9分割 2進イメージがビクセル列表示から予備的圧縮表示へ予め圧縮された後、イメー ジはシンボルへ分割される。本発明によれば、黒いビクセルの結合された各領域 がシンボルとして識別される。従1て、字および数に加えて、ロゴおよびチャー トの如き図形もまたシンボルと見做される。このことは、全ての先行する研究と は対照的である。例えば、米国特許第4,410.916号は、2進イメージが シンボル(例えば、字)と非シンボル(例えば、図形)に分割される分割法を開 示している。
事例として、2進イメージのランレングス・コード化表示を分割する有効な方法 が提示される。この方法は、一部をなす文字に対する識別子を黒い各線と関連さ せることにより働く。
この分割法の望ましい実施態様においては、2進イメージにおける黒の各線は、 最)一部から最下部へ、左方から右方への順序で操作される。各線毎に、その時 の線の真」ユの前の行の領域が調べられ、この領域と重なる全ての線が集められ る。
これらの絆の各々は、最−1一部から最下部の順序でその時の線の前に現れるの で、既にシンボルに割当てられていることになる。その時の線は、最も左方のこ のような重なり線と関連するシンボルへ追加される。再関連付けは、関連が適当 に表わされるならば、1回のポインタ操作により行うことができる。
分割プロセスの2つの状態が図6に示される。イメージの2行を分割した後、線 は3つの異なるシンボル(ラベルr aJ、「b」および(”cJで示される) に割当てられた1、3番[Jの行の線が処理されると、それぞオ]がその−[− の線のラベルを与えられる。真上に2つの線を持つ最後の締の場合は、最初のこ のような線のラベルが用いられる。以降の線(本例では、ラベル「b」と関連す るもの)が、その時の線(rcJ )のラベルと再び関連付けられる。
少数に過ぎないビクセルの小さなグループは、走査あるいは印刷のエラーの結果 としてしばしば2進イメージにおいて導入されることになる。これらの文字は、 以下に述べるように、圧縮プロセスを1.特にテンプレート・コードの表示およ び対応するシンボルの場所の最終の圧縮を中断し得る。本発明の望ましい実施態 様によれば、ある閾値(例えば、4)より小さい全てのシンボルが、シンボル識 別プロセスの間に排除される。
シンボルのマツチング 2進イメージ圧縮のためのシンボル・マツチングの従来の方法において、1回以 上のテストから得る数値結果は加重法で組合わされ、この結果は閾値とされてシ ンボルがテンプレートと一致するかどうかを判定する。本発明によれば、マツチ ング精度を改善するため、従ってエラーを低減するために示された別の手法が用 いられる。本発明の方法は1つの投票方式であり、これにおいては複数のテスト がシンボル/テンプレートの対毎に用いられる。通過した各テスト(シンボルと テンプレート間の類似性を示す)は、合計票に対して1票を寄与する。1回の一 致が宣言されるためには、予め定めた数の票が受取られねばならない。更に一般 に、テストは1つ以」二の予め定めたグループに分類することができ、少なくと も1つのグループ内の全てのテストは、宣言されるべき一致の場合に通過されね ばならない。=一実施例において、票は宣言されるべき一致に対して1Illl [iがあってはならない。
大半の用途に対して、2進イメージ圧縮の目的のための良好なシンボル・マツチ ング・プロセスが、走査により生じるエラーを勘定に入れなければならない。
このエラーは、主として走査グリッドに対する文字の整合における変位による量 子化エラーであるものと推定することができる。これに従えば、エラーは、シン ボルのエツジ(黒と白のビクセルの接合点)においてのみ生じると予期される。
しかし、量子化エラーが走査グリッドに対する同じシンボルの異なる位置と関連 するので、黒いビクセルの全数が2つの類似するシンボルに対して略々〜・定と なるものと予期される。更にまた、エラー・ピクセル数は、2つの類似するシン ボルに対して小さいものと予期される。a後に、走査グリッドに対する文字の推 定変位に対する証拠は、シンボル全体にわたって一定でなければならない。これ らの観察は、シンボルとテンプレート間の一致を判定するための下−記の類似性 テストを示唆する。
エツジ・テスト1 全でのエラー・ビクセルがエツジの固定距離d ed*。内 になければならない。
エツジ・テスト2.エラー・ビクセルのブロックが(d、xd、)の2乗より大 きいことはない。
エツジ・テスト3ニシンポルとテンプレートの高さの差が、固定領域d11、よ り小さいかあるいはこれと等しくなければならず、また幅についても同様である 。
濃度テスト・テンプレートにおける黒いビクセル数に対するシンボルにおける黒 いビクセル数の比が、範囲(1±d、l!ne++J以内になければならない。
エラー・テスト1 テンプレートにおける黒いビクセル数、およびシンボルにお ける黒いビクセル数の最小値に対するエラー・ビクセルの比が、範囲d 111 11111111111より小さくなければならない。
エラー・テスト2:テンプレートあるいはシンボルにおけるエツジ(即ち、白い ビクセルに隣接する)において生じる黒いビクセルに対するエラー・ビクセルの 比が、範囲4.□−dll+6111..++より小さくなければならない。
変位テスト、テンプレートに対するシンボルの全ての推定変位が一定でなければ ならない。
他のテストもまた可能である。
エツジ・テスト1は、例えば、各エラー・ピクセル場所と、エラー・ビクセル場 所に白いビクセルを有するテンプレートまたはシンボルにおける最も近い黒いビ クセルとの間の距離が予め定めた値より小さいかどうかを調べることにより実現 される。逆のテストもまた用いることができ、即ち、各エラー・ビクセル場所と 、エラー・ビクセル場所に黒いビクセルを有するテンプレートまたはシンボルに おける最も近い白いビクセルとの間の距離を調べることができる。
変位テストは、テンプレートに対するシンボルの推定変位を推定するための方法 を要求する。変位を推定するための1つの方法は、同じ源のエラー・ビクセルの グループ、即ち、テンプレートにおける全ての黒いビクセルあるいはシンボルに おける全ての黒いビクセルであるグループを調べることである。エラー・ビクセ ル場所の全体マツプは、2つの別個のマツプ、即ち、(1)テンプレートにお“  ける黒であるエラー・ビクセルのマツプ(テンプレート・エラー・マツ力と、 (2)シンボルにおける黒であるエラー・ビクセルのマツプ(シンボル・エラー ・マツプ)とに分割することができる。これらの種々のエラー・マツプにおける ビクセルの連続グループは、テンプレートに対するシンボルの変位から生じたも のと推定することができる。例えば、テンプレートにおける黒いビクセルの右側 に隣接するテンプレート・エラー・マツプにおける2つのエラー・ビクセルの垂 直列は、エラー・ビクセルから隣接するビクセルに向けて遠ざかるように変位し たシンボルによるものである。このような形態の事例が、図7のaに示される。
変位の推定に用いることができるエラー・ビクセルの別のパターンは、同じ源の 3つの連続するエラー・ビクセルの三角形である。例えば、このような形態の3 つの連続エラー・ビクセルがテンプレートのエラー・マツプに見出され、3つの エラー・ビクセルを囲む2×2の方形内に該当するビクセル場所はテンプレート における黒であるならば、変位は、エラー・ビクセルから隣接するビクセルに向 けて遠ざかるように推定することができる。一方、隣接するビクセルがテンプレ ートにおける白であるならば、隣接するビクセルから遠ざかる変位を推定するこ とができる。反対方向の推定変位は、シンボルのエラー・マツプにおけるエラー ・ビクセルのこのような三角形から推定することができる。これらの形態の事例 は図7のb −eに示される。
種々のエラー・マツプからのエラー・ビクセルの局部セットの他の大きさ、形状 および配向は、変位の一貫性を比較する目的のため変位を推定するために用いる ことができる。変位を推定するための三角形に基くテストが、当該方法の望まし い実施態様において用いられる。
全ての変位が一貫していると見做されるかどうかの判定は、推定される変位の全 てが同じものであることを要求することにより、あるいはある百分率が同じこと 、あるいは対が反対方向にないこと、あるいは全てが相互にある角度範囲内にあ ることを要求するが如き弱い制約により、あるいはこれらのテストの組合わせに よって行うことができる。望ましい実施態様においては、全ての推定される変位 の同一性が要求される。
エツジ・テスト1および2、および変位テストが特にエラー・マツプ(全体的マ ツプ、テンプレート内にマツプ、およびシンボル・マツプ)におけるビクセルの 局部的な形態を探すことに注目されたい。エラー・ビクセルの局部セットの隣接 ビクセルの大きさ、形状、配向およびこれに対する関係に基く種別的テストを用 いることは、本方法にとって新規である。本文に述べた特定のテストは望ましい 実施態様において用いられるが、このようなテストは全て本発明の範囲内に含ま れる。
これらのテストをシンボル/テンプレートの対に用いるためには、シンボルおよ びテンプレートは、例えば、2つの隅部を整合することにより相互に整合されね ばならない。1つのビクセルまたは1つ以上のビクセルだけ異なる整合状態もま たテストされることが望ましく、複数の潜在的な整合を考慮することを必要とす る。
各テストにおいて指定される種々の範囲は固定される必要はない。望ましくは、 これら範囲はシンボルの大きさの関数として変更される。これは、人間がシンボ ルの相違をシンボルの大きさが顕著に異なるものとして知覚する故である。例え ば小さなフォントの場合、ビクセル数における僅か数%の相違は重大であるが、 大きなフォント・サイズにおいては、同じ百分率は重大とは感じられない。異な る大きさにおける異なる範囲を使用できることは、比較的小さなサイズにおける 相違を犠牲にすることな(、比較的大きいサイズにおける更に積極的なマツチン グを許容し得る。
一例として、上記テストに対する範囲の適当な値は、d tdgm= 1、屯= 2、d、、、、=2、d、+、、、1..=0.50、d、、、、、、、、、、 =0.20 (150ビクセルより少なければ)=(L 40 (200ビクセ ルより大きければ)、および他の方法で内挿されて、d edge dl@l^ r l l e−= 0・ 51である◎チンプレートの表示 シンボル・マツチングを用いる2進イメージ圧縮の多くの先行方法においては、 各テンプレート・グループにおいて遭遇する第1のシンボルがこのグループに対 する事例として働く。本発明によれば、最初のシンボルと一致した他の全てのシ ンボルの外観についての情報を捨てる代わりに、全てのシンボルの幾つかを用い てテンプレート表示を構成する。この方法において、形成されたシンボルのどれ かよりも「良く」見えるテンプレートを構成することができる。再構成された2 進イメージは、2進イメージにおいて一致した文字間の類似性がシンボルの形状 について更なる情報を提供する故に、実際に改善されたイメージとなり得る。平 滑化技術とは異なり、当該方法は一般に高頻度の情報を犠牲にすることなく、高 頻度のエラーを低減する。このような特性の故に、当該方法は、イメージ・エン ハンスメント技術ならびにイメージ圧縮方法として使用することができる。予期 し得るエンハンスメントの事例が図8に示され、同図においては、ディジタル化 イメージにおけるその原稿形態における単語rhereJの拡大イメージと、再 構成されたイメージにおける同じ単語の拡大イメージとが提示される。文字、特 に複数のシンボルのテンプレートへの構成により得られた文字「「」の改善され た品質に注目されたい。
このような「平均化」プロセスを実施し得る1つの方法は、テンプレートを形成 する大半のシンボルがこの黒のビクセルを持ちさえすれば、単に黒のビクセルを テンプレートに保持するだけである。少数のシンボルが平均化される時に生じ得 る平均化プロセスの不自然さくar目fact)を避けるため、別の構成方法は 1つのシンボル、例えば遭遇した最初のシンボルの外観を用いることであるが、 他のシンボルが所与のビクセルの変更に票を投じることを許容することである。
この票は、他のシンボルの特定部分、例えば3分の2が原稿シンボルと一致しな ければ成功することになろう。多数のシンボルからなるテンプレートの場合は、 効果は平均化法よりもはるかに著しいが、少数のシンボルを持つテンプレートの 場合は、1つのシンボルに対してより大きな加重が与えられ、平均化の不自然さ を排除する。先に述べた利点を得るテンプレート構成のための他の手順も可能で ある。
テンプレートの構成は、圧縮プロセス間の多くの段階で行うことができる。一実 施例によれば、「平均化」は、シンボルがテンプレートのライブラリにおけるテ ンプレートと突合される時、使用中のプロセスとして行われる。このモードにお いては、ライブラリにおけるテンプレートの表示は、シンボルがテンプレート・ グループに突合される時に、連続的に変化する。これは、テンプレートが徐々に シンボルの平均的特徴と似て(るために、最終的にはライブラリに記憶されたテ ンプレート数を低減し、結果として更に高い頻度の一致をもたらす。
別の実施例によれば、全てのシンボルがテンプレート・グループに入れた後での み「平均化」が行われる。このモードでは、いずれかのテンプレート・グループ の(典型的には)最初に遭遇したシンボルがマツチング・プロセスにおいて用い られる。プロセスの終りに生じる平均化は、テンプレート・グループにおけるシ ンボルの特徴の改善された表示を折供するように働く。
上記の動作モードのいずれかにおいて、シンボルがテンプレートに分類された後 に、2つのテンプレートの表示が上記の基準の下に一致するならば、2つのテン プレートがマージされることに注目されたい。テンプレートの構成の平均化の効 果の故に、例え2つのテンプレートと一致させられたシンボルが一致しなかった としても、2つのテンプレートが一致し得る。テンプレートのマージは、表示さ れねばならないテンプレート数を更に低減し得る。一実施例によれば、テンプレ ートは、個々にマツチングすることにより各ページに対して生成することができ 、次いで幾つかのページからのテンプレートがマージされる。ページ内の最初の マツチング・プロセスに対して異なるマツチング基準を用いることができ、2番 目のマージ・プロセスがページに跨る。
2進イメージにおけるシンボルが処理される時、新たなテンプレートが見出され ると、初期ライブラリを新たなテンプレートで追補することによって、テンプレ ートのライブラリが生成される。初期ライブラリは、予め記憶されたシンボル( 例えば、特定の用途において特に頻繁に使用されるもの)を含み、あるいは空で ある。もし予め記憶されたシンボルが用いられるならば、ライブラリを追補する ことは必要ない。更にまた、予め記憶されたシンボルと対応するテンプレート表 示をイメージの圧縮表示へ組込むことは、これらのテンプレート表示もまた解除 を行う装N(圧縮を行う装置と同じものでないこともある)に予め記憶されるの で、必要ではない。
テンプレートは1.所与のシンボルと一致し得るテンプレートが最初にアクセス されるようにライブラリに記憶されることが望ましい。従来の方法(例えば、米 国特許第4.606.069号)においては、一致するテンプレートを見出すの に要する時間を短縮するように、テンプレートは発生頻度に従って記憶される。
本発明によれば、速度および効率の増加を結果として生じるように示された別の 記憶方式が用いられる。望ましい実施態様においては、テンプレートは、黒いビ クセルの高さ、幅、数などのマツチング・プロセスに適する特徴により指標付け されたハラシュド(hashed)構造で記憶される。
前記の指標付は方式では、少なくとも2つの操作方法が可能である。1つのモー ドにおいては、一致が見出されるか、あるいはテンプレートが尽きるまで、所与 のシンボルがテンプレートに比較される。テンプレートは、最も一致しそうなも のが最初に比較されるように、指標付は方式により決定される順序で比較される 。しかし、望ましい操作モードにおいては、この指標付は方式は、テンプレート のグループを分類するために使用され、所与のシンボルは、その指標付けされた 特徴が一致を阻むテンプレートには比較されない。
前記の指標付は方式はまた、突合せが行われる速度を改善するためマツチング・ プロセスにおいて用いられるテストの順序付けを調整するために使用することも できる。
本発明の別の特質によれば、テンプレートの記憶された表示が圧縮される。テン プレートの圧縮表示は、マツチングおよびテンプレート構成プロセス全体にわた って使用され、あるいはまた、テンプレートはこれらのプロセスが完了した後に 圧縮することができる。このことは、テンプレート表示が伝送されるべきイメー ジ伝送システl〜において特に有利である。例えば、テンプレートは、CCIT T−3でコード化される。あるいは、ランレングス・コード化表示は、適合ハフ マン・コードまたはレンペルージブ(Lempe I−ZI v)圧縮の一変形 の如き適合方法により更に圧縮される。
あるいはまた、典型的な文字の繋がりおよび縦方向の安定度を利用する表示の変 更を用いることができる。ビクセルをランレングス・コード化する代わりに、文 字の境界をトレースすることができる。図9は、エツジのこのようなトレースが 実行可能である1つの方法を示す。同図においては、字rbJのビクセル列表示 の最も左のエツジがイメージにおける最初の黒いビクセルからトレースされる。
トレースの規則的構造に注目されたい。最大の動きはrLEFT OJである。
この規則性は、更なる著しい圧縮を許容し得る。
更にまた、2進イメージ表示は、同じカラー・ビクセルの結合した領域へ分解す ることができる。このシンボルは、1つの行内の最も左方と最も右方の黒の線間 に生じる全ての黒の締を排除することにより、1つの1フレーム」とフレーム内 の幾つかの「穴」へ分解することができる。排除された線は、パリティが反転さ れた時、フレームにおける穴を構成する。図10は、1つのフレームに分解され た字「t)」のビクセル列表示と穴の反転イメージとを示している(本例では、 2つとも)。後者のイメージは、それ自体が、これを別個のシンボルとして取扱 い、かつこれをテンプレート・グループに入れることにより循環的に圧縮するこ とができる。次いで、テンプレートの原稿イメージが、1つのフレーム・テンプ レートおよびフレームにおける関連する位置を持つ穴テンプレートのリストの照 合によって表わすことができる。幾つかのフレーム・テンプレートにおける同じ 穴イメージを使用できることは、更なる圧縮を許容する。圧縮プロセスの循環的 性格の故に、これらの穴はそれ自体がそれらに更なる穴を持ち、等などとなる。
各レベルにおいて、フレームのパリティおよびその穴が反転して、黒いフレーム における白い穴、白いアレーン・における黒い穴11、などの如くである。
フレームおよび穴の表示の利点は、文字の構造が、特にそれらの境界の形状に関 して更によく表わされることである。その結果、(先に述べたように)テンプレ ートをそれらの境界のトレースにより表わすことは更に有効である。
テキストを走査しあるいは印刷する際のエラーは、近傍文字を一緒にさせ得る。
このような文字をそれらの2つの部分に分けることにより、更なる冗長性が圧縮 において活用し得るが、これは、−緒になった対は一致しにくいが、この2つの 部分が他の文字と一致し得る故である。少数の(例えば、2つの)ビクセルの1 つの縦方向線が1つのシンボルの2つの半部と接触する時は常に、−緒になった 文字の切り分けがプロセスのシンボル識別ステップにおいて行うことができる。
しかし、本発明の望ましい実施態様によれば、この切り分けは、全てのシンボル がテンプレート・グループに突き合わされた後に、テンプレートについて行われ る。テンプレートが1つ以上の成分に切り分けられた後、各成分が他のテンプレ ートと比較され、あるいはもし一致するテンプレートが見出されるならば、この テンプレートとマージされることが望ましい。テンプレートはグループにおける シンボルの「平均的な」特徴を表わすことが望ましいため、−緒になるエラーは 、通常は平均化されることになる。このため、再構成されたイメージは、実際に は、−緒になった文字の減殺により改善されることになる。
このような[!がり(brjdge)Jを内部に偶然持つテンプレートの切り分 けを避けるため、望ましくは2つの半部は充分な大きさであることが要求される 。特に、各半部は、少な(ともある高さであることが要求され得る。また、一方 は、半部の一方または両方が存在するテンプレートと一致することを要求する。
(テンプレート表示において平均化され得るが)前記繋がりが削除されないこと が望ましいことに注目されたい。このように、例え実際にこのような繋がりを持 つシンボルが切り分けられても、この繋がりは、イメージが再構成される時に現 れることになる。
テンプレート・コードおよびシンボルの場所の表示本発明により圧縮される2進 イメージの再構成を許容するために、各シンボルと対応するテンプレートへの照 合および2次元の各シンボルの位置が、コード化されねばならない。テンプレー トの照合およびシンボルの位1冑の表示は、圧縮されることが望ましい。
圧縮量は、テンプレート照合およびンンポル位置の初期のコード化に依存するこ とになる。大半のシンボルがテキストからの文字である場合の理想的な状況は、 シンボル情報が読出し順、即ち、人が文字を読む順序に並べられる場合である。
これは、文字およびそれらの位置が、このような視点から見て、最小のエントロ ピを有する故である。例えば、言語のスペリング規則による、それらの位置によ る、文字を直線−1−に整列するため規格による、カーニング(kcrning :飾りひげ)による、などの文字の表示冗長性である。
従うて、望ましい実施態様においては、文字の読出し順の近似が再構成される。
光学的文字認識システムとは異なり、このようなタスクは完全に自動的に取扱わ れねばならず、またイメージについての最小限の仮定数を行う方法で取扱われね ばならない。例えば、2進イメージが英語のテキストを表わすこと、あるいはロ ーマ字が使用されることさえも仮定されるべきてはない。一方、再構成の忠実度 ではなく小さなエラーのみが圧縮率に影響を及ぼす故に、完全な操作は不要であ る。
読出し順の再構成は、傾斜することがある(ファクシミリ・システムでは典型的 な状況である)原稿を走査することにより原稿の2進イメージ表示が得られた場 合にはm純なタスクではない。読出し順を再構成することに対する1つの解決法 は、テキスト中の各行を追跡することを含む。本文に述べる方法は、2段階プロ セスを含む。最初に、1行内の全ての文字が位置決めされる。第2に、文字は、 これを正しい読出し順に配置する列位置似より仕分けられる。
最初のステップは下記の如くに働く。ページにおける最初の文字が、最上部から 最下部へ、左方から右方へ2進イメージの記憶された表示を「走査」することに より見出される。この文字は、行内の最初の文字であるか、あるいはそうではな い。次に、イメージが文字1n位に逆方向に走査されて、同じ行における文字を 最初の文字として明瞭に見出し、最後に1行の最も左方の文字で終わる。次に、 このイメージは再び順方向に走査され、行中の全ての文字が収集される。走査ス テップは、イメージのテキスト行における傾斜の故に、水平に整合されたように 見える他の行における文字により欺隔されないように、注意深く設計されねばな らない。図11は、1つのイメージのテキスト行における傾斜がどのように文字 を同じ行にあるかのように見せ得るかの事例を提示する。更に、口」、日」、「 −」および「%」の如き2つのシンボルからなる文字は、1つの行に一緒に分類 してはならない。
その時の文字から始まる走査の望ましい方法は、水平の「ビームj内の少なくと も1つの線を持つ文字に対して左方または右方に見ることにより働く。文字に対 する走査のため使用されるビームは、図12に示される事例において示される。
本例では、このビームが「1」上の点を見出したことに注目されたい。ビームの 高さは、最初は走査プロセスにおいて見出された最初の文字の高さであることが 望ましい。より高い文字が走査される時は常に、このより高い文字の全高を含む ようにこのビームが拡げられる。しかし、より短い文字が走査される時は、ビー ムは新たな文字の高さまで縮められるこはなく、最後の幾つかの文字の高さの加 重された移動平均(running avcrage)を取ることにより計算さ れた高さに縮められることが望ましい。これは、例えば、新たなビーム高さを( nl)/nx元のビーム高さと、1/n×次の文字の高さとの和として計算する ことによって近似化される。但し、nは減衰の強さを規定するパラメータである 。
幾つかの文字がビーム内に入るならば、全てがその時の行へ加えられる。(これ らは、文字が水平位置で分類される以降のステップにおいて正しい順序に分類さ れることになる。) 他の行からのなにかがその時の行からのなにかと不都合にも関連することを防止 するため、ビームは水平および垂直方向に制限されることが望ましい。ある数の ビクセル以上の高さに伸ばすことは決して許されない。更にまた、ある数のビク セルより水平方向に遠い文字は、走査に含まれないことが望ましい。
所与の行内の全ての文字が見出されると、これらの文字は近似的な読出し順序に 水平位置で分類され、それらのテンプレート・コードおよび位置がこの順序でコ ード化される。
1つのページにおけるテキストの位債決めの規則性は、更なる圧縮の潜在的根源 であり、これにおいては1つの文字の位置は前の文字の位置から全く予測可能で ある。大半の場合において、この文字は底部で縦方向に整合されて、標準的な文 字間のスペースにより前の文字、から分離されることになる。ある場合には、例 えばカーニング(kerning:飾りひげ)の故に、あるいは文字が[前にあ るJrjJ上のテンプレートである故に、あるいは文字が1つの行における最初 のものである故に、文字間の間隔は変化することになる。それにも拘わらず、略 々規則的な変化の間隔は、文字の絶対的なXおよびy位置ではな(、前の文字か らのそれらのオフセット、例えば、前の文字の右下隅からその時の文字の左下隅 までの変位をコード化することにより利用することができる。更にまた、変態の 最初の2つの根源−即ち、カーニングおよび多重シンボルの文字は、(前に起生 じたならば)デフォルトの文字間隔としてその時の文字の最後の結果的な発生間 のスペースを用いることにより、あるいは対に対する文字間のスペースの最大頻 度値(モード値)をコード化して、このモードからの差を文字間スペースの表示 として用いることにより、処理することができる。最後に、このデフォルトの文 字間スペースが用いることができる回数が、近似ミスを的中として取扱われるこ とを許容することによって最大化することができる。これを行う1つの方法は、 低下した解像度で検査を行うことである。無論、エラーは伝搬することがある。
もしこれが受入れ難ければ、近似ミスは文字のコード化位置をして真の位置から 少量のみ異ならせるはずであり、この量は1ビクセルが適当である。
テンプレート・コードのシーケンスは、ハフマン・コーディング法により、ある いはシンペルージブ圧縮法、あるいは類似の方法によりスペリングにおける規則 性を利用するため、種々のテンプレートの起生頻度の変動によって更に圧縮する ことができる。シンボルの位置情報もまた、このような方法によって更に圧縮す ることができる。
実際に、テンプレート・コードあるいはシンボルの位置情報は、それぞれテンプ レート・ライブラリおよび座標位置への明確な指標付けによるのではなく、圧縮 された表示において示唆的に示すことさえできる。例えば、各テンプレートと一 致する文字の位置は、テンプレート表示事態の直後に与えることができ、これに より関連するテンプレートが示唆的に示される時、これらのシンボルに対するテ ンプレート・コードの明確な表示の必要を不要にする。
要約すれば、上記の諸方法により、典型的に4つの情報ストリームが生成される 。即ち、テンプレート表示シーケンス、シンボルと対応するテンブレー1・照合 シーケンス(2進イメージが主としてテキストであるならば、略々続出し順序に おける)、シンボルの行位置のシーケンス、およびシンボルの列位置のシーケン スである。これらストリームはそれ自体で、2進イメージの著しく圧縮された表 示を構成する。しかし、これらのストリームは、開示された手法によりそれぞれ 更に圧縮することができる。
当該方法は、例えば、8ページの300DPI文書に対してCCITT−3で生 じるものの25倍以上の圧縮率を達成するように示された。このため、各ページ は、本発明の方法により、1メガバイトの化イメージから4キロバイトまで圧縮 される。1つの文書のページが別々に取扱われないので、圧縮率が文書の長さと 共に増大することを知ることは重要である。
ある実施例においては、圧縮イメージを開始イメージよりも低い解像度で記憶し あるいは伝送することが望ましい。例えば、300DPIの文書を100DPI で記憶しあるいは伝送することを欲することがある。これは、ビクセルの間引き により、あるいは実数または整数の除数でビクセル数を減じる何らかの方法にお いてテンプレート表示を更に圧縮することによって行うことができる。解除にお いては、テンプレートを再生するため内挿法を用いることができる。無論、ある 品質が失われようが、多くの用途において、達成された圧縮の増加は圧倒的な要 因である。このような解像度の低下が圧縮プロセスにおける早期のステップでは 行われないことが望ましい。これは、高解像度がシンボル・マツチング・プロセ スを補佐する故である。従って、高解像度でイメージが走査され、シンボルが識 別されて突き合わせられるべきであり、解像度の低下は、テンプレート・ライブ ラリか確立された後にのみ行われるべきである。
非2進イメージの圧縮 望ましい実施態様はビクセルが行と列に分布された2進イメージの圧縮に関して 記述されるが、本発明は異なる空間的分布により非2進イメージに対しても同様 に適用し得る。例えば、テキストおよび図形を表わす第1のタイプと、バックグ ラウンドを表わす第2のタイプとにビクセルを分類し、この圧縮法を第1のタイ プのビクセル・パターンに用いて、異なる方法を用いてバックグラウンドを圧縮 することにより、グレースケール・イメージあるいはカラー・イメージが圧縮さ れる。このように、テキスト文書は、バックグラウンド情報を保持しながら白で ないパックグラウンドに印刷される場合でも圧縮される。更にまた、ビクセルが 第1または第2のタイプのいずれであるかについての判定は、そのグレースケー ル値のみに基くのではな(、コンテキストまたは他の情報にも基く。最後に、グ レースケール図形はおそらくは中間調、ディザリング(dithering)あ るいは他の予備的処理で別佃に圧縮されるが、グレースケール情報は、本発明の 方法によりテキストが圧縮できるように、図形およびバックグラウンドからテキ ストを弁別するために用いられる。(これらの可能性のあるものは、2進黒白イ メージに対しても同様に妥当する。)非2進イメージに使用される別の方法は、 ビクセルを同様なカラーのシンボルに分類し、これらを形状のみに基いて突き合 わせ、かつその関連するテンプレートとそのカラーの表示を各シンボル毎に記憶 することを含む。
非2進イメージに使用される別の方法は、イメージをビット面に分離し、これら ビット面の一部または全てを本発明の方法を用いて圧縮することを含む。ビット 面の一部と主なシンボルに基くパターンとの間にある相関関係がある限り、当該 方法は、非シンボル・マツチング法よりも良好にイメージを圧縮することができ る。
本発明の方法は、例えば、テンプレートを、各ビクセルの値について投票ではな く平均化により得られるグレースケール・イメージとして保持することにより、 2進原稿からさえ非2進イメージを同様に生成するために使用することができる 。
この方法は、各シンボルのエイリアス除去表示を自動的に現像することを可能に し、これがイメージ・エンハンスメント方法として本発明の用途において特に有 効である。
イメージは、均等間隔の行および列において構成することに限定される必要がな い。例えば、走査プロセスは、Xおよびy方向に異なる解像度を持つことがある (200X100ビクセルで走査される標準的なファクシミリ・イメージにおけ る如く。これにより方形ビクセルではな(矩形状ビクセルをもたらす)。任意の 固定あるいは不規則な面のモザイク法に基く他のビクセル構成が可能である。
本発明の変更および修正が当業者には着想されようことが考えられ、かかる変更 および修正の全てが請求の範囲内に含まれるべきである。例えば、イメージ全体 ではなく、連続あるいは非連続のイメージの各部を圧縮し、あるいは(例えば、 図形的な識別シンボルではなくテキスト的な識別シンボルのみの如き)機能、大 きさ、形状、位置あるいは他の特徴により弁別される識別シンボルのサブセット に圧縮することに本方法を用いることは、本発明の範囲内に含まれる。
〆ヅ 浄書(内容に変更なし) FIo、6 c縮埠鹸ters appear 補正書の翻訳文提出書 (特許法第184条の8)

Claims (84)

    【特許請求の範囲】
  1. 1.イメージを圧縮する方法において、第1のタイプと第2のタイプのピクセル に基く第1のイメージ表示を予め圧縮して、前記イメージの予め圧縮された表示 を生成し、前記イメージの前記予め圧縮された表示におけるシンボルを識別し、 複数の識別されたシンボルをテンプレート・ライブラリからの少なくとも1つの テンプレートの各々と比較して、識別されたシンボルをテンプレートに突き合わ せ、 テンプレート表示と、場所の表示と、前記イメージにおけるシンボルに対するテ ンプレートとを含む前記イメージの圧縮表示を生成することを含むイメージを圧 縮する方法。
  2. 2.イメージの前記第1の表示が、ランレングス・コード化により予め圧縮され る請求の範囲第1項記載の方法。
  3. 3.前記第1の表示がピクセルの行および列に基いており、シンボルが、同じ列 かあるいは同じか隣接する列における前記第1のタイプの少なくとも1つのピク セルを有する前記予め圧縮された表示の隣接する行における前記第1のタイプの ピクセルの線を関連付けることによって識別される請求の範囲第2項記載の方法 。
  4. 4.イメージを圧縮する方法において、第1のイメージ表示におけるシンボルを 識別し、複数の識別されたシンボルをテンプレート・ライブラリからの少なくと も1つのテンプレートの各々と比較して、識別されたシンボルをテンプレートに 突き合わせ、イメージ圧縮の間に、前記ライブラリが、一致するテンプレートが 新たなテンプレートとして見出されないシンボルを前記ライブラリに記憶するこ とにより追補され、テンプレートが一致する複数のシンボルにより決定される表 示により規定され、 テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルに対する テンプレートとを含む前記イメージの正縮された表示を生成することを含むイメ ージを圧縮する方法。
  5. 5.各テンプレートがピクセルの一義的な空間的分布により規定され、該分布が 、前記テンプレートと一致する複数のシンボルのピクセルの分布により決定され る請求の範囲第4項記載の方法。
  6. 6.テンプレートを規定するピクセルの分布が、前記テンプレートと一致する複 数のシンボルのピクセルの分布を平均化することにより決定される請求の範囲第 5項記載の方法。
  7. 7.テンプレートを規定するピクセルの分布が、前記テンプレートと一致する1 つのシンボルを取り、該テンプレートと一致する他のシンボルの予め定めた断片 以上が前記ピクセルと一致しない場合にのみ、前記シンボルにおけるピクセルを 変更することにより決定される請求の範囲第5項記載の方法。
  8. 8.イメージを圧縮する方法において、イメージの第1の表示におけるシンボル を識別し、複数の識別されたシンボルをテンプレート・ライブラリにおける少な くとも1つのテンプレートの各々に比較して、識別されたシンボルをテンプレー トに突き合わせ、該比較ステップが、エラー場所を識別して、該エラー場所およ びシンボルおよびテンプレートの他の大域的特徴について少なくとも1回のテス トを行い、1組の予め定めたテスト・グループの少なくとも1つにおける全ての テストを通過する場合にのみ、シンボルとテンプレートとの間の一致を宣言する 二とを含み、 テンプレート表示と、場所の表示と、前記イメージにおけるシンボルに対するテ ンプレートとを含む前記イメージの圧縮表示を生成することを含むイメージを圧 縮する方法。
  9. 9.前記少なくとも1回のテストにおける各テストを通過する場合にのみ一致が 宣言される請求の範囲第8項記載の方法。
  10. 10.前記第1の表示が、第1のタイプと第2のタイプのピクセルの行および列 に基くものであり、前記比較ステップが、前記シンボルまたは前記テンプレート の両方ではなくその一方のみにおける前記第1のタイプのピクセルを持つエラー ・ピクセル場所を識別し、前記エラー・ピクセル場所および前記シンボルと前記 テンプレートの他の大域的特徴について少なくとも1回のテストを行うことを含 み、シンボルとテンプレートとの間の一致は、1組の予め定めたテスト・グルー プの少なくとも1つにおける全てのテストを通過する場合にのみ宣言される請求 の範囲第8項記載の方法。
  11. 11.前記エラー・ピクセル場所がランレングス・コード化される請求の範囲第 10項記載の方法。
  12. 12.各エラー・ピクセル場所と、前記テンプレートにおける第1のタイプの最 も近いピクセル、または前記エラー・ピクセル場所における第2のタイプのピク セルを有するシンボルとの間の距離が予め定めた値より小さければ、前記少なく とも1回のテストの1つを通過する請求の範囲第10項記載の方法。
  13. 13.各エラー・ピクセル場所と、前記テンプレートにおける第2のタイプの最 も近いピクセル、または前記エラー・ピクセル場所における第1のタイプのピク セルを有するシンボルとの間の距離が予め定めた値より小さければ、前記少なく とも1回のテストの1つを通過する請求の範囲第10項記載の方法。
  14. 14.前記少なくとも1回のテストの1つが、あるエラー・マップにおけるエラ ー・ピクセルの連続するグループのサイズ、形状および配向に依存する請求の範 囲第10項記載の方法。
  15. 15.エラー・ピクセル場所の全ての連続するグループが予め定めたサイズおよ び形状より小さければ、前記少なくとも1回のテストの1つを通過する請求の範 囲第14項記載の方法。
  16. 16.前記テンプレートに対する前記シンボルの推定変位が一定であれば、前記 少なくとも1回のテストの1つを通過する請求の範囲第14項記載の方法。
  17. 17.変位が、エラー・ピクセル場所の連続的なグループのサイズ、形状および 配向、および隣接するピクセルに対するそれらの関係から推定される請求の範囲 第16項記載の方法。
  18. 18.前記推定された変位が、4番目のピクセルがテンプレートにおける三角形 のピクセルとして同じかあるいは異なるパリティをそれぞれ有するかどうかに従 って、該三角形を囲む方形における4番目のピクセルに対して近づくかあるいは これから遠ざかるように、、テンプレートおよびシンボルのエラー・マップにお けるピクセルの三角形から変位が推定される請求の範囲第17項記載の方法。
  19. 19.テンプレートとシンボルとの間の高さの差が予め定めた値より小さければ 、前記少なくとも1回のテストの1つを通過する請求の範囲第10項記載の方法 。
  20. 20.テンプレートとシンボルとの間の幅の差が予め定めた値より小さければ、 前記少なくとも1回のテストの1つを通過する請求の範囲第10項記載の方法。
  21. 21.前記シンボルにおける第1のタイプのピクセル数と、前記テンプレートに おける第1のタイプのピクセル数との比が予め定めた範囲内「あるならば、前記 少なくとも1回のテストの1つを通過する請求の範囲第10項記載の方法。
  22. 22.前記テンプレートまたは前記シンボルにおける前記第1のタイプのピクセ ル数に対するエラー・ピクセル場所数の比、あるいは両者の最小値または最大が 予め定めた値より小さければ、前記少なくとも1回のテストの1つを通過する請 求の範囲第10項記載の方法。
  23. 23.前記テンプレートまたは前記シンボルにおける前記第2のタイプのピクセ ルに隣接する前記第1のタイプのピクセル数に対するエラー・ピクセル場所数の 比が予め定めた値より小さければ、前記少なくとも1回のテストの1つを通過す る請求の範囲第10項記載の方法。
  24. 24.前記少なくとも1回のテストの少なくとも1つがシンボルのサイズに依存 する請求の範囲第8項乃至第10項のいずれかに記載の方法。
  25. 25.イメージを圧縮する方法において、イメージの第1の表示におけるシンボ ルを識別し、複数の識別されたシンボルをテンプレート・ライブラリにおける少 なくとも1つのテンプレートの各々と比較して、識別されたシンボルをテンプレ ートに突き合わせ、前記冬テンプレートが、第1のタイプのピクセルの空間的分 布に基く表示により規定され、 テンプレート表示と、場所の表示と、前記イメージにおけるシンボルに対するテ ンプレートとを含む前記イメージの圧縮された表示を生成し、前記複数のテンプ レートの表示が、該テンプレートに対する前記第1のタイプのピクセルの空間的 分布の境界の表示である イメージを圧縮する方法。
  26. 26.イメージを圧縮する方法において、イメージの第1の表示におけるシンボ ルを識別し、複数の識別されたシンボルをテンプレート・ライブラリにおける少 なくとも1つのテンプレートに比較して、識別されたシンボルをテンプレートに 突き合わせ、 テンプレート表示と、場所の表示と、前記イメージにおけるシンボルに対するテ ンプレートとを含む前記イメージの圧縮された表示を生成し、前記複数のテンプ レートの表示が、該テンプレートの外側境界を規定するフレーム・テンプレート に対する照合と、前記テンプレートの内側境界を規定する前記フレーム・チンプ レート内の関連する位置を持つ穴テンプレートのリストとを含むイメージを圧縮 する方法。
  27. 27.前記フレーム・テンプレートおよび穴テンプレートが、該フレーム・テン プレートおよび穴テンプレートの境界の表示により表わされる請求の範囲第26 項記載の方法。
  28. 28.イメージを圧縮する方法において、イメージの第1の表示におけるシンボ ルを識別し、複数の識別されたシンボルをテンプレート・ライブラリにおける少 なくとも1つのテンプレートに比較して、識別されたシンボルをテンプレートに 突き合わせ、前記テンプレートがテンプレートの特徴に従って前記ライブラリに おいて指標付けされ、前記比較ステップが該指標付けに従って進行し、これによ り特徴に基いて1つのシンボルと更に一致し易いテンプレートが、それほど一致 しないテンプレート前のシンボルと比較され、その指標付けされた特徴が一致の 可能性が予め定めた閾値より低くなることを示すテンプレートは比較されず、テ ンプレート表示と、場所の表示と、前記イメージにおけるシンボルに対するテン プレートとを含む前記イメージの圧縮された表示を生成することをを含むイメー ジを圧縮する方法。
  29. 29.イメージを圧縮する方法において、イメージの第1の表示におけるシンボ ルを識別し、複数の識別されたシンボルをテンプレート・ライブラリにおける少 なくとも1つのテンプレートに比較して、識別されたシンボルをテンプレートに 突き合わせ、テンプレート表示と、場所の表示と、前記イメージにおけるシンボ ルに対するテンプレートとを含む前記イメージの圧縮された表示を生成し、複数 のテンプレートの表示の解像度を低下させることをを含むイメージを圧縮する方 法。
  30. 30.各テンプレートがピクセルの一義的な空間的分布により規定され、該分布 が前記テンプレートと一致する複数のシンボルのピクセルの分布により決定され る請求の範囲第1項乃至第3項のいずれかに記載の方法。
  31. 31.前記比較ステップが、エラー場所を識別し、該エラー場所および前記シン ボルおよびテンプレートの他の大域的特徴について少なくとも1回のテストを行 い、1組の予め定めたテスト・グループにおける全てのテストを通過する場合に のみ、シンボルとテンプレートとの間の一致を宣言することを含む請求の範囲第 4項または第5項に記載の方法。
  32. 32.前記比較ステップが、前記シンボルまたは前記テンプレートの両方ではな いいずれか一方のみにおける前記第1のタイプのピクセルを持つエラー・ピクセ ル場所を識別し、前記エラー・ピクセル場所、および前記シンボルおよびテンプ レートの他の大域的特徴について少なくとも1回のテストを行うことを含み、1 組の予め定めたテスト・グループの少なくとも1つにおける全てのテストを通過 する場合にのみ、シンボルとテンプレートとの間の一致が宣言される請求の範囲 第1項乃至第3項のいずれかに記載の方法。
  33. 33.前記第1の表示が第1のタイプおよび第2のタイプのピクセルに基くもの であり、前記複数のテンプレートの表示が、前記テンプレートに対する前記第1 のタイプのピクセルの空間的分布の境界の表示である請求の範囲第1項乃至第5 項のいずれか、また第8項乃至10のいずれかに記載の方法。
  34. 34.前記各テンプレートの表示が、前記テンプレートの外側境界を規定するフ レーム・テンプレートと、関連する位置が前記フレーム・テンプレート内にあっ て前記テンプレートの内側境界を規定する穴テンプレートのリストとに対する照 合を含む請求の範囲第1項乃至第5項のいずれか、また第8項乃至10のいずれ かに記載の方法。
  35. 35.前記テンプレートが、テンプレート特徴に従って前記ライブラリにおいて 指標付けされ、前記比較ステップが該指標付けに従って進行し、これにより特徴 に基いてシンボルと一致し易いテンプレートが、一致しにくいテンプレート前の シンボルと比較され、一致の可能性が予め定めた閾値より低くなることを示す指 標付けされた特徴が示すテンプレートは比較されない請求の範囲第1項乃至第5 項のいずれか、また第8項乃至10のいずれか、あるいは第25項または第26 項のいずれかに記載の方法。
  36. 36.複数のテンプレートの表示の解像度を低下することを更に含む請求の範囲 第1項乃至第5項のいずれか、また第8項乃至10のいずれか、あるいは第25 項または第26項または第28項のいずれかに記載の方法。
  37. 37.前記イメージの前記圧縮された表示が複数のデータ・ストリームを含み、 該ストリームの少なくとも1つが更に圧縮される請求の範囲第1項乃至第5項の いずれか、また第8項乃至10のいずれか、あるいは第25項または第26項ま たは第28項または第29項のいずれかに記載の方法。
  38. 38.前記イメージの前記圧縮された表示が、テンプレート・ストリームと、テ ンプレート照合ストリームと、行および列位置ストリームとを含み、前記ストリ ームの少なくとも1つが更に圧縮される請求の範囲第1項乃至第5項のいずれか 、また第8項乃至10のいずれか、あるいは第25項または第26項または第2 8項または第29項のいずれかに記載の方法。
  39. 39.予め定めたサイズおよび形状より小さい領域を含むテンプレートを1つ以 上のテンプレートに切り分けることを更に含む請求の範囲第1項乃至第5項のい ずれか、また第8項乃至10のいずれか、あるいは第25項または第26項また は第28項または第29項のいずれかに記載の方法。
  40. 40.他のテンプレートへの切り分けにより形成されるテンプレートを比較して 、別のテンプレートを該テンプレートと一致させる切り分けにより形成されるテ ンプレートをマージすることを更に含む請求の範囲第39項記載の方法。
  41. 41.予め定めたサイズおよび形状より小さなシンボルを排除することを更に含 む請求の範囲第1項乃至第5項のいずれか、また第8項乃至10のいずれか、あ るいは第25項または第26項または第28項または第29項のいずれかに記載 の方法。
  42. 42.前記イメージにおけるシンボルに対する場所の表示が、所与のシンボルと 先行するシンボルとの間の実際のオフセットと、前記所与のシンボルと先行する シンボルとにより規定されるシンボル対に対する標準的なオフセットとの間の距 離により表わされる請求の範囲第1項乃至第5項のいずれか、また第8項乃至1 0のいずれか、あるいは第25項または第26項または第28項または第29項 のいずれかに記載の方法。
  43. 43.前記標準的オフセットが前記シンボル対に対して最後に見出されたオフセ ットである請求の範囲第42項記載の方法。
  44. 44.前記標準的オフセットが、前記シンボル対に対する最も頻繁に見出された オフセットである請求の範囲第42項記載の方法。
  45. 45.前記標準的オフセットと前記実際のオフセットとの間の距離が、前記イメ ージの最初の表示の解像度より低い解像度で決定される請求の範囲第42項記載 の方法。
  46. 46.前記シンボルの近似の読出し順を決定し、該読出し順に従って前記イメー ジの前記圧縮された表示を生成することを更に含む請求の範囲第1項乃至第5項 のいずれか、また第8項乃至10のいずれか、あるいは第25項または第26項 または第28項または第29項のいずれかに記載の方法。
  47. 47.前記読出し順が、1つの行にシンボルを見出して該シンボルを分類するこ とにより決定される請求の範囲第46項記載の方法。
  48. 48.1つの行におけるシンボルが、ビームを用いて該行に沿って探索すること により決定され、該ビームのサイズは1つ以上の隣接するシンボルのサイズに従 って変化する請求の範囲第47項記載の方法。
  49. 49.前記ビームのサイズにおける限界が課される請求の範囲第48項記載の方 法。
  50. 50.イメージ伝送システムに対して適用される請求の範囲第1項乃至第5項の いずわか、また第8項乃至10のいずれか、あるいは第25項または第26項ま たは第28項または第29項のいずれかに記載の方法。
  51. 51.ファクシミリ伝送システムに対して適用される請求の範囲第1項乃至第5 項のいずれか、また第8項乃至10のいずれか、あるいは第25項または第26 項または第28項または第29項のいずれかに記載の方法。
  52. 52.イメージ・エンハンスメント・システムに対して適用される請求の範囲第 1項乃至第5項のいずれか、また第8項乃至10のいずれか、あるいは第25項 または第26項または第28項または第29項のいずれかに記載の方法。
  53. 53.イメージ記憶システムに対して適用される請求の範囲第1項乃至第5項の いずれか、また第8項乃至10のいずれか、あるいは第25項または第26項ま たは第28項または第29項のいずれかに記載の方法。
  54. 54.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示を予め圧縮して、前記イメージの予 め圧縮された表示を生成し、 b)前記イメージの前記予め圧縮された表示におけるシンボルを識別し、c)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの各々に比較して、識別されたシンボルをテンプレートに突き合わ せ、 d)テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルと対 応するテンプレートとを含む前記イメージの圧縮された表示を生成するための処 理手段とを 含むイメージを圧縮する装置。
  55. 55.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示におけるシンボルを識別し、b)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの名々に比較して、識別されたシンボルをテンプレートに突き合わ せ、一致するテンプレートが見出されないシンボルを前記ライブラリに記憶する ことにより、前記ライブラリがイメージ圧縮の間に追補され、テンプレートが、 一致する複数のシンボルにより決定される表示により規定され、c)テンプレー トの表示と、場所の表示と、前記イメージにおけるシンボルと対応するテンプレ ートとを含む前記イメージの圧縮された表示を化成するための処理手段と、 を含むイメージを圧縮する装置。
  56. 56.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示におけるシンボルを識別し、b)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの各々に比較して、識別されたシンボルをテンプレートに突き合わ せ、前記比較ステップが、エラー場所を識別し、該エラー場所およびシンボルお よびテンプレートの他の大域的特徴について少なくとも1回のテストを行い、1 組の予め定めたテスト・グループの少なくとも1つにおける全てのテストを通過 する場合にのみ、シンボルとテンプレートとの間の一致を宣言することを含み、 c)テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルと対 応するテンプレートとを含む前記イメージの圧縮された表示を生成するための処 理手段とを 含むイメージを圧縮する装置。
  57. 57.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示におけるシンボルを識別し、b)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの各々に比較して、識別されたシンボルをテンプレートに突き合わ せ、前記各テンプレートが、第1のタイプおピクセルの空間的分布に基く表示に より規定され、 c)テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルと対 応するテンプレートとを含む前記イメージの圧縮された表示を化成するための処 理手段とを含み、前記複数のテンプレートの表示が該テンプレートに対する前記 第1のタイプのピクセルの空間的分布の境界の表示であるイメージを圧縮する装 置。
  58. 58.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示におけるシンボルを識別し、b)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの各々に比較して、識別されたシンボルをテンプレートに突き合わ せ、 c)テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルと対 応するテンプレートとを含む前記イメージの圧縮された表示を生成するための処 理手段であって、前記複数のテンプレートの表示が、該テンプレートの外側境界 を規定するフレーム・テンプレートに対する照合と、前記テンプレートの内側境 界を規定する前記フレーム・テンプレート内の関連する位置を持つ穴テンプレー トのリストとを含む該処理手段と、 を含むイメージを圧縮する装置。
  59. 59.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示におけるシンボルを識別し、b)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの各々に比較して、識別されたシンボルをテンプレートに突き合わ せ、該テンプレートがテンプレートの特徴に従って前記ライブラリにおいて指標 付けされ、前記比較ステップが該指標付けに従って進行し、これにより特徴に基 いてシンボルと一致し易いテンプレートが一致しにくいテンプレートの前のシン ボルと比較され、指標付けされた特徴が一致しにくいテンプレートは比較されず 、 c)テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルと対 応するテンプレートとを含む前記イメージの圧縮された表示を生成するための処 理手段と、 を含むイメージを圧縮する装置。
  60. 60.イメージを圧縮する装置において、イメージの最初の表示を受入れる入力 手段と、a)前記イメージの前記最初の表示におけるシンボルを識別し、b)複 数の識別されたシンボルを、テンプレート・ライブラリからの少なくとも1つの テンプレートの名々に比較して、識別されたシンボルをテンプレートに突き合わ せ、 c)テンプレートの表示と、場所の表示と、前記イメージにおけるシンボルと対 応するテンプレートとを含む前記イメージの圧縮された表示を生成し、d)複数 のテンプレートの表示の解像度を低下させるための処理手段と、を含むイメージ を圧縮する装置。
  61. 61.前記イメージの前記圧縮された表示を提供する出力手段を更に含む請求の 範囲第54項乃至第60項のいずれかに記載の装置。
  62. 62.前記入力手段がスキャナである請求の範囲第54項乃至第60項のいずれ かに記載の装置。
  63. 63.前記出力手段がモデムである請求の範囲第62項記載の装置。
  64. 64.イメージを圧縮する方法において、第1のタイプと第2のタイプのピクセ ルに基く第1のイメージ表示を予め圧縮して、前記イメージの予め圧縮された表 示を生成し前記イメージの前記予め圧縮された表示におけるシンボルを識別し、 複数の識別されたシンボルをテンプレート・ライブラリからの少なくとも1つの テンプレートの各々と比較して、識別されたシンボルをテンプレートに突き合わ せ、 場所の表示と、前記イメージにおけるシンボルに対するテンプレートとを含む前 記イメージの圧縮された表示を化成することを含むイメージを圧縮する方法。
  65. 65.イメージの前記第1の表示がランレングス・コード化により予め圧縮され る請求の範囲第64項記載の方法。
  66. 66.前記第1の表示がピクセルの行および列に基くものであり、同じ列か、あ るいは同じかあるいは隣接する列における前記第1のタイプの少なくとも1つの ピクセルを持つ前記予め圧縮された表示の隣接する行における前記第1のタイプ のピクセルの関連する線によりシンボルが識別される請求の範囲第65項記載の 方法。
  67. 67.イメージを圧縮する方法において、イメージの第1の表示の標識を識別す ること、複数の識別されたシンボルをテンプレート・ライブラリにおける少なく とも1つのテンプレートの各々と比較して、識別されたシンボルをテンプレート に突き合わせ、前記比較ステップが、エラー場所を識別し、該エラー場所と、シ ンボルおよびテンプレートの他の大域的特徴について少なくとも1回のテストを 行い、1組の予め定めたテスト・グループの少なくとも1つにおける全てのテス トをパスする場合にのみ、シンボルとテンプレートとの間の一致を宣言すること を含み、 場所の表示と前記イメージにおけるシンボルに対するテンプレートとを含む前記 イメージの圧縮された表示を生成すること、を含むイメージを圧縮する方法。
  68. 68.前記少なくとも1つのテストにおける各テストをパスする場合にのみ、一 致が宣言される請求の範囲第67項記載の方法。
  69. 69.前記第1の表示が第1のタイプと第2のタイプのピクセルの行および列に 基くものであり、前記比較ステップが、前記シンボルまたは前記テンプレートの 両者でないいずれか一方のみにおける前記第1のタイプのピクセルを持つエラー ・ピクセル場所を識別し、前記エラー・ピクセル場所と、シンボルおよびテンプ レートの他の大域的特徴について少なくとも1つのテストを行うことを含み、1 組の予め定めたテスト・グループの少なくとも1つにおける全てのテストをバス する場合にのみ、シンボルとテンプレート・グループ間の一致が宣言される請求 の範囲第67項記載の方法。
  70. 70.前記エラー場所がランレングス・コード化される請求の範囲第69項記載 の方法。
  71. 71.冬エラー・ピクセル場所と、該エラー・ピクセル場所における第2のタイ プのピクセルを持つテンプレートまたはシンボルにおける前記第1のタイプの最 も近いピクセルとの間の距離が予め定めた値より小さければ、前記少なくとも1 回のテストの1つをパスする請求の範囲第69項記載の方法。
  72. 72.各エラー・ピクセル場所と、該エラー・ピクセル場所における前記第1の タイプのピクセルを持つテンプレートまたはシンボルにおける前記第2のタイプ の最も近いピクセルとの間の距離が予め定めた値より小さければ、前記少なくと も1回のテストの1つをパスする請求の範囲第69項記載の方法。
  73. 73.前記少なくとも1回のテストの1つが、あるエラー・マップにおけるエラ ー・ピクセルの連続するグループのサイズ、形状および配向に依存する請求の範 囲第69項記載の方法。
  74. 74.エラー・ピクセル場所の全ての連続するグループが予め定めたサイズと形 状より小さければ、前記少なくとも1回のテストの1つをパスする請求の範囲第 73項記載の方法。
  75. 75.前記テンプレートに対する前記シンボルの推定される変位が一貫している ならは、前記少なくとも1回のテストの1つをパスする請求の範囲第73項記載 の方法。
  76. 76.エラー・ピクセル場所の連続するグループのサイズ、形状および配向、お よびそれらの隣接するピクセルに対する関係から変位が推定される請求の範囲第 75項記載の方法。
  77. 77.前記テンプレートにおける三角形のピクセルとして・4番目のピクセルが それぞれ同じかあるいは異なるパリティを持つかどうかに従って、前記推定され る変位が三角形を囲む方形における4番目のピクセルに向けあるいはこれから遠 ざかるように、テンプレートおよびシンボルのエラー・マップにおけるピクセル の三角形から変位が推定される請求の範囲第76項記載の方法。
  78. 78.テンプレートとシンボルとの間の高さの差が予め定めた値より小さければ 、前記少なくとも1回のテストの1つをパスする請求の範囲第69項記載の方法 。
  79. 79.テンプレートとシンボルとの間の幅の差が予め定めた値より小さければ、 前記少なくとも1回のテストの1つをパスする請求の範囲第69項記載の方法。
  80. 80.前記シンボルにおける前記第1のタイプのピクセル数と前記テンプレート における前記第1のタイプのピクセル数との比が予め定めた範囲内にあるならば 、前記少なくとも1回のテストの1つをパスする請求の範囲第69項記載の方法 。
  81. 81.前記テンプレートまたは前記シンボルにおける前記第1のタイプのピクセ ル数に対するエラー・ピクセル場所数の比、あるいは両者の最小値または最大値 が予め定めた値より小さければ、前記少なくとも1回のテストの1つをパスする 請求の範囲第69項記載の方法。
  82. 82.前記テンプレートまたは前記シンボルにおける前記第2のタイプのピクセ ルに隣接する前記第1のタイプのピクセル数に対するエラー・ピクセル場所数の 比、あるいは両者の最小値または最大値が予め定めた値より小さければ、前記少 なくとも1回のテストの1つをパスする請求の範囲第69項記載の方法。
  83. 83.前記少なくとも1回のテストの少なくとも1つがシンボルのサイズに依存 する請求の範囲第67項乃至第69項のいずれかに記載の方法。
  84. 84.イメージを圧縮する方法において、イメージの第1の表示におけるシンボ ルを識別し、複数の識別されたシンボルをテンプレート・ライブラリにおける少 なくとも1つのテンプレートの各々と比較して、識別されたシンボルをテンプレ ートに突き合わせ、該テンプレートが、テンプレートの特徴に従って前記ライブ ラリにおいて指標付けされ、前記比較ステップが該指標付けに従って進行し、こ れにより特徴についてシンボルと一致し易いテンプレートが一致しにくいテンプ レート前のシンボルと比較され、指標付けされた特徴が一致の可能性が予め定め た閾値より低くなることを示すテンプレートは比較されず、場所の表示と前記イ メージにおけるシンボルに対するテンプレートとを含む前記イメージの圧縮され た表示を生成することを含むイメージを圧縮する方法。
JP5510925A 1991-12-16 1992-11-23 イメージ圧縮の方法および装置 Pending JPH07505024A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US07/808,539 US5303313A (en) 1991-12-16 1991-12-16 Method and apparatus for compression of images
US808,539 1991-12-16
PCT/US1992/010172 WO1993012610A1 (en) 1991-12-16 1992-11-23 Method and apparatus for compression of images

Publications (1)

Publication Number Publication Date
JPH07505024A true JPH07505024A (ja) 1995-06-01

Family

ID=25199069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5510925A Pending JPH07505024A (ja) 1991-12-16 1992-11-23 イメージ圧縮の方法および装置

Country Status (7)

Country Link
US (1) US5303313A (ja)
EP (1) EP0617870A1 (ja)
JP (1) JPH07505024A (ja)
KR (1) KR950700662A (ja)
AU (1) AU3224693A (ja)
CA (1) CA2125868A1 (ja)
WO (1) WO1993012610A1 (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5901246A (en) * 1995-06-06 1999-05-04 Hoffberg; Steven M. Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5321520A (en) * 1992-07-20 1994-06-14 Automated Medical Access Corporation Automated high definition/resolution image storage, retrieval and transmission system
JPH06149990A (ja) * 1992-11-02 1994-05-31 Fujitsu Ltd 画像圧縮方法及び画像処理装置
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
EP0672982B1 (en) * 1994-03-18 2002-07-31 Hewlett-Packard Company, A Delaware Corporation Printer system with compressed font procedure that enables memory conservation
DE69519323T2 (de) * 1994-04-15 2001-04-12 Canon Kk System zur Seitensegmentierung und Zeichenerkennung
JP3415270B2 (ja) * 1994-06-03 2003-06-09 ソニー株式会社 画像信号符号化方法及び復号方法
JP3150856B2 (ja) * 1994-10-12 2001-03-26 株式会社リコー 画像処理方法
US6343152B1 (en) * 1994-10-18 2002-01-29 Peerless Systems Corporation Bi-level image compression by gray scale encoding
US5956419A (en) * 1995-04-28 1999-09-21 Xerox Corporation Unsupervised training of character templates using unsegmented samples
US5706364A (en) * 1995-04-28 1998-01-06 Xerox Corporation Method of producing character templates using unsegmented samples
US5689620A (en) * 1995-04-28 1997-11-18 Xerox Corporation Automatic training of character templates using a transcription and a two-dimensional image source model
US5594809A (en) * 1995-04-28 1997-01-14 Xerox Corporation Automatic training of character templates using a text line image, a text line transcription and a line image source model
US5883986A (en) * 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
JPH0981763A (ja) * 1995-07-07 1997-03-28 Oki Data:Kk 文字・イメージ混在データの圧縮方法及び装置
US6041137A (en) * 1995-08-25 2000-03-21 Microsoft Corporation Radical definition and dictionary creation for a handwriting recognition system
US5764808A (en) * 1995-10-26 1998-06-09 Motorola, Inc. Method and device for compact representation of a discrete region contour
US5818965A (en) * 1995-12-20 1998-10-06 Xerox Corporation Consolidation of equivalence classes of scanned symbols
US5778095A (en) * 1995-12-20 1998-07-07 Xerox Corporation Classification of scanned symbols into equivalence classes
US5784284A (en) * 1995-12-29 1998-07-21 Snap-On Tools Company Technique for plotting a variable-width signal in a fixed-width plot area
JP3636809B2 (ja) * 1996-03-12 2005-04-06 株式会社リコー 画像処理方法
JP3061765B2 (ja) 1996-05-23 2000-07-10 ゼロックス コーポレイション コンピュータベースの文書処理方法
US5884014A (en) * 1996-05-23 1999-03-16 Xerox Corporation Fontless structured document image representations for efficient rendering
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US6094453A (en) * 1996-10-11 2000-07-25 Digital Accelerator Corporation Digital data compression with quad-tree coding of header file
US6275610B1 (en) * 1996-10-16 2001-08-14 Convey Corporation File structure for scanned documents
JP2940496B2 (ja) * 1996-11-05 1999-08-25 日本電気株式会社 パタンマッチング符号化装置及び方法
JP2974061B2 (ja) 1996-11-13 1999-11-08 日本電気株式会社 パタン抽出装置
JP2836681B2 (ja) * 1997-01-14 1998-12-14 日本電気株式会社 パタンマッチング符号化方法及び符号化装置
JP3082837B2 (ja) 1997-03-19 2000-08-28 日本電気株式会社 パタンマッチング符号化装置、復号化装置及び記録媒体
JP3284932B2 (ja) * 1997-08-05 2002-05-27 松下電器産業株式会社 画像処理装置
US6020972A (en) * 1997-11-14 2000-02-01 Xerox Corporation System for performing collective symbol-based compression of a corpus of document images
JPH11167623A (ja) * 1997-12-03 1999-06-22 Canon Inc 画像処理装置及び画像処理方法
JP3095071B2 (ja) * 1998-04-21 2000-10-03 日本電気株式会社 パタンマッチング符号化装置、及びその符号化方法
US6748115B1 (en) 1998-06-19 2004-06-08 Cvision Technologies Llc Perceptually lossless image compression
US6373981B1 (en) 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6400844B1 (en) 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6324305B1 (en) 1998-12-22 2001-11-27 Xerox Corporation Method and apparatus for segmenting a composite image into mixed raster content planes
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
JP4416890B2 (ja) * 1999-12-20 2010-02-17 富士通株式会社 帳票識別装置
JP2001203897A (ja) 2000-01-18 2001-07-27 Nec Corp パタンマッチング符号化装置及び方法
US6658148B1 (en) * 2000-06-06 2003-12-02 Matsushita Electric Works, Ltd. Image processing method and apparatus
US6778291B1 (en) 2000-06-12 2004-08-17 Hewlett-Packard Development Company, L.P. Fast page analyzer for proper selection of compression engine for rendered data
US6832007B1 (en) * 2000-11-21 2004-12-14 Xerox Corporation Method and system for compensating for scaling artifacts in mixed raster content (MRC) representations
KR100382649B1 (ko) * 2000-12-29 2003-05-09 삼성전자주식회사 하드 카피 장치용 데이타 압축 및 복원 방법들 및 장치들
EP1362340A4 (en) * 2001-01-09 2007-01-10 Goldklang Meshilim Zisha IMPROVED DEVICES AND METHOD FOR REPLACING DECORATIVE IMAGES BY TEXT AND / OR GRAPHIC PATTERNS
US7164369B2 (en) * 2001-06-19 2007-01-16 Sharp Laboratories Of America, Inc. System for improving storage efficiency of digital files
US7068271B2 (en) * 2001-09-05 2006-06-27 Autodesk, Inc. Assembly patterns by feature association
US7068844B1 (en) * 2001-11-15 2006-06-27 The University Of Connecticut Method and system for image processing for automatic road sign recognition
US7024049B2 (en) * 2002-01-16 2006-04-04 Xerox Corporation Method and apparatus for improving image appearance
US7076109B2 (en) * 2002-03-28 2006-07-11 International Business Machines Corporation System and method of automatically determining the dominant periodicity in sequential binary data
US7017816B2 (en) * 2003-09-30 2006-03-28 Hewlett-Packard Development Company, L.P. Extracting graphical bar codes from template-based documents
CN100541537C (zh) * 2003-11-24 2009-09-16 廖宏 一种利用计算机对数字化档案文件压缩的方法
KR100597004B1 (ko) * 2004-11-22 2006-07-06 삼성전자주식회사 심볼 사전 재배치 방식을 이용한 이진 영상 처리 장치 및방법
US7492957B1 (en) * 2005-08-29 2009-02-17 Symantec Corporation Using run length encoding to detect target images
US8155312B2 (en) * 2005-10-18 2012-04-10 The University Of Connecticut Optical data storage device and method
US8326037B1 (en) 2005-11-23 2012-12-04 Matrox Electronic Systems, Ltd. Methods and apparatus for locating an object in an image
US8019164B2 (en) * 2007-01-29 2011-09-13 Hitachi High-Technologies Corporation Apparatus, method and program product for matching with a template
US8229232B2 (en) * 2007-08-24 2012-07-24 CVISION Technologies, Inc. Computer vision-based methods for enhanced JBIG2 and generic bitonal compression
US9053359B2 (en) 2012-06-07 2015-06-09 Konica Minolta Laboratory U.S.A., Inc. Method and system for document authentication using Krawtchouk decomposition of image patches for image comparison
US9230383B2 (en) 2012-12-28 2016-01-05 Konica Minolta Laboratory U.S.A., Inc. Document image compression method and its application in document authentication
CN104778491B (zh) * 2014-10-13 2017-11-07 刘整 用于信息处理的图像码及生成与解析其的装置与方法
US10681388B2 (en) 2018-01-30 2020-06-09 Google Llc Compression of occupancy or indicator grids
CN113127637A (zh) * 2019-12-31 2021-07-16 中兴通讯股份有限公司 一种字符的还原方法及装置、存储介质、电子装置
US11562522B2 (en) * 2020-07-24 2023-01-24 Unity Technologies Sf Method and system for identifying incompatibility between versions of compiled software code

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4091424A (en) * 1977-02-18 1978-05-23 Compression Labs, Inc. Facsimile compression system
US4410916A (en) * 1979-08-24 1983-10-18 Compression Labs, Inc. Dual mode facsimile coding system and method
US4288782A (en) * 1979-08-24 1981-09-08 Compression Labs, Inc. High speed character matcher and method
US4773098A (en) * 1980-05-27 1988-09-20 Texas Instruments Incorporated Method of optical character recognition
SE448922B (sv) * 1980-10-21 1987-03-23 Ibm Svenska Ab Metod for behandling av videodata vid ett optiskt teckenidentifieringssystem jemte en anordning for teckenidentifiering i en optisk dokumentlesare
US4463386A (en) * 1982-05-03 1984-07-31 International Business Machines Corporation Facsimile data reduction
US4494150A (en) * 1982-07-13 1985-01-15 International Business Machines Corporation Word autocorrelation redundancy match facsimile compression for text processing systems
US4499499A (en) * 1982-12-29 1985-02-12 International Business Machines Corporation Method for identification and compression of facsimile symbols in text processing systems
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching
JPS60254871A (ja) * 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法
US4628534A (en) * 1984-07-06 1986-12-09 Honeywell Information Systems Inc. Method for changing the resolution of compressed image data
US4887304A (en) * 1987-09-30 1989-12-12 Raytheon Company Library image optimization
US5109432A (en) * 1989-12-27 1992-04-28 Fujitsu Limited Character recognition method
JPH03238567A (ja) * 1990-02-15 1991-10-24 Eastman Kodatsuku Japan Kk パターン認識装置

Also Published As

Publication number Publication date
KR950700662A (ko) 1995-01-16
US5303313A (en) 1994-04-12
EP0617870A1 (en) 1994-10-05
WO1993012610A1 (en) 1993-06-24
AU3224693A (en) 1993-07-19
CA2125868A1 (en) 1993-06-24

Similar Documents

Publication Publication Date Title
JPH07505024A (ja) イメージ圧縮の方法および装置
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
US5963966A (en) Automated capture of technical documents for electronic review and distribution
US6366695B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
JP3925971B2 (ja) 統合同値類の作成方法
US4653107A (en) On-line recognition method and apparatus for a handwritten pattern
US5048099A (en) Polygon-based method for automatic extraction of selected text in a digitized document
US6640010B2 (en) Word-to-word selection on images
EP0700197B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
JPH04225485A (ja) バーコードを認識する方法
JPH03119486A (ja) 記入済書式に含まれている情報を記憶または伝送のために圧縮する方法
US4817187A (en) Apparatus and method for vectorization of incoming scanned image data
US20040213458A1 (en) Image processing method and system
US6701022B2 (en) Pattern matching coding device and method thereof
Witten et al. Textual image compression: Two-stage lossy/lossless encoding of textual images
JPH01253077A (ja) 文字列検出方法
US5835638A (en) Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
JP2766053B2 (ja) 画像データ処理方法
JPH09198511A (ja) シンボルの分類方法
JPH08147446A (ja) 電子ファイリング装置
US20060146349A1 (en) Digital image processing without rasterization
US5228097A (en) Method for registering image data
US20030123087A1 (en) Image compression method, decompression method thereof and program therefor
US6088039A (en) Compression of grey scale images of text
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法