JP3031603B2 - 画像圧縮方法 - Google Patents

画像圧縮方法

Info

Publication number
JP3031603B2
JP3031603B2 JP6164087A JP16408794A JP3031603B2 JP 3031603 B2 JP3031603 B2 JP 3031603B2 JP 6164087 A JP6164087 A JP 6164087A JP 16408794 A JP16408794 A JP 16408794A JP 3031603 B2 JP3031603 B2 JP 3031603B2
Authority
JP
Japan
Prior art keywords
pattern
image
area
template
compression method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6164087A
Other languages
English (en)
Other versions
JPH0830794A (ja
Inventor
高志 齋藤
和典 高津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6164087A priority Critical patent/JP3031603B2/ja
Publication of JPH0830794A publication Critical patent/JPH0830794A/ja
Application granted granted Critical
Publication of JP3031603B2 publication Critical patent/JP3031603B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ハーフトーン領域を含
む文書画像を高圧縮率で圧縮する画像圧縮方法に関す
る。
【0002】
【従来の技術】文書画像から連結成分を切り出し、一つ
の連結成分を一つのパターンとみなしてテンプレートと
して登録し、該切り出されたパターンの内、類似のパタ
ーンをテンプレートで置き換えることによって、イメー
ジ情報を削減する画像圧縮方法がある(例えば、米国特
許第5,303,313号を参照)。
【0003】図9は、上記公報に記載された従来の画像
圧縮方法を説明する図である。901は英文字からなる
文書画像、902はテンプレート、903は位置情報、
904はシンボル(テンプレート番号)である。文書画
像901から連結成分(文字パターン)を切り出す。図
の例では、まず連結成分「H」を切り出し、これをテン
プレート902に登録されたパターンとのパターンマッ
チングを行う。この場合、何も登録されていないのでマ
ッチングせず、連結成分「H」がテンプレートとして新
規に登録される。また、連結成分「H」をシンボル
「1」(テンプレート番号)で表現し、そのシンボル9
04の位置情報903と共にメモリに格納する。つま
り、切り出された各連結成分(文字パターン)は、シン
ボル904と、シンボルの位置情報903で表される。
【0004】次いで、連結成分「e」を切り出し、これ
もテンプレートに登録されたパターンとマッチングしな
いので、テンプレートとして新規に登録し、これをシン
ボル「2」で表す。以下、連結成分「t」、「o」、
「l」、「d」、「m」までは、同様に処理されてテン
プレートとして登録され、それぞれにシンボル「3」か
ら「7」が割当られ、その位置情報がメモリに格納され
る。
【0005】続いて、「m」の次の「e」が切り出され
と、この連結成分「e」は、テンプレートに登録された
パターン「e」とマッチングするのでテンプレートとし
て新規に登録されない。ただし、登録済みのパターンと
マッチングしたパターンとの平均(あるいは両パターン
の代表値)をとったパターンを作成してテンプレートを
更新処理する。これにより、類似するパターンについて
は、その代表パターンが登録されるように更新処理され
る。
【0006】また、シンボルには既に決定されている
「2」が割り当てられる。以下、同様にしてシンボルと
して数字「9」までが使用されると、文字「h」、
「a」には、それぞれシンボル「a」、「b」が割当ら
れる。
【0007】上記したようにして文書画像は、シンボル
列(テンプレート番号列)と、シンボルの位置情報と、
各テンプレートのパターン情報に分解される。そして、
符号化での予測効率を上げ、高い圧縮率を得るためにキ
ャラクタを読み順に並べ替えた後に、予測符号化するこ
とによって画像を高効率に圧縮する。
【0008】
【発明が解決しようとする課題】上記した圧縮方法は、
テキスト画像の圧縮を考慮した方法であり、つまりタイ
プされた文字は本来同じパターンであることから、この
情報の中の冗長性を排除することによって、大きな圧縮
率を得る手法である。従って、上記した方法において
は、テンプレートでの置き換え効率が悪いハーフトーン
画像領域が文書中に存在する場合に、全体として圧縮効
率が悪くなるという問題がある(なお、ハーフトーン画
像とは、階調画像を、網点などを使用して擬似的に2値
で表現した画像をいう)。これは、ハーフトーン領域で
は文字領域のように各パターン間でマッチングがとれな
いことが原因である。
【0009】上記した例の他に、個別文字を切り出し、
該切り出された個別文字から典型文字パターンを生成
し、これをテンプレートとして各文字パターンを分類
し、典型文字パターンと分類コードを送信する画像情報
圧縮伝送方式がある(特開平3−157064号公報を
参照)。しかし、この方法では、典型文字パターンの生
成領域を考慮していないので、類似パターンの現れ難い
イメージ領域についても、同様の切り出し、マッチング
処理を行うために全体として圧縮効率の向上が期待でき
ない。
【0010】本発明の目的は、画像中にテンプレートで
の置き換え効率の悪い領域が含まれていても高圧縮率を
可能にする画像圧縮方法を提供することにある。
【0011】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像から連結成分を
切り出し、該連結成分をパターンとみなしてテンプレー
トとして登録し、該パターンと類似する他のパターンを
該テンプレートで置き換えることにより画像情報を圧縮
する画像圧縮方法において、前記文書画像から該テンプ
レートによる置き換えを行なわない領域を判定し、該判
定された領域以外に対してテンプレートによる置き換え
を行って画像を圧縮することを特徴としている。
【0012】請求項2記載の発明では、前記領域は、ハ
ーフトーン領域であることを特徴としている。
【0013】請求項3記載の発明では、前記領域は、前
記文書画像から切り出された連結成分の輪郭が所定の閾
値以上の大きさの輪郭であることを特徴としている。
【0014】請求項4記載の発明では、前記領域は、前
記所定の閾値以上の大きさの輪郭に包含されるパターン
であることを特徴としている。
【0015】請求項5記載の発明では、前記領域は、前
記文書画像から切り出された連結成分を囲む凸領域が所
定の閾値以上の大きさであるとき、該凸領域の内部にあ
るパターンであることを特徴としている。
【0016】請求項6記載の発明では、前記領域は、前
記文書画像に対してぼかし処理を施し、ぼかし処理され
た画像から切り出された連結成分の輪郭が所定の閾値以
上の大きさの輪郭であることを特徴としている。
【0017】請求項7記載の発明では、前記領域は、前
記所定の閾値以上の大きさの輪郭に包含されるパターン
であることを特徴としている。
【0018】請求項8記載の発明では、前記領域は、前
記文書画像に対してぼかし処理を施し、ぼかし処理され
た画像から切り出された連結成分を囲む凸領域が所定の
閾値以上の大きさであるとき、該凸領域の内部にあるパ
ターンであることを特徴としている。
【0019】
【作用】本発明の一実施例において、マッチング領域判
定部は、入力画像を格子状の領域に分割して、各領域毎
に画像の特徴を判定する。一判定方法として、黒ランの
数を数えて、所定数以上あればハーフトーン領域と判定
する。パターン切り出し部は、ハーフトーン領域でない
と判定された文字領域などからパターンを切り出す。テ
ンプレート生成マッチング部は、切り出したパターンと
テンプレートとして登録されたパターンとのマッチング
をとり、パターンのシンボル情報、各シンボルの位置情
報、各テンプレートのパターン情報を作成する。符号化
部では、これらの情報を予測符号化方法で符号化するこ
とにより、画像を高圧縮率で圧縮する。
【0020】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図において、101はスキャナなどの画像入力装置、1
02は各格子領域がマッチング対象領域であるか否かを
判定するマッチング領域判定部、103はパターン切り
出し部、104はテンプレートを生成し、マッチングを
行うテンプレート生成マッチング部、105は抽出した
パターン情報や位置情報などを符号化する符号化部、1
06は入力画像や生成データを記憶する記憶部、107
は全体を制御する制御部、108はデータ通信路であ
る。
【0021】図2は、本発明の実施例1の処理フローチ
ャートである。図を参照しながら動作を説明する。ま
ず、スキャナなどの画像入力装置101によって画像を
入力する(ステップ201)。次に、マッチング領域判
定部102は、画像を格子状の領域に分割し(例えば、
8×8個に分割)、各領域毎に画像の特徴を調べる(ス
テップ202)。例えば、一つの方法として、黒ランの
数を数えて、一定数以上あればハーフトーン領域と判定
する。ディザ法で表現されたハーフトーン領域は細かい
点から構成されていて、文字領域に比べて黒ランの数が
多いため、ラン数で判別することができる。なお、ディ
ザ法とは、階調画像を2値の擬似的な階調画像に変換す
る一手法であり、画素の値と、閾値行列の要素の値とを
比較して、画素の値が小さければ0、それ以外のとき1
に変換することにより2値の擬似階調画像を生成する方
法である。
【0022】マッチング領域判定部102によってハー
フトーン領域(部分)ではない、つまり文字などの領域
であると判別された領域において、パターン切り出し部
103はパターン(黒画素連結成分)の切り出しを行う
(ステップ203、204)。このとき、領域の境界に
かかるパターンについては、領域を超えて連結する画素
をすべて含む形で切り出しもよいし、領域を超える場合
は画素が連結していても無視して、あくまでも領域内だ
けのパターンを切り出すという2つの方法がある。後者
の方がパターン切り出し処理は簡単であるが、領域の境
界でパターンの一部が欠落するため、マッチングの度合
いが減少する。これに対して、前者の方法はパターンが
完全に切り出せるため、マッチングの度合いは落ちない
が、境界周辺での処理が複雑になる。なお、切り出され
たパターンが領域の境界にかかるか否かは、データ記憶
部106に格納されたランデータを参照することによっ
て分かる。
【0023】次に、テンプレート生成マッチング部10
4は、切り出したパターンとテンプレートとして登録さ
れた幾つかのパターンとのマッチングをとる(ステップ
205)。従来技術で説明したと同様に、マッチングす
ればその登録されたパターンのシンボルによって、切り
出したパターンが表され、またどのテンプレートともマ
ッチングしなければ新たなテンプレートとして登録され
る。このとき、前述したように各シンボルの位置情報も
生成され、各パターンがシンボル情報と各シンボルの位
置情報で表現されてデータ記憶部106に格納される。
【0024】以上のマッチング/テンプレート生成処理
を、対象となる領域のすべてのパターンについて行う。
その結果、シンボル情報、各シンボルの位置情報、各テ
ンプレートのパターン情報がデータ記憶部106に格納
される。符号化部105は、これらの情報を予測符号化
方法で符号化し、これにより高い圧縮率が得られる。ハ
ーフトーン領域については、その内部の画像情報を所定
の符号化方法(例えば、MH、JBIGなど)で符号化
する(ステップ206)。
【0025】〈実施例2〉図3は、本発明の実施例2の
構成を示し、実施例1のマッチング領域判定部を、パタ
ーンサイズ判定部に置き換えて構成され、他の要素は実
施例1のものと同様である。
【0026】図4は、本発明の実施例2の処理フローチ
ャートである。まず、画像入力装置301によって画像
を入力し(ステップ401)、次に、パターン切り出し
部303はパターンの切り出しを行う(ステップ40
2)。パターンサイズ判定部302は、切り出したパタ
ーンが所定サイズ以上であるか否かを判定する(ステッ
プ403)。切り出したパターンが所定の大きさ以上の
ものは、文字ではなく写真などを構成する部分と判定
し、マッチングの対象外とするものである。
【0027】具体的には、切り出したパターン(黒画素
の連結成分)の輪郭を求め、該輪郭(縦および横のサイ
ズまたはその面積)が所定の閾値以上大きいとき、マッ
チングの対象外とする。
【0028】従って、図5に示すように、このような所
定サイズ以上のパターン501の内部に含まれる、文字
サイズのパターン502、503などは、マッチングの
対象としない。また、図6は、マッチングの対象外とす
るパターンの他の例を示す。601は所定サイズ以上の
パターン(黒画素連結成分)であり、602は、所定サ
イズ以上のパターン601を囲む凸領域であり、603
は、該凸領域にある文字サイズ程度のパターンである。
本実施例では、所定サイズ以上のパターンを囲む凸領域
内にあるパターン603は、マッチングの対象から外
す。
【0029】ステップ404以下の処理は、実施例1と
同様であるので、説明を省略する。
【0030】〈実施例3〉図7は、実施例3の構成を示
し、実施例2の構成に、ぼかし処理部702を付加して
構成されている。図8は、実施例3の処理フローチャー
トである。ハーフトーン部分をディザ法で表現すると、
黒画素は連結しにくいので、ハーフトーン部分を構成す
るパターンは小さくなり易い。
【0031】そこで、本実施例では、パターンの切り出
し処理を行う前に、ぼかし処理部702で予め画像にぼ
かし処理を施す(ステップ802)。例えば、このよう
なぼかし処理としては、8画素×8画素の領域の中に一
つでも黒画素があれば64画素すべてを黒画素とする処
理である。このぼかし処理によってハーフトーン部分は
黒画素が近接しているので、全体的に融合して大きな黒
画素連結成分(パターン)となる。
【0032】一方、文字部分は同一行の隣合う文字は融
合するものの、行間までは融合しない(その程度にぼか
しを設定しておく)ので、ぼかし処理後の連結成分はさ
ほど大きな塊とはならない。
【0033】ぼかし処理後、実施例2と同様に、パター
ン切り出し部704がパターンを切り出し(ステップ8
03)、切り出されたパターンについて、パターンサイ
ズ判定部703は所定以上の大きさか否かを判定する
(ステップ804)。以下、実施例2と同様に、パター
ンが所定以上の大きさのパターンと、またその内部のパ
ターンについては、マッチング対象外とする。マッチン
グ対象と判定された領域については、実施例1、2と同
様にして、原画像上でマッチング/テンプレート生成を
行い(ステップ805)、符号化する(ステップ80
6)。
【0034】
【発明の効果】以上、説明したように、請求項1、2記
載の発明によれば、文書画像から該テンプレートによる
置き換えを行なわない領域を判定し、判定された領域以
外に対してテンプレートによる置き換えを行って画像を
圧縮しているので、マッチング効率の悪いハーフトーン
部分を含む画像においても、マッチング処理を利用した
圧縮方法によって高い圧縮率を実現することができる。
また、簡単な処理によってハーフトーン領域を判別する
ことができる。
【0035】請求項3、4、5記載の発明によれば、連
結成分の輪郭が所定の閾値以上の大きさの輪郭と、所定
の閾値以上の大きさの輪郭に包含されるパターンと、連
結成分を囲む凸領域が所定の閾値以上の大きさであっ
て、その凸領域の内部にあるパターンとを、文字部分か
ら高精度に分離しているので、効率よく画像を圧縮する
ことができる。
【0036】請求項6、7、8記載の発明によれば、文
書画像中のハーフトーン領域がディザ法で処理されてい
ても、ぼかし処理を施しているので、連結成分の輪郭が
所定の閾値以上の大きさの輪郭と、所定の閾値以上の大
きさの輪郭に包含されるパターンと、連結成分を囲む凸
領域が所定の閾値以上の大きさであって、その凸領域の
内部にあるパターンとを、文字部分から高精度に分離す
ることができ、従って画像の高圧縮が可能となる。
【図面の簡単な説明】
【図1】本発明の実施例1の構成を示す。
【図2】本発明の実施例1の処理フローチャートであ
る。
【図3】本発明の実施例2の構成を示す。
【図4】本発明の実施例2の処理フローチャートであ
る。
【図5】マッチングの対象外とするパターンの例を示
す。
【図6】マッチングの対象外とするパターンの他の例を
示す。
【図7】本発明の実施例3の構成を示す。
【図8】本発明の実施例3の処理フローチャートであ
る。
【図9】従来の画像圧縮方法を説明する図である。
【符号の説明】
101 画像入力装置 102 マッチング領域判定部 103 パターン切り出し部 104 テンプレート生成マッチング部 105 符号化部 106 データ記憶部 107 制御部 108 データ通信路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−183759(JP,A) 特開 平4−223717(JP,A) 特開 昭63−279368(JP,A) 特表 平7−505024(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 1/00 G06T 5/00 - 5/50 H04N 1/411 - 1/419

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像から連結成分を切り出し、該連
    結成分をパターンとみなしてテンプレートとして登録
    し、該パターンと類似する他のパターンを該テンプレー
    トで置き換えることにより画像情報を圧縮する画像圧縮
    方法において、前記文書画像から該テンプレートによる
    置き換えを行なわない領域を判定し、該判定された領域
    以外に対してテンプレートによる置き換えを行って画像
    を圧縮することを特徴とする画像圧縮方法。
  2. 【請求項2】 前記領域は、ハーフトーン領域であるこ
    とを特徴とする請求項1記載の画像圧縮方法。
  3. 【請求項3】 前記領域は、前記文書画像から切り出さ
    れた連結成分の輪郭が所定の閾値以上の大きさの輪郭で
    あることを特徴とする請求項1記載の画像圧縮方法。
  4. 【請求項4】 前記領域は、前記所定の閾値以上の大き
    さの輪郭に包含されるパターンであることを特徴とする
    請求項3記載の画像圧縮方法。
  5. 【請求項5】 前記領域は、前記文書画像から切り出さ
    れた連結成分を囲む凸領域が所定の閾値以上の大きさで
    あるとき、該凸領域の内部にあるパターンであることを
    特徴とする請求項1記載の画像圧縮方法。
  6. 【請求項6】 前記領域は、前記文書画像に対してぼか
    し処理を施し、ぼかし処理された画像から切り出された
    連結成分の輪郭が所定の閾値以上の大きさの輪郭である
    ことを特徴とする請求項1記載の画像圧縮方法。
  7. 【請求項7】 前記領域は、前記所定の閾値以上の大き
    さの輪郭に包含されるパターンであることを特徴とする
    請求項6記載の画像圧縮方法。
  8. 【請求項8】 前記領域は、前記文書画像に対してぼか
    し処理を施し、ぼかし処理された画像から切り出された
    連結成分を囲む凸領域が所定の閾値以上の大きさである
    とき、該凸領域の内部にあるパターンであることを特徴
    とする請求項1記載の画像圧縮方法。
JP6164087A 1994-07-15 1994-07-15 画像圧縮方法 Expired - Fee Related JP3031603B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6164087A JP3031603B2 (ja) 1994-07-15 1994-07-15 画像圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6164087A JP3031603B2 (ja) 1994-07-15 1994-07-15 画像圧縮方法

Publications (2)

Publication Number Publication Date
JPH0830794A JPH0830794A (ja) 1996-02-02
JP3031603B2 true JP3031603B2 (ja) 2000-04-10

Family

ID=15786534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6164087A Expired - Fee Related JP3031603B2 (ja) 1994-07-15 1994-07-15 画像圧縮方法

Country Status (1)

Country Link
JP (1) JP3031603B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951210A (zh) * 2019-05-14 2020-11-17 阿里巴巴集团控股有限公司 数据的处理方法、装置及设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3604993B2 (ja) * 2000-03-16 2004-12-22 シャープ株式会社 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法
JP2002314821A (ja) * 2001-04-18 2002-10-25 Ricoh Co Ltd 画像圧縮方法、画像伸張方法、画像圧縮装置及び画像伸張装置
JP5051971B2 (ja) * 2004-08-18 2012-10-17 シャープ株式会社 画像符号化装置および画像復号装置、画像符号化方法および画像符号化方法のプログラムを記録したコンピュータ読取可能な記録媒体、ならびに画像復号方法および画像復号方法のプログラムを記録したコンピュータ読取可能な記録媒体
KR101454208B1 (ko) 2007-12-28 2014-10-24 삼성전자주식회사 하프톤 영상 인코딩 및 디코딩 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951210A (zh) * 2019-05-14 2020-11-17 阿里巴巴集团控股有限公司 数据的处理方法、装置及设备

Also Published As

Publication number Publication date
JPH0830794A (ja) 1996-02-02

Similar Documents

Publication Publication Date Title
US5303313A (en) Method and apparatus for compression of images
US7352490B1 (en) Method and system for generating contone encoded binary print data streams
US7386168B2 (en) Image processing apparatus
US8077986B2 (en) Information processing apparatus, method of controlling same and computer program
US6320981B1 (en) Image processing system and image processing method
CA2369841C (en) Method and system for classifying image elements
US6337929B1 (en) Image processing apparatus and method and storing medium
US20030184809A1 (en) Grayscale and binary image data compression
JP4364809B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP3278298B2 (ja) ビットマップデータの圧縮方法及び圧縮装置
JP3031603B2 (ja) 画像圧縮方法
EP0902398B1 (en) Method and system for compressing and decompressing binary representations of dithered images
JPH04144485A (ja) 画像処理装置
JP2005020734A (ja) ラスタ画像パス・アーキテクチャ
JP2007306560A (ja) 文書画像データのページ境界の処理方法
US5542007A (en) Form dropout compression method which handles form white-out and writing in shaded and white-out areas of the form
US6487311B1 (en) OCR-based image compression
Martins et al. Lossless, near-lossless, and refinement coding of bilevel images
EP0434005B1 (en) Image data compression method using a run prediction technique
JPH11272798A (ja) ボ―ルド体文字を区別する方法及び装置
US20030123087A1 (en) Image compression method, decompression method thereof and program therefor
Algazi et al. Compression of binary facsimile images by preprocessing and color shrinking
JP4311663B2 (ja) 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体
JPH09167222A (ja) 画像処理装置
JPH05294018A (ja) プリント装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees