JP3031603B2 - 画像圧縮方法 - Google Patents
画像圧縮方法Info
- Publication number
- JP3031603B2 JP3031603B2 JP6164087A JP16408794A JP3031603B2 JP 3031603 B2 JP3031603 B2 JP 3031603B2 JP 6164087 A JP6164087 A JP 6164087A JP 16408794 A JP16408794 A JP 16408794A JP 3031603 B2 JP3031603 B2 JP 3031603B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- image
- area
- template
- compression method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/004—Predictors, e.g. intraframe, interframe coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【産業上の利用分野】本発明は、ハーフトーン領域を含
む文書画像を高圧縮率で圧縮する画像圧縮方法に関す
る。
む文書画像を高圧縮率で圧縮する画像圧縮方法に関す
る。
【0002】
【従来の技術】文書画像から連結成分を切り出し、一つ
の連結成分を一つのパターンとみなしてテンプレートと
して登録し、該切り出されたパターンの内、類似のパタ
ーンをテンプレートで置き換えることによって、イメー
ジ情報を削減する画像圧縮方法がある(例えば、米国特
許第5,303,313号を参照)。
の連結成分を一つのパターンとみなしてテンプレートと
して登録し、該切り出されたパターンの内、類似のパタ
ーンをテンプレートで置き換えることによって、イメー
ジ情報を削減する画像圧縮方法がある(例えば、米国特
許第5,303,313号を参照)。
【0003】図9は、上記公報に記載された従来の画像
圧縮方法を説明する図である。901は英文字からなる
文書画像、902はテンプレート、903は位置情報、
904はシンボル(テンプレート番号)である。文書画
像901から連結成分(文字パターン)を切り出す。図
の例では、まず連結成分「H」を切り出し、これをテン
プレート902に登録されたパターンとのパターンマッ
チングを行う。この場合、何も登録されていないのでマ
ッチングせず、連結成分「H」がテンプレートとして新
規に登録される。また、連結成分「H」をシンボル
「1」(テンプレート番号)で表現し、そのシンボル9
04の位置情報903と共にメモリに格納する。つま
り、切り出された各連結成分(文字パターン)は、シン
ボル904と、シンボルの位置情報903で表される。
圧縮方法を説明する図である。901は英文字からなる
文書画像、902はテンプレート、903は位置情報、
904はシンボル(テンプレート番号)である。文書画
像901から連結成分(文字パターン)を切り出す。図
の例では、まず連結成分「H」を切り出し、これをテン
プレート902に登録されたパターンとのパターンマッ
チングを行う。この場合、何も登録されていないのでマ
ッチングせず、連結成分「H」がテンプレートとして新
規に登録される。また、連結成分「H」をシンボル
「1」(テンプレート番号)で表現し、そのシンボル9
04の位置情報903と共にメモリに格納する。つま
り、切り出された各連結成分(文字パターン)は、シン
ボル904と、シンボルの位置情報903で表される。
【0004】次いで、連結成分「e」を切り出し、これ
もテンプレートに登録されたパターンとマッチングしな
いので、テンプレートとして新規に登録し、これをシン
ボル「2」で表す。以下、連結成分「t」、「o」、
「l」、「d」、「m」までは、同様に処理されてテン
プレートとして登録され、それぞれにシンボル「3」か
ら「7」が割当られ、その位置情報がメモリに格納され
る。
もテンプレートに登録されたパターンとマッチングしな
いので、テンプレートとして新規に登録し、これをシン
ボル「2」で表す。以下、連結成分「t」、「o」、
「l」、「d」、「m」までは、同様に処理されてテン
プレートとして登録され、それぞれにシンボル「3」か
ら「7」が割当られ、その位置情報がメモリに格納され
る。
【0005】続いて、「m」の次の「e」が切り出され
と、この連結成分「e」は、テンプレートに登録された
パターン「e」とマッチングするのでテンプレートとし
て新規に登録されない。ただし、登録済みのパターンと
マッチングしたパターンとの平均(あるいは両パターン
の代表値)をとったパターンを作成してテンプレートを
更新処理する。これにより、類似するパターンについて
は、その代表パターンが登録されるように更新処理され
る。
と、この連結成分「e」は、テンプレートに登録された
パターン「e」とマッチングするのでテンプレートとし
て新規に登録されない。ただし、登録済みのパターンと
マッチングしたパターンとの平均(あるいは両パターン
の代表値)をとったパターンを作成してテンプレートを
更新処理する。これにより、類似するパターンについて
は、その代表パターンが登録されるように更新処理され
る。
【0006】また、シンボルには既に決定されている
「2」が割り当てられる。以下、同様にしてシンボルと
して数字「9」までが使用されると、文字「h」、
「a」には、それぞれシンボル「a」、「b」が割当ら
れる。
「2」が割り当てられる。以下、同様にしてシンボルと
して数字「9」までが使用されると、文字「h」、
「a」には、それぞれシンボル「a」、「b」が割当ら
れる。
【0007】上記したようにして文書画像は、シンボル
列(テンプレート番号列)と、シンボルの位置情報と、
各テンプレートのパターン情報に分解される。そして、
符号化での予測効率を上げ、高い圧縮率を得るためにキ
ャラクタを読み順に並べ替えた後に、予測符号化するこ
とによって画像を高効率に圧縮する。
列(テンプレート番号列)と、シンボルの位置情報と、
各テンプレートのパターン情報に分解される。そして、
符号化での予測効率を上げ、高い圧縮率を得るためにキ
ャラクタを読み順に並べ替えた後に、予測符号化するこ
とによって画像を高効率に圧縮する。
【0008】
【発明が解決しようとする課題】上記した圧縮方法は、
テキスト画像の圧縮を考慮した方法であり、つまりタイ
プされた文字は本来同じパターンであることから、この
情報の中の冗長性を排除することによって、大きな圧縮
率を得る手法である。従って、上記した方法において
は、テンプレートでの置き換え効率が悪いハーフトーン
画像領域が文書中に存在する場合に、全体として圧縮効
率が悪くなるという問題がある(なお、ハーフトーン画
像とは、階調画像を、網点などを使用して擬似的に2値
で表現した画像をいう)。これは、ハーフトーン領域で
は文字領域のように各パターン間でマッチングがとれな
いことが原因である。
テキスト画像の圧縮を考慮した方法であり、つまりタイ
プされた文字は本来同じパターンであることから、この
情報の中の冗長性を排除することによって、大きな圧縮
率を得る手法である。従って、上記した方法において
は、テンプレートでの置き換え効率が悪いハーフトーン
画像領域が文書中に存在する場合に、全体として圧縮効
率が悪くなるという問題がある(なお、ハーフトーン画
像とは、階調画像を、網点などを使用して擬似的に2値
で表現した画像をいう)。これは、ハーフトーン領域で
は文字領域のように各パターン間でマッチングがとれな
いことが原因である。
【0009】上記した例の他に、個別文字を切り出し、
該切り出された個別文字から典型文字パターンを生成
し、これをテンプレートとして各文字パターンを分類
し、典型文字パターンと分類コードを送信する画像情報
圧縮伝送方式がある(特開平3−157064号公報を
参照)。しかし、この方法では、典型文字パターンの生
成領域を考慮していないので、類似パターンの現れ難い
イメージ領域についても、同様の切り出し、マッチング
処理を行うために全体として圧縮効率の向上が期待でき
ない。
該切り出された個別文字から典型文字パターンを生成
し、これをテンプレートとして各文字パターンを分類
し、典型文字パターンと分類コードを送信する画像情報
圧縮伝送方式がある(特開平3−157064号公報を
参照)。しかし、この方法では、典型文字パターンの生
成領域を考慮していないので、類似パターンの現れ難い
イメージ領域についても、同様の切り出し、マッチング
処理を行うために全体として圧縮効率の向上が期待でき
ない。
【0010】本発明の目的は、画像中にテンプレートで
の置き換え効率の悪い領域が含まれていても高圧縮率を
可能にする画像圧縮方法を提供することにある。
の置き換え効率の悪い領域が含まれていても高圧縮率を
可能にする画像圧縮方法を提供することにある。
【0011】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像から連結成分を
切り出し、該連結成分をパターンとみなしてテンプレー
トとして登録し、該パターンと類似する他のパターンを
該テンプレートで置き換えることにより画像情報を圧縮
する画像圧縮方法において、前記文書画像から該テンプ
レートによる置き換えを行なわない領域を判定し、該判
定された領域以外に対してテンプレートによる置き換え
を行って画像を圧縮することを特徴としている。
に、請求項1記載の発明では、文書画像から連結成分を
切り出し、該連結成分をパターンとみなしてテンプレー
トとして登録し、該パターンと類似する他のパターンを
該テンプレートで置き換えることにより画像情報を圧縮
する画像圧縮方法において、前記文書画像から該テンプ
レートによる置き換えを行なわない領域を判定し、該判
定された領域以外に対してテンプレートによる置き換え
を行って画像を圧縮することを特徴としている。
【0012】請求項2記載の発明では、前記領域は、ハ
ーフトーン領域であることを特徴としている。
ーフトーン領域であることを特徴としている。
【0013】請求項3記載の発明では、前記領域は、前
記文書画像から切り出された連結成分の輪郭が所定の閾
値以上の大きさの輪郭であることを特徴としている。
記文書画像から切り出された連結成分の輪郭が所定の閾
値以上の大きさの輪郭であることを特徴としている。
【0014】請求項4記載の発明では、前記領域は、前
記所定の閾値以上の大きさの輪郭に包含されるパターン
であることを特徴としている。
記所定の閾値以上の大きさの輪郭に包含されるパターン
であることを特徴としている。
【0015】請求項5記載の発明では、前記領域は、前
記文書画像から切り出された連結成分を囲む凸領域が所
定の閾値以上の大きさであるとき、該凸領域の内部にあ
るパターンであることを特徴としている。
記文書画像から切り出された連結成分を囲む凸領域が所
定の閾値以上の大きさであるとき、該凸領域の内部にあ
るパターンであることを特徴としている。
【0016】請求項6記載の発明では、前記領域は、前
記文書画像に対してぼかし処理を施し、ぼかし処理され
た画像から切り出された連結成分の輪郭が所定の閾値以
上の大きさの輪郭であることを特徴としている。
記文書画像に対してぼかし処理を施し、ぼかし処理され
た画像から切り出された連結成分の輪郭が所定の閾値以
上の大きさの輪郭であることを特徴としている。
【0017】請求項7記載の発明では、前記領域は、前
記所定の閾値以上の大きさの輪郭に包含されるパターン
であることを特徴としている。
記所定の閾値以上の大きさの輪郭に包含されるパターン
であることを特徴としている。
【0018】請求項8記載の発明では、前記領域は、前
記文書画像に対してぼかし処理を施し、ぼかし処理され
た画像から切り出された連結成分を囲む凸領域が所定の
閾値以上の大きさであるとき、該凸領域の内部にあるパ
ターンであることを特徴としている。
記文書画像に対してぼかし処理を施し、ぼかし処理され
た画像から切り出された連結成分を囲む凸領域が所定の
閾値以上の大きさであるとき、該凸領域の内部にあるパ
ターンであることを特徴としている。
【0019】
【作用】本発明の一実施例において、マッチング領域判
定部は、入力画像を格子状の領域に分割して、各領域毎
に画像の特徴を判定する。一判定方法として、黒ランの
数を数えて、所定数以上あればハーフトーン領域と判定
する。パターン切り出し部は、ハーフトーン領域でない
と判定された文字領域などからパターンを切り出す。テ
ンプレート生成マッチング部は、切り出したパターンと
テンプレートとして登録されたパターンとのマッチング
をとり、パターンのシンボル情報、各シンボルの位置情
報、各テンプレートのパターン情報を作成する。符号化
部では、これらの情報を予測符号化方法で符号化するこ
とにより、画像を高圧縮率で圧縮する。
定部は、入力画像を格子状の領域に分割して、各領域毎
に画像の特徴を判定する。一判定方法として、黒ランの
数を数えて、所定数以上あればハーフトーン領域と判定
する。パターン切り出し部は、ハーフトーン領域でない
と判定された文字領域などからパターンを切り出す。テ
ンプレート生成マッチング部は、切り出したパターンと
テンプレートとして登録されたパターンとのマッチング
をとり、パターンのシンボル情報、各シンボルの位置情
報、各テンプレートのパターン情報を作成する。符号化
部では、これらの情報を予測符号化方法で符号化するこ
とにより、画像を高圧縮率で圧縮する。
【0020】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図において、101はスキャナなどの画像入力装置、1
02は各格子領域がマッチング対象領域であるか否かを
判定するマッチング領域判定部、103はパターン切り
出し部、104はテンプレートを生成し、マッチングを
行うテンプレート生成マッチング部、105は抽出した
パターン情報や位置情報などを符号化する符号化部、1
06は入力画像や生成データを記憶する記憶部、107
は全体を制御する制御部、108はデータ通信路であ
る。
的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図において、101はスキャナなどの画像入力装置、1
02は各格子領域がマッチング対象領域であるか否かを
判定するマッチング領域判定部、103はパターン切り
出し部、104はテンプレートを生成し、マッチングを
行うテンプレート生成マッチング部、105は抽出した
パターン情報や位置情報などを符号化する符号化部、1
06は入力画像や生成データを記憶する記憶部、107
は全体を制御する制御部、108はデータ通信路であ
る。
【0021】図2は、本発明の実施例1の処理フローチ
ャートである。図を参照しながら動作を説明する。ま
ず、スキャナなどの画像入力装置101によって画像を
入力する(ステップ201)。次に、マッチング領域判
定部102は、画像を格子状の領域に分割し(例えば、
8×8個に分割)、各領域毎に画像の特徴を調べる(ス
テップ202)。例えば、一つの方法として、黒ランの
数を数えて、一定数以上あればハーフトーン領域と判定
する。ディザ法で表現されたハーフトーン領域は細かい
点から構成されていて、文字領域に比べて黒ランの数が
多いため、ラン数で判別することができる。なお、ディ
ザ法とは、階調画像を2値の擬似的な階調画像に変換す
る一手法であり、画素の値と、閾値行列の要素の値とを
比較して、画素の値が小さければ0、それ以外のとき1
に変換することにより2値の擬似階調画像を生成する方
法である。
ャートである。図を参照しながら動作を説明する。ま
ず、スキャナなどの画像入力装置101によって画像を
入力する(ステップ201)。次に、マッチング領域判
定部102は、画像を格子状の領域に分割し(例えば、
8×8個に分割)、各領域毎に画像の特徴を調べる(ス
テップ202)。例えば、一つの方法として、黒ランの
数を数えて、一定数以上あればハーフトーン領域と判定
する。ディザ法で表現されたハーフトーン領域は細かい
点から構成されていて、文字領域に比べて黒ランの数が
多いため、ラン数で判別することができる。なお、ディ
ザ法とは、階調画像を2値の擬似的な階調画像に変換す
る一手法であり、画素の値と、閾値行列の要素の値とを
比較して、画素の値が小さければ0、それ以外のとき1
に変換することにより2値の擬似階調画像を生成する方
法である。
【0022】マッチング領域判定部102によってハー
フトーン領域(部分)ではない、つまり文字などの領域
であると判別された領域において、パターン切り出し部
103はパターン(黒画素連結成分)の切り出しを行う
(ステップ203、204)。このとき、領域の境界に
かかるパターンについては、領域を超えて連結する画素
をすべて含む形で切り出しもよいし、領域を超える場合
は画素が連結していても無視して、あくまでも領域内だ
けのパターンを切り出すという2つの方法がある。後者
の方がパターン切り出し処理は簡単であるが、領域の境
界でパターンの一部が欠落するため、マッチングの度合
いが減少する。これに対して、前者の方法はパターンが
完全に切り出せるため、マッチングの度合いは落ちない
が、境界周辺での処理が複雑になる。なお、切り出され
たパターンが領域の境界にかかるか否かは、データ記憶
部106に格納されたランデータを参照することによっ
て分かる。
フトーン領域(部分)ではない、つまり文字などの領域
であると判別された領域において、パターン切り出し部
103はパターン(黒画素連結成分)の切り出しを行う
(ステップ203、204)。このとき、領域の境界に
かかるパターンについては、領域を超えて連結する画素
をすべて含む形で切り出しもよいし、領域を超える場合
は画素が連結していても無視して、あくまでも領域内だ
けのパターンを切り出すという2つの方法がある。後者
の方がパターン切り出し処理は簡単であるが、領域の境
界でパターンの一部が欠落するため、マッチングの度合
いが減少する。これに対して、前者の方法はパターンが
完全に切り出せるため、マッチングの度合いは落ちない
が、境界周辺での処理が複雑になる。なお、切り出され
たパターンが領域の境界にかかるか否かは、データ記憶
部106に格納されたランデータを参照することによっ
て分かる。
【0023】次に、テンプレート生成マッチング部10
4は、切り出したパターンとテンプレートとして登録さ
れた幾つかのパターンとのマッチングをとる(ステップ
205)。従来技術で説明したと同様に、マッチングす
ればその登録されたパターンのシンボルによって、切り
出したパターンが表され、またどのテンプレートともマ
ッチングしなければ新たなテンプレートとして登録され
る。このとき、前述したように各シンボルの位置情報も
生成され、各パターンがシンボル情報と各シンボルの位
置情報で表現されてデータ記憶部106に格納される。
4は、切り出したパターンとテンプレートとして登録さ
れた幾つかのパターンとのマッチングをとる(ステップ
205)。従来技術で説明したと同様に、マッチングす
ればその登録されたパターンのシンボルによって、切り
出したパターンが表され、またどのテンプレートともマ
ッチングしなければ新たなテンプレートとして登録され
る。このとき、前述したように各シンボルの位置情報も
生成され、各パターンがシンボル情報と各シンボルの位
置情報で表現されてデータ記憶部106に格納される。
【0024】以上のマッチング/テンプレート生成処理
を、対象となる領域のすべてのパターンについて行う。
その結果、シンボル情報、各シンボルの位置情報、各テ
ンプレートのパターン情報がデータ記憶部106に格納
される。符号化部105は、これらの情報を予測符号化
方法で符号化し、これにより高い圧縮率が得られる。ハ
ーフトーン領域については、その内部の画像情報を所定
の符号化方法(例えば、MH、JBIGなど)で符号化
する(ステップ206)。
を、対象となる領域のすべてのパターンについて行う。
その結果、シンボル情報、各シンボルの位置情報、各テ
ンプレートのパターン情報がデータ記憶部106に格納
される。符号化部105は、これらの情報を予測符号化
方法で符号化し、これにより高い圧縮率が得られる。ハ
ーフトーン領域については、その内部の画像情報を所定
の符号化方法(例えば、MH、JBIGなど)で符号化
する(ステップ206)。
【0025】〈実施例2〉図3は、本発明の実施例2の
構成を示し、実施例1のマッチング領域判定部を、パタ
ーンサイズ判定部に置き換えて構成され、他の要素は実
施例1のものと同様である。
構成を示し、実施例1のマッチング領域判定部を、パタ
ーンサイズ判定部に置き換えて構成され、他の要素は実
施例1のものと同様である。
【0026】図4は、本発明の実施例2の処理フローチ
ャートである。まず、画像入力装置301によって画像
を入力し(ステップ401)、次に、パターン切り出し
部303はパターンの切り出しを行う(ステップ40
2)。パターンサイズ判定部302は、切り出したパタ
ーンが所定サイズ以上であるか否かを判定する(ステッ
プ403)。切り出したパターンが所定の大きさ以上の
ものは、文字ではなく写真などを構成する部分と判定
し、マッチングの対象外とするものである。
ャートである。まず、画像入力装置301によって画像
を入力し(ステップ401)、次に、パターン切り出し
部303はパターンの切り出しを行う(ステップ40
2)。パターンサイズ判定部302は、切り出したパタ
ーンが所定サイズ以上であるか否かを判定する(ステッ
プ403)。切り出したパターンが所定の大きさ以上の
ものは、文字ではなく写真などを構成する部分と判定
し、マッチングの対象外とするものである。
【0027】具体的には、切り出したパターン(黒画素
の連結成分)の輪郭を求め、該輪郭(縦および横のサイ
ズまたはその面積)が所定の閾値以上大きいとき、マッ
チングの対象外とする。
の連結成分)の輪郭を求め、該輪郭(縦および横のサイ
ズまたはその面積)が所定の閾値以上大きいとき、マッ
チングの対象外とする。
【0028】従って、図5に示すように、このような所
定サイズ以上のパターン501の内部に含まれる、文字
サイズのパターン502、503などは、マッチングの
対象としない。また、図6は、マッチングの対象外とす
るパターンの他の例を示す。601は所定サイズ以上の
パターン(黒画素連結成分)であり、602は、所定サ
イズ以上のパターン601を囲む凸領域であり、603
は、該凸領域にある文字サイズ程度のパターンである。
本実施例では、所定サイズ以上のパターンを囲む凸領域
内にあるパターン603は、マッチングの対象から外
す。
定サイズ以上のパターン501の内部に含まれる、文字
サイズのパターン502、503などは、マッチングの
対象としない。また、図6は、マッチングの対象外とす
るパターンの他の例を示す。601は所定サイズ以上の
パターン(黒画素連結成分)であり、602は、所定サ
イズ以上のパターン601を囲む凸領域であり、603
は、該凸領域にある文字サイズ程度のパターンである。
本実施例では、所定サイズ以上のパターンを囲む凸領域
内にあるパターン603は、マッチングの対象から外
す。
【0029】ステップ404以下の処理は、実施例1と
同様であるので、説明を省略する。
同様であるので、説明を省略する。
【0030】〈実施例3〉図7は、実施例3の構成を示
し、実施例2の構成に、ぼかし処理部702を付加して
構成されている。図8は、実施例3の処理フローチャー
トである。ハーフトーン部分をディザ法で表現すると、
黒画素は連結しにくいので、ハーフトーン部分を構成す
るパターンは小さくなり易い。
し、実施例2の構成に、ぼかし処理部702を付加して
構成されている。図8は、実施例3の処理フローチャー
トである。ハーフトーン部分をディザ法で表現すると、
黒画素は連結しにくいので、ハーフトーン部分を構成す
るパターンは小さくなり易い。
【0031】そこで、本実施例では、パターンの切り出
し処理を行う前に、ぼかし処理部702で予め画像にぼ
かし処理を施す(ステップ802)。例えば、このよう
なぼかし処理としては、8画素×8画素の領域の中に一
つでも黒画素があれば64画素すべてを黒画素とする処
理である。このぼかし処理によってハーフトーン部分は
黒画素が近接しているので、全体的に融合して大きな黒
画素連結成分(パターン)となる。
し処理を行う前に、ぼかし処理部702で予め画像にぼ
かし処理を施す(ステップ802)。例えば、このよう
なぼかし処理としては、8画素×8画素の領域の中に一
つでも黒画素があれば64画素すべてを黒画素とする処
理である。このぼかし処理によってハーフトーン部分は
黒画素が近接しているので、全体的に融合して大きな黒
画素連結成分(パターン)となる。
【0032】一方、文字部分は同一行の隣合う文字は融
合するものの、行間までは融合しない(その程度にぼか
しを設定しておく)ので、ぼかし処理後の連結成分はさ
ほど大きな塊とはならない。
合するものの、行間までは融合しない(その程度にぼか
しを設定しておく)ので、ぼかし処理後の連結成分はさ
ほど大きな塊とはならない。
【0033】ぼかし処理後、実施例2と同様に、パター
ン切り出し部704がパターンを切り出し(ステップ8
03)、切り出されたパターンについて、パターンサイ
ズ判定部703は所定以上の大きさか否かを判定する
(ステップ804)。以下、実施例2と同様に、パター
ンが所定以上の大きさのパターンと、またその内部のパ
ターンについては、マッチング対象外とする。マッチン
グ対象と判定された領域については、実施例1、2と同
様にして、原画像上でマッチング/テンプレート生成を
行い(ステップ805)、符号化する(ステップ80
6)。
ン切り出し部704がパターンを切り出し(ステップ8
03)、切り出されたパターンについて、パターンサイ
ズ判定部703は所定以上の大きさか否かを判定する
(ステップ804)。以下、実施例2と同様に、パター
ンが所定以上の大きさのパターンと、またその内部のパ
ターンについては、マッチング対象外とする。マッチン
グ対象と判定された領域については、実施例1、2と同
様にして、原画像上でマッチング/テンプレート生成を
行い(ステップ805)、符号化する(ステップ80
6)。
【0034】
【発明の効果】以上、説明したように、請求項1、2記
載の発明によれば、文書画像から該テンプレートによる
置き換えを行なわない領域を判定し、判定された領域以
外に対してテンプレートによる置き換えを行って画像を
圧縮しているので、マッチング効率の悪いハーフトーン
部分を含む画像においても、マッチング処理を利用した
圧縮方法によって高い圧縮率を実現することができる。
また、簡単な処理によってハーフトーン領域を判別する
ことができる。
載の発明によれば、文書画像から該テンプレートによる
置き換えを行なわない領域を判定し、判定された領域以
外に対してテンプレートによる置き換えを行って画像を
圧縮しているので、マッチング効率の悪いハーフトーン
部分を含む画像においても、マッチング処理を利用した
圧縮方法によって高い圧縮率を実現することができる。
また、簡単な処理によってハーフトーン領域を判別する
ことができる。
【0035】請求項3、4、5記載の発明によれば、連
結成分の輪郭が所定の閾値以上の大きさの輪郭と、所定
の閾値以上の大きさの輪郭に包含されるパターンと、連
結成分を囲む凸領域が所定の閾値以上の大きさであっ
て、その凸領域の内部にあるパターンとを、文字部分か
ら高精度に分離しているので、効率よく画像を圧縮する
ことができる。
結成分の輪郭が所定の閾値以上の大きさの輪郭と、所定
の閾値以上の大きさの輪郭に包含されるパターンと、連
結成分を囲む凸領域が所定の閾値以上の大きさであっ
て、その凸領域の内部にあるパターンとを、文字部分か
ら高精度に分離しているので、効率よく画像を圧縮する
ことができる。
【0036】請求項6、7、8記載の発明によれば、文
書画像中のハーフトーン領域がディザ法で処理されてい
ても、ぼかし処理を施しているので、連結成分の輪郭が
所定の閾値以上の大きさの輪郭と、所定の閾値以上の大
きさの輪郭に包含されるパターンと、連結成分を囲む凸
領域が所定の閾値以上の大きさであって、その凸領域の
内部にあるパターンとを、文字部分から高精度に分離す
ることができ、従って画像の高圧縮が可能となる。
書画像中のハーフトーン領域がディザ法で処理されてい
ても、ぼかし処理を施しているので、連結成分の輪郭が
所定の閾値以上の大きさの輪郭と、所定の閾値以上の大
きさの輪郭に包含されるパターンと、連結成分を囲む凸
領域が所定の閾値以上の大きさであって、その凸領域の
内部にあるパターンとを、文字部分から高精度に分離す
ることができ、従って画像の高圧縮が可能となる。
【図1】本発明の実施例1の構成を示す。
【図2】本発明の実施例1の処理フローチャートであ
る。
る。
【図3】本発明の実施例2の構成を示す。
【図4】本発明の実施例2の処理フローチャートであ
る。
る。
【図5】マッチングの対象外とするパターンの例を示
す。
す。
【図6】マッチングの対象外とするパターンの他の例を
示す。
示す。
【図7】本発明の実施例3の構成を示す。
【図8】本発明の実施例3の処理フローチャートであ
る。
る。
【図9】従来の画像圧縮方法を説明する図である。
101 画像入力装置 102 マッチング領域判定部 103 パターン切り出し部 104 テンプレート生成マッチング部 105 符号化部 106 データ記憶部 107 制御部 108 データ通信路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−183759(JP,A) 特開 平4−223717(JP,A) 特開 昭63−279368(JP,A) 特表 平7−505024(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 1/00 G06T 5/00 - 5/50 H04N 1/411 - 1/419
Claims (8)
- 【請求項1】 文書画像から連結成分を切り出し、該連
結成分をパターンとみなしてテンプレートとして登録
し、該パターンと類似する他のパターンを該テンプレー
トで置き換えることにより画像情報を圧縮する画像圧縮
方法において、前記文書画像から該テンプレートによる
置き換えを行なわない領域を判定し、該判定された領域
以外に対してテンプレートによる置き換えを行って画像
を圧縮することを特徴とする画像圧縮方法。 - 【請求項2】 前記領域は、ハーフトーン領域であるこ
とを特徴とする請求項1記載の画像圧縮方法。 - 【請求項3】 前記領域は、前記文書画像から切り出さ
れた連結成分の輪郭が所定の閾値以上の大きさの輪郭で
あることを特徴とする請求項1記載の画像圧縮方法。 - 【請求項4】 前記領域は、前記所定の閾値以上の大き
さの輪郭に包含されるパターンであることを特徴とする
請求項3記載の画像圧縮方法。 - 【請求項5】 前記領域は、前記文書画像から切り出さ
れた連結成分を囲む凸領域が所定の閾値以上の大きさで
あるとき、該凸領域の内部にあるパターンであることを
特徴とする請求項1記載の画像圧縮方法。 - 【請求項6】 前記領域は、前記文書画像に対してぼか
し処理を施し、ぼかし処理された画像から切り出された
連結成分の輪郭が所定の閾値以上の大きさの輪郭である
ことを特徴とする請求項1記載の画像圧縮方法。 - 【請求項7】 前記領域は、前記所定の閾値以上の大き
さの輪郭に包含されるパターンであることを特徴とする
請求項6記載の画像圧縮方法。 - 【請求項8】 前記領域は、前記文書画像に対してぼか
し処理を施し、ぼかし処理された画像から切り出された
連結成分を囲む凸領域が所定の閾値以上の大きさである
とき、該凸領域の内部にあるパターンであることを特徴
とする請求項1記載の画像圧縮方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6164087A JP3031603B2 (ja) | 1994-07-15 | 1994-07-15 | 画像圧縮方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6164087A JP3031603B2 (ja) | 1994-07-15 | 1994-07-15 | 画像圧縮方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0830794A JPH0830794A (ja) | 1996-02-02 |
JP3031603B2 true JP3031603B2 (ja) | 2000-04-10 |
Family
ID=15786534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6164087A Expired - Fee Related JP3031603B2 (ja) | 1994-07-15 | 1994-07-15 | 画像圧縮方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3031603B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111951210A (zh) * | 2019-05-14 | 2020-11-17 | 阿里巴巴集团控股有限公司 | 数据的处理方法、装置及设备 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3604993B2 (ja) * | 2000-03-16 | 2004-12-22 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法 |
JP2002314821A (ja) * | 2001-04-18 | 2002-10-25 | Ricoh Co Ltd | 画像圧縮方法、画像伸張方法、画像圧縮装置及び画像伸張装置 |
JP5051971B2 (ja) * | 2004-08-18 | 2012-10-17 | シャープ株式会社 | 画像符号化装置および画像復号装置、画像符号化方法および画像符号化方法のプログラムを記録したコンピュータ読取可能な記録媒体、ならびに画像復号方法および画像復号方法のプログラムを記録したコンピュータ読取可能な記録媒体 |
KR101454208B1 (ko) | 2007-12-28 | 2014-10-24 | 삼성전자주식회사 | 하프톤 영상 인코딩 및 디코딩 방법 및 장치 |
-
1994
- 1994-07-15 JP JP6164087A patent/JP3031603B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111951210A (zh) * | 2019-05-14 | 2020-11-17 | 阿里巴巴集团控股有限公司 | 数据的处理方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
JPH0830794A (ja) | 1996-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5303313A (en) | Method and apparatus for compression of images | |
US7352490B1 (en) | Method and system for generating contone encoded binary print data streams | |
US7386168B2 (en) | Image processing apparatus | |
US8077986B2 (en) | Information processing apparatus, method of controlling same and computer program | |
US6320981B1 (en) | Image processing system and image processing method | |
CA2369841C (en) | Method and system for classifying image elements | |
US6337929B1 (en) | Image processing apparatus and method and storing medium | |
US20030184809A1 (en) | Grayscale and binary image data compression | |
JP4364809B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記録媒体 | |
JP3278298B2 (ja) | ビットマップデータの圧縮方法及び圧縮装置 | |
JP3031603B2 (ja) | 画像圧縮方法 | |
EP0902398B1 (en) | Method and system for compressing and decompressing binary representations of dithered images | |
JPH04144485A (ja) | 画像処理装置 | |
JP2005020734A (ja) | ラスタ画像パス・アーキテクチャ | |
JP2007306560A (ja) | 文書画像データのページ境界の処理方法 | |
US5542007A (en) | Form dropout compression method which handles form white-out and writing in shaded and white-out areas of the form | |
US6487311B1 (en) | OCR-based image compression | |
Martins et al. | Lossless, near-lossless, and refinement coding of bilevel images | |
EP0434005B1 (en) | Image data compression method using a run prediction technique | |
JPH11272798A (ja) | ボ―ルド体文字を区別する方法及び装置 | |
US20030123087A1 (en) | Image compression method, decompression method thereof and program therefor | |
Algazi et al. | Compression of binary facsimile images by preprocessing and color shrinking | |
JP4311663B2 (ja) | 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体 | |
JPH09167222A (ja) | 画像処理装置 | |
JPH05294018A (ja) | プリント装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080210 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090210 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100210 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110210 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |