JP2010062935A - 符号化装置、符号化方法、プログラム、および情報記録媒体 - Google Patents

符号化装置、符号化方法、プログラム、および情報記録媒体 Download PDF

Info

Publication number
JP2010062935A
JP2010062935A JP2008227297A JP2008227297A JP2010062935A JP 2010062935 A JP2010062935 A JP 2010062935A JP 2008227297 A JP2008227297 A JP 2008227297A JP 2008227297 A JP2008227297 A JP 2008227297A JP 2010062935 A JP2010062935 A JP 2010062935A
Authority
JP
Japan
Prior art keywords
image
encoding
foreground
filter
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008227297A
Other languages
English (en)
Other versions
JP4965534B2 (ja
Inventor
Hiroyuki Sakuyama
宏幸 作山
Akio Matsubara
章雄 松原
Tamon Sadasue
多聞 貞末
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008227297A priority Critical patent/JP4965534B2/ja
Publication of JP2010062935A publication Critical patent/JP2010062935A/ja
Application granted granted Critical
Publication of JP4965534B2 publication Critical patent/JP4965534B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】文字画像および非文字画像ともに圧縮率を高くし、かつ文字画像および非文字画像それぞれの役割に応じた符号化を行うことができる符号化装置、符号化方法、プログラム、および情報記録媒体を提供する。
【解決手段】原画像から、前景1、前景2、および前景1または前景2を画素毎に選択するためのマスク2を作成する作成部1501と、マスク2を符号化するマスク符号化部1502と、第1フィルタを施して前景1を周波数変換することにより得られた係数の量子化および符号化を行う前景1符号化部1503と、低周波成分に対するタップ長が第1フィルタの低周波成分に対するタップ長より短い第2フィルタを施して前景2を周波数変換することにより得られた係数の量子化および符号化を行う前景2符号化部1504と、マスク2、前景1、および前景2の符号を結合し、所定のフォーマットに従った符号化データを取得する符号取得部1506と、を備える。
【選択図】 図15

Description

本発明は、符号化装置、符号化方法、プログラム、および情報記録媒体に関するものである。
一般に文書は文字・線画・画像が混在して構成されるが、近年、このような混在文書を効率的に符号化するために、文書を、文字または線画の色を表す文字画像と、文字画像を除いた画像の色を表す非文字画像とに分離し、各々に対して異なる符号化処理を施す技術が提案されている。
文書を複数の画像に分離し、各々に対して異なる符号化を施す手法としてミクストラスターコンテント(MRC)モデルと呼ばれる手法がある。図24は、MRCモデルの概念を示す説明図である。MRCモデルと呼ばれる手法は、図24に示すように、1ページの文書を、文字画像(前景)と、非文字画像(背景)と、文字画像または非文字画像を選択するための選択画像(マスク)といった3つのレイヤに分けて、レイヤごとに符号化を行う手法である。
例えば、MRCモデルの典型例であり、画像データを、第1の画像データと、第2の画像データと、第1の画像データおよび第2の画像データのいずれかを選択する選択データと、の3つのデータに分離し、それぞれ符号化して圧縮した圧縮データを入力として画像を合成することにより、高圧縮率時の文字・線画の劣化を防止することができる画像処理装置が提案されている(特許文献1参照)。
また、このようなMRCモデルでは、1つの背景に対して、前景およびマスクの組を複数重ね合わせる手法が一般的である。また、マスクとは、前景を文字の形に切り取るための形状情報を持つものであり、マスクの値が前景の透過率(前景と背景の混合比)を持つ場合もある。さらに、背景、マスク、および前景の解像度は、任意に選択できることも多い。
特開平11−177977号公報
ところで、近年では、上述したMRCモデルにおける符号化処理に対する高画質化かつ高圧縮率化のニーズの高まりと同時に、混在文書の構造の複雑化が進んでいる。例えば、従来の混在文書の前景は、図24に示すように、単色の組み合わせで実現できるもの(例えば、人口画像に近いもの)がほとんどであったが、最近の文書作成環境の高度化に伴い、前景にグラーデーション等をかけることが容易になってきた。このような、単色の組み合わせでは表現できない前景は、従来の前景よりも自然画に近い絵柄であり、かつ高圧縮率化へのニーズの高まりにより高圧縮率化が求められるようになってきている。
従って、最近では、前景の圧縮方式として、自然画よりの絵柄を高圧縮率で圧縮可能な方式であって、周波数変換と量子化とを伴う符号化(所謂、変換符号化)を採用する必要性が生じてきた。その結果、最近では、背景だけでなく、前景に対しても変換符号化を適用することがある。
しかし、変換符号化は、量子化による誤差が周波数変換または周波数逆変換に用いるフィルタのタップが及ぶ範囲に分散するため、MRCモデルにおける符号化処理に変換符号化を用いる場合、周波数変換に用いるフィルタのタップ長に関して以下に述べる点に注意する必要がある。
例えば、JEPGのような8*8画素範囲単位で周波数変換または周波数逆変換を行う方式の場合、周波数変換時および周波数逆変換時に用いるフィルタのタップ長は8画素であり、8*8画素範囲内に量子化による誤差が分散される。一方、JEPG2000のようなウェーブレット変換を再帰的にn回繰り返すような周波数変換を用いる場合、再帰的な周波数変換の結果、フィルタのタップ長を2のn乗倍する効果を有するため、ある係数に生じた量子化による誤差は、広範囲の画素に対して分散される。
一般には、低周波成分の画像を近似するにはフィルタのタップ長が長い変換符号化(例えば、JPEG2000)が適しており、高周波成分の画像を近似するにはフィルタのタップ長が短い変換符号化(例えば、JPEG)が適している。よって、画像の圧縮率を上げるためには、低周波成分の画像に対してはよりフィルタのタップ長が長い変換符号化を用い、高周波成分の画像に対してはよりフィルタのタップ長が短い変換符号化を用いる方式が有利であるとされている。なお、ハイパスフィルタとローパスフィルタのタップ長が異なることは一般的である。
従って、低周波成分の画像に対する変換符号化ではフィルタのタップ長を長くとる傾向があるが、タップ長が長くなると、量子化による誤差が分散する範囲が広くなる。そして、この誤差の分散は、色自体が分散することを意味し、例えば、図24に示す前景の様に本来は2色であった画像を周波数変換した場合、2色の境界部分の色が混じることを意味する。仮に、その境界部分付近に文字があった場合、その文字の色が本来の色とは大きく異なるものになることがある。
つまり、量子化による誤差が分散する範囲が限定される変換符号化は、圧縮率は低いが、色が混ざらないという利点がある。一方、量子化による誤差が分散する範囲が広い変換符号化は、圧縮率は高いが、色が混ざりやすいという欠点がある。よって、前景および背景の符号化に変換符号化を用いる場合、その役割上、前景に対しては色の混ざりにくい変換符号化、背景に対しては圧縮率が高い変換符号化を用いるのが望ましい。
本発明は、上記に鑑みてなされたものであって、文字画像および非文字画像ともに圧縮率を高くし、かつ文字画像および非文字画像それぞれの役割に応じた符号化を行うことができる符号化装置、符号化方法、プログラム、および情報記録媒体を提供することを目的とする。
上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、原画像から、線画または文字を表す文字画素の色を、前記文字画素以外の非文字画素を構成する色の割合および前記文字画素と前記非文字画素との位置関係の少なくとも一方に応じて決定される色で置換した第1画像、前記非文字画素の色を、前記文字画素を構成する色の割合および前記文字画素と前記非文字画素との位置関係の少なくとも一方に応じて決定される色で置換した第2画像、および前記第1画像または前記第2画像を画素毎に選択するためのマスク画像を作成する作成手段と、前記マスク画像を符号化するマスク符号化手段と、第1フィルタを施して前記第1画像を周波数変換することにより得られた係数の量子化および符号化を行う第1画像符号化手段と、低周波成分に対するタップ長が前記第1フィルタの低周波成分に対するタップ長より短い第2フィルタを施して前記第2画像を周波数変換することにより得られた係数の量子化および符号化を行う第2画像符号化手段と、前記マスク画像、前記第1画像、および前記第2画像の符号を結合し、所定のフォーマットに従った符号化データを取得する取得手段と、を備えたことを特徴とする。
また、請求項2にかかる発明は、請求項1にかかる発明において、前記第1画像符号化手段は、JPEG−XRにより前記第1画像を符号化し、前記第2画像符号化手段は、JPEGにより前記第2画像を符号化することを特徴とする。
また、請求項3にかかる発明は、請求項1にかかる発明において、前記第1画像符号化手段は、JPEG−2000により前記第1画像を符号化し、前記第2画像符号化手段は、JPEGにより前記第2画像を符号化することを特徴とする。
また、請求項4にかかる発明は、請求項1にかかる発明において、前記第1画像符号化手段は、JPEG−XRにより前記第1画像を符号化し、前記第2画像符号化手段は、JPEG−XRにより前記第2画像を符号化するものであって、前記第1画像符号化手段がプレフィルタを施した回数よりも少ない回数プレフィルタを施すことを特徴とする。
また、請求項5にかかる発明は、請求項1にかかる発明において、前記第1画像符号化手段は、JPEG2000により前記第1画像を符号化し、前記第2画像符号化手段は、JPEG2000により前記第2画像を符号化するものであって、ウェーブレット変換を行った回数が前記第1画像符号化手段によりウェーブレット変換を行った回数より少ないことを特徴とする。
また、請求項6にかかる発明は、請求項1にかかる発明において、前記第1画像符号化手段は、JPEG2000により前記第1画像を符号化するものであって、前記第1画像を9*7フィルタを施して周波数変換し、前記第2画像符号化手段は、JPEG2000により前記第2画像を符号化するものであって、前記第2画像を5*3フィルタを施して周波数変換することを特徴とする。
また、請求項7にかかる発明は、請求項1から6のいずれか一に記載の符号化装置において実行される符号化方法である。
また、請求項8にかかる発明は、請求項7に記載の符号化方法を実行するプログラムである。
また、請求項9にかかる発明は、請求項8記載のプログラムを記憶する情報記録媒体である。
本発明によれば、文字画像および非文字画像ともに高圧縮率で圧縮可能な符号化方式で符号化することができるので、文字画像および非文字画像ともに圧縮率を高くすることができ、かつ文字画像と非文字画像とで量子化による誤差が分散する範囲を変えることができるので、文字画像および非文字画像それぞれの役割に応じた符号化を行うことができる、という効果を奏する。
以下に添付図面を参照して、この発明にかかる符号化装置、符号化方法、プログラム、および情報記録媒体の最良な実施の形態を詳細に説明する。なお、本実施の形態では、符号化装置を備える一般的なPC(パーソナルコンピュータ)の最良な実施の形態を詳細に説明する。但し、PCに限られず、MFP(Multi Function Peripheral)、デジタル複写機、プリンタ、ファクシミリ、スキャナ機能やコピー、ファクシミリ、プリンタなどの画像形成処理を行うものであれば、本実施の形態の符号化装置を適用することができる。
まず、本実施の形態の理解を容易にするため、本実施の形態で使用するMRCモデルで用いる符号化方式であるJPEG2000およびJPEG−XRの概要について説明する。
図1〜3を参照して、JPEG2000の概要について説明する。図1は、JPEG2000の符号化アルゴリズムの説明のためのフローチャートである。
まず、画像は矩形のタイルに分割される(分割数≧1)。次に、タイルは、例えば、RGBの3コンポーネントで構成されるカラー画像を符号化する場合、DCレベルシフトと輝度・色差のコンポーネントへの色変換が施される(ステップS101)。より厳密には、色変換を施す前に、DCレベルシフトを行う。DCレベルシフトは、入力される画像信号がRGB信号値のような正の数である場合に所定の変換式を用いて各信号値から信号のダイナミックレンジの1/2を減算するレベルシフト処理を行い、色変換ではRGB画像を輝度色差系のYCrCb画像に変換することによりカラー画像の圧縮効率を高める処理を行うことができる。
DCレベルシフトは、画像信号がRGB信号値のような正の数(符号なし整数)である場合には、式(1)に示すように順変換では各信号値から信号のダイナミックレンジの半分を減算するレベルシフトを、逆変換では各信号値に信号のダイナミックレンジの半分を加算するレベルシフトを行う。但し、レベルシフトは画像信号がYCbCr信号におけるCbやCrのような符号付き整数の場合には適用しない。
JPEG2000のDCレベルシフトの順変換および逆変換に用いる式(1)は以下の通りである。
I(x,y)←I(x,y)-2^Ssiz(i) 順変換
(1)
I(x,y)←I(x,y)+2^Ssiz(i) 逆変換
ここで、Ssiz(i)とは画像の各コンポーネントi(RGB画像ならi=0,1,2)のビット深さから1を減じたものである。また、2^Ssiz(i)は2のSsiz(i)乗を意味し、I(x,y)は座標(x,y)における信号値(画素値)である。
色変換は、カラー画像を効率良く圧縮するために行う。これはJPEGでもRGB画像をYCrCb画像に変換後に圧縮を行うと圧縮率が向上し、結果的には再生画質が良くなることと目的は同じである。色変換には、可逆と非可逆の2つの方法が定義されている。
可逆変換(RCT)
可逆変換は、RCT(Reversible multiple component transformation)と呼ばれ、変換式の係数が整数値であることが特徴である。この変換式を式(2)に示す。
Y0(x,y)=floor((I0(x,y)+2*(I1(x,y)+I2(x,y))/4)
Y1(x,y)=I2(x,y)-I1(x,y) 順変換
Y2(x,y)=I0(x,y)-I1(x,y)
(2)
I1(x,y)=Y0(x,y)-floor((Y2(x,y)+Y1(x,y))/4)
I0(x,y)=Y2(x,y)+I1(x,y) 逆変換
I2(x,y)=Y1(x,y)+I1(x,y)
なお、Iは原信号を示し、Yは変換後の信号を示している。また、IやYに続く0〜2はサフィクスである。具体的には、RGB信号を可逆変換する場合、I信号においてはI0=R,I1=G,I2=Bと表され、Y信号においてはY0=Y,Y1=Cb,Y2=Crと表される。さらに、floor(x)は、xのフロア関数(実数xを、xを越えず、かつxに最も近い整数に置換する関数)を示している。
非可逆変換(ICT)
非可逆変換はICT(Irreversible multiple component transformation)と呼ばれ、変換式の係数がRCTと異なり実数値であることが特徴である。この変換式を式(3)に示す。
Y0(x,y)=0.299*I0(x,y)+0.587*I1(x,y)+0.144*I2(x,y)
Y1(x,y)=-0.16875*I0(x,y)-0.33126*I1(x,y)+0.5*I2(x,y) 順変換
Y2(x,y)=0.5*I0(x,y)-0.41869*I1(x,y)-0.08131*I2(x,y)
(3)
I0(x,y)=Y0(x,y)+1.402*Y2(x,y)
I1(x,y)=Y0(x,y)-0.34413*Y1(x,y)-0.71414*Y2(x,y) 逆変換
I2(x,y)=Y0(x,y)+1.772*Y1(x,y)
なお、Iは原信号を示し、Yは変換後の信号を示している。また、IやYに続く0〜2はサフィクスである。具体的には、RGB信号を非可逆変換する場合、I信号においてはI0=Y,I1=G,I2=Bと表され、Y信号においてはI0=Y,I1=Cb,I2=Crと表される。
そして、タイル毎に、色変換後のコンポーネント(タイルコンポーネントと呼ばれる)は、ウェーブレット変換によって、LL,HL,LH,HHと略称される4つのサブバンドに分割される(ステップS102)。そしてLLサブバンドに対して再帰的にウェーブレット変換(デコンポジション)を繰返すと、最終的に1つのLLサブバンドと複数のHL,LH,HHサブバンドが生成される。ここで、JPEG2000で採用されている2次元ウェーブレット変換について説明する。
色変換後施される2次元ウェーブレット変換では、5*3フィルタを施す5*3ウェーブレット変換と、9*7フィルタを施す9*7ウェーブレット変換を選択することができる。5*3ウェーブレット変換とは、5画素を用いて1つのローパスフィルタの出力(ローパス係数)が得られ、3画素を用いて1つのハイパスフィルタの出力(ハイパス係数)が得られる変換である。同様に、9*7ウェーブレット変換とは、9画素を用いて1つのローパスフィルタの出力(ローパス係数)が得られ、7画素を用いて1つのハイパスフィルタの出力(ハイパス係数)が得られる変換である。主な違いは、フィルタの範囲の違いであり、偶数位置中心にローパスフィルタ、奇数位置中心にハイパスフィルタが施されるのは同様である。9*7フィルタにも同様に当てはまる。
5*3ウェーブレット変換の変換式を式(4)に示す。
順変換
C(2i+1)=P(2i+1)-floor((P(2i)+P(2i+2))/2) [step1]
C(2i)=P(2i)+floor((C(2i-1)+C(2i+1)+2)/4) [step2]
逆変換 (4)
P(2i)=C(2i)-floor((C(2i-1)+C(2i+1)+2)/4) [step3]
P(2i+1)=C(2i+1)+floor((P(2i)+P(2i+2))/2) [step4]
9*7ウェーブレット変換の変換式を式(5)に示す。
順変換
C(2n+1)=P(2n+1)+α*(P(2n)+P(2n+2)) [step1]
C(2n)=P(2n)+β*(C(2n-1)+C(2n+1)) [step2]
C(2n+1)=C(2n+1)+γ*(C(2n)+C(2n+2)) [step3]
C(2n)=C(2n)+δ*(C(2n-1)+C(2n+1)) [step4]
C(2n+1)=K*C(2n+1) [step5]
C(2n)=(1/K)*C(2n) [step6]
逆変換 (5)
P(2n)=K*C(2n) [step1]
P(2n+1)=(1/K)*C(2n+1) [step2]
P(2n)=X(2n)-δ*(P(2n-1)+P(2n+1)) [step3]
P(2n+1)=P(2n+1)-γ*(P(2n)+P(2n+2)) [step4]
P(2n)=P(2n)-β*(P(2n-1)+P(2n+2)) [step5]
P(2n)=P(2n+1)-α*(P(2n)+P(2n+2)) [step6]
但し、α=-1.586134342059924
β=-0.052980118572961
γ=0.882911075530934
δ=0.443506852043971
K=1.230174104914001
ウェーブレット変換後、各サブバンドはプリシンクトと呼ばれる矩形に分割される。図2は、画像、タイル、サブバンド、プリシンクト、コードブロックの関係を示す図である。プリシンクトは、図2に示すように、サブバンドを矩形に分割したもので、HL,LH,HH各サブバンドの対応したプリシンクトは3つで1まとまりとして扱われる。但し、LLサブバンドを分割したプリシンクトは1つで1まとまりとして扱われる。プリシンクトは、大まかには画像中の場所(Position)を表すものである。プリシンクトはサブバンドと同じサイズにできる。図2に示すように、プリシンクトをさらに矩形に分割したものがコードブロックである。よって、物理的な大きさの序列は、画像≧タイル>サブバンド≧プリシンクト≧コードブロックとなる。図3は、デコンポジションレベル(施すウェーブレット変換の回数)と解像度レベルの関係を示す説明図である。
以上の分割の後、サブバンド毎の係数の量子化およびMQR符号化と呼ばれるエントロピー符号化(ビットプレーン符号化)が、コードブロック毎かつビットプレーン順に成される(ステップS103、ステップS104)。なお、本実施の形態では、係数の量子化は、9*7フィルタを施してウェーブレット変換した場合、係数自体を量子化するが、5*3フィルタを施してウェーブレット変換した場合、係数をビットプレーン順にMQR符号化する際の下位ビットプレーンの符号化の省略または符号化後のビットプレーンの符号の破棄により量子化と同様の効果を得るものとする。
そして、プリシンクトに含まれる全てのコードブロックから、ビットプレーンの符号の一部を取り出して集めたものにヘッダをつけたパケットを生成する(ステップS105)。パケットヘッダには、当該パケットに含まれる符号に関する情報が含まれ、各パケットは独立して扱うことができる。いわばパケットは符号の単位である。
そして、全てのプリシンクト(=全てのコードブロック=全てのサブバンド)のパケットに関して、必要なパケットのみを選択し、選択したパケットを、並べて符号を形成する(ポスト量子化)(ステップS106)。
次に、図4〜11を参照して、JPEG−XRの概要について説明する。図4は、JPEG−XRの符号化アルゴリズムの説明のためのフローチャートである。
まず、JPEG−XRでは、画像は色変換が施された後(ステップS401)、矩形のタイルに分割される(分割数≧1)。さらに、タイルは、4*4画素のブロックに分割され、この4*4画素のブロック単位で周波数変換が行われる。そのため、高い圧縮率で符号化処理を行った場合、従来のJPEGと同様に、量子化による誤差の分散範囲が広くなり、ノイズが生じる恐れがある。
そこで、JPEG−XRでは、4*4画素のブロックに周波数変換を行う前に、画像の当該ブロック間をまたぐ4*4画素ごとに圧縮するプレフィルタが用いられる(ステップS402)。但し、このプレフィルタを用いるか否かは任意に選択できるものとする。図5は、プレフィルタを用いる4*4画素と周波数変換する4*4画素との関係の説明図である。また、図6は、4*4画素のプレフィルタの式を仮想的なプログラムで表した図である。図7は、4*4画素のプレフィルタの式を仮想的なプログラムで表した図である。図8は、周波数変換式を仮想的なプログラムで表した図である。
なお、図5から予想されるように、画像の境界部においては、4画素分(4*1)のプレフィルタ(4点プレフィルタとも呼ぶ)を2回用い、画像の4隅の2*2画素については、プレフィルタ自体を用いないものとする。
次に、画像内でブロック間をまたぐ4*4画素ごとにプレフィルタが用いられた後、各タイル内でブロックごとに周波数変換が成される(ステップS403)。そして、各タイル内で、16個のブロックの集合であるマクロブロック内のDC成分を集めて4×4係数のブロックを形成し(ステップS404)、ブロックを集めてできる画像(係数群)内で、ブロックをまたぐ4×4係数ごとにプレフィルタを用いる(ステップS405)。上述したように、この2回目のプレフィルタを用いるか否かは任意に選択できるものとする。
図9は、JPEG−XRにおける原画像、タイル、マクロブロック、ブロック、および画素の関係を示した説明図である。図9に示すように、原画像はタイルに分割され、タイルはマクロブロックに分割され、マクロブロックは16個のブロックに分割され、1ブロックは4*4画素から成る。よって、原画像、タイル、マクロブロック、ブロック、および画素の大きさの関係は、原画像≧タイル≧マクロブロック≧ブロック≧画素の関係になる。
図10は、4*4画素のブロックの周波数変換により得られるDC(直流)係数、LP(ローパス)係数、HP(ハイパス)係数の階層的な関係を示す説明図である。すなわち、DC係数だけを復号すると、画像の1/16の解像度の画像が得られ、DC係数およびLP係数を復号すると、画像の1/4の解像度の画像が得られる。また、図11は、色変換式を示す図である。
以上のように、JPEG−XRでは、符号化された係数を復号すると、DC係数の誤差は最初の逆変換で4*4の第1ブロックに拡散され、次の逆変換で16*16のマクロブロックに分散されるため、その周波数変換で施したフィルタのタップ長は16タップであると見なすことができる。また、プレフィルタを施した場合は、量子化による誤差の拡散範囲はより広くなり、より長いタップ長とみなすことができる。
次いで、タイル毎に、係数を量子化し、所定のエントロピー符号化が成される(エントロピー符号化の詳細は本質的な事項ではないため詳述しない)(ステップS406)。
図12は、MRCモデルによる符号構成の説明図である。MRCを用いた符号フォーマットは、MRC符号であること等を示す全体用ヘッダと、1つの背景符号およびそのヘッダと、それに重ね合わせる1つ若しくは複数の「前景符号とマスク符号のペア」およびそのペア用のヘッダで構成されるのが典型であり、図12のような符号の構成をとる。
例えば、本実施の形態では、背景、前景、およびマスクの符号化方式として、JPEG2000を選択可能にしたJPM(JPEG2000 Multi Layer)を用いる。もちろん、JPMでは、JPEG2000以外の符号化方式としてJPEG、MMR、JBIG等も選択可能であり、そのJPM符号のフォーマットも、図12に示すような符号の構成をとる。
図13は、JPM符号の構成例の説明図である。なお、点線部分はオプションであるので、実線部分を中心に簡単に説明する。図13において、「JPEG2000 Signature box」は、当該符号がJPEG2000ファミリーに属することを示す全体のヘッダである。「File Type box」は、当該符号がJPMフォーマットであることを示す全体のヘッダである。「Compound Image Header box」は、当該符号の全般的な情報を含む全体のヘッダである。「Page Collection box」は、当該符号がマルチページからなる場合に各ページの順番を示す目次的なものである。「Page box」は、ページの解像度等を示す全体のヘッダである。ここで、ページとは、画像を順次重ねて(合成して)いくためのキャンバスであり、合成が終った後の画像と同じ大きさを持つ。JPMの場合、ページには、前景とマスクのペアで構成される「layout object(レイアウト・オブジェクト)」が順次描画される。「Layout Object box」は、前景とマスクのサイズや位置等を示す、前景及びマスク用のヘッダである。「Media Data box」や「Contiguous Codestream box」は、前景やマスクの符号を含む部分である。なお、JPMでは、背景(BasePage)は、レイアウト・オブジェクトが描画される前の初期的なページとして扱われる。
なお、JPMでは、上述したように、背景に対して前景とマスクとのペアとして定義されるレイアウト・オブジェクトを順次重ねて画像を合成する処理において、前景と背景とを合成する方法として、
(i)前景か背景のいずれかを選択する方法
(ii)前景の値と背景の値の加重平均をとる方法
が選択可能である。(i)の場合には、マスクを2値とし、その値が1のときに前景を選択し、0のときに背景を選択するものである。また、(ii)の場合には、マスクに8ビットの正の値を持たせ、以下に示す式(6)
合成画像=(マスク値/255)*前景+{(255-マスク値)/255}*背景 (6)
により前景と背景の加重平均により合成するものである。これらのいずれの合成方法をとるかは、前景とマスクのペアごとに指定可能であり、各ペア用のヘッダに記載する。
(第1実施の形態)
図14は、本実施の形態にかかるPCのハードウェア構成を示すブロック図である。本実施の形態にかかるPC100は、CPU(Central Processing Unit)101、RAM(Random Access Memory)102、HDD(Hard Disk Drive)103等をシステムバス104により相互接続した一般的なパーソナルコンピュータである。
CPU101は、PC100の全体を制御するためのマイクロプロセッサである。
RAM102は、各種データを書換え可能に記憶する性質を有していることから、CPU101の作業エリアとして機能してバッファ等の役割を果たす。
HDD103は、画像やCPU101により実行される各種プログラムを記憶する情報記録媒体である。
なお、情報記録媒体としては、HDD103のみならずCD(Compact Disk)−ROM、DVD(Digital Versatile Disk)などの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク等、半導体メモリ等の各種方式のメディアを用いることができる。また、図示しない外部I/F装置を介してインターネットなどのネットワークからプログラムをダウンロードし、HDD103にインストールするようにしてもよい。この場合に、送信側のサーバでプログラムを記憶している記憶装置も、この発明における情報記録媒体である。なお、プログラムは、所定のOS(Operating System)上で動作するものであってもよいし、その場合に後述する各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれるものであってもよい。
このシステム全体の動作を制御するCPU101は、このシステムの主記憶装置として使用されるHDD103に記憶されたプログラムに基づいて各種処理を実行する。
次に、PC100のHDD103に記憶されているプログラムがCPU101に実行させる機能のうち、本実施の形態のPC100が備える特長的な機能について説明する。
まず、図14を用いて、PC100が備える特長的な機能の概略について説明する。(1)HDD103より処理対象となる原画像がCPU101からの命令によってRAM102に読み込まれる。(2)CPU101は、RAM102上の原画像を読み込み、MRCモデルを用いた符号化を行う。(3)CPU101は、符号化されたデータをRAM102上の別の領域に書き込む。(4)CPU101からの命令によってその符号化されたデータがHDD103に保存される。
次に、図15〜17を用いて、PC100が備える特長的な機能の詳細について説明する。図15は、本実施の形態にかかるPCの機能構成を示すブロック図である。図16は、本実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。図17は、原画像を、背景、マスク1と前景1のペア、マスク2と前景2のペアに分割する例を示す図である。PC100は、HDD103に記憶されているプログラムを従うことにより、RAM102上の原画像を読み込み、原画像から背景、前景1、前景2、マスク1およびマスク2を作成する作成部1501と、マスク1,2を符号化するマスク符号化部1502と、前景1を周波数変換することにより得られた係数の量子化および符号化を行う前景1符号化部1503と、前景2を周波数変換することにより得られた係数の量子化および符号化を行う前景2符合化部1504、背景を周波数変換することにより得られた係数の量子化および符号化を行う背景符号化部1505と、マスク1,2、前景1,2、および背景の符号を所定のフォーマットに従って結合した符号を取得する符号取得部1506と、を実現する。
まず、作成部1501は、RAM102上の原画像を4つのタイルに分割する(ステップS1600)。なお、タイルの分割数は増減可能である。
次に、作成部1501は、RAM102上の原画像の画素単位で、線画または文字を構成する画素(文字画素)であるか、それ以外の画素(非文字画素)であるかの判別を行い、文字画素に対応する位置の値を1、それ以外の非文字画素に対応する位置の値を0にしたものであって、前景1または前景2を画素毎に選択するためのマスク2(マスク画像)を作成する(ステップS1601)。
ここで、文字画素とそれ以外の非文字画素の判別は公知の像域判別の手法によることができるが、本実施の形態では、例えば、以下に示す手法が用いられる。図18Aおよび図18Bは、Sobelオペレータを示す図である。原画像の各画素に対し、エッジ検出オペレータとして周知のSobelフィルタを作用させる。すなわち、注目画素を中心とした3*3画素に対し、図18Aに示す第1の重みマトリクス(Sobelオペレータ)を乗算し、その和HSを算出し、同様に図18Bに示す第2の重みマトリクスを乗算して、その和VSを算出する。そして、HSとVSの2乗和の平方根√(HS^2+VS^2)を、注目画素についてのフィルタの出力値とする。そして、フィルタの出力値が所定の閾値th(例えば30)以上ならば注目画素を文字画素と判断し、マスクの対応画素位置に1をセットし、そうでなければ対応画素位置に0をセットする。同様の処理手順を全画素について繰り返すことにより、マスク2を作成する。
次に、作成部1501は、原画像の非文字画素の色を、当該非文字画素の最も近傍に位置する文字画素の色で置換した、多値の前景2(本発明にかかる第2画像)を作成する(ステップS1602)。なお、本実施の形態では、原画像の非文字画素の色を文字画素の色で置換しているが、非文字画素の色を、文字画素を構成する色の割合および文字画素と非文字画素との位置関係の少なくとも一方に応じて決定される色で置換するものであれば、これに限定するものではない。例えば、非文字画素の色を、当該非文字画素の近傍に位置する文字画素の色の平均値で置換してもよい。本実施の形態では、作成部1501は、タイル内の全ての非文字画素に対して、この処理を行うため、図17に示すように、タイル内は文字画素の色で置換される。よって、原画像の文字画素の色が一色の場合には、タイル自体が一色の色で置換される。
次に、作成部1501は、原画像の文字画素の色を、当該文字画素の最も近傍に位置する非文字画素の色で置換した、多値の前景1(本発明にかかる第1画像)を作成する(ステップS1603)。なお、本実施の形態では、原画像の文字画素の色を非文字画素の色で置換しているが、文字画素の色を、非文字画素を構成する色の割合および文字画素と非文字画素との位置関係の少なくとも一方に応じて決定される色で置換するものであれば、これに限定するものではない。例えば、文字画素の色を、当該文字画素の近傍に位置する非文字画素の色の平均値で置換してもよい。次に、作成部1501は、原画像と同一サイズで全画素値を1にセットした2値のマスク1を作成する(ステップS1604)。次に、作成部1501は、原画像と同一サイズの全画素値を0にセットした多値の背景を作成する(ステップS1605)。以上の処理により、原画像から、背景、前景1とマスク1のペア、前景2とマスク2のペアが作成される。
前景1符号化部1503は、5*3フィルタを施すウェーブレット変換を3回行って得られた係数の量子化および符号化を行うJPEG2000により前景1を圧縮する(ステップS1606)。なお、5*3フィルタを施すウェーブレット変換が3回行われた場合、前景1符号化部1503が周波数変換で施した前景1の低周波成分に対するフィルタ(第1フィルタ)のタップ長は、20とみなすことができる。
本実施の形態では、前景1符号化部1503は、5*3フィルタを施すウェーブレット変換を行っているため、MQR符号化する際の下位ビットプレーンの符号化の省略により量子化と同様の効果を得るものとする。具体的には、前景1符号化部1503は、最上位のビットプレーンから、図19に示すテーブルで予め規定された数の下位ビットプレーンを除いたビットプレーンまでをMQR符号化する。図19は、各コンポーネント(Y,Cb,Cr)の各デコンポジションレベルにおけるサブバンドの係数のうち、符号化しない下位ビットプレーンの数を示したテーブルを示す図である。例えば、前景1符号化部1503は、Yコンポーネントのデコンポジションレベル1におけるHHサブバンドの係数のうち、下位4ビットのビットプレーンの符号化を行わない(破棄する)。
次いで、前景2符号化部1504は、低周波成分に対するフィルタのタップ長が前景1符合化部1503で施したフィルタのタップ長より短いフィルタ(第2フィルタ)を施して周波数変換(離散コサイン変換)することにより得られた係数の量子化および符号化を行うJPEGにより前景2を圧縮する(ステップS1607)。
ここで、圧縮率を高くすることができる変換符号化(符号化方式)としては、標準化されたJPEGおよびJPEG2000、標準化の途上にあるJPEG−XRがあるが、各符号化方式における量子化による誤差が分散する範囲(周波数変換を施すフィルタのタップ長)は、JPEG<JPEG−XR<JPEG2000という関係にある。本実施の形態では、前景1の周波数変換で施したフィルタのタップ長より短いフィルタを施して前景2を周波数変換することにより、前景2の量子化による誤差が分散する範囲を前景1の量子化による誤差が分散する範囲より狭くしている。
また、マスク符号化部1502は、周知のMMRにより2値のマスク1およびマスク2を符号化する(ステップS1608)。
また、背景符号化部1505は、背景をJPM仕様(JPEG2000 Multi Layer)により符号化する(エントロピー符号化を行わず、符合として背景色を指定する)(ステップS1609)。
最後に、符号取得部1506は、前景1,2、マスク1,2、および背景の符号をJPMフォーマットに従って結合したJPM符号を取得する(ステップS1610)。なお、本実施の形態では、前景1,2、マスク1,2、および背景の符号をJPMフォーマットに従って結合したが、これに限定するものではない。例えば、MRCモデルであれば例えばPDFフォーマットに従って前景1,2、マスク1,2、および背景の符号を結合してもよい。
このように、本実施の形態にかかるPC100によれば、前景1をJPEG2000により圧縮し、前景2をJPEGで圧縮することにより、前景1および前景2ともに高圧縮率で圧縮可能な符号化方式で符号化することができ、かつ前景1と前景2とで量子化による誤差が分散する範囲を変えることができるので、前景1および前景2それぞれの役割に応じた符号化を行うことができる。
(第2実施の形態)
本実施の形態にかかるPCは、JPEG2000による前景1のデコンポジションレベルを、JPEG2000による前景2のデコンポジションレベルより高くして、前景2の量子化による誤差が分散する範囲を、前景1の量子化による誤差が分散する範囲より狭くすることにより、第1実施の形態と同様の効果を得ることができる。なお、PCの構成、作成部1501、マスク符号化部1502、前景1符号化部1503、前景2符号化部1504、背景符号化部1505、および符号取得部1506によって実現される機能構成については、第1実施の形態とほぼ同様であるため、第1実施の形態と異なる部分の処理のみを説明する。
図20Aを用いて、PC100が備える特長的な機能の詳細について説明する。図20Aは、本実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。なお、ステップS2000〜2005、ステップS2008〜2010に示す処理は、第1実施の形態と同様であるため、ここでは説明を省略する。
前景1符号化部1503は、5*3フィルタを施すウェーブレット変換を3回行って得られた係数の量子化および符号化を行うJPEG2000により前景1を圧縮する(ステップS2006)。なお、5*3フィルタを施すウェーブレット変換が3回行われた場合、前景1符号化部1503が周波数変換で施した前景1の低周波成分に対するフィルタ(第1フィルタ)のタップ長は、20とみなすことができる。
本実施の形態では、前景1符号化部1503は、5*3フィルタを施してウェーブレット変換しているため、MQR符号化する際の下位ビットプレーンの符号化の省略により量子化と同様の効果を得るものとする。具体的には、前景1符号化部1503は、第1実施の形態と同様に、最上位のビットプレーンから、図19に示すテーブルで予め規定された数の下位ビットプレーンを除いたビットプレーンまでをMQR符号化する。
前景2符号化部1504は、5*3フィルタを施すウェーブレット変換を2回行って得られた係数の量子化および符号化を行うJPEG2000により前景2を圧縮する(ステップS2007)。なお、5*3フィルタを施すウェーブレット変換が2回行われた場合、前景2符号化部1504が周波数変換で施した前景2の低周波成分に対するフィルタ(第2フィルタ)のタップ長は、10とみなすことができる。
本実施の形態では、前景2符号化部1504は、5*3フィルタを施すウェーブレット変換を行っているため、MQR符号化する際の下位ビットプレーンの符号化の省略により量子化と同様の効果を得るものとする。具体的には、前景2符号化部1504は、最上位のビットプレーンから図20Bにテーブルで予め規定された数の下位ビットプレーンを除いたビットプレーンまでをMQR符号化する。図20Bは、各コンポーネント(Y,Cb,Cr)の各デコンポジションレベルにおけるサブバンドの係数のうち、符号化しない下位ビットプレーンの数を示したテーブルを示す図である。例えば、前景2符号化部1504は、Yコンポーネントのデコンポジションレベル1におけるHHサブバンドの係数のうち、下位4ビットのビットプレーンの符号化を行わない(破棄する)。
このように、本実施の形態にかかるPC100によれば、JPEG2000による前景1のデコンポジションレベルを、JPEG2000による前景2のデコンポジションレベルをより高くすることにより、前景2の量子化による誤差が分散する範囲を、前景1の量子化による誤差が分散する範囲より狭くすることができるので、第1実施の形態と同様の効果を得ることができる。また、前景1と前景2とを同じJPEG2000により符号化することができるので、前景1の符号化処理と前景2の符号化処理とで同じプログラムや回路を用いることができ、プログラムや回路規模を抑えることができる。
(第3実施の形態)
本実施の形態にかかるPCは、9*7フィルタを施すウェーブレット変換を行うJPEG2000により前景1を符号化し、5*3フィルタを施すウェーブレット変換を行うJPEG2000により前景2を符号化して、前景2の量子化による誤差が分散する範囲を、前景1の量子化による誤差が分散する範囲より狭くすることにより、第1実施の形態と同様の効果を得ることができる。なお、PCの構成、作成部1501、マスク符号化部1502、前景1符号化部1503、前景2符号化部1504、背景符号化部1505、および符号取得部1506によって実現される機能構成については、第1実施の形態とほぼ同様であるため、第1実施の形態と異なる部分の処理のみを説明する。
図21Aを用いて、PC100が備える特長的な機能の詳細について説明する。図21Aは、本実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。なお、ステップS2100〜2105、ステップS2108〜2110に示す処理は、第1実施の形態と同様であるため、ここでは説明を省略する。
前景1符号化部1503は、9*7フィルタを施すウェーブレット変換を3回行って得られた係数の量子化および符号化を行うJPEG2000により前景1を圧縮する(ステップS2106)。なお、9*7フィルタを施すウェーブレット変換が3回行われた場合、前景1符号化部1503が周波数変換で施した前景1の低周波成分に対するフィルタ(第1フィルタ)のタップ長は、36とみなすことができる。
本実施の形態では、前景1符号化部1503は、9*7フィルタを施すウェーブレット変換を行っているため、ウェーブレット変換により得られた各サブバンドの係数を、図21Bに示すテーブルに示す量子化ステップで除算することにより量子化を行う。図21Bは、各デコンポジションレベルにおけるサブバンドの係数を量子化する量子化ステップを示すテーブルを示す図である。なお、本実施の形態では、Y,Cb,Crの全てのコンポーネントに対して図21Bのテーブルに示す量子化ステップにより各デコンポジションレベルにおけるサブバンドの係数を除算するものとする。
さらに、本実施の形態では、前景1符号化部1503は、MQR符号化する際の下位ビットプレーンの符号化の省略を行うものとする。具体的には、前景1符号化部1503は、最上位のビットプレーンから、図21Cに示すテーブルで予め規定された数の下位ビットプレーンを除いたビットプレーンまでをMQR符号化する。図21Cは、各コンポーネント(Y,Cb,Cr)の各デコンポジションレベルにおけるサブバンドの係数のうち、符号化しない(破棄する)下位ビットプレーンの数を示したテーブルを示す図である。例えば、前景1符号化部1503は、Yコンポーネントのデコンポジションレベル1におけるHHサブバンドの係数のうち、下位3ビットのビットプレーンの符号化を行わない(破棄する)。
前景2符号化部1504は、5*3フィルタを施すウェーブレット変換を3回行って得られた係数の量子化および符号化を行うJPEG2000により前景1を圧縮する(ステップS2107)。なお、5*3フィルタを施すウェーブレット変換が3回行われた場合、前景2符号化部1504が周波数変換で施した前景2の低周波成分に対するフィルタ(第2フィルタ)のタップ長は、20とみなすことができる。
本実施の形態では、前景2符号化部1504は、5*3フィルタを施すウェーブレット変換を行っているため、MQR符号化する際の下位ビットプレーンの符号化の省略により量子化と同様の効果を得るものとする。具体的には、前景2符号化部1504は、第1実施の形態と同様に、最上位のビットプレーンから、図19に示すテーブルで予め規定された数の下位ビットプレーンを除いたビットプレーンまでをMQR符号化する。
このように、本実施の形態にかかるPC100によれば、JPEG2000による前景1のウェーブレット変換で9*7フィルタを施し、JPEG2000による前景2のウェーブレット変換で5*3フィルタを施すことにより、前景2の量子化による誤差が分散する範囲を、前景1の量子化による誤差が分散する範囲より狭くすることができるので、第1実施の形態と同様の効果を得ることができる。また、前景1と前景2とを同じJPEG2000により符号化することができるので、前景1の符号化処理と前景2の符号化処理とで同じプログラムや回路を用いることができ、プログラムや回路規模を抑えることができる。
(第4実施の形態)
本実施の形態にかかるPCは、JPEG−XRにより前景1を符号化し、JPEGにより前景2を符号化して、前景2の量子化による誤差が分散する範囲を、前景1の量子化による誤差が分散する範囲より狭くすることにより、第1実施の形態と同様の効果を得ることができる。なお、PCの構成、作成部1501、マスク符号化部1502、前景1符号化部1503、前景2符号化部1504、背景符号化部1505、および符号取得部1506によって実現される機能構成については、第1実施の形態とほぼ同様であるため、第1実施の形態と異なる部分の処理のみを説明する。
図22を用いて、PC100が備える特長的な機能の詳細について説明する。図22は、本実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。なお、ステップS2200〜2205、およびステップS2208に示す処理は、第1実施の形態と同様であるため、ここでは説明を省略する。
前景1符号化部1503は、JPEG−XRにより前景1を圧縮する(ステップS2206)。なお、上述したように、JPEG−XRでは、フィルタ(第1フィルタ)のタップ長は16タップとみなすことができる。また、プレフィルタを施した場合には、量子化により誤算が拡散する範囲はより広くなり、より長いタップ長とみなすことができる。
前景2符号化部1504は、低周波成分に対するフィルタのタップ長が前景1符号化部1503で施したフィルタのタップ長より短いフィルタ(第2フィルタ)を施す離散コサイン変換を行うことにより得られた係数の量子化および符号化を行うJPEGにより前景2を圧縮する(ステップS2207)。
そして、背景符号化部1505は、背景をJPM仕様により符号化する(エントロピー符号化を行わず、符合として背景色を指定する)(ステップS2209)。
最後に、符号取得部1506は、前景1,2、マスク1,2、および背景の符号をJPMと同様のフォーマットに従って結合したJPMライクな符号を取得する(ステップS2210)。ここで、JPMライクとしたのは、現在のJPMは対象とする符号化方式としてJPEG−XRを想定していないためである。
このように、本実施の形態にかかるPC100によれば、前景1をJPEG−XRにより圧縮し、前景2をJPEGで圧縮することにより、前景1および前景2ともに高圧縮率で圧縮可能な符号化方式で符号化することができ、かつ前景1と前景2とで量子化による誤差が分散する範囲を変えることができるので、第1実施の形態と同様の効果を得ることができる。
(第5実施の形態)
本実施の形態にかかるPCは、JPEG−XRにより前景1および前景2を符号化するものであって、前景1と前景2とでプレフィルタを施す回数を変えることにより、第1実施の形態と同様の効果を得ることができる。なお、PCの構成、作成部1501、マスク符号化部1502、前景1符号化部1503、前景2符合化部1504、背景符号化部1505、および符号取得部1506によって実現される機能構成については、第1実施の形態とほぼ同様であるため、第1実施の形態と異なる部分の処理のみを説明する。
図23Aを用いて、PC100が備える特長的な機能の詳細について説明する。図23Aは、本実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。なお、ステップS2300〜2305、およびステップS2308〜2310に示す処理は、第4実施の形態と同様であるため、ここでは説明を省略する。
前景1符号化部1503は、JPEG−XRにより前景1を圧縮する(ステップS2306)。本実施の形態では、前景1符号化部1503は、図4に示したように、2回プレフィルタを施すものとする。
前景2符号化部1504は、JPEG−XRにより前景2を圧縮する(ステップS2307)。本実施の形態では、前景2符号化部1504は、前景1符号化部1503がプレフィルタを施した回数(2回)よりも少ない回数(0回)プレフィルタを施している。
本実施の形態では、前景1符号化部1503および前景2符号化部1504は、周波数変換により得られた各コンポーネント(Y,Cg,Co)のDC係数、LP係数、およびHP係数を、図23Bに示すテーブルで予め規定された量子化ステップで量子化する。図23Bは、各コンポーネントの各係数の量子化ステップを示すテーブルを示す図である。
このように、本実施の形態にかかるPC100によれば、前景2符号化部1504がJPEG−XRによりプレフィルタを施す回数を、前景1符号化部1503がJPEG−XRによりプレフィルタを施す回数よりも少なくすることにより、前景2の量子化による誤差が分散する範囲を、前景1の量子化による誤差が分散する範囲より狭くすることができるので、第1実施の形態と同様の効果を得ることができる。また、前景1と前景2とを同じJPEG−XRにより符号化することができるので、前景1の符号化処理と前景2の符号化処理とで同じプログラムや回路を用いることができ、プログラムや回路規模を抑えることができる。
JPEG2000の符号化アルゴリズムの説明のためのフローチャートである。 画像、タイル、サブバンド、プリシンクト、コードブロックの関係を示す図である。 デコンポジションレベル(施すウェーブレット変換の回数)と解像度レベルの関係を示す説明図である。 JPEG−XRの符号化アルゴリズムの説明のためのフローチャートである。 プレフィルタを用いる4*4画素と周波数変換する4*4画素との関係の説明図である。 4*4画素のプレフィルタの式を仮想的なプログラムで表した図である。 4*4画素のプレフィルタの式を仮想的なプログラムで表した図である。 周波数変換式を仮想的なプログラムで表した図である。 JPEG−XRにおける原画像、タイル、マクロブロック、ブロック、および画素の関係を示した説明図である。 4*4画素のブロックの周波数変換により得られるDC(直流)係数、LP(ローパス)係数、HP(ハイパス)係数の階層的な関係を示す説明図である。 色変換式を示す図である。 MRCモデルによる符号構成の説明図である。 JPM符号の構成例の説明図である。 第1実施の形態にかかるPCのハードウェア構成を示すブロック図である。 第1実施の形態にかかるPCの機能構成を示すブロック図である。 第1実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。 原画像を、背景、マスク1と前景1のペア、マスク2と前景2のペアに分割する例を示す図である。 Sobelオペレータを示す図である。 Sobelオペレータを示す図である。 各コンポーネント(Y,Cb,Cr)の各デコンポジションレベルにおけるサブバンドの係数のうち、符号化しない下位ビットプレーンの数を示したテーブルを示す図である。 第2実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。 各コンポーネント(Y,Cb,Cr)の各デコンポジションレベルにおけるサブバンドの係数のうち、符号化しない下位ビットプレーンの数を示したテーブルを示す図である。 第3実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。 各デコンポジションレベルにおけるサブバンドの係数を量子化する量子化ステップを示すテーブルを示す図である。 各コンポーネント(Y,Cb,Cr)の各デコンポジションレベルにおけるサブバンドの係数のうち、符号化しない(破棄する)下位ビットプレーンの数を示したテーブルを示す図である。 第4実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。 第5実施の形態にかかるPCによる符号化処理の手順を示すフローチャートである。 各コンポーネントの各係数の量子化ステップを示すテーブルを示す図である。 MRCの概念を示す説明図である。
符号の説明
100 PC
101 CPU
102 RAM
103 HDD
104 システムバス
1501 作成部
1502 マスク符号化部
1503 前景1符号化部
1504 前景2符号化部
1505 背景符号化部
1506 符号取得部

Claims (9)

  1. 原画像から、線画または文字を表す文字画素の色を、前記文字画素以外の非文字画素を構成する色の割合および前記文字画素と前記非文字画素との位置関係の少なくとも一方に応じて決定される色で置換した第1画像、前記非文字画素の色を、前記文字画素を構成する色の割合および前記文字画素と前記非文字画素との位置関係の少なくとも一方に応じて決定される色で置換した第2画像、および前記第1画像または前記第2画像を画素毎に選択するためのマスク画像を作成する作成手段と、
    前記マスク画像を符号化するマスク符号化手段と、
    第1フィルタを施して前記第1画像を周波数変換することにより得られた係数の量子化および符号化を行う第1画像符号化手段と、
    低周波成分に対するタップ長が前記第1フィルタの低周波成分に対するタップ長より短い第2フィルタを施して前記第2画像を周波数変換することにより得られた係数の量子化および符号化を行う第2画像符号化手段と、
    前記マスク画像、前記第1画像、および前記第2画像の符号を結合し、所定のフォーマットに従った符号化データを取得する取得手段と、
    を備えたことを特徴とする符号化装置。
  2. 前記第1画像符号化手段は、JPEG−XRにより前記第1画像を符号化し、
    前記第2画像符号化手段は、JPEGにより前記第2画像を符号化することを特徴とする請求項1に記載の符号化装置。
  3. 前記第1画像符号化手段は、JPEG−2000により前記第1画像を符号化し、
    前記第2画像符号化手段は、JPEGにより前記第2画像を符号化することを特徴とする請求項1に記載の符号化装置。
  4. 前記第1画像符号化手段は、JPEG−XRにより前記第1画像を符号化し、
    前記第2画像符号化手段は、JPEG−XRにより前記第2画像を符号化するものであって、前記第1画像符号化手段がプレフィルタを施した回数よりも少ない回数プレフィルタを施すことを特徴とする請求項1に記載の符号化装置。
  5. 前記第1画像符号化手段は、JPEG2000により前記第1画像を符号化し、
    前記第2画像符号化手段は、JPEG2000により前記第2画像を符号化するものであって、ウェーブレット変換を行った回数が前記第1画像符号化手段によりウェーブレット変換を行った回数より少ないことを特徴とする請求項1に記載の符号化装置。
  6. 前記第1画像符号化手段は、JPEG2000により前記第1画像を符号化するものであって、前記第1画像を9*7フィルタを施して周波数変換し、
    前記第2画像符号化手段は、JPEG2000により前記第2画像を符号化するものであって、前記第2画像を5*3フィルタを施して周波数変換することを特徴とする請求項1に記載の符号化装置。
  7. 請求項1から6のいずれか一に記載の符号化装置において実行される符号化方法。
  8. 請求項7記載の符号化方法を実行することを特徴とするプログラム。
  9. 請求項8記載のプログラムを記憶することを特徴とする情報記録媒体。
JP2008227297A 2008-09-04 2008-09-04 符号化装置、符号化方法、プログラム、および情報記録媒体 Active JP4965534B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008227297A JP4965534B2 (ja) 2008-09-04 2008-09-04 符号化装置、符号化方法、プログラム、および情報記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008227297A JP4965534B2 (ja) 2008-09-04 2008-09-04 符号化装置、符号化方法、プログラム、および情報記録媒体

Publications (2)

Publication Number Publication Date
JP2010062935A true JP2010062935A (ja) 2010-03-18
JP4965534B2 JP4965534B2 (ja) 2012-07-04

Family

ID=42189235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008227297A Active JP4965534B2 (ja) 2008-09-04 2008-09-04 符号化装置、符号化方法、プログラム、および情報記録媒体

Country Status (1)

Country Link
JP (1) JP4965534B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013207777A (ja) * 2012-03-29 2013-10-07 Kyocera Document Solutions Inc 画像圧縮装置
JP2014072556A (ja) * 2012-09-27 2014-04-21 Oki Data Corp 画像処理装置、プログラム及び方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0865667A (ja) * 1994-08-26 1996-03-08 Oki Electric Ind Co Ltd 画像信号符号化方法
JP2004180075A (ja) * 2002-11-28 2004-06-24 Ricoh Co Ltd 画像圧縮装置
JP2006165954A (ja) * 2004-12-07 2006-06-22 Ricoh Co Ltd 符号化装置、符号化方法、プログラム及び情報記録媒体
JP2007005844A (ja) * 2005-05-25 2007-01-11 Ricoh Co Ltd 符号化処理装置、符号化処理方法、プログラム及び情報記録媒体
JP2008042687A (ja) * 2006-08-08 2008-02-21 Canon Inc 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0865667A (ja) * 1994-08-26 1996-03-08 Oki Electric Ind Co Ltd 画像信号符号化方法
JP2004180075A (ja) * 2002-11-28 2004-06-24 Ricoh Co Ltd 画像圧縮装置
JP2006165954A (ja) * 2004-12-07 2006-06-22 Ricoh Co Ltd 符号化装置、符号化方法、プログラム及び情報記録媒体
JP2007005844A (ja) * 2005-05-25 2007-01-11 Ricoh Co Ltd 符号化処理装置、符号化処理方法、プログラム及び情報記録媒体
JP2008042687A (ja) * 2006-08-08 2008-02-21 Canon Inc 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013207777A (ja) * 2012-03-29 2013-10-07 Kyocera Document Solutions Inc 画像圧縮装置
JP2014072556A (ja) * 2012-09-27 2014-04-21 Oki Data Corp 画像処理装置、プログラム及び方法

Also Published As

Publication number Publication date
JP4965534B2 (ja) 2012-07-04

Similar Documents

Publication Publication Date Title
Zhang et al. Lossless compression of color mosaic images
KR100880039B1 (ko) 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템
TWI301592B (en) Method of preparing an image for compression
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
US20080089413A1 (en) Moving Image Encoding Apparatus And Moving Image Encoding Method
JP2005236895A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
Nageswara et al. Image compression using discrete cosine transform
JP4191592B2 (ja) 圧縮符号化装置、圧縮符号化方法およびプログラム
JP4229323B2 (ja) 符号化装置、符号化方法及びプログラム
JP2004242290A (ja) 画像処理装置および画像処理方法、画像編集処理システム、画像処理プログラム及び記憶媒体
JP4958832B2 (ja) 画像符号化装置及びその制御方法
JP2004166254A (ja) 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP4965534B2 (ja) 符号化装置、符号化方法、プログラム、および情報記録媒体
JP2007005844A (ja) 符号化処理装置、符号化処理方法、プログラム及び情報記録媒体
JP4726040B2 (ja) 符号化処理装置、復号処理装置、符号化処理方法、復号処理方法、プログラム及び情報記録媒体
JP3732674B2 (ja) カラー画像圧縮方法およびカラー画像圧縮装置
JP5267252B2 (ja) 画像符号化装置、画像符号化方法、画像符号化用記録媒体、画像符号化用プログラム
JP5482177B2 (ja) 符号化装置、プログラム、記録媒体
JP2005151207A (ja) 画像符号化方法
JP2002290743A (ja) 画像情報符号化方法、符号化装置、ディジタル複写機、ディジタルファクシミリ装置、及び、ディジタルファイリング装置
JP2006086579A (ja) 画像処理装置、プログラム、及び記憶媒体
JP4934081B2 (ja) 符号化装置、符号処理装置、符号化方法、符号処理方法、コンピュータプログラム及び記録媒体
JP5245771B2 (ja) 符号化装置、符号化方法、プログラム及び記録媒体
JP2001157209A (ja) 画像処理装置及びその方法
JP5560172B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110803

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120321

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120329

R150 Certificate of patent or registration of utility model

Ref document number: 4965534

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3