JP2004326447A - 画像合成装置及び方法 - Google Patents
画像合成装置及び方法 Download PDFInfo
- Publication number
- JP2004326447A JP2004326447A JP2003120367A JP2003120367A JP2004326447A JP 2004326447 A JP2004326447 A JP 2004326447A JP 2003120367 A JP2003120367 A JP 2003120367A JP 2003120367 A JP2003120367 A JP 2003120367A JP 2004326447 A JP2004326447 A JP 2004326447A
- Authority
- JP
- Japan
- Prior art keywords
- code
- image
- encoded
- code block
- code stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Processing (AREA)
- Studio Circuits (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【課題】少ないメモリ使用量で容易且つ効果的に2つの符号化コードストリームを合成する。
【解決手段】画像合成装置1において、コードストリーム解析部10,11、コードブロック抽出部12,13、及びEBCOT復号部14,15では、JPEG−2000規格に従って符号化された符号化コードストリームD10,D11を復号してコードブロック毎の量子化係数D16,D17を生成する。クロスフェード部16において、加算器17,18では量子化係数D16,D17に対してそれぞれ係数α(t)、(1−α(t))が乗算され、これらが加算器19で加算されてクロスフェード量子化係数D20となる。そしてEBCOT符号化部20、レート制御部21、及びコードストリーム生成部22では、このクロスフェード量子化係数D20を符号化し、最終的な符号化コードストリームD23を出力する。
【選択図】 図8
【解決手段】画像合成装置1において、コードストリーム解析部10,11、コードブロック抽出部12,13、及びEBCOT復号部14,15では、JPEG−2000規格に従って符号化された符号化コードストリームD10,D11を復号してコードブロック毎の量子化係数D16,D17を生成する。クロスフェード部16において、加算器17,18では量子化係数D16,D17に対してそれぞれ係数α(t)、(1−α(t))が乗算され、これらが加算器19で加算されてクロスフェード量子化係数D20となる。そしてEBCOT符号化部20、レート制御部21、及びコードストリーム生成部22では、このクロスフェード量子化係数D20を符号化し、最終的な符号化コードストリームD23を出力する。
【選択図】 図8
Description
【0001】
【発明の属する技術分野】
本発明は、例えばJPEG−2000規格に従って符号化された2つの画像を合成する画像合成装置及びその方法に関し、特にクロスフェード処理を行う際に用いて好適な画像合成装置及びその方法に関する。
【0002】
【従来の技術】
従来、例えば1つの画像から他の画像に全体が移り変わっていく様子を表現するための画像処理技術としてクロスフェード処理が知られており(特許文献1,2等参照)、コンピュータグラフィックス、放送用機器の特殊再生、カムコーダの特殊再生、ゲーム機での画像処理等に用いられている。
【0003】
通常、このようなクロスフェード処理は、2つの画像の空間的に同じ位置の画素を線形内挿し、2つの画像を合成することで実現される。
【0004】
【特許文献1】
特開2000−78467号公報
【特許文献2】
特開2000−184278号公報
【0005】
【発明が解決しようとする課題】
ところで、近年では、フィルタバンクと呼ばれるハイパス・フィルタとローパス・フィルタとを組み合わせたフィルタによって画像を複数の帯域に分割し、各帯域毎に符号化を行う方式の研究が盛んになっている。その中でも、ウェーブレット変換符号化は、離散コサイン変換(Descrete Cosine Transform;DCT)のように高圧縮でブロック歪みが顕著になるという欠点がないことから、DCTに代わる新たな技術として有力視されている。例えば2001年1月に国際標準化が完了したJPEG−2000は、このウェーブレット変換に高能率なエントロピー符号化(ビットプレーン単位のビット・モデリングと算術符号化)を組み合わせた方式を採用しており、JPEGに比べて符号化効率の大きな改善を実現している。
【0006】
ここで、上述した従来手法を用いて2つの画像の符号化コードストリームからクロスフェード画像の符号化コードストリームを得るためには、符号化コードストリームをJPEG−2000規格に従って復号し、得られた2つの復号画像を線形内挿によって合成してクロスフェード画像を生成し、さらにこのクロスフェード画像をJPEG−2000規格に従って符号化する処理が必要となる。
【0007】
しかしながら、このような手法では、2つの復号画像を記憶するメモリが必要になる上、クロスフェード画像を記憶するメモリも必要になる。また、JPEG−2000規格に準拠した画像復号装置と画像符号化装置との双方が必要になるという問題があった。
【0008】
本発明は、このような従来の実情に鑑みて提案されたものであり、少ないメモリ使用量で容易且つ効果的に2つの符号化コードストリームを合成する画像合成装置及びその方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る画像合成装置は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成装置であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析手段と、該コードストリーム解析手段の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出手段と、該コードブロック情報を算術復号する算術復号手段とをそれぞれ有する第1,第2の画像復号手段と、上記第1,第2の画像復号手段から供給されたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成手段と、上記合成手段における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化手段とを備えるものである。
【0010】
また、上述した目的を達成するために、本発明に係る画像合成方法は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成方法であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析工程と、該コードストリーム解析工程の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出工程と、該コードブロック情報を算術復号する算術復号工程とをそれぞれ有する第1,第2の画像復号工程と、上記第1,第2の画像復号工程で得られたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成工程と、上記合成工程における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化工程とを有するものである。
【0011】
このような画像合成装置及びその方法では、例えばJPEG−2000規格に従って符号化された2つの符号化コードストリームを合成し、合成符号化コードストリームを出力する際に、合成処理を空間領域ではなく係数領域で行う。
【0012】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明するが、その前に、2つの画像を合成してクロスフェード画像を作成する場合の従来手法と、その従来手法をJPEG−2000で符号化された符号化画像に適用した場合における画像合成装置の構成について説明する。
【0013】
従来、画像F1(x,y,t)と画像F2(x,y,t)との間でクロスフェード画像を生成する場合、以下の式(1)に示すように、同一時刻のフレームの同位置のサンプル同士を線形内挿処理することによってクロスフェード画像G(x,y,t)を得ていた。ここで、x,yはそれぞれ画像の水平、垂直位置座標を表し、tは時刻を表す。
【0014】
【数1】
【0015】
この従来手法をJPEG−2000規格に従って符号化された符号化画像に適用した場合、例えば図2に示すような画像合成装置100が構成される。ここで、図2は、JPEG−2000規格に従って符号化された符号化コードストリームD100,D101を入力してクロスフェード処理を行い、クロスフェード後の符号化コードストリームD115を出力する場合について説明するものである。
【0016】
この画像合成装置100において、EBCOT(Embedded Coding with Optimized Truncation)復号部101は、符号化コードストリームD100を復号して量子化係数D102を生成し、この量子化係数D102を逆量子化部103に供給する。逆量子化部103は、この量子化係数D102を逆量子化してウェーブレット変換係数D104を生成し、このウェーブレット変換係数D104をウェーブレット逆変換部105に供給する。そして、ウェーブレット逆変換部105は、ウェーブレット変換係数D104をウェーブレット逆変換して復号画像D106を生成し、この復号画像D106をクロスフェード部107に供給する。
【0017】
同様に、EBCOT復号部102は、符号化コードストリームD101を復号して量子化係数D103を生成し、この量子化係数D103を逆量子化部104に供給する。逆量子化部104は、この量子化係数D103を逆量子化してウェーブレット変換係数D105を生成し、このウェーブレット変換係数D105をウェーブレット逆変換部106に供給する。そして、ウェーブレット逆変換部106は、ウェーブレット変換係数D105をウェーブレット逆変換して復号画像D107を生成し、この復号画像D107をクロスフェード部107に供給する。
【0018】
クロスフェード部107は、乗算器108,109と、加算器110とから構成され、上述した式(1)のような演算を行うことで、クロスフェード画像D110を生成する。すなわち、乗算器108では復号画像D106に対して係数α(t)が乗算され、乗算器109では復号画像D107に対して係数(1−α(t))が乗算される。そして、加算器110において、乗算器108,109から出力された画像D108,D109が加算されてクロスフェード画像D110となり、このクロスフェード画像D110がウェーブレット変換部111に供給される。ここで、復号画像D106,107、クロスフェード画像D110は、それぞれ式(1)におけるF1(x,y,t)、F2(x,y,t)、G(x,y,t)に相当する。
【0019】
以上により、入力した符号化コードストリームD100,D101からクロスフェード画像D110が得られ、後段では、このクロスフェード画像D110をJPEG−2000規格に従って符号化し、符号化コードストリームD115を生成する。
【0020】
ウェーブレット変換部111は、通常、低域フィルタと高域フィルタとから構成されるフィルタバンクによって実現される。なお、デジタルフィルタは、通常複数タップ長のインパルス応答(フィルタ係数)を持っているため、フィルタリングが行えるだけの入力画像を予めバッファリングしておく必要があるが、簡単のため、図1では図示を省略する。
【0021】
ウェーブレット変換部111は、フィルタリングに必要な最低限のクロスフェード画像D110を入力し、ウェーブレット変換を行うフィルタリング処理を行ってウェーブレット変換係数D111を生成する。
【0022】
このウェーブレット変換では、通常図3に示すように低域成分が繰り返し変換されるが、これは画像のエネルギの多くが低域成分に集中しているためである。ここで、図3におけるウェーブレット変換のレベル数は2であり、この結果計7個のサブバンドが生成されている。すなわち、1回目のフィルタリング処理によって水平方向のサイズX_SIZE及び垂直方向のサイズY_SIZEがそれぞれ1/2に分割され、LL1,LH2,HL2,HH2の4つのサブバンドが生成される。そして2回目のフィルタリング処理によってLL1がさらに分割されて、LL0,LH1,HL1,HH1の4つのサブバンドが生成される。なお、図3においてL,Hはそれぞれ低域,高域を表し、L,Hの後の数字は解像度レベルを表す。すなわち、例えばLH1は、水平方向が低域で垂直方向が高域である解像度レベル=1のサブバンドを表す。
【0023】
量子化部112は、ウェーブレット変換部111から供給されたウェーブレット変換係数D111に対して非可逆圧縮を施す。量子化手段としては、ウェーブレット変換係数D111を量子化ステップサイズで除算するスカラ量子化を用いることができる。
【0024】
EBCOT符号化部113は、量子化部112で生成されたサブバンド毎の量子化係数D112に対してJPEG−2000規格で定められたEBCOTと呼ばれるエントロピー符号化を施し、算術符号D113を生成する。EBCOTの処理単位が上述のコードブロックである。なお、このEBCOTについては、例えば、文献「ISI/IEC FDIS 15444−1, JPEG−2000 Part−1 FDIS, 18 August 2000」等に詳細に記載されている。
【0025】
具体的に、EBCOT符号化部113は、先ず量子化部112で生成されたサブバンド毎の量子化係数D112を、JPEG−2000の符号化単位であるコードブロック単位に分割する。すなわち図3に示すように、例えば64×64程度のサイズのコードブロックが、分割後の全てのサブバンド中に生成される。なお、JPEG−2000の規定では、コードブロックのサイズは水平方向、垂直方向共に2の冪乗で表され、通常は32×32、又は64×64が使用されることが多い。
【0026】
そして、EBCOT符号化部113は、コードブロック毎の量子化係数に対して、以下のようにビットプレーン単位で係数ビットモデリングを行う。このビットプレーンの概念について図5を用いて説明する。図5(A)は、縦4個、横4個の計16個の係数からなる量子化係数を仮定したものである。この16個の係数のうち絶対値が最大のものは13であり、2進数表現では1101となる。したがって、係数の絶対値のビットプレーンは、図5(B)に示すような4つのビットプレーンから構成される。なお、各ビットプレーンの要素は、全て0又は1の数を取る。一方、量子化係数の符号は、−6が唯一負の値であり、それ以外は0又は正の値である。したがって、符号のビットプレーンは、図5(C)に示すようになる。
【0027】
各コードブロックは、最上位ビット(MSB)から最下位ビット(LSB)方向にビットプレーン毎に独立して符号化される。量子化係数は、nビットの符号付き2進数で表されており、bit0からbit(n−2)がLSBからMSBまでのそれぞれのビットを表す。なお、残りの1ビットは符号である。符号ブロックの符号化は、MSB側のビットプレーンから順番に、以下の(a)〜(c)に示す3種類のコーディングパスによって行われる。
(a) Significance Propagation Pass
(b) Magnitude Refinement Pass
(c) Clean up Pass
【0028】
3つのコーディングパスの用いられる順序を図6に示す。図6に示すように、先ずビットプレーン(n−2)(MSB)がClean up Pass(以下、適宜「CUパス」という。)によって符号化される。続いて、順次LSB側に向かい、各ビットプレーンが、Significance Propagation Pass(以下、適宜「SPパス」という。)、Magnitude Refinement Pass(以下、適宜「MRパス」という。)、CUパスの順序で用いられて符号化される。
【0029】
但し、実際にはMSB側から何番目のビットプレーンで初めて1が出てくるかをヘッダに書き、オール0のビットプレーンは符号化しない。この順序で3種類のコーディングパスを繰返し用いて符号化し、任意のビットプレーンの任意の符号化パスまでで符号化を打ち切ることにより、符号量と画質のトレードオフを取る、すなわちレート制御を行うことができる。
【0030】
ここで、係数の走査(スキャニング)について図7を用いて説明する。コードブロックは、高さ4個の係数毎にストライプ(stripe)に分けられる。ストライプの幅は、コードブロックの幅に等しい。スキャン順とは1個のコードブロック内の全ての係数を辿る順番であり、コードブロック中では上のストライプから下のストライプへの順序、各ストライプ中では左の列から右の列への順序、各列中では上から下への順序でスキャニングされる。なお、各コーディングパスにおいてコードブロック中の全ての係数がこのスキャン順で処理される。
【0031】
以上のようにしてEBCOT符号化部113は、コードブロック毎の量子化係数をビットプレーンに分解すると共に各ビットプレーンを3つのコーディングパスに分解し、コーディングパス毎に量子化係数を生成する。そして、このコーディングパス毎の量子化係数に対して算術符号化を施す。
【0032】
レート制御部114は、EBCOT符号化部113から供給された算術符号D113の符号量をカウントしながら、目標のビットレート又は圧縮率に近づけるように、符号量制御を行う。具体的には、レート制御部114は、コードブロック毎のコーディングパスの少なくとも一部を切り捨てる(Truncateする)ことにより符号量制御を行う。
【0033】
コードストリーム生成部115は、レート制御部114から供給されたレート制御終了後の算術符号D114をJPEG−2000規格に従ってパケット化し、ヘッダを付加して、最終的な符号化コードストリームD115を出力する。
【0034】
以上のように、画像合成装置100では、JPEG−2000規格に従って符号化された2つの符号化コードストリームを入力してクロスフェード処理を行い、クロスフェード後の符号化コードストリームを出力する際に、2つの画像を空間領域で合成してクロスフェード画像を作成し、このクロスフェード画像を符号化してクロスフェード後の符号化コードストリームを生成する。
【0035】
しかしながら、このような構成の画像合成装置100では、2つの復号画像を記憶するメモリが必要になる上、クロスフェード画像を記憶するメモリも必要になる。また、JPEG−2000規格に準拠した画像復号装置と画像符号化装置との双方が必要になるという問題があった。
【0036】
そこで、本実施の形態における画像合成装置は、以下に説明するように、クロスフェード処理を空間領域ではなく係数領域で実現することにより、上述した問題を解決する。
【0037】
本実施の形態における画像合成装置の概略構成を図8に示す。図8に示すように、本実施の形態における画像合成装置1は、コードストリーム解析部10,11と、コードブロック抽出部12,13と、EBCOT復号部14,15と、クロスフェード部16と、EBCOT符号化部20と、レート制御部21と、コードストリーム生成部22とから構成されている。ここで、クロスフェード部16は、乗算部17,18と加算部19とから構成される。
【0038】
コードストリーム解析部10は、JPEG−2000規格に従って符号化された符号化コードストリームD10を入力し、JPEG−2000規格で定められた手法で符号化コードストリームD10の解析を行う。コードブロック抽出部12は、コードストリーム解析部10から供給された解析情報D12に基づいて、コードブロック毎の符号化情報D14をEBCOT復号部14に供給する。そして、EBCOT復号部14は、この符号化情報D14を復号してコードブロック毎の量子化係数D16を生成し、この量子化係数D16をクロスフェード部16に供給する。
【0039】
同様に、コードストリーム解析部11は、JPEG−2000規格に従って符号化された符号化コードストリームD11を入力し、JPEG−2000規格で定められた手法で符号化コードストリームD11の解析を行う。コードブロック抽出部13は、コードストリーム解析部11から供給された解析情報D13に基づいて、コードブロック毎の符号化情報D15をEBCOT復号部15に供給する。そして、EBCOT復号部15は、この符号化情報D15を復号してコードブロック毎の量子化係数D17を生成し、この量子化係数D17をクロスフェード部16に供給する。
【0040】
クロスフェード部16は、乗算器17,18と、加算器19とから構成され、量子化係数D16,D17を合成することにより、クロスフェード量子化係数D20を生成する。具体的には、量子化係数D16をQ_cb1(x,y)、量子化係数D17をQ_cb2(x,y)としたとき、以下の式(2)に従ってクロスフェード量子化係数を生成する。ここで、x,yはそれぞれ量子化係数領域の水平、垂直位置を表す。なお、Q_cb1(x,y)、Q_cb2(x,y)は同一時刻のものであることを前提としているため、上述した式(1)のようにパラメータとして時刻tは必要ない。
【0041】
【数2】
【0042】
すなわち、乗算器17では量子化係数D16に対して係数α(t)が乗算され、乗算器18では量子化係数D17に対して係数(1−α(t))が乗算される。そして、加算器19において、乗算器17,18から出力された量子化係数D18,D19が加算されてクロスフェード量子化係数D20となり、このクロスフェード量子化係数D20がEBCOT符号化部20に供給される。
【0043】
EBCOT符号化部20は、クロスフェード部16で生成されたクロスフェード量子化係数D20に対してEBCOTのエントロピー符号化を施し、算術符号D21を生成する。
【0044】
レート制御部21は、EBCOT符号化部20から供給された算術符号D21の符号量をカウントしながら、目標のビットレート又は圧縮率に近づけるように、符号量制御を行う。具体的には、レート制御部21は、コードブロック毎のコーディングパスの少なくとも一部を切り捨てる(Truncateする)ことにより符号量制御を行う。なお、レート制御を行わずに算術符号D21をそのままコードストリーム生成部22に供給するようにしてもよく、この場合にはレート制御部21は不要である。
【0045】
コードストリーム生成部22は、レート制御部21から供給されたレート制御終了後の算術符号D22をJPEG−2000規格に従ってパケット化し、ヘッダを付加して、最終的な符号化コードストリームD23を出力する。
【0046】
ここで、符号化コードストリームD10,D11がそれぞれオウムの画像、家のある風景画を符号化したコードストリームであり、クロスフェード部16においてα=0.2、α=0.5、α=0.8とした場合におけるクロスフェード画像をそれぞれ図9乃至図11に示す。図9乃至図11に示すように、家のある風景画からオウムの画像まで滑らかにフェードが掛かっていることが確認できる。なお、この図9乃至図11では、αの値として0.2,0.5及び0.8の3つを用いたが、α(t)の値の時間変化の割合を変えることにより、クロスフェードの滑らかさの度合いを変化させることができる。
【0047】
以上説明したように、本実施の形態における画像合成装置1によれば、JPEG−2000規格に従って符号化された2つの符号化コードストリームを入力してクロスフェード処理を行い、クロスフェード後の符号化コードストリームを出力する際に、クロスフェード処理を係数領域で行うことにより、JPEG−2000規格に準拠した画像復号装置及び画像符号化装置の一部を有するのみで、空間領域でクロスフェード処理を行う場合と同じ結果を得ることができる。
【0048】
また、クロスフェード処理を係数領域で行うことにより、空間領域での場合と比較して少ないメモリ量で済むという利点がある。特に、本実施の形態における画像合成装置1では、クロスフェード処理をコードブロック単位で行っているため、全画面単位で行う場合と比較して遙かに少ないメモリ量でクロスフェードを実現することができる。
【0049】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0050】
例えば、上述した画像合成装置1では、符号化コードストリームD10を量子化係数D16まで復号する画像復号手段(コードストリーム解析部10、コードブロック抽出部12及びEBCOT復号部14)と、符号化コードストリームD11を量子化係数D17まで復号する画像復号手段(コードストリーム解析部11、コードブロック抽出部13及びEBCOT復号部15)とを備えているが、これらは別々の画像復号部であってもよく、同一の画像復号部の構成要素であってもよい。後者の場合、パイプライン処理と呼ばれるH/Wで多用される技術を用いて、これらの処理を並列化することができる。
【0051】
【発明の効果】
以上詳細に説明したように本発明に係る画像合成装置は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成装置であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析手段と、該コードストリーム解析手段の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出手段と、該コードブロック情報を算術復号する算術復号手段とをそれぞれ有する第1,第2の画像復号手段と、上記第1,第2の画像復号手段から供給されたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成手段と、上記合成手段における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化手段とを備えるものである。
【0052】
また、本発明に係る画像合成方法は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成方法であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析工程と、該コードストリーム解析工程の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出工程と、該コードブロック情報を算術復号する算術復号工程とをそれぞれ有する第1,第2の画像復号工程と、上記第1,第2の画像復号工程で得られたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成工程と、上記合成工程における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化工程とを有するものである。
【0053】
このような画像合成装置及びその方法によれば、例えばJPEG−2000規格に従って符号化された2つの符号化コードストリームを合成し、合成符号化コードストリームを出力する際に、合成処理を空間領域ではなく係数領域で行うことにより、JPEG−2000規格に準拠した画像復号装置及び画像符号化装置の一部を有するのみで、空間領域で合成処理を行う場合と同じ結果を得ることができ、また、空間領域での場合よりもメモリの必要量が少ない。
【図面の簡単な説明】
【図1】従来のクロスフェード処理方法を説明する図である。
【図2】従来のクロスフェード処理方法を
【図3】第2レベルまでウェーブレット変換した場合のサブバンドを説明する図である。
【図4】コードブロックとサブバンドの関係を説明する図である。
【図5】ビットプレーンの説明する図であり、同図(A)は、計16個の係数から成る量子化係数を示し、同図(B)は、係数の絶対値のビットプレーンを示し、同図(C)は、符号のビットプレーンを示す。
【図6】コードブロック内のコ−ディングパスの処理手順を説明する図である。
【図7】コ−ドブロック内の係数のスキャン順序を説明する図である。
【図8】本実施の形態における画像合成装置の概略構成を説明する図である。
【図9】α=0.2である場合のクロスフェード画像の一例を示す図である。
【図10】α=0.5である場合のクロスフェード画像の一例を示す図である。
【図11】α=0.8である場合のクロスフェード画像の一例を示す図である。
【符号の説明】
1 画像合成装置、10,11 コードストリーム解析部、12,13 コードブロック抽出部、14,15 EBCOT復号部、16 クロスフェード部、17,18 乗算器、19 加算器、20 EBCOT符号化部、21 レート制御部、22 コードストリーム生成部
【発明の属する技術分野】
本発明は、例えばJPEG−2000規格に従って符号化された2つの画像を合成する画像合成装置及びその方法に関し、特にクロスフェード処理を行う際に用いて好適な画像合成装置及びその方法に関する。
【0002】
【従来の技術】
従来、例えば1つの画像から他の画像に全体が移り変わっていく様子を表現するための画像処理技術としてクロスフェード処理が知られており(特許文献1,2等参照)、コンピュータグラフィックス、放送用機器の特殊再生、カムコーダの特殊再生、ゲーム機での画像処理等に用いられている。
【0003】
通常、このようなクロスフェード処理は、2つの画像の空間的に同じ位置の画素を線形内挿し、2つの画像を合成することで実現される。
【0004】
【特許文献1】
特開2000−78467号公報
【特許文献2】
特開2000−184278号公報
【0005】
【発明が解決しようとする課題】
ところで、近年では、フィルタバンクと呼ばれるハイパス・フィルタとローパス・フィルタとを組み合わせたフィルタによって画像を複数の帯域に分割し、各帯域毎に符号化を行う方式の研究が盛んになっている。その中でも、ウェーブレット変換符号化は、離散コサイン変換(Descrete Cosine Transform;DCT)のように高圧縮でブロック歪みが顕著になるという欠点がないことから、DCTに代わる新たな技術として有力視されている。例えば2001年1月に国際標準化が完了したJPEG−2000は、このウェーブレット変換に高能率なエントロピー符号化(ビットプレーン単位のビット・モデリングと算術符号化)を組み合わせた方式を採用しており、JPEGに比べて符号化効率の大きな改善を実現している。
【0006】
ここで、上述した従来手法を用いて2つの画像の符号化コードストリームからクロスフェード画像の符号化コードストリームを得るためには、符号化コードストリームをJPEG−2000規格に従って復号し、得られた2つの復号画像を線形内挿によって合成してクロスフェード画像を生成し、さらにこのクロスフェード画像をJPEG−2000規格に従って符号化する処理が必要となる。
【0007】
しかしながら、このような手法では、2つの復号画像を記憶するメモリが必要になる上、クロスフェード画像を記憶するメモリも必要になる。また、JPEG−2000規格に準拠した画像復号装置と画像符号化装置との双方が必要になるという問題があった。
【0008】
本発明は、このような従来の実情に鑑みて提案されたものであり、少ないメモリ使用量で容易且つ効果的に2つの符号化コードストリームを合成する画像合成装置及びその方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る画像合成装置は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成装置であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析手段と、該コードストリーム解析手段の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出手段と、該コードブロック情報を算術復号する算術復号手段とをそれぞれ有する第1,第2の画像復号手段と、上記第1,第2の画像復号手段から供給されたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成手段と、上記合成手段における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化手段とを備えるものである。
【0010】
また、上述した目的を達成するために、本発明に係る画像合成方法は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成方法であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析工程と、該コードストリーム解析工程の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出工程と、該コードブロック情報を算術復号する算術復号工程とをそれぞれ有する第1,第2の画像復号工程と、上記第1,第2の画像復号工程で得られたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成工程と、上記合成工程における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化工程とを有するものである。
【0011】
このような画像合成装置及びその方法では、例えばJPEG−2000規格に従って符号化された2つの符号化コードストリームを合成し、合成符号化コードストリームを出力する際に、合成処理を空間領域ではなく係数領域で行う。
【0012】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明するが、その前に、2つの画像を合成してクロスフェード画像を作成する場合の従来手法と、その従来手法をJPEG−2000で符号化された符号化画像に適用した場合における画像合成装置の構成について説明する。
【0013】
従来、画像F1(x,y,t)と画像F2(x,y,t)との間でクロスフェード画像を生成する場合、以下の式(1)に示すように、同一時刻のフレームの同位置のサンプル同士を線形内挿処理することによってクロスフェード画像G(x,y,t)を得ていた。ここで、x,yはそれぞれ画像の水平、垂直位置座標を表し、tは時刻を表す。
【0014】
【数1】
【0015】
この従来手法をJPEG−2000規格に従って符号化された符号化画像に適用した場合、例えば図2に示すような画像合成装置100が構成される。ここで、図2は、JPEG−2000規格に従って符号化された符号化コードストリームD100,D101を入力してクロスフェード処理を行い、クロスフェード後の符号化コードストリームD115を出力する場合について説明するものである。
【0016】
この画像合成装置100において、EBCOT(Embedded Coding with Optimized Truncation)復号部101は、符号化コードストリームD100を復号して量子化係数D102を生成し、この量子化係数D102を逆量子化部103に供給する。逆量子化部103は、この量子化係数D102を逆量子化してウェーブレット変換係数D104を生成し、このウェーブレット変換係数D104をウェーブレット逆変換部105に供給する。そして、ウェーブレット逆変換部105は、ウェーブレット変換係数D104をウェーブレット逆変換して復号画像D106を生成し、この復号画像D106をクロスフェード部107に供給する。
【0017】
同様に、EBCOT復号部102は、符号化コードストリームD101を復号して量子化係数D103を生成し、この量子化係数D103を逆量子化部104に供給する。逆量子化部104は、この量子化係数D103を逆量子化してウェーブレット変換係数D105を生成し、このウェーブレット変換係数D105をウェーブレット逆変換部106に供給する。そして、ウェーブレット逆変換部106は、ウェーブレット変換係数D105をウェーブレット逆変換して復号画像D107を生成し、この復号画像D107をクロスフェード部107に供給する。
【0018】
クロスフェード部107は、乗算器108,109と、加算器110とから構成され、上述した式(1)のような演算を行うことで、クロスフェード画像D110を生成する。すなわち、乗算器108では復号画像D106に対して係数α(t)が乗算され、乗算器109では復号画像D107に対して係数(1−α(t))が乗算される。そして、加算器110において、乗算器108,109から出力された画像D108,D109が加算されてクロスフェード画像D110となり、このクロスフェード画像D110がウェーブレット変換部111に供給される。ここで、復号画像D106,107、クロスフェード画像D110は、それぞれ式(1)におけるF1(x,y,t)、F2(x,y,t)、G(x,y,t)に相当する。
【0019】
以上により、入力した符号化コードストリームD100,D101からクロスフェード画像D110が得られ、後段では、このクロスフェード画像D110をJPEG−2000規格に従って符号化し、符号化コードストリームD115を生成する。
【0020】
ウェーブレット変換部111は、通常、低域フィルタと高域フィルタとから構成されるフィルタバンクによって実現される。なお、デジタルフィルタは、通常複数タップ長のインパルス応答(フィルタ係数)を持っているため、フィルタリングが行えるだけの入力画像を予めバッファリングしておく必要があるが、簡単のため、図1では図示を省略する。
【0021】
ウェーブレット変換部111は、フィルタリングに必要な最低限のクロスフェード画像D110を入力し、ウェーブレット変換を行うフィルタリング処理を行ってウェーブレット変換係数D111を生成する。
【0022】
このウェーブレット変換では、通常図3に示すように低域成分が繰り返し変換されるが、これは画像のエネルギの多くが低域成分に集中しているためである。ここで、図3におけるウェーブレット変換のレベル数は2であり、この結果計7個のサブバンドが生成されている。すなわち、1回目のフィルタリング処理によって水平方向のサイズX_SIZE及び垂直方向のサイズY_SIZEがそれぞれ1/2に分割され、LL1,LH2,HL2,HH2の4つのサブバンドが生成される。そして2回目のフィルタリング処理によってLL1がさらに分割されて、LL0,LH1,HL1,HH1の4つのサブバンドが生成される。なお、図3においてL,Hはそれぞれ低域,高域を表し、L,Hの後の数字は解像度レベルを表す。すなわち、例えばLH1は、水平方向が低域で垂直方向が高域である解像度レベル=1のサブバンドを表す。
【0023】
量子化部112は、ウェーブレット変換部111から供給されたウェーブレット変換係数D111に対して非可逆圧縮を施す。量子化手段としては、ウェーブレット変換係数D111を量子化ステップサイズで除算するスカラ量子化を用いることができる。
【0024】
EBCOT符号化部113は、量子化部112で生成されたサブバンド毎の量子化係数D112に対してJPEG−2000規格で定められたEBCOTと呼ばれるエントロピー符号化を施し、算術符号D113を生成する。EBCOTの処理単位が上述のコードブロックである。なお、このEBCOTについては、例えば、文献「ISI/IEC FDIS 15444−1, JPEG−2000 Part−1 FDIS, 18 August 2000」等に詳細に記載されている。
【0025】
具体的に、EBCOT符号化部113は、先ず量子化部112で生成されたサブバンド毎の量子化係数D112を、JPEG−2000の符号化単位であるコードブロック単位に分割する。すなわち図3に示すように、例えば64×64程度のサイズのコードブロックが、分割後の全てのサブバンド中に生成される。なお、JPEG−2000の規定では、コードブロックのサイズは水平方向、垂直方向共に2の冪乗で表され、通常は32×32、又は64×64が使用されることが多い。
【0026】
そして、EBCOT符号化部113は、コードブロック毎の量子化係数に対して、以下のようにビットプレーン単位で係数ビットモデリングを行う。このビットプレーンの概念について図5を用いて説明する。図5(A)は、縦4個、横4個の計16個の係数からなる量子化係数を仮定したものである。この16個の係数のうち絶対値が最大のものは13であり、2進数表現では1101となる。したがって、係数の絶対値のビットプレーンは、図5(B)に示すような4つのビットプレーンから構成される。なお、各ビットプレーンの要素は、全て0又は1の数を取る。一方、量子化係数の符号は、−6が唯一負の値であり、それ以外は0又は正の値である。したがって、符号のビットプレーンは、図5(C)に示すようになる。
【0027】
各コードブロックは、最上位ビット(MSB)から最下位ビット(LSB)方向にビットプレーン毎に独立して符号化される。量子化係数は、nビットの符号付き2進数で表されており、bit0からbit(n−2)がLSBからMSBまでのそれぞれのビットを表す。なお、残りの1ビットは符号である。符号ブロックの符号化は、MSB側のビットプレーンから順番に、以下の(a)〜(c)に示す3種類のコーディングパスによって行われる。
(a) Significance Propagation Pass
(b) Magnitude Refinement Pass
(c) Clean up Pass
【0028】
3つのコーディングパスの用いられる順序を図6に示す。図6に示すように、先ずビットプレーン(n−2)(MSB)がClean up Pass(以下、適宜「CUパス」という。)によって符号化される。続いて、順次LSB側に向かい、各ビットプレーンが、Significance Propagation Pass(以下、適宜「SPパス」という。)、Magnitude Refinement Pass(以下、適宜「MRパス」という。)、CUパスの順序で用いられて符号化される。
【0029】
但し、実際にはMSB側から何番目のビットプレーンで初めて1が出てくるかをヘッダに書き、オール0のビットプレーンは符号化しない。この順序で3種類のコーディングパスを繰返し用いて符号化し、任意のビットプレーンの任意の符号化パスまでで符号化を打ち切ることにより、符号量と画質のトレードオフを取る、すなわちレート制御を行うことができる。
【0030】
ここで、係数の走査(スキャニング)について図7を用いて説明する。コードブロックは、高さ4個の係数毎にストライプ(stripe)に分けられる。ストライプの幅は、コードブロックの幅に等しい。スキャン順とは1個のコードブロック内の全ての係数を辿る順番であり、コードブロック中では上のストライプから下のストライプへの順序、各ストライプ中では左の列から右の列への順序、各列中では上から下への順序でスキャニングされる。なお、各コーディングパスにおいてコードブロック中の全ての係数がこのスキャン順で処理される。
【0031】
以上のようにしてEBCOT符号化部113は、コードブロック毎の量子化係数をビットプレーンに分解すると共に各ビットプレーンを3つのコーディングパスに分解し、コーディングパス毎に量子化係数を生成する。そして、このコーディングパス毎の量子化係数に対して算術符号化を施す。
【0032】
レート制御部114は、EBCOT符号化部113から供給された算術符号D113の符号量をカウントしながら、目標のビットレート又は圧縮率に近づけるように、符号量制御を行う。具体的には、レート制御部114は、コードブロック毎のコーディングパスの少なくとも一部を切り捨てる(Truncateする)ことにより符号量制御を行う。
【0033】
コードストリーム生成部115は、レート制御部114から供給されたレート制御終了後の算術符号D114をJPEG−2000規格に従ってパケット化し、ヘッダを付加して、最終的な符号化コードストリームD115を出力する。
【0034】
以上のように、画像合成装置100では、JPEG−2000規格に従って符号化された2つの符号化コードストリームを入力してクロスフェード処理を行い、クロスフェード後の符号化コードストリームを出力する際に、2つの画像を空間領域で合成してクロスフェード画像を作成し、このクロスフェード画像を符号化してクロスフェード後の符号化コードストリームを生成する。
【0035】
しかしながら、このような構成の画像合成装置100では、2つの復号画像を記憶するメモリが必要になる上、クロスフェード画像を記憶するメモリも必要になる。また、JPEG−2000規格に準拠した画像復号装置と画像符号化装置との双方が必要になるという問題があった。
【0036】
そこで、本実施の形態における画像合成装置は、以下に説明するように、クロスフェード処理を空間領域ではなく係数領域で実現することにより、上述した問題を解決する。
【0037】
本実施の形態における画像合成装置の概略構成を図8に示す。図8に示すように、本実施の形態における画像合成装置1は、コードストリーム解析部10,11と、コードブロック抽出部12,13と、EBCOT復号部14,15と、クロスフェード部16と、EBCOT符号化部20と、レート制御部21と、コードストリーム生成部22とから構成されている。ここで、クロスフェード部16は、乗算部17,18と加算部19とから構成される。
【0038】
コードストリーム解析部10は、JPEG−2000規格に従って符号化された符号化コードストリームD10を入力し、JPEG−2000規格で定められた手法で符号化コードストリームD10の解析を行う。コードブロック抽出部12は、コードストリーム解析部10から供給された解析情報D12に基づいて、コードブロック毎の符号化情報D14をEBCOT復号部14に供給する。そして、EBCOT復号部14は、この符号化情報D14を復号してコードブロック毎の量子化係数D16を生成し、この量子化係数D16をクロスフェード部16に供給する。
【0039】
同様に、コードストリーム解析部11は、JPEG−2000規格に従って符号化された符号化コードストリームD11を入力し、JPEG−2000規格で定められた手法で符号化コードストリームD11の解析を行う。コードブロック抽出部13は、コードストリーム解析部11から供給された解析情報D13に基づいて、コードブロック毎の符号化情報D15をEBCOT復号部15に供給する。そして、EBCOT復号部15は、この符号化情報D15を復号してコードブロック毎の量子化係数D17を生成し、この量子化係数D17をクロスフェード部16に供給する。
【0040】
クロスフェード部16は、乗算器17,18と、加算器19とから構成され、量子化係数D16,D17を合成することにより、クロスフェード量子化係数D20を生成する。具体的には、量子化係数D16をQ_cb1(x,y)、量子化係数D17をQ_cb2(x,y)としたとき、以下の式(2)に従ってクロスフェード量子化係数を生成する。ここで、x,yはそれぞれ量子化係数領域の水平、垂直位置を表す。なお、Q_cb1(x,y)、Q_cb2(x,y)は同一時刻のものであることを前提としているため、上述した式(1)のようにパラメータとして時刻tは必要ない。
【0041】
【数2】
【0042】
すなわち、乗算器17では量子化係数D16に対して係数α(t)が乗算され、乗算器18では量子化係数D17に対して係数(1−α(t))が乗算される。そして、加算器19において、乗算器17,18から出力された量子化係数D18,D19が加算されてクロスフェード量子化係数D20となり、このクロスフェード量子化係数D20がEBCOT符号化部20に供給される。
【0043】
EBCOT符号化部20は、クロスフェード部16で生成されたクロスフェード量子化係数D20に対してEBCOTのエントロピー符号化を施し、算術符号D21を生成する。
【0044】
レート制御部21は、EBCOT符号化部20から供給された算術符号D21の符号量をカウントしながら、目標のビットレート又は圧縮率に近づけるように、符号量制御を行う。具体的には、レート制御部21は、コードブロック毎のコーディングパスの少なくとも一部を切り捨てる(Truncateする)ことにより符号量制御を行う。なお、レート制御を行わずに算術符号D21をそのままコードストリーム生成部22に供給するようにしてもよく、この場合にはレート制御部21は不要である。
【0045】
コードストリーム生成部22は、レート制御部21から供給されたレート制御終了後の算術符号D22をJPEG−2000規格に従ってパケット化し、ヘッダを付加して、最終的な符号化コードストリームD23を出力する。
【0046】
ここで、符号化コードストリームD10,D11がそれぞれオウムの画像、家のある風景画を符号化したコードストリームであり、クロスフェード部16においてα=0.2、α=0.5、α=0.8とした場合におけるクロスフェード画像をそれぞれ図9乃至図11に示す。図9乃至図11に示すように、家のある風景画からオウムの画像まで滑らかにフェードが掛かっていることが確認できる。なお、この図9乃至図11では、αの値として0.2,0.5及び0.8の3つを用いたが、α(t)の値の時間変化の割合を変えることにより、クロスフェードの滑らかさの度合いを変化させることができる。
【0047】
以上説明したように、本実施の形態における画像合成装置1によれば、JPEG−2000規格に従って符号化された2つの符号化コードストリームを入力してクロスフェード処理を行い、クロスフェード後の符号化コードストリームを出力する際に、クロスフェード処理を係数領域で行うことにより、JPEG−2000規格に準拠した画像復号装置及び画像符号化装置の一部を有するのみで、空間領域でクロスフェード処理を行う場合と同じ結果を得ることができる。
【0048】
また、クロスフェード処理を係数領域で行うことにより、空間領域での場合と比較して少ないメモリ量で済むという利点がある。特に、本実施の形態における画像合成装置1では、クロスフェード処理をコードブロック単位で行っているため、全画面単位で行う場合と比較して遙かに少ないメモリ量でクロスフェードを実現することができる。
【0049】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0050】
例えば、上述した画像合成装置1では、符号化コードストリームD10を量子化係数D16まで復号する画像復号手段(コードストリーム解析部10、コードブロック抽出部12及びEBCOT復号部14)と、符号化コードストリームD11を量子化係数D17まで復号する画像復号手段(コードストリーム解析部11、コードブロック抽出部13及びEBCOT復号部15)とを備えているが、これらは別々の画像復号部であってもよく、同一の画像復号部の構成要素であってもよい。後者の場合、パイプライン処理と呼ばれるH/Wで多用される技術を用いて、これらの処理を並列化することができる。
【0051】
【発明の効果】
以上詳細に説明したように本発明に係る画像合成装置は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成装置であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析手段と、該コードストリーム解析手段の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出手段と、該コードブロック情報を算術復号する算術復号手段とをそれぞれ有する第1,第2の画像復号手段と、上記第1,第2の画像復号手段から供給されたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成手段と、上記合成手段における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化手段とを備えるものである。
【0052】
また、本発明に係る画像合成方法は、第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成方法であって、上記第1,第2の符号化コードストリームを解析するコードストリーム解析工程と、該コードストリーム解析工程の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出工程と、該コードブロック情報を算術復号する算術復号工程とをそれぞれ有する第1,第2の画像復号工程と、上記第1,第2の画像復号工程で得られたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成工程と、上記合成工程における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化工程とを有するものである。
【0053】
このような画像合成装置及びその方法によれば、例えばJPEG−2000規格に従って符号化された2つの符号化コードストリームを合成し、合成符号化コードストリームを出力する際に、合成処理を空間領域ではなく係数領域で行うことにより、JPEG−2000規格に準拠した画像復号装置及び画像符号化装置の一部を有するのみで、空間領域で合成処理を行う場合と同じ結果を得ることができ、また、空間領域での場合よりもメモリの必要量が少ない。
【図面の簡単な説明】
【図1】従来のクロスフェード処理方法を説明する図である。
【図2】従来のクロスフェード処理方法を
【図3】第2レベルまでウェーブレット変換した場合のサブバンドを説明する図である。
【図4】コードブロックとサブバンドの関係を説明する図である。
【図5】ビットプレーンの説明する図であり、同図(A)は、計16個の係数から成る量子化係数を示し、同図(B)は、係数の絶対値のビットプレーンを示し、同図(C)は、符号のビットプレーンを示す。
【図6】コードブロック内のコ−ディングパスの処理手順を説明する図である。
【図7】コ−ドブロック内の係数のスキャン順序を説明する図である。
【図8】本実施の形態における画像合成装置の概略構成を説明する図である。
【図9】α=0.2である場合のクロスフェード画像の一例を示す図である。
【図10】α=0.5である場合のクロスフェード画像の一例を示す図である。
【図11】α=0.8である場合のクロスフェード画像の一例を示す図である。
【符号の説明】
1 画像合成装置、10,11 コードストリーム解析部、12,13 コードブロック抽出部、14,15 EBCOT復号部、16 クロスフェード部、17,18 乗算器、19 加算器、20 EBCOT符号化部、21 レート制御部、22 コードストリーム生成部
Claims (6)
- 第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成装置であって、
上記第1,第2の符号化コードストリームを解析するコードストリーム解析手段と、該コードストリーム解析手段の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出手段と、該コードブロック情報を算術復号する算術復号手段とをそれぞれ有する第1,第2の画像復号手段と、
上記第1,第2の画像復号手段から供給されたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成手段と、
上記合成手段における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化手段と
を備えることを特徴とする画像の画像合成装置。 - 上記第1の実数値と上記第2の実数値との和が1であることを特徴とする請求項1記載の画像合成装置。
- 上記合成手段は、上記第1,第2の実数値が乗算されたコードブロック毎の係数値のうち、対応する位置の係数値同士を加算することを特徴とする請求項1記載の画像合成装置。
- 上記第1,第2の画像復号手段は、同一の画像復号手段の構成要素であることを特徴とする請求項1記載の画像合成装置。
- 上記第1,第2の実数値の変化率が可変とされていることを特徴とする請求項1記載の画像合成装置。
- 第1,第2の入力画像に対してフィルタリング処理を施し、生成されたサブバンドを分割して所定の大きさのコードブロックを生成し、上記コードブロック毎に最上位ビットから最下位ビットに至るビットプレーンを生成し、上記ビットプレーン毎にビットモデリングを行ってコーディングパスを生成し、生成されたコーディングパス内で算術符号化を施して得られた第1,第2の符号化コードストリームを入力し、該第1,第2の符号化コードストリームを合成した合成符号化コードストリームを生成する画像合成方法であって、
上記第1,第2の符号化コードストリームを解析するコードストリーム解析工程と、該コードストリーム解析工程の解析結果に基づいてコードブロック情報を抽出するコードブロック抽出工程と、該コードブロック情報を算術復号する算術復号工程とをそれぞれ有する第1,第2の画像復号工程と、
上記第1,第2の画像復号工程で得られたコードブロック毎の係数値にそれぞれ第1,第2の実数値を乗算して加算する合成工程と、
上記合成工程における加算結果に対して算術符号化を施して上記合成符号化コードストリームを生成する算術符号化工程と
を有することを特徴とする画像の画像合成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003120367A JP2004326447A (ja) | 2003-04-24 | 2003-04-24 | 画像合成装置及び方法 |
US10/830,668 US7433541B2 (en) | 2003-04-24 | 2004-04-22 | Image synthesizing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003120367A JP2004326447A (ja) | 2003-04-24 | 2003-04-24 | 画像合成装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004326447A true JP2004326447A (ja) | 2004-11-18 |
Family
ID=33499304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003120367A Pending JP2004326447A (ja) | 2003-04-24 | 2003-04-24 | 画像合成装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7433541B2 (ja) |
JP (1) | JP2004326447A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011511573A (ja) * | 2008-02-01 | 2011-04-07 | アクティブビデオ ネットワークス, インコーポレイテッド | 変換領域内における符号化映像に対する遷移の生成 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4322920B2 (ja) * | 2004-05-17 | 2009-09-02 | 三菱電機株式会社 | 画像符号化装置 |
JP4849297B2 (ja) * | 2005-04-26 | 2012-01-11 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP6091071B2 (ja) * | 2011-04-11 | 2017-03-08 | キヤノン株式会社 | データ復号装置 |
US10482600B2 (en) * | 2018-01-16 | 2019-11-19 | Siemens Healthcare Gmbh | Cross-domain image analysis and cross-domain image synthesis using deep image-to-image networks and adversarial networks |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3053117B2 (ja) * | 1990-01-26 | 2000-06-19 | 株式会社日立製作所 | カラー画像表示方式 |
JPH0443773A (ja) * | 1990-06-11 | 1992-02-13 | Matsushita Electric Ind Co Ltd | 演算回路 |
US5761342A (en) * | 1991-04-16 | 1998-06-02 | Canon Kabushiki Kaisha | Image processing apparatus and method |
CN1164120C (zh) * | 1996-11-07 | 2004-08-25 | 松下电器产业株式会社 | 图像编码装置和图像解码装置 |
JP2000078467A (ja) | 1998-06-18 | 2000-03-14 | Sony Corp | 画像合成方法 |
JP2000184278A (ja) | 1998-12-16 | 2000-06-30 | Sony Corp | 画像混合装置及び画像処理装置 |
JP4612782B2 (ja) * | 2000-09-27 | 2011-01-12 | キヤノン株式会社 | 画像処理装置、及びその方法、並びにプログラム、記憶媒体 |
JP3702778B2 (ja) * | 2000-11-27 | 2005-10-05 | ソニー株式会社 | 画像符号化装置及び方法 |
US6898323B2 (en) * | 2001-02-15 | 2005-05-24 | Ricoh Company, Ltd. | Memory usage scheme for performing wavelet processing |
JP3750797B2 (ja) * | 2001-06-20 | 2006-03-01 | ソニー株式会社 | 画像処理方法および装置 |
-
2003
- 2003-04-24 JP JP2003120367A patent/JP2004326447A/ja active Pending
-
2004
- 2004-04-22 US US10/830,668 patent/US7433541B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011511573A (ja) * | 2008-02-01 | 2011-04-07 | アクティブビデオ ネットワークス, インコーポレイテッド | 変換領域内における符号化映像に対する遷移の生成 |
Also Published As
Publication number | Publication date |
---|---|
US7433541B2 (en) | 2008-10-07 |
US20040264784A1 (en) | 2004-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Boulgouris et al. | Lossless image compression based on optimal prediction, adaptive lifting, and conditional arithmetic coding | |
Zhang et al. | Lossless compression of color mosaic images | |
JP3743384B2 (ja) | 画像符号化装置及び方法、並びに画像復号装置及び方法 | |
Lian et al. | Analysis and architecture design of block-coding engine for EBCOT in JPEG 2000 | |
US10205951B2 (en) | Method of signalling motion information for efficient scalable video compression | |
JP5457199B2 (ja) | 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御 | |
US9860566B2 (en) | Image decoding apparatus and image decoding method | |
CN1126065C (zh) | 压缩和解压缩图象 | |
CN1805547A (zh) | 用于高效无损数据压缩的可逆重叠算子 | |
GB2303031A (en) | Reversible wavelet transform and embedded codestream manipulation | |
WO2007035539A2 (en) | Classified filtering for temporal prediction | |
JP3948619B2 (ja) | 画像圧縮装置、画像圧縮方法、プログラム及び記録媒体 | |
US6917717B2 (en) | System and method for image compression using wavelet coding of masked images | |
JP2004166254A (ja) | 画像符号化装置及び方法、並びにプログラム及び記録媒体 | |
JP2004326447A (ja) | 画像合成装置及び方法 | |
JP4726040B2 (ja) | 符号化処理装置、復号処理装置、符号化処理方法、復号処理方法、プログラム及び情報記録媒体 | |
JP2007288779A (ja) | リンギング欠陥を減少した解凍 | |
JP2007282006A (ja) | 画像信号処理装置 | |
Maleki et al. | Rate-distortion analysis of directional wavelets | |
CN1222171C (zh) | 图像变换装置和方法 | |
JP2009049627A (ja) | スケーラブル画像符号化方法,復号方法,符号化装置,復号装置およびそれらのプログラムとその記録媒体 | |
CN1947346A (zh) | 正交归一时空变换的基于提升的实现方式 | |
JP2007049485A (ja) | 離散ウェーブレット変換装置及び方法、並びにプログラム及び記録媒体 | |
JP4367113B2 (ja) | 画像符号化装置及び方法 | |
JP2006352365A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090331 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090721 |