JP2010135863A - 画像符号化方法及び装置 - Google Patents
画像符号化方法及び装置 Download PDFInfo
- Publication number
- JP2010135863A JP2010135863A JP2007085712A JP2007085712A JP2010135863A JP 2010135863 A JP2010135863 A JP 2010135863A JP 2007085712 A JP2007085712 A JP 2007085712A JP 2007085712 A JP2007085712 A JP 2007085712A JP 2010135863 A JP2010135863 A JP 2010135863A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional
- orthogonal transform
- image
- orthogonal
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
【課題】予測残差の時間方向の冗長性を考慮して最適直交変換を選択する画像符号化装置を提供する。
【解決手段】非参照符号化対象画像間で共通位置の符号化対象領域の予測残差画像を生成する予測器(101)と各予測残差画像に2次元直交変換を行う2次元モード又は予測残差画像でなる3次元予測残差画像に3次元直交変換を行う3次元モードを選択する選択部と2次元モード選択により各予測残差画像に2次元直交変換を行う2次元直交変換部(104b)と3次元モード選択により3次元予測残差画像に3次元直交変換を行う3次元直交変換部(104a,104b)と2又は3次元直交変換係数を量子化する量子化器(106)と量子化係数を可変長符号化する符号化器(108)と選択変換モードを示す直交変換モード情報と符号化変換係数の多重化符号化データを出力する多重化器とを備えた。
【選択図】 図1
【解決手段】非参照符号化対象画像間で共通位置の符号化対象領域の予測残差画像を生成する予測器(101)と各予測残差画像に2次元直交変換を行う2次元モード又は予測残差画像でなる3次元予測残差画像に3次元直交変換を行う3次元モードを選択する選択部と2次元モード選択により各予測残差画像に2次元直交変換を行う2次元直交変換部(104b)と3次元モード選択により3次元予測残差画像に3次元直交変換を行う3次元直交変換部(104a,104b)と2又は3次元直交変換係数を量子化する量子化器(106)と量子化係数を可変長符号化する符号化器(108)と選択変換モードを示す直交変換モード情報と符号化変換係数の多重化符号化データを出力する多重化器とを備えた。
【選択図】 図1
Description
本発明は、動画像または静止画像のための画像符号化方法及び装置に関する。
ISO/IEC14496−10 ITU−T Recommendation H.264(非特許文献1)などで代表される動画像符号化標準方式では、入力画像信号に対し、例えば図3に示すような参照構造を用いて、すでに符号化済みの参照画像信号から画面内予測や動き補償を行うことで予測信号が作成される。この予測画像信号と入力信号との予測誤差信号に対し、離散コサイン変換(DCT)等の直交変換、即ち周波軸上への変換を行い予測誤差信号から空間方向の冗長性が除去される。その後、予測誤差信号に対して量子化及び符号化による圧縮処理を行って符号化画像が生成される。即ち、非可逆圧縮方式による動画像符号化が行われる。図3において、Iは画面内の符号化済みの画像信号からのみ予測を行って符号化を行うフレームを示している。Pは入力画像のフレーム順で時間的に前方に位置する既に符号化されたIやPから予測を行って符号化を行うフレームを示している。Bは入力画像のフレーム順で前方や後方に位置するすでに符号化済みの画像信号から予測を行って符号化するフレームを示している。フレームの下の番号は表示順序を示している。Bは表示順序で後方に位置するフレームを参照し予測することから、参照するフレームを先に符号化するように、フレーム順序を並べ替えて符号化を行う。図3では、例えばI0,P3,B1,B2,P6,B4,B5の順で符号化が行われる。このように、図3に示されるような参照構造を用いて予測画像を作成する動画像符号化方式では、参照画像と入力画像との差分をとることで時間方向の冗長性が削除され、さらに予測誤差信号の空間方向の冗長性が直交変換により削除される。その後、予測誤差信号に可変長符号化を行うことで、圧縮効率を向上させている。しかし、フレーム間の予測誤差信号の時間方向の冗長性は考慮されていない。これに対し、特許文献1は、図3に示すような符号化構造において、P6,B4,B5の3フレーム分の動き補償後の差分をまとめて3次元直交変換を行う。量子化後、可変長符号化することで、予測誤差信号の時間方向の冗長性も除去して符号化を行う。このようにして符号化効率を高める方式が提案されている。
ISO/IEC14496−10 ITU−T Recommendation H.264 特開平10−164594号公報
ISO/IEC14496−10 ITU−T Recommendation H.264
非特許文献1では、Bフレームの予測残差を作成する際にPフレームを参照して動き補償を行う必要がある。例えば、図3のB4、B5はP6の復号画像信号を参照して予測画像が作成されるが、P6、B4、B5の3フレーム分の動き補償後の予測残差信号を3次元直交変換して量子化する。このため、B4,B5の予測画像作成時にはP6の正しい復号画像信号を得ることはできないため、符号化側と復号化側でミスマッチが生じる。
本発明は、互いに参照されない複数の入力画像に関する予測残差を、複数フレームまとめてブロックごとに、2次元直交変換または3次元直交変換し、変換後、量子化・可変長符号化を行う符号化装置及び方法並びにこの符号化装置のための復号化装置及び方法を提供することを目的とする。
本発明の一実施形態は、複数の入力画像の中の互いに参照されない複数の符号化対象画像間で共通な位置にある複数の符号化対象領域の複数の予測残差画像を、前記複数の入力画像の中で既に符号化がなされた参照画像の局部復号画像を参照して生成する予測残差画像生成器と、前記複数の予測残差画像の各々に対して空間方向の2次元直交変換を行う2次元モード、または、前記複数の予測残差画像からなる3次元時空間予測残差画像に対して時空間方向の3次元直交変換を行う3次元モードを、直交変換モードとして選択するモード選択部と、前記直交変換モードとして2次元モードが選択された場合に前記複数の予測残差画像の各々に対して空間方向の2次元直交変換を行うことにより2次元直交変換係数を生成する2次元直交変換部と、前記直交変換モードとして前記3次元モードが選択された場合に前記複数の予測残差画像からなる3次元時空間予測残差画像に対して時空間方向に3次元直交変換を行うことにより3次元直交変換係数を生成する3次元直交変換部と、前記2次元又は前記3次元直交変換係数を量子化して量子化直交変換係数を生成する量子化器と、量子化直交変換係数を可変長符号化して符号化変換係数を生成する可変長符号化器と、前記モード選択部で選択された直交変換モードを示す直交変換モード情報と前記符号化変換係数とを多重化した符号化データを出力する多重化器と、を備えたことを特徴とする画像符号化装置を提供する。
本発明では、時間方向の冗長性に応じて最適な直交変換を選択することで、予測誤差信号の符号量を小さくし、符号化効率を向上させる。即ち、互いに参照されないBフレームの予測残差をブロックごとに複数フレームまとめて、2次元直交変換と3次元直交変換および予測モードをレート−歪最適化によって選択し、時間方向の冗長性に応じて最適な直交変換を選択することで、符号化側と復号化側でミスマッチを生じさせることなく、符号化効率を向上させる。
以下、図面を参照して本発明の実施の形態について説明する。
図1に、本発明の一実施形態に係る動画像符号化のための画像符号化装置を示す。画像符号化装置には、画像信号100として例えばフレーム単位で動画像信号が符号化部10に入力され、いったん入力フレームバッファ118に格納される。符号化構造制御器120は、バッファに蓄えられた入力フレームの参照順序に応じた符号化順序を決定し、符号化構造情報119を符号化部10に出力する。符号化構造制御部120の具体的な処理の詳細については後述する。
図1に、本発明の一実施形態に係る動画像符号化のための画像符号化装置を示す。画像符号化装置には、画像信号100として例えばフレーム単位で動画像信号が符号化部10に入力され、いったん入力フレームバッファ118に格納される。符号化構造制御器120は、バッファに蓄えられた入力フレームの参照順序に応じた符号化順序を決定し、符号化構造情報119を符号化部10に出力する。符号化構造制御部120の具体的な処理の詳細については後述する。
入力フレームバッファ118は符号化構造情報119に基づいて、符号化順序に従ったフレーム、または複数のフレームの画像信号をある符号化単位ごとに差分信号作成器101に出力する。差分信号生成器101により入力画像信号100と予測画像信号102との差分が計算され、予測誤差信号103が生成される。生成された予測誤差信号103に対して、直交変換器104により2次元直交変換か3次元直交変換のいずれかが施される。2次元直交変換か3次元直交変換のいずれかは符号化構造情報119と予測誤差信号103に応じて選択される。どのように選択するかは後述する。具体的には、予測誤差信号103に施される直交変換として、例えば離散コサイン変換(DCT)が挙げられる。直交変換器104の内部には、時間方向の直交変換を行う時間方向直交変換器104aと空間方向の直交変換を行う空間方向直交変換器104bを含む。選択された変換が3次元変換の場合は、スイッチが104c側に接続され、即ち差分信号生成器101の出力が空間方向直交変換器104aに接続され、予測誤差信号103は時間方向直交変換器104aと空間方向直交変換器104bの両方によって時空間方向に3次元直交変換される。選択された変換が2次元変換の場合は、104d側に接続され、即ち、差分信号生成器101の出力が空間方向直交変換器104bに接続され、予測誤差信号103は空間方向直交変換器104bだけによって空間方向のみに2次元直交変換される。直交変換器104では直交変換係数情報105、例えばDCT係数情報が得られる。また、ここで施される直交変換が2次元直交変換か3次元直交変換かを示す情報、またはその変換サイズなどの直交変換情報121がエントロピー符号化器108に導かれる。直交変換係数情報105は量子化器106により量子化された後、二分岐される。二分岐された量子化直交変換係数情報107の一方は、エントロピー符号化器108に導かれる。
二分岐された量子化直交変換係数情報107の他方は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて予測誤差信号と同様の信号に変換される。この信号は局部復号画像信号生成器111で予測画像信号102と加算されることにより、局部復号画像信号112が生成される。
逆直交変換器110は内部に時間方向の逆直交変換を行う時間方向逆直交変換器110aと、空間方向の逆直交変換を行う空間方向逆直交変換器110bを含む。2次元直交変換か3次元直交変換かを示す直交変換情報に応じてスイッチが110c側又は110dに切り替わる。スイッチが110c側に接続されると、即ち空間方向逆直交変換器110bの出力が時間方向逆直交変換器110aに接続されると、逆量子化器109の逆量子化信号は空間方向逆直交変換器110b及び時間方向逆直交変換器110aの両方によって時空間方向の3次元逆直交変換される。110d側に接続されると、即ち空間方向逆直交変換器110bの出力が時間方向逆直交変換器110aをバイパスして局部復号画像信号生成部111に接続されると、逆量子化器109の逆量子化信号は空間方向逆直交変換器110bだけによる空間方向のみの逆直交変換、すなわち2次元直交変換される。局部復号画像信号112は、必要に応じてループフィルタ113によりフィルタ処理がなされた後、フレームメモリ114に格納される。
予測画像生成器115は、入力画像信号100及びフレームメモリ114に格納された局部復号画像信号112からある予測モード情報に基づく予測画像信号を生成する。この際、局部復号画像信号生成器111からの局部復号画像信号112はフレームメモリ114に一旦蓄えられる。フレーム内のブロック毎に入力画像信号100とフレームメモリ114に蓄えられた局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)をとり、動きベクトルを検出する。この動きベクトルで補償された局部画像信号を用いて予測画像信号を作成する。ここで生成された予測画像信号102は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像生成器115より出力される。エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116、直交変換情報121および符号化構造情報119がエントロピー符号化され、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
次に図4および図5を用いて、本発明の実施形態の特徴である符号化構造と符号化単位、および符号化順序について説明を行う。本実施形態では、互いに参照されない複数のBフレームをフレーム単位ではなく、2フレームあるいは4フレームなど、2のN乗の数のフレームをまとめて符号化を行うことで、時間方向の直交変換を利用できるようにする。例えば図4のようにIフレームとPフレームの間に2枚のBフレームを挟むような構造の場合、Bmと示されたフレーム間では互いに参照関係がないため、本実施形態を用いてまとめて符号化することが可能である。例えば、(Bm1、Bm2)および(Bm4、Bm5)の2フレームをそれぞれまとめて符号化することで、時間方向にも3次元直交変換、例えば時間方向の変換サイズが2の場合、4x4x2DCT(離散コサイン変換)や8x8x2DCTなどを用いることができる。この場合、符号化順序は、例えば、I0、P3、(Bm1、Bm2)、P6、(Bm4、Bm5)・・・となる。
また、(Bm1、Bm2、Bm4、Bm5)の4フレームも、互いに参照されることはないためまとめて符号化して例えば4x4x4DCTや8x8x4DCTなどの時間方向の変換サイズが4の3次元直交変換をさらに用いて符号化することも可能である。この場合、符号化順序は、例えば、I0、P3、P6、(Bm1,Bm2,Bm4,Bm5)・・・となる。
図5は、前述のように互いに参照されない複数のBフレームをまとめて符号化する際の符号化単位を図示している。複数のフレーム内の同一の空間位置にあるH.264ではマクロブロックと呼ばれる例えば16x16画素単位の正方形ブロックを時間方向に連結した例えば16x16xM(Mは時間方向のフレームの枚数)の直方体ブロック(以下、マクロキューブと呼ぶ)を1符号化単位として順次符号化を行うマルチスライス構造で符号化を行う。マルチスライスは、複数のマクロキューブからなり、複数のBフレームをまとめた場合、その全体をマルチスライスとしてもよいし、ある一定数のマクロキューブでスライス分割してもよい。
また、別の符号化構造として図6に示すような階層B構造と呼ばれる符号化構造がある。階層B構造では、IフレームとPフレームの間に含まれるBフレームを階層的に参照する構造である。本構造はH.264のようにBフレームを参照画像として利用できる場合に用いることができる。例えば図6のような参照構造の場合、同じ階層に含まれるBフレームは互いに参照されないため、まとめてマルチスライス単位で符号化することが可能である。例えば、(Bm1、Bm3)(Bm5,Bm7)をそれぞれ2枚のスライスを含むマルチスライスとして符号化する場合には、符号化順序は例えば、I0、P8、RB4、RB2、(Bm1,Bm3)、RB6、(Bm5、Bm7)・・・となる。また、例えば、(Bm1、Bm3、Bm5,Bm7)の4フレームをまとめて符号化する場合には、符号化順序は例えばI0、P8、RB4、RB2、RB6、(Bm1,Bm3、Bm5、Bm7)・・・となる。
さらに、上段の(RB2,RB6)もそれぞれ互いを参照しないという条件を満たすならば、これらフレームもまとめて符号化することも可能で、例えば(RB2,RB6)、(Bm1,Bm3)、(Bm5、Bm7)のそれぞれを2フレームずつまとめて、I0、P8、RB4、(RB2、RB6)、(Bm1,Bm3)、(Bm5、Bm7)・・・という符号化順序で符号化してもよいし、(RB2,RB6)の2枚と、(Bm1,Bm3、Bm5、Bm7)の4フレームをまとめて、I0、P8、RB4、(RB2、RB6)、(Bm1,Bm3、Bm5、Bm7)・・・
という符号化順序で符号化してもよい。
という符号化順序で符号化してもよい。
図7は、例えば(Bm1,Bm3、Bm5、Bm7)の4フレームをまとめて符号化する際の符号化単位を図示したものであり、この場合、マクロキューブは同じ空間位置に位置する4つのマクロブロックを時間方向に連結した例えば16x16x4の直方体ブロックとなる。
ここで、本発明の実施形態に適用可能な符号化構造をいくつか説明したが、本発明はこれらの符号化構造のみに適用されるわけではなく、互いに参照されない複数のBフレームをまとめてマルチスライスとして符号化するような符号化構造であれば、どのような符号化構造にも適用することが可能である。
以下、互いに参照されない複数のBフレームをまとめてマルチスライスとして符号化する際のスライスタイプをBmスライスとする。
図8を用いて符号化構造制御部120によって制御される符号化処理の流れ400を説明する。まずステップ401において、フレーム単位で入力画像信号が表示順序で順次入力され、入力フレームバッファ118に蓄えられる。一定枚数がバッファされた状態で、ステップ402に進み、入力フレームバッファ118内の各フレームの符号化順序と符号化スライスタイプ(IフレームかPフレームかBフレームか、Bmフレームか)の判断が行われる。この判断は、例えば図4や図6のような符号化構造があらかじめ符号化外部より入力されており、入力された順序、すなわち表示順序に照らしあわせて決定される。ここで、例として、図4の符号化構造で、(Bm1、Bm2)および(Bm4、Bm5)をマルチスライスとして符号化する場合について詳細に説明する。
ステップ403において、ステップ402で決定された符号化順序順に入力フレームを取り出し、スライスタイプを判定する。まず、I0が取り出されるが、スライスタイプはBmスライスではないためステップ404に進み、当該フレームは例えばH.264と同様の手順を踏んでスライス符号化される。I0の符号化が全て終了するとステップ405に進み、全てのフレームの符号化が終了したかどうかを判断する。ここでは、さらに符号化すべきフレームが存在しているため、ステップ401に戻る。
前述の手順でフレーム入力(ステップ401)及び符号化順序決定(ステップ402)がされた後、符号化順序がI0の次のP3が入力フレームバッファ118から取り出され、ステップ403にてスライスタイプの判定が行われる。当該フレームはBmスライスではないため、ステップ404に進み、I0と同様に例えばH.264と同様の手順を踏んでスライス符号化され、ステップ405に進む。さらに符号化すべきフレームが存在しているため、ステップ401に戻る。
前述の手順でフレーム入力(401)及び符号化順序決定(402)がされた後、符号化順序がP3の次のBm1が入力フレームバッファ118から取り出され、ステップ403にてスライスタイプの判定が行われる。当該フレームはBmスライスであるため、ステップ405に進み、当該フレームBm1と同じマルチスライスに属するBm2も同時に入力フレームバッファ118から出力され、マルチスライスとして符号化が行われる。マルチスライスの符号化処理の手順については後述する。当該マルチスライスの符号化が終了するとステップ405に進み、以下同様の手順で順次、P6がスライスとして、(Bm4,Bm5)がマルチスライスとして符号化されていく。このような手順で、入力された全てのフレームの符号化が終了すると符号化処理を終了する。
次に図9を用いて、マルチスライス符号化処理404の詳細な手順500を説明する。ここでは図4の符号化構造で、(Bm1、Bm2)をマルチスライスとして符号化する場合について詳細に説明する。
まずステップ501において、マルチスライス内のマクロキューブが順次入力される。ここで、入力順序は例えばマルチスライスの左上から右下へのラスタスキャン順で行われる。次に入力されたマクロキューブに対する予測画像が作成される。マクロキューブ内には、フレームBm1に属するマクロブロックMB1と、フレームBm2に属するマクロブロックMB2が含まれている。MB1、MB2の予測画像はそれぞれ、参照画像であるI0、P3と例えばブロックマッチングなどによって動き補償を行って予測ブロック形状(予測モード)や動きベクトルを探索して作成され、候補となる予測モードと動きベクトルはMB1、MB2のそれぞれについて、一時メモリで保持される。
ステップ503において、予測残差信号の作成を行う。ステップ502で作成された予測画像信号と、当該マクロキューブの入力画像信号との差分を差分信号生成器101で作成し、予測モードや動きベクトルなどと同様に、一時メモリで保持される。
処理はステップ504に進み、直交変換のタイプを決定する。ここでは例として、2次元直交変換として4x4DCTと8x8DCT、3次元直交変換として4x4x2DCTと8x8x2DCTの4つが直交変換として利用可能であるとする。どの直交変換を用いて符号化するかを決定する手段として、例えば一時メモリに保存された予測モードと動きベクトルの情報およびどの直交変換を用いるかを示す直交変換情報を含むモード情報OH、予測残差信号の絶対和(sum of absolute value)をSADとすると、次式により算出される符号化コストKの最小値を与える予測モードおよび直交変換情報を最適な予測モードと直交変換情報として選択する。
K = SAD+λ×OH (1)
ここで、λは定数であり、量子化パラメータの値に基づいて決められる。
ここで、λは定数であり、量子化パラメータの値に基づいて決められる。
コスト計算の他の例として、モード情報OHのみ、または予測残差信号の絶対和SADのみを用いてもよい。モード情報または予測残差信号をアダマール変換したり、近似したりした値を利用してもよい。量子化幅、量子化パラメータを利用してコスト関数を作成してもよい。
コスト計算の更に別の例として、仮符号化部を用意し、各予測モードで生成された予測残差信号103を実際に2次元変換または3次元変換し、出力された直交変換係数を量子化して可変長符号化した場合の符号量と、符号化データを局部復号して得られる復号画像信号と入力画像信号との間の二乗誤差を用いてもよい。この場合、次式により算出される符号化コストJの最小値を与える予測モードを最適モードとして選択する。
J = D+λ×R (2)
ここで、Dは入力画像信号と復号画像信号との間の二乗誤差を表す符号化歪みである。一方、Rは仮符号化によって見積もられた符号量を表している。
ここで、Dは入力画像信号と復号画像信号との間の二乗誤差を表す符号化歪みである。一方、Rは仮符号化によって見積もられた符号量を表している。
式(2)の符号化コストJを用いた場合、予測モード毎に仮符号化と局部復号(逆量子化や逆直交変換)が必要となるため、処理量または回路規模が増大する。しかし、Jは正確な符号量と符号化歪みを反映するため、より最適な予測モードを選択することを可能とする。この結果、より高い符号化効率を得ることができる。式(2)では、符号化コストJの計算に符号化歪D及び符号量Rを用いているが、D及びRのいずれか一方のみを用いて符号化コストを算出してもよい。また、D及びRを近似した値を用いてコスト関数を作成してもよい。
ステップ505では、ステップ504で決定された直交変換が2次元変換か3次元変換かどうかの判定を行う。ここで2次元変換が最適モードとして決定された場合にはステップ506に進み、マクロキューブ内のマクロブロックMB1とMB2のそれぞれの予測残差信号に対して、最適と判定された直交変換(4x4DCTあるいは8x8DCT)が施され、変換係数に対して量子化が行われる。ここで行われる直交変換や量子化は、例えばH.264と同様の変換量子化を用いる。一方、ステップ505で、2次元変換でない、即ち3次元変換が最適モードとして決定された場合にはステップ507へ進む。
ステップ507ではマクロキューブの予測残差信号に対し3次元直交変換を施した後、量子化を行う。3次元直交変換としては、例えば4x4x2DCTや8x8x2DCTを用いる。この3次元直交変換では、例えば16x16x2のマクロキューブ内に含まれるマクロブロックMB1,MB2を16分割または4分割して4x4や8x8の正方形のサブブロックが作られる。空間位置で同じ場所に位置するサブブロック内の画素値に対し、時間方向直交変換器104cによって時間方向に2x2DCTを施したのち、空間方向の2つの4x4または8x8サブブロック内の変換係数に対して例えばH.264と同様の4x4DCTや8x8DCTが空間方向直交変換器104bによって行われる。このようにして得られたマクロキューブ内の3次元直交変換係数に対して、例えばH.264と同様の量子化処理を施す。
上記の説明では、2枚のフレームをマルチスライスとして一括して符号化する例について説明したため、3次元直交変換として、4x4x2DCTや8x8x2DCTを用いた。しかしながら、例えば図7に示すように4枚のフレームをマルチスライスとして一括して符号化する場合には、マクロキューブとして例えば16x16x4という直方体ブロックとして入力されるため、3次元直交変換として4x4x2DCTや8x8x2DCTをマクロキューブ内のマクロブロックを2つずつに分割して施してもよいし、マクロブロック4つに対して4x4x4DCTや8x8x4DCTを用いてもよい。また例えば16x16x2DCTのような大きなサイズの直交変換を用いてもよいし、4x8x2DCTのように空間方向が正方ブロックでないサイズの直交変換を用いてもよい。さらには、3次元直交変換であれば、例えばKL変換など離散コサイン変換(DCT)以外の変換を用いてもよい。
また、本実施の形態では、2次元変換と3次元変換を適応的に選択できるようになっているが、3次元変換のみを選択できるようにすることも可能であり、この場合はステップ506は不要となる。
以上のような処理が施された後、ステップ508に進み、マクロキューブ内の量子化直交変換係数がエントロピー符号化器108において可変長符号化され、直交変換情報、予測モード情報、動きベクトル情報とともに多重化される。エントロピー符号化の詳細については、後述する。
最後にステップ509において、当該マルチスライス内の全てのマクロキューブが符号化されたかどうかが判定され、当該マクロキューブがマルチスライス内の最後のマクロキューブではない場合にはステップ501に戻り、次のマクロキューブの符号化が前述の処理手順で行われる。当該マクロキューブがマルチスライス内の最後のマクロキューブの場合には、マルチスライス符号化の処理が終了する。
次に図10および図11を用いて前述の符号化構造情報119や、マクロキューブ内の予測画像信号に施される直交変換としてどのような変換を用いたかを示す直交変換情報121をエントロピー符号化器108で符号化データに多重化して送信する方法について説明する。
図10に、本実施形態で用いられるシンタクスの構造の例を示す。このシンタクス構造例において、アクセスユニット(301)は、復号化処理の際に読み込まれる単位であり、この単位ごとに復号化処理が行われる。アクセスユニット(301)の内部には、処理の内容や符号化構造に応じて、ハイレベルシンタクス(302)、マルチスライスレイヤシンタクス(305)、スライスレベルシンタクス(312)などが詰め込まれている。ハイレベルシンタクス(302)には、スライス以上の上位レイヤのシンタクス情報が詰め込まれている。マルチスライスレベルシンタクス(305)は、マルチスライス毎に必要な情報が明記されている。一方、スライスレベルシンタクス(312)は、スライス毎に必要な情報が明記されている。
マルチスライスレベルシンタクス(305)は、含まれている複数のスライスそれぞれに対するスライスヘッダシンタクス(306a〜306n)とマルチスライスデータシンタクス(307)などから構成されている。マルチスライスデータシンタクス(307)は、マルチスライス内に含まれるマクロキューブレイヤの復号に必要な情報が明記されたマクロキューブレイヤシンタクス(308)が含まれる。マクロキューブレイヤシンタクスは、マクロキューブヘッダシンタクス(309)およびマクロキューブデータシンタクス(310)から構成されており、マクロキューブデータシンタクスは、内部に含まれる複数のマクロブロックレイヤの復号にそれぞれ必要な情報が明記された複数のマクロブロックレイヤシンタクス(311)から構成される。
一方で、スライスレベルシンタクス(312)は、スライスヘッダシンタクス(313)とスライスデータシンタクス(314)から構成される。スライスデータシンタクスは、スライス内に含まれるマクロブロックレイヤの復号に必要な情報が明記されたマクロブロックレイヤシンタクス(315)が含まれており、マクロブロック毎に必要とされる量子化パラメータの変更値やモード情報などが明記されている。
上述したシンタクスは復号化時に必要不可欠な構成要素であり、これらのシンタクス情報が欠けると復号化時に正しくデータを復元できなくなる。
マルチスライスレイヤ内部のシンタクス構造の一例を図11(A)に示す.log2_slice_cnt_minus_1は、マルチスライス内に何枚のスライスが含まれているか,即ち何枚のフレームを一括符号化するかを指定する。この値から、マルチスライス内に含まれるスライスの枚数slice_numは例えば以下のように計算される。
マルチスライスレイヤ内部のシンタクス構造の一例を図11(A)に示す.log2_slice_cnt_minus_1は、マルチスライス内に何枚のスライスが含まれているか,即ち何枚のフレームを一括符号化するかを指定する。この値から、マルチスライス内に含まれるスライスの枚数slice_numは例えば以下のように計算される。
続いて、マルチスライス内に含まれる各スライスのヘッダ情報を明記したスライスヘッダシンタクスslice_header()がslice_num個送信される.slice_header()は例えばH.264と同様のシンタクスを用いる。その後,マルチスライス内の実際の符号化データの情報を明記したマルチスライスデータシンタクスmulti_slice_data()が送信される。
図11(B)はマルチスライスデータシンタクスmulti_slice_data()の一例を示している。マルチスライスデータシンタクスの内部では、マルチスライス内のマクロキューブの数だけのmcube_skip_flagか、またはマクロキューブレイヤシンタクスmacrocube_layer()が送信される。mcube_skip_flagはマクロキューブの復号化の際に必要な情報を一切明記せずともそれまでの符号化および復号化の情報から復号可能かどうかを示すフラグであり、TRUEの場合はマクロキューブレイヤシンタクス以下の情報を送信しなくてもよい。FALSEの場合には、マルチスライス内に含まれるマクロキューブの復号に必要な情報を明記したマクロキューブレイヤシンタクスmacrocube_layer()がend_of_slice_flagが1となるまで、順次送信される。
end_of_slice_flagは、マルチスライス内に含まれるマクロキューブのシンタクスが全て送信されたかどうかを示すフラグを示しており、0の場合はまだ送信されていないマクロキューブシンタクスが存在することを示す。1の場合は、マルチスライス内のマクロキューブシンタクスが全て送信されたことを示す。
図11(C)にマクロキューブレイヤmacrocube_layer()のシンタクス構造の一例を示す。マクロキューブレイヤは内部に含まれる予測残差が2D/3Dのどちらの変換を用いて変換されているかを示す1ビットのフラグthree_d_transform_flagを含んでいる。このフラグは3次元変換のみを利用可能とする場合には必ずしも必要がない。また,マルチスライスレイヤに4枚のスライスを含む場合には,3次元直交変換の時間方向の変換サイズを示すlog2_temporal_transform_size_minus_1を送信する.この値を用いて、3次元変換の時間方向の変換サイズTsizeは例えば以下のように計算される。
log2_temporal_transform_size_minus_1は、マルチスライスレイヤに含まれるスライス数が2枚か4枚の場合には1ビットのフラグとして送信できる。すなわち、時間方向の変換サイズが2の場合には0、4の場合には1を送信すればよい。また、マルチスライスレイヤに含まれるスライス数が2の場合には、このフラグは時間方向の変換サイズが2の変換のみを3Dの変換として使用することになるため、必要のないフラグとなる.
さらに,3D変換が選択されている場合には,空間方向の変換サイズとして4x4か8x8のどちらが用いられているかを示す1ビットのフラグtransform_size_8x8_flagを送信する。2D変換が選択されている場合は,H.264と同様にマクロブロックレイヤでこれらの情報を送信し、ここでは必ずしも送信しなくてもよい。
さらに,3D変換が選択されている場合には,空間方向の変換サイズとして4x4か8x8のどちらが用いられているかを示す1ビットのフラグtransform_size_8x8_flagを送信する。2D変換が選択されている場合は,H.264と同様にマクロブロックレイヤでこれらの情報を送信し、ここでは必ずしも送信しなくてもよい。
マクロキューブレイヤ内部では,マルチスライス内のスライス数slice_cnt個のmb_skip_flagまたはマクロブロックレイヤのシンタクスmacroblock_layer()が送信される。mb_skip_flagは、マクロブロックの復号化の際に必要な情報を一切明記せずともそれまでの符号化および復号化の情報から復号可能かどうかを示すフラグであり、TRUEの場合はマクロキューブレイヤシンタクス以下の情報を送信しなくてもよい。当該フラグがFALSEの場合には、マクロブロックレイヤシンタクスmacroblock_layer()が送信される。マクロブロックレイヤのシンタクスは,例えばH.264と同様のシンタクスを用いる。
H.264のマクロブロックレイヤのシンタクスでは、モード情報や動きベクトルなど復号化に必要な情報の一部を当該マクロブロックの左と上のマクロブロックから予測して符号化を行うが、本実施の形態においても、当該マクロブロックを含む同一スライスの左と上のマクロブロックからそれぞれH.264と同様の予測を行ってもよいし、当該マクロブロックを含むマクロキューブ内の別のスライスに属するマクロブロックや、そのマクロブロックと同一スライス内の左や上のブロックから予測を行ってもよい。また、マクロブロックレイヤのシンタクスは,例えばH.264と同様のシンタクスを用いた際に、マクロキューブレイヤシンタクスmacrocube_layer()で既に送信されており、重複するフラグ(例えば、transform_size_8x8_flag)は省略してもよい。
次に、図12および図13を用いて3次元直交変換を行った際の量子化直交変換係数情報107のエントロピー符号化方法の具体例を説明する。
3次元直交変換を行い、量子化が施された量子化直交変換係数情報107は、例えば図12に示すように3次元直交変換係数、即ちマクロキューブ内の各マクロブロック0,1,2,3の量子化直交変換係数を時間方向にそれぞれ例えば4つに分割し、それぞれを各マクロブロックレイヤのサブブロックの変換係数として、例えばH.264と同様のスキャン手順(ジグザグスキャン)やエントロピー符号化の手順を用いて符号化を行う。
3次元直交変換を行い、量子化が施された量子化直交変換係数情報107は、例えば図12に示すように3次元直交変換係数、即ちマクロキューブ内の各マクロブロック0,1,2,3の量子化直交変換係数を時間方向にそれぞれ例えば4つに分割し、それぞれを各マクロブロックレイヤのサブブロックの変換係数として、例えばH.264と同様のスキャン手順(ジグザグスキャン)やエントロピー符号化の手順を用いて符号化を行う。
また、図12とは別の一例として、図13に示すように、3次元直交変換を施す単位である、マクロキューブ内のサブマクロブロックを時間方向に連結したサブマクロキューブ単位内の量子化直交変換係数情報を、あらかじめ決められたスキャン順序によって一次元の係数列に並べ替えて、その係数列を例えば時間的に一番初めに位置するマクロブロックレイヤの予測残差としてH.264と同等の手順でエントロピー符号化してもよい。例えば8x8x4変換を行った場合には、サブマクロキューブ内に256個の量子化直交変換係数が存在する。これを例えば各係数位置で非零となる係数が発生する確率の高い順に並べ替えて256個の一次元係数列としてエントロピー符号化を行う。この場合、図13に示すように、時間方向のサイズが4のマクロキューブの場合には、残りの3つのマクロブロックレイヤの予測残差を送信するためのシンタクスは必要なくなる。
また、図13のように3次元直交変換を施す単位であるサブマクロキューブ単位内の変換係数を1次元の係数列に並べ替えたのち、その係数列をマクロキューブ内のマクロブロック数(たとえば図の場合は4)で等分割して、分割された系列をそれぞれ図12で示すように各マクロブロックレイヤのサブブロックの変換係数として、例えばH.264と同様の手順でエントロピー符号化を行ってもよい。
図2に本実施の形態における画像復号化装置を示す。まず、エントロピー復号化器200において、前記符号化装置によって符号化された符号化データ117がエントロピー符号化の逆の手順をふんで復号化され、量子化直交変換係数情報107a、動きベクトル/予測モード情報116、符号化構造制御情報119、および直交変換情報121が得られる。量子化直交変換係数情報107aは直交変換情報121に基づいて、逆量子化器209及び逆直交変換器210により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて残差信号201とされる。ここで逆直交変換器210は内部に時間方向の逆直交変換を行う時間方向逆直交変換器210aと、空間方向の逆直交変換を行う空間方向逆直交変換器210bを含む。直交変換情報121に基づいて、スイッチが210c側に接続されると、逆量子化直交変換係数情報107bは空間方向逆直交変換器210b及び時間方向逆直交変換器210aの両方によって時空間方向の3次元逆直交変換される。スイッチが210d側に接続されると、逆量子化直交変換係数情報107bは空間方向逆直交変換器210bだけで空間方向のみの逆直交変換、すなわち2次元直交変換される。逆直交変換器210が3次元逆直交変換器として機能する場合、所定の量の直交変換係数を有する1次元の断片化係数列を求め、複数の断片化係数列を連結して1次元の係数列を求め、係数列から3次元直交変換係数を生成し、3次元直交変換係数に対して3次元逆直交変換を行う。逆直交変換器210は複数の復号化対象領域の各々の前記直交変換係数を時間方向に連結して3次元直交変換係数を生成し、前記3次元直交変換係数に対して3次元逆直交変換を行うことができる。また、逆直交変換器210は所定の量の前記直交変換係数から3次元直交変換係数を生成し、前記3次元直交変換係数に対して3次元逆直交変換を行うことができる。
一方、動きベクトル/予測モード情報116は予測画像生成器に入力され、フレームメモリ214に格納された復号画像信号203から動きベクトル/予測モード情報116に基づく予測画像信号102が生成される。残差信号201と予測画像信号102は局部復号画像信号生成器202によって加算される。加算された信号はループフィルタ213で必要に応じてフィルタ処理がなされ、復号画像信号203として出力され、フレームメモリ214に格納される。符号化構造制御器220は、符号化構造情報119に基づいて、復号化部20の処理を制御するとともに、フレームメモリ214内に格納された復号画像信号203を表示順序に並び替えて出力する。
次に、図14および図15を用いて本実施の形態における画像復号化装置の具体的な処理の流れを説明する。
次に、図14および図15を用いて本実施の形態における画像復号化装置の具体的な処理の流れを説明する。
図14は入力された符号化データの復号化処理のおおまかな手順を示す図である。ここで符号化データは、図10および図11に示したシンタクス構造を用いて符号化されているとする。まずステップ601で処理単位としてアクセスユニットが入力される。次にステップ602において、アクセスユニット内のシンタクスがハイレベルシンタクスであるかどうかの判定が行われ、ハイレベルシンタクスの場合にはステップ603にて例えばH.264と同様の復号化処理によってハイレベルシンタクスの復号化が行われる。ハイレベルシンタクスでない場合にはステップ604に進む。ステップ604では、アクセスユニット内のシンタクスがBmスライスであるかどうかの判定が行われる。Bmスライスでない場合には、ステップ605に進み、例えばH.264と同様の処理手順でスライスの復号化が行われる。Bmスライスであった場合にはステップ606に進み、マルチスライスの復号化が行われる。マルチスライスの復号化の具体的な処理手順については後述する。
以上の復号化処理が終了すると、ステップ607にて符号化データ内のアクセスユニットの全ての復号化が終了したかどうかを判定し、全ての復号化が終了していない場合には、ステップ601に戻って次のアクセスユニットの復号化処理を行う。全てのアクセスユニットの復号化が終了すると、符号化データの復号化処理は全て終了する。
図15は、図14におけるマルチスライスの復号化処理(ステップ606)のさらに具体的な処理手順を示した図である。まずステップ701において、マルチスライス内に含まれるフレーム数を管理するカウンタslice_cntを0に初期化する。次に、ステップ702でマルチスライス内のslice_cnt番目のスライスに対するスライスヘッダの復号化を行う。この復号化は例えばH.264と同様の手順を用いて行われる。次にステップ703でカウンタをインクリメントし、ステップ704でslice_cntすなわち復号化済みのスライスヘッダがマルチスライス内に含まれるスライス数slice_numより小さいかどうかを判定する。ステップ702から704の処理は、復号化済みのスライスヘッダ数がslice_num個になるまで繰り返される。
ステップ705から717は、マルチスライスデータシンタクスの復号化手順である。まず、ステップ705において、mcube_skip_flagの値の復号化が行われ、その値の判定が行われる。mcube_skip_flagがTRUEの場合には、ステップ712に進む。mcube_skip_flagがFALSEの場合には、ステップ706に進み、マクロキューブヘッダの復号化が行われる。
図11(C)のシンタクスを例に説明すると、まずマクロキューブ内の変換が2次元変換か3次元変換かを示すthree_d_transform_flagの復号化が行われる。次に、three_d_transform_flagの値が3次元変換を示す値であり、かつマクロキューブ内のマクロブロック数、すなわちマルチスライス内に含まれるスライス数slice_numが2より大きな値であった場合には、3次元変換の時間方向の変換サイズを示すlog2_temporal_transform_size_minus_1が復号化される。さらに、three_d_transform_flagの値が3次元変換を示す値である場合には、空間方向の変換サイズが4x4か8x8かを示すtransform_size_8x8_flagが復号化される。
ステップ707〜711は、マクロキューブ内に含まれるマクロブロックレイヤの復号化の処理手順を示している。まず、ステップ707でマクロキューブ内に含まれるマクロブロックの数を管理するカウンタmb_cntを0に初期化する。次に、ステップ708において、mb_skip_flagの復号化が行われ、その値の判定が行われる。mb_skip_flagがTRUEの場合には、ステップ710に進む。mb_skip_flagがFALSEの場合には、マクロキューブ内のmb_cnt番目のマクロブロックレイヤのシンタクスの復号化が行われる。この復号化は例えばH.264と同様の手順を用いて行われる。
ステップ710において、カウンタmb_cntのインクリメントが行われ、マクロキューブ内の全てのマクロブロックの復号化が終了したかどうかをmb_cntがslice_numより小さいかどうかで判断し、終了していない場合にはステップ708に戻って、次のマクロブロックレイヤの復号化処理が行われる。ステップ708−711の処理は、マクロキューブ内の全てのマクロブロックの復号化が終了するまで繰り返される。マクロキューブ内の全てのマクロブロックの復号化が終了すると、ステップ712に進む。ここで、マクロキューブ内の残差信号201の量子化直交変換係数情報107aは、前述の量子化直交変換係数のエントロピー符号化およびスキャン手順と逆の手順を経て再構成される。
ステップ712では、マクロキューブ内の各マクロブロックに対する予測画像信号102を作成する。予測画像信号102の作成は、フレームメモリ214に格納されているすでに復号化済みの参照画像信号から、各マクロブロックの復号化済みの予測モード/動きベクトル情報116に基づいて作成される。
処理はステップ713に進み、マクロキューブ内の残差信号201が2次元直交変換されているか、3次元直交変換されているかをthree_d_transform_flagによって判断する。three_d_transform_flagが2次元直交変換を示している場合にはステップ714に進む。3次元直交変換を示している場合にはステップ715に進む。
ステップ714では、2次元直交変換の場合の逆量子化と逆直交変換の処理が行われる。マクロキューブ内の各マクロブロックの量子化直交変換係数107aに対し、逆量子化器209による逆量子化と逆直交変換器210による逆直交変換が行われる。この際、逆直交変換器210内部のスイッチは210d側に接続され、空間方向逆直交変換器210bによる空間方向逆直交変換のみが施される。この処理は、例えばH.264と同等の手順で行われる。
ステップ715では、3次元直交変換の場合の逆量子化と逆直交変換の処理が行われる。例えば、まずH.264と同等の手順で量子化直交変換係数107aに対して逆量子化器209による逆量子化が行われる。次に、逆直交変換器210による3次元逆直交変換が行われる。この際、逆直交変換器210内部のスイッチは210d側に接続され、逆量子化直交変換係数107bはまず空間方向逆直交変換器210bにより空間方向の逆直交変換される。例えば、空間方向の変換サイズが4x4の場合には4x4IDCT(逆離散コサイン変換)が、8x8の場合には8x8IDCTがマクロキューブ内の各マクロブロックの各サブブロックに対して施される。さらに、出力された変換係数に対して、時間方向逆直交変換器210aによって時間方向の逆直交変換が施される。たとえば時間方向の変換サイズが2の場合には各サブブロックの空間上で同一位置に位置する2つの変換係数列に対して、2x2IDCTが施される。時間方向の変換サイズが4であった場合にも、同様に4x4IDCTが施される。
以上、ステップ713、714、715の処理によって、マクロキューブ内の残差信号201が得られ、マクロキューブ内の各マクロブロックの残差信号201を、予測画像信号102に足し合わせることによって、復号画像信号203が生成される(ステップ716)。なお、ステップ713、714、715の処理は、mcube_skip_flagがTRUEの場合は必ずしも行う必要はなく、マクロキューブ内の各画素の残差信号201の値を0とすればよい。また、ステップ714の処理についても、mb_skip_flagがTRUEの場合には、必ずしも行う必要はなく、当該マクロブロックの各画素の残差信号201の値を0とすればよい。また、ステップ715において、マクロキューブ内のマクロブロックのいずれかがmb_skip_flag==TRUEによってスキップされている場合は当該マクロブロックの量子化直交変換係数を0として逆量子化および逆3次元直交変換の処理を行うものとする。
最後に、ステップ717において、end_of_slice_flagがTRUEであるかどうかを判定する。このフラグがFALSEの場合には、ステップ705に戻り、ステップ705以下の処理が全てのマクロキューブの復号を終えるまで繰り返される。全てのマクロキューブの復号が終了すると、マルチスライスの復号化処理が終了する。
以上の構成によれば、互いに参照されないBフレームの予測残差をブロックごとに複数枚まとめて、2次元直交変換と3次元直交変換のいずれかを選択し、時間方向の冗長性に応じて最適な直交変換を選択することができるため、符号化効率を向上させることができる。また、互いに参照されない表示時刻の異なるBフレームを一括して符号化するため、それぞれのBフレームの予測画像信号は既に符号化された参照画像から独立に作成することができるため、符号化側と復号化側でミスマッチを生じさせることなく符号化/復号化を行うことが可能である。
10…画像符号化器、100…入力画像信号、101…差分信号生成器、102…予測画像信号、103…予測誤差信号、104…直交変換器、104a…時間方向直交変換器、104b…空間方向直交変換器、105…直交変換係数情報、106…量子化器、107…量子化直交変換係数情報、108…エントロピー符号化器、109…逆量子化器、110…逆直交変換器、110a…時間方向逆直交変換器、110b…空間方向逆直交変換器、111…局部復号画像信号生成器、112…局部復号画像信号、113…ループフィルタ、114…フレームメモリ、115…予測画像生成器、116…予測モード/動きベクトル情報、117…符号化データ、118…入力フレームバッファ、119…符号化構造制御情報、120…符号化構造制御器、20…画像復号化器、200…エントロピー復号化器、201…残差信号、202…局部復号画像信号生成器、203…復号画像信号、107a…量子化直交変換係数情報、107b…逆量子化直交変換係数情報、209…逆量子化器、210…逆直交変換器、210a…時間方向逆直交変換器、210b…空間方向逆直交変換器、213…ループフィルタ、214…フレームメモリ、215…予測画像生成器、220…符号化構造制御器
Claims (12)
- 複数の入力画像の中の互いに参照されない複数の符号化対象画像間で共通な位置にある複数の符号化対象領域の複数の予測残差画像を、前記複数の入力画像の中で既に符号化がなされた参照画像の局部復号画像を参照して生成する予測残差画像生成器と、
前記複数の予測残差画像の各々に対して空間方向の2次元直交変換を行う2次元モード、または、前記複数の予測残差画像からなる3次元時空間予測残差画像に対して時空間方向の3次元直交変換を行う3次元モードを、直交変換モードとして選択するモード選択部と、
前記直交変換モードとして2次元モードが選択された場合に前記複数の予測残差画像の各々に対して空間方向の2次元直交変換を行うことにより2次元直交変換係数を生成する2次元直交変換部と、
前記直交変換モードとして前記3次元モードが選択された場合に前記複数の予測残差画像からなる3次元時空間予測残差画像に対して時空間方向に3次元直交変換を行うことにより3次元直交変換係数を生成する3次元直交変換部と、
前記2次元又は前記3次元直交変換係数を量子化して量子化直交変換係数を生成する量子化器と、
量子化直交変換係数を可変長符号化して符号化変換係数を生成する可変長符号化器と、
前記モード選択部で選択された直交変換モードを示す直交変換モード情報と前記符号化変換係数とを多重化した符号化データを出力する多重化器と、
を備えたことを特徴とする画像符号化装置。 - 前記符号化器は、前記直交変換モードとして3次元モードが選択された場合には、前記3次元直交変換係数を1次元走査して得た係数列を複数の分割係数列に分割し、各分割係数列を可変長符号化する
ことを特徴とする請求項1記載の画像符号化装置。 - 前記符号化器は、前記直交変換モードとして3次元モードが選択された場合には、前記3次元直交変換係数を複数の2次元係数ブロックに分割し、各係数ブロックを1次元走査して得られる係数列を可変長符号化することを特徴とする請求項1記載の画像符号化装置。
- 前記符号化器は、前記直交変換モードとして3次元モードが選択された場合には、前記3次元直交変換係数を1次元走査して得た係数列を可変長符号化することを特徴とする請求項1記載の画像符号化装置。
- 複数の入力画像の中の互いに参照されない複数の符号化対象画像間で共通な位置にある複数の符号化対象領域の各々の予測残差画像を、前記複数の入力画像の中で既に符号化がなされた参照画像の局部復号画像を参照して生成する予測残差画像生成器と、
前記複数の予測残差画像からなる3次元時空間予測残差画像に、時空間方向の3次元直交変換を行って直交変換係数を生成する直交変換器と、
前記直交変換係数を量子化して量子化直交変換係数を生成する量子化器と、
前記量子化直交変換係数を可変長符号化して前記符号化対象領域の符号化データを出力する符号化器と、
を備えたことを特徴とする画像符号化装置。 - 複数の入力画像の中の互いに参照されない複数の符号化対象画像間で共通な位置にある複数の符号化対象領域の複数の予測残差画像を、前記複数の入力画像の中で既に符号化がなされた参照画像の局部復号画像を参照して生成する予測残差画像生成ステップと、
前記複数の予測残差画像の各々に対して空間方向の2次元直交変換を行う2次元モード、または、前記複数の予測残差画像からなる3次元時空間予測残差画像に対して時空間方向の3次元直交変換を行う3次元モードを、直交変換モードとして選択するモード選択部ステップと、
前記直交変換モードとして2次元モードが選択された場合には前記複数の予測残差画像に対してそれぞれ別々に空間方向に2次元直交変換を行うことにより2次元の直交変換係数を生成する2次元直交変換ステップと、
前記直交変換モードとして前記3次元モードが選択された場合には前記複数の予測残差画像からなる3次元時空間予測残差画像に対して時空間方向に3次元直交変換を行うことにより3次元の直交変換係数を生成する3次元直交変換ステップと、
前記2次元または3次元の直交変換係数を量子化し量子化直交変換係数を生成する量子化ステップと
量子化直交変換係数を可変長符号化して符号化変換係数を生成する可変長符号化ステップと、
前記モード選択部で選択された直交変換モードを示す直交変換モード情報と前記符号化変換係数とを多重化して符号化データを出力する多重化ステップと、
を含むことを特徴とする画像符号化方法。 - 入力された符号化データから、符号化変換係数と直交変換モード情報とを抽出する逆多重化部と、
前記符号化変換係数を可変長復号して量子化直交変換係数を生成する可変長復号部と、
前記量子化直交変換係数を逆量子化して復号化対象画像の復号化対象領域の直交変換係数を生成する逆量子化器と、
前記直交変換モード情報が2次元モードを示す値の場合に前記直交変換係数を空間方向に2次元逆直交変換して復号化対象画像の復号化対象領域の予測残差画像を生成する2次元逆直交変換器と、
前記直交変換モード情報が3次元モードを示す値の場合に複数の復号化対象画像間で共通な位置にある複数の復号化対象領域の前記直交変換係数を時空間方向に3次元逆直交変換して複数の復号化対象画像間で共通な位置にある複数の復号化対象領域の複数の予測残差画像からなる3次元時空間予測残差画像を生成する3次元逆直交変換器と、
参照画像を参照して、前記2次元逆直交変換器および前記3次元逆直交変換器で生成された予測残差画像から、復号化対象画像の復号化対象領域の復号化画像を生成する復号画像生成部と、
を備えたことを特徴とする画像復号化装置 - 前記3次元逆直交変換器は、所定の量の前記直交変換係数を有する1次元の断片化係数列を求め、複数の前記断片化係数列を連結して1次元の係数列を求め、前記係数列から3次元直交変換係数を生成し、前記3次元直交変換係数に対して3次元逆直交変換を行う、ことを特徴とする請求項7に記載の画像復号化装置。
- 前記3次元逆直交変換器は、複数の復号化対象領域の各々の前記直交変換係数を時間方向に連結して3次元直交変換係数を生成し、前記3次元直交変換係数に対して3次元逆直交変換を行う、ことを特徴とする請求項7に記載の画像復号化装置。
- 前記3次元逆直交変換器は、所定の量の前記直交変換係数から3次元直交変換係数を生成し、前記3次元直交変換係数に対して3次元逆直交変換を行う、ことを特徴とする請求項7に記載の画像復号化装置。
- 入力された符号化データを可変長復号して量子化直交変換係数を生成する可変長復号化器と、
前記量子化直交変換係数を逆量子化して直交変換係数を生成する逆量子化器と、
前記直交変換係数に時空間方向の3次元逆直交変換を行って、互いに参照されない複数の復号化対象画像間で共通な位置にある複数の復号化対象領域の複数の予測残差画像からなる3次元時空間予測残差画像を生成する逆直交変換器と、
前記複数の予測残差画像と既に生成された復号化画像とを用いて、前記複数の復号化対象領域の画像を生成する復号化画像生成器と、
を備えたことを特徴とする画像復号化装置。 - 入力された符号化データから、符号化変換係数と直交変換モード情報とを抽出する逆多重化ステップと、
前記符号化変換係数を可変長復号して量子化直交変換係数を生成する可変長復号ステップと、
前記量子化直交変換係数を逆量子化して復号化対象画像の復号化対象領域の直交変換係数を生成する逆量子化ステップと、
前記直交変換モード情報が2次元モードを示す値の場合に前記直交変換係数を空間方向に2次元逆直交変換して復号化対象画像の復号化対象領域の予測残差画像を生成する2次元逆直交変換ステップと、
前記直交変換モード情報が3次元モードを示す値の場合に複数の復号化対象画像間で共通な位置にある複数の復号化対象領域の前記直交変換係数を時空間方向に3次元逆直交変換して複数の復号化対象画像間で共通な位置にある複数の復号化対象領域の複数の予測残差画像からなる3次元時空間予測残差画像を生成する3次元逆直交変換ステップと、
参照画像を参照して、前記2次元逆直交変換ステップおよび前記3次元逆直交変換ステップで生成された予測残差画像から、復号化対象画像の復号化対象領域の復号化画像を生成する復号画像生成ステップと、
を有することを特徴とする画像復号化方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007085712A JP2010135863A (ja) | 2007-03-28 | 2007-03-28 | 画像符号化方法及び装置 |
PCT/JP2008/054079 WO2008126530A1 (ja) | 2007-03-28 | 2008-03-06 | 画像符号化方法及び装置 |
TW97109113A TW200913726A (en) | 2007-03-28 | 2008-03-14 | Image encoding method and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007085712A JP2010135863A (ja) | 2007-03-28 | 2007-03-28 | 画像符号化方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010135863A true JP2010135863A (ja) | 2010-06-17 |
Family
ID=39863688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007085712A Pending JP2010135863A (ja) | 2007-03-28 | 2007-03-28 | 画像符号化方法及び装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2010135863A (ja) |
TW (1) | TW200913726A (ja) |
WO (1) | WO2008126530A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2013153778A1 (ja) * | 2012-04-09 | 2015-12-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 画像符号化方法および画像復号化方法 |
US11659190B2 (en) | 2015-11-12 | 2023-05-23 | Samsung Electronics Co., Ltd. | Method of operating semiconductor device and semiconductor system |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2907203T3 (es) | 2010-04-13 | 2022-04-22 | Ge Video Compression Llc | Codificación de vídeo que usa subdivisiones multiárbol de imágenes |
CN102939750B (zh) | 2010-04-13 | 2016-07-06 | Ge视频压缩有限责任公司 | 跨平面预测 |
CN106454370B (zh) | 2010-04-13 | 2019-11-01 | Ge视频压缩有限责任公司 | 解码器、重建数组的方法、编码器、编码方法及数据流 |
JP5718453B2 (ja) | 2010-04-13 | 2015-05-13 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 復号化方法 |
KR20220062526A (ko) * | 2019-09-25 | 2022-05-17 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치, 부호화 방법, 및 복호 방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2526675B2 (ja) * | 1989-08-28 | 1996-08-21 | 日本電気株式会社 | 動画像の直交変換符号化方式およびその復号化の方式 |
JP3071205B2 (ja) * | 1990-01-23 | 2000-07-31 | オリンパス光学工業株式会社 | 画像データの符号化装置および符号化方法 |
US4999705A (en) * | 1990-05-03 | 1991-03-12 | At&T Bell Laboratories | Three dimensional motion compensated video coding |
JP2743037B2 (ja) * | 1990-06-25 | 1998-04-22 | 三菱電機株式会社 | 符号化方法及び符号化装置 |
JPH05191797A (ja) * | 1992-01-14 | 1993-07-30 | Matsushita Electric Ind Co Ltd | 高能率符号化装置 |
JP3029354B2 (ja) * | 1992-12-22 | 2000-04-04 | 三菱電機株式会社 | ディジタルビデオ信号符号化装置および復号化装置 |
JPH10164594A (ja) * | 1996-11-29 | 1998-06-19 | Hitachi Ltd | 動画像の圧縮符号化方法およびその装置 |
-
2007
- 2007-03-28 JP JP2007085712A patent/JP2010135863A/ja active Pending
-
2008
- 2008-03-06 WO PCT/JP2008/054079 patent/WO2008126530A1/ja active Application Filing
- 2008-03-14 TW TW97109113A patent/TW200913726A/zh unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2013153778A1 (ja) * | 2012-04-09 | 2015-12-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 画像符号化方法および画像復号化方法 |
US10075708B2 (en) | 2012-04-09 | 2018-09-11 | Sun Patent Trust | Image encoding method and image decoding method |
US11659190B2 (en) | 2015-11-12 | 2023-05-23 | Samsung Electronics Co., Ltd. | Method of operating semiconductor device and semiconductor system |
Also Published As
Publication number | Publication date |
---|---|
TW200913726A (en) | 2009-03-16 |
WO2008126530A1 (ja) | 2008-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106488232B (zh) | 编码和解码图像的方法、编码和解码设备 | |
EP2153655B1 (en) | Method and apparatus for encoding and decoding image using modification of residual block | |
WO2011083573A1 (ja) | 動画像符号化装置及び動画像復号化装置 | |
KR101336204B1 (ko) | 다시점 비디오에서 전역변이를 이용하여 상이한 시점의 화면들을 압축 또는 복호하는 인코더와 인코딩하는 방법 및디코더와 디코딩하는 방법 | |
KR20010075232A (ko) | 비디오 시퀀스의 압축을 위한 인코딩 방법 | |
JP2013513333A (ja) | ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置 | |
JP2010135863A (ja) | 画像符号化方法及び装置 | |
US20200195933A1 (en) | Method for encoding and decoding images, device for encoding and decoding images and corresponding computer programs | |
JP5908619B2 (ja) | 動画像符号化装置及び動画像復号化装置 | |
JP6503014B2 (ja) | 動画像符号化方法及び動画像復号化方法 | |
KR20180048719A (ko) | 이미지들을 코딩 및 디코딩하는 방법, 이미지들을 코딩 및 디코딩하는 장치, 및 이에 대응하는 컴퓨터 프로그램 | |
KR20110090841A (ko) | 가중치 예측을 이용한 영상 부호화/복호화 장치 및 방법 | |
JP6528635B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
JP5526277B2 (ja) | 動画像復号化装置、方法及びプログラム | |
JP5432359B2 (ja) | 動画像符号化装置、方法及びプログラム | |
JP5432412B1 (ja) | 動画像符号化装置及び動画像復号化装置 | |
KR100994395B1 (ko) | 동영상 인코딩/디코딩 장치 및 방법 | |
JP6510084B2 (ja) | 動画像復号化方法及び電子装置 | |
JP2011049816A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム | |
Hu et al. | Motion differential set partition coding for image sequence and video compression | |
Takamura et al. | Lossless scalable video coding with H. 264 compliant base layer | |
JP5696248B2 (ja) | 動画像符号化装置及び動画像復号化装置 | |
JP5597782B2 (ja) | 動画像符号化装置及び動画像復号化装置 | |
JP5525650B2 (ja) | 動画像復号化装置、方法及びプログラム | |
JP5323209B2 (ja) | 動画像符号化装置及び動画像復号化装置 |