JP2009531942A - エントロピ符号化効率を向上させる方法およびその方法を用いたビデオエンコーダおよびビデオデコーダ - Google Patents

エントロピ符号化効率を向上させる方法およびその方法を用いたビデオエンコーダおよびビデオデコーダ Download PDF

Info

Publication number
JP2009531942A
JP2009531942A JP2009502667A JP2009502667A JP2009531942A JP 2009531942 A JP2009531942 A JP 2009531942A JP 2009502667 A JP2009502667 A JP 2009502667A JP 2009502667 A JP2009502667 A JP 2009502667A JP 2009531942 A JP2009531942 A JP 2009531942A
Authority
JP
Japan
Prior art keywords
coefficient
layer
coding
video
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009502667A
Other languages
English (en)
Inventor
リー,ベ−グン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009531942A publication Critical patent/JP2009531942A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、FGS(Fine Granular Scalability)階層をエントロピ符号化することにおいて符号化効率を上げる方法および装置に関するものである。
ビデオエンコーダは、入力ビデオフレームから少なくとも1つの品質階層を生成するフレームエンコーディング部と、現在品質階層の第1係数と対応し、前記少なくとも1つの品質階層に含まれた前記現在階層に隣接する下位階層の第2係数を参照してコーディングパスを選択するコーディングパス選択部、および前記選択されたコーディングパスによって前記第1係数を無損失符号化するパスコーディング部とを含む。

Description

本発明は、ビデオ圧縮技術に関するものであって、より詳しくはFGS(Fine Granular Scalability)階層をエントロピ符号化において符号化効率を上げる方法および装置に関するものである。
インターネットを含む情報通信技術が発達するにつれて文字、音声だけでなく画像通信が増加しつつある。既存の文字中心の通信方式では消費者の多様な欲求を充足させることができず、このため、文字、映像、音楽など多様な形態の特性を収容できるマルチメディアサービスが増加しつつある。マルチメディアデータは、その量がぼう大であるため、大容量の格納媒体を必要とし、かつ伝送時に広い帯域幅を必要とする。したがって、文字、映像、オーディオを含むマルチメディアデータを伝送するためには圧縮コーディング技法を用いるのが必須的である。
データを圧縮する基本的な原理はデータの重複(redundancy)要素を除去する過程である。イメージで同じ色やオブジェクトが反復されるような空間的重複や、動画フレームで隣接フレームがほぼ変化のない場合や、オーディオで同じ音が反復続くような時間的重複、または人間の視覚および知覚能力が高い周波数に鈍感なことを考慮した知覚的重複を除去することによって、データを圧縮することができる。一般的なビデオコーディング方法において、時間的重複はモーション補償に基づく時間的フィルタリング(temporal filtering)によって除去し、空間的重複は空間的変換(spatial transform)によって除去する。
データの重複を除去した結果は、再び量子化過程によって所定の量子化ステップに従い損失符号化される。前記量子化された結果は最終的にエントロピ符号化(entropy coding)によって最終的に無損失符号化される。
現在、ISO/IEC(International Organization for Standardization / International Electrotechnical Commission)とITU(International Telecommunication Union)のビデオ専門家の集いであるJVT(Joint Video Team)で進めているスケーラブルビデオコーディング標準(以下、SVC標準という)では、既存のH.264に基づく多階層基盤のコーディング技術に関する研究が栄えている。特に、1つのフレームの品質またはビット率を徐々に向上させることができるようにFGS技術を採択する。
図1は、1つのフレームまたはスライス(10:以下通称してスライスと記載する)を構成する複数の品質階層11,12,13,14の概念を示す図である。品質階層とは、SNRスケーラビリティをサポートするために1つのスライスを分割して記録したデータであって、FGS階層が代表的な例であるが、これに限らない。複数の品質階層は、1つの基礎階層と少なくとも1つ以上のFGS階層11,12,13で構成されうる。ビデオデコーダで測定されるビデオ画質は基礎階層14のみが受信された場合、基礎階層14と第1 FGS階層13が受信された場合、基礎階層14、第1 FGS階層13および第2 FGS階層12が受信された場合、そして、すべての階層11,12,13,14が受信された場合順に向上される。
前記SVC草案では、各FGS階層間の関連性を用いてコーディングを実行する。すなわち、分離されたコーディングパス(重要パス、精製パスを含む概念である)によって1つのFGS階層の係数を用いて他のFGS階層をコーディングする。この時、対応するすべての下位階層の係数が0である場合には該当現在階層の係数は重要パス(significant pass)でコーディングし、前記対応する下位階層の係数のうち1つでも0ではない係数がある該当現在階層の係数は精製パス(refinement pass)でコーディングする。このようにFGS階層のある係数を互いに異なるパスでコーディングすることは対応する下位階層の係数によって前記係数の確率的分布が互いに明確に区分される現象に起因する。
図2は、離散階層の係数を参照して第1 FGS階層のコーディングパスを選択した時、該当コーディングパスに対して0が発生する確率を示すグラフの例である。図2でSIGは重要パスを、REFは精製パスを指示する。図2を参照すると、離散階層の対応する係数が0であるため、重要パスでコーディングされる第1 FGS階層の係数のうち0が発生する確率分布と、離散階層に対応する係数が0ではないため、精製パスでコーディングされる第1 FGS階層の係数のうち0が発生する確率分布は多少明確に区分されることが分かる。このように0が発生する確率分布が明確に区分される場合には互いに異なるコーディングパス、すなわち互いに異なるコンテクストモデルによってコーディングすることでコーディングの効率を向上させることができる。
図3は、離散階層および第1 FGS階層の係数を参照して第2 FGS階層のコーディングパスを選択した時、該当コーディングパスに対して0が発生する確率を示すグラフの例である。図3を参照すると、精製パスでコーディングされる第2 FGS階層の係数と、重要パスでコーディングされる第2 FGS階層の係数との間に0が発生する確率が区別されず混ざっていることが分かる。すなわち、SVC草案で開示されたコーディングパス別コーディング技法は、第1 FGS階層のコーディングにおいては非常に効率的であるが、第2 FGS階層以上のコーディングにおいてはその効率性が減少することもある。前記効率性の減少は、隣接する階層間には確率的な関連性が高いが、隣接しておらず多少離れている階層間には確率的な関連性が低いという事実に起因する。
本発明が解決しようとする課題は、複数の品質階層で構成されるビデオデータのエントロピコーディング効率を向上させることにある。
本発明が解決しようとする他の技術的課題は、複数の品質階層で構成されるビデオデータのエントロピコーディングにおいて計算の複雑性(computational complexity)を減少させることにある。
本発明の技術的課題は、以上で言及した技術的課題に制限されず、言及されていないまた他の技術的課題は次の記載から当業者に明確に理解できるであろう。
前記技術的課題を達成するための本発明の一実施形態によるビデオエンコーダは、入力ビデオフレームから少なくとも1つの品質階層を生成するフレームエンコーディング部と、現在品質階層の第1係数と対応し、前記少なくとも1つの品質階層に含まれた前記現在階層に隣接する下位階層の第2係数を参照してコーディングパスを選択するコーディングパス選択部、および前記選択されたコーディングパスによって前記第1係数を無損失符号化するパスコーディング部と、を含む。
前記技術的課題を達成するための本発明の一実施形態によるビデオデコーダは、入力ビットストリームに含まれた少なくとも1つの品質階層のうち1つである現在階層に属する第1係数と対応する位置にあり、前記現在階層に隣接する下位階層に属する第2係数を参照してコーディングパスを選択するコーディングパス選択部と、前記選択されたコーディングパスによって前記第1係数を無損失復号化するパスデコーディング部、および前記無損失復号化された第1係数から現在階層のイメージを復元するフレームデコーディング部と、を含む。
前記技術的課題を達成するための本発明の一実施形態によるビデオエンコーディング方法は、入力ビデオフレームから少なくとも1つの品質階層を生成する段階と、現在階層の第1係数と対応する位置にあり、前記少なくとも1つの品質階層に含まれた前記現在階層に隣接する下位階層の第2係数を参照してコーディングパスを選択する段階、および前記選択されたコーディングパスによって前記第1係数を無損失符号化する段階と、を含む。
前記技術的課題を達成するための本発明の一実施形態によるビデオデコーディング方法は、入力ビットストリームに含まれた少なくとも1つの品質階層のうち1つである現在階層に属する第1係数と対応する位置にあり、前記階層に隣接する下位階層に属する第2係数を参照してコーディングパスを選択する段階と、前記選択されたコーディングパスによって前記第1係数を無損失復号化する段階、および前記無損失復号化された第1係数から前記現在階層のイメージを復元する段階と、を含む。
本発明によると、複数の品質階層で構成されるビデオデータのエントロピコーディング効率を向上させることができる。
また本発明によると、複数の品質階層で構成されるビデオデータのエントロピコーディングにおいて計算複雑性を減少させることができる。
以下、添付された図面を参照して本発明による一実施形態を詳細に説明する。
図4は、1つのスライスを1つの基礎階層と2つのFGS階層で表現する過程を示す図である。最初にオリジナルスライスは第1量子化パラメータ(QP1)によって量子化される(S1)。前記量子化されたスライス22は基礎階層を形成する。前記量子化されたスライス22は逆量子化された後(S2)減算器(subtractor:24)に提供される。減算器23はオリジナルスライスから前記逆量子化されたスライス23を減算する(S3)。前記減算した結果は再び第2量子化パラメータ(QP2)によって量子化される(S4)。前記量子化された結果25は第1 FGS階層を形成する。
次に、前記量子化されたスライス25は、逆量子化され(S5)、加算器27に提供される。前記逆量子化されたスライス26および、逆量子化されたスライス23は加算器(adder:27)によって加算された後、減算器28に提供される(S6)。減算器28はオリジナルスライスから前記加算された結果を減算する(S7)。前記減算された結果は再び第3量子化パラメータ(QP3)によって量子化される(S8)。前記量子化された結果29は第2 FGS階層を形成する。このような過程によって図1のような複数の品質階層が形成されうる。ここで、離散階層を除いた第1 FGS階層および第2 FGS階層は、1つの階層内でも任意のビットを切り取ることができる構造(図5参照)になっている。これのために、各々のFGS階層には既存のMPEG−4で用いられたビット平面(bit plane)コーディング技法、SVC草案で用いられる循環(cyclic) FGSコーディング技法などが適用されうる。
前述した通り、現在SVC草案ではあるFGS階層の係数のコーディングパスを決定において下位に存在するすべての階層の対応する係数を参照する。ここで、「対応する係数」とは、複数の品質階層の間の空間的な位置が同じ係数を意味する。例えば、図6のように4x4ブロックが離散階層、第1 FGS階層および第2 FGS階層で表示されるとする時、第2 FGS階層の係数53と対応する係数は第1 FGS階層の係数52および離散階層の係数51である。
図7および図8は従来のSVC草案でのコーディングパス決定スキーム(scheme) 61と本発明によるコーディングパス決定スキーム62を比較する図である。図7において、第2 FGS階層の係数のコーディングパスは、それに対応する下位階層の係数のうち0ではない値が1つでもあれば精製パスに、そうではなければ重要パスに決定される。例えば、第2 FGS階層の係数のうちc、cn+1,cn+2は、その下位階層で少なくとも1つの0ではない係数が存在するため精製パスに決定され、cn+3は、その下位階層の係数がすべて0であるため重要パスに決定される。
これに比べて、図8では、第2 FGS階層の係数のコーディングパスは、その真下の階層(隣接する下位階層)の係数のみを参照して決定される。したがって、前記隣接する下位階層、すなわち第1 FGS階層の対応する係数が0ならば重要パスに、そうではなければ精製パスに決定される。これは離散階層の係数がいかなる値を有するかとは関係がなく決定される。したがって、第2 FGS階層の係数のうちc、cn+1は重要パスでコーディングされ、cn+2およびcn+3は精製パスでコーディングされる。
図9は、従来のJSVM(Joint Scalable Video Model)−5によってH.264技術でのFootballシーケンスとして知られたQCIF標準シーケンスをエンコーディングする時、第2 FGS階層の係数が有するコーディングパスによって0が発生する確率を示すグラフの例である。このような従来のSVC草案による場合、第2 FGS階層またはそれ以上の階層ではコーディングパス別に確率分布が明確に区分されず、これはエントロピコーディングの効率に影響を及ぼしうる。
図10は、本発明によってQCIF Footballシーケンスをエンコーディングする時、第2 FGS階層の係数が有するコーディングパスによって0が発生する確率を示すグラフの例である。図10を見ると、精製パスの場合0が発生する確率が概ね100%近くで形成されて、重要パスの場合、0が発生する確率が概ね60〜80%の間で形成されることが分かる。このように、隣接する下位階層の係数のみを参照してコーディングパスを決める場合には、第2 FGS階層またはそれ以上の階層においてもコーディングパス別に確率分布が明確に区分される可能性が大きくなる。
一方、従来のSVC草案では図7と共に精製パスおよび重要パスを決めた後には、図12のように各コーディングパスに該当する係数同士を集め、エントロピコーディングを実行する。4x4 FGS階層ブロックに含まれた16個の係数(c〜c16)のスキャン順序が決まって、そのうちc,c,c,c,およびc11が精製パスでコーディングされる係数と仮定すれば、図12に示す通り、総16個の係数に対してエントロピコーディングを実行するにおいて総2回のループ(loop)が必要である。第1ループでは16個の係数を探索しつつ、そのうち精製パスに該当する係数のみをエントロピコーディングし、第2ループでは再び16個の係数を探索しつつ、そのうち重要パスに該当する係数だけをエントロピコーディングする。このように2回のループを経るのは、ビデオエンコーダまたはデコーダでの演算速度を低下させる一要因となりうる。
したがって、本発明ではコーディングパスによるエントロピコーディングにおいての演算量を減少させるために、従来のSVC草案のようにコーディングパス別に係数をグループ化せず、図11に示す通り、スキャン順に1つのループによってエントロピコーディングを実行することを提案する。すなわち、いかなる係数が精製パスなのか重要パスなのかを問わずスキャン順に該当係数をエントロピコーディングするのである。
次の表1はJSVM−5に含まれた演算過程を示す疑似コードの例であり、表2は本発明による演算過程を示す疑似コードの例である。
Figure 2009531942

Figure 2009531942
表2のコードの長さは表1のコードの長さより非常に減少した。また、表1ではwhileループが2回用いられたのに比べて、表2ではwhileループが1回用いられた。したがって、表2のようなアルゴリズムに従う場合、表1のアルゴリズムに比べて演算量が減少されることは明らかである。
図13は、本発明の一実施形態によるビデオエンコーダ100の構成を示すブロック図である。ビデオエンコーダ100は、フレームエンコーディング部110とエントロピ符号化部120を含み構成されうる。
フレームエンコーディング部110は、入力されたビデオフレームから前記ビデオフレームに関する少なくとも1つの品質階層を生成する。
これのために、フレームエンコーディング部110は、予測部111、変換部112、量子化部113、および品質階層生成部114を含み構成されうる。
予測部111は、現在マクロブロックで所定の予測方法により予測されたイメージを差分することによって残差信号を求める。前記予測方法ではSVC草案に開示された予測技法、すなわちインター予測、方向的イントラ予測、イントラベース予測などが用いられる。インター予測は、現在フレームと同一な解像度および異なる時間的位置を有するフレームと現在フレームと間の相対的な動きを表現するためのモーションベクターを求めるモーション推定過程を含みうる。一方、現在フレームは、現在フレームと同一な時間的位置に存在し、現在フレームと解像度が相異なる下位階層(基礎階層)のフレームを参照して予測されることもできる。これをイントラベース(inta base)予測という。もちろん、イントラベース予測では前記モーション推定過程は必要ではない。
変換部112は、前記求めた残差信号をDCT、ウェーブレット変換など空間的変換技法を用いて変換し、変換係数を生成する。このような空間的変換方法ではDCT(Discrete Cosine Transform)、ウェーブレット変換(wavelet transform)などが用いられる。空間的変換の結果、変換係数が求められるが、空間的変換方法でDCTを用いる場合はDCT係数が、ウェーブレット変換を用いる場合はウェーブレット係数が求められる。
量子化部113は、空間的変換部112で求めた変換係数を量子化して量子化係数を生成する。量子化(quantization)とは、任意の実数と表現される前記変換係数を一定区間に分けて、離散値(discrete value)で示す作業を意味する。このような量子化方法ではスカラー量子化、ベクター量子化などの方法がある。
品質階層生成部114は、図4で説明したような過程によって複数の品質階層を生成する。前記複数の品質階層は1つの離散階層と少なくとも1つ以上のFGS階層で構成されうる。前記離散階層は、独立的にエンコーディング/デコーディングが行われるが、前記FGS階層は、他の階層を参照してエンコーディング/デコーディングが行われる。
エントロピ符号化部120は、本発明の実施形態による独立的な無損失符号化を実行する。前記無損失符号化部120の細部な構成は図14に示す。図14を参照すると、エントロピ符号化部120は、コーディングパス選択部121、精製パスコーディング部122、重要パスコーディング部123およびMUX124を含み構成されうる。
コーディングパス選択部121は、前記品質階層に属する現在ブロック(4x4ブロック、8x8ブロックまたは16x16ブロック)の係数をコーディング下記ために前記品質階層の隣接する下位階層のブロックだけを参照する。本発明において、前記品質階層は第2 FGS階層以上の階層であることが好ましい。コーディングパス選択部121は前記参照されるブロックの係数のうち前記現在ブロックの係数と空間的に対応する係数が0であるか、0ではない値であるかを判断する。コーディングパス選択部121は、前記対応する係数が0である場合には、前記現在ブロックの係数に対するコーディングパスとして重要パスを選択し、前記対応する係数が0ではない場合には、前記コーディングパスとして精製パスを選択する。
パスコーディング部125は、前記選択されたコーディングパスによって前記現在ブロックの係数を無損失符号化(エントロピ符号化)する。これのために、パスコーディング部125は前記対応する係数が0ではない時(1またはそれ以上の値)、前記現在ブロックの係数を精製パスによって無損失符号化する精製パスコーディング部122と、前記対応する係数が0である時、前記現在ブロックの係数を重要パスによって無損失符号化する重要パスコーディング部123を含む。実際精製パスまたは重要パスによってエントロピコーディングする具体的な方法は、既存のSVC草案で用いられる方式をそのまま用いることができる。特に、SVC提案文書JVT−P056では重要パスに対して、次のようなコーディング技法を提案している。エンコーディングされた結果であるコードワード(codeword)はカット−オフ(cut−off)パラメータ「m」によって特性が付与される。コーディングされるシンボル「C」が前記mより小さいか同じならば、前記シンボルはExp_Golombコードを用いてエンコーディングされる。前記シンボルCが前記mより大きければ、次の式(1)によって長さ(length)および添え字(suffix)の二つの部分に分れてエンコーディングされる。
Figure 2009531942
前記Pは、エンコーディングされたコードワードであって、長さおよび添え字(00,10,または10を有する)から成る。
一方、精製パスにおいては、確率的に0が発生する可能性がさらに高いため、JVT−P056では、コーディングされる各精製係数(refinement bit)のグループに含まれる0の個数に基づく1つのVLCテーブルを用いて、互いに異なる長さを有するコードワードを割当てるCAVLC(Context−adaptive Variable Length Coding)技法を提案する。前記精製係数グループは精製係数を所定個数単位で集めたものであり、例えば4つの精製係数を1つの精製係数グループで見なすこともある。
もちろん、精製パスに対してCABAC(Context−adaptive Binary Arithmetic Coding)技法を適用してコーディングすることも可能である。CABACは、所定のコーディング対象に対する確率モデルを選択して算術コーディングをする方式である。一般的にCABAC過程は、2進演算、コンテクストモデルの選択、算術コーディング、および確率アップデート過程で成される。
パスコーディング部125は、品質階層の係数を所定のブロック単位(4x4,8x8,16x16など)内で単一ループを用いてエントロピコーディングすることができる。すなわち、従来のSVC草案のように、精製パスに選択された係数と重要パスに選択された係数を別途に集めてコーディングするのではなく、前記係数のスキャン順に精製パスコーディングまたは重要パスコーディングを実行するのである。
MUX124は、精製パスコーディング部122の出力と、重要パスコーディング部123の出力を多重化して1つのビットストリームで出力する。
図15は、本発明の一実施形態によるビデオデコーダ200の構成を示すブロック図である。ビデオデコーダ200はエントロピ復号化部220とフレームデコーディング部210を含む。
エントロピ復号化部220は、入力されたビットストリームに含まれた少なくとも1つの品質階層に属する現在ブロックの係数に対して、本発明の実施形態によるエントロピ復号化を実行する。エントロピ復号化部220のより詳しい構成は後述するド16に示す。
フレームデコーディング部210は、エントロピ復号化部220によって無損失復号化された現在ブロックの係数から現在ブロックのイメージを復元する。これのためにフレームデコーディング部210は品質階層組立部211、逆量子化部212、逆変換部213および逆予測部214を含む。
品質階層組立部211は、図1のような複数の品質階層を加算して1つのスライスデータまたはフレームデータを生成する。
逆量子化部212は、品質階層組立部211から提供されたデータを逆量子化する。
逆変換部213は、前記逆量子化結果に対して逆変換を実行する。このような逆変換は図14の変換部112で実行される変換過程の逆に実行される。
逆予測部214は、逆変換部213から提供される復元された残差信号を予測信号と加算してビデオフレームを復元する。この時、前記予測信号はビデオエンコーダ端と同様にインター予測またはイントラベース予測によって求めることができる。
図16は、エントロピ復号化部220のより詳しい構成を示すブロック図である。エントロピ復号化部220は、コーディングパス選択部221、精製パスデコーディング部222、重要パスデコーディング部223およびMUX224を含み構成されうる。
コーディングパス選択部221は、入力されたビットストリームに含まれた少なくとも1つの品質階層に属する現在ブロック(4x4ブロック、8x8ブロックまたは16x16ブロック)の係数をコーディングするために、前記品質階層の隣接する下位階層のブロックだけを参照する。コーディングパス選択部221は、前記参照されるブロックの係数のうち前記現在ブロックの係数と空間的に対応する係数が0であるか、0ではない値であるかを判断する。コーディングパス選択部221は、前記対応する係数が0である場合には、前記現在ブロックの係数に対するコーディングパスとして重要パスを選択し、前記対応する係数が0ではない場合には、前記コーディングパスとして精製パスを選択する。
パスデコーディング部225は、前記選択されたコーディングパスによって前記現在ブロックの係数を無損失復号化する。これのために、パスデコーディング部225は対応する係数が0ではない時(1またはそれ以上の値)、前記現在ブロックの係数を精製パスによって無損失復号化する精製パスデコーディング部222と、前記対応する係数が0である時、前記現在ブロックの係数を重要パスによって無損失復号化する重要パスデコーディング部223を含む。パスコーディング部125と同様に、パスデコーディング部225も前記係数の無損失復号化を単一ループで実行することができる。
MUX224は、精製パスデコーディング部222の出力と、重要パスデコーディング部223の出力を多重化して1つの品質階層に関するデータ(スライスまたはフレーム)を生成する。
今まで図13から図16の各構成要素はメモリ上の所定領域で実行されるタスク、クラス、サブルーチン、プロセス、オブジェクト、実行スレッド、プログラムのようなソフトウェア(software)や、FPGA(field−programmable gate array)やASIC(application−specific integrated circuit)のようなハードウェア(hardware)で具現されることができ、また前記ソフトウェアおよびハードウェアの組合せで形成されることもできる。前記構成要素は、コンピュータで判読可能な保存媒体に含まれている事もでき、複数のコンピュータにその一部が分散して分布されることもできる。
図17および図18は、CIF BUSシーケンス(フレーム率:15Hz)および4CIF HARBOURシーケンス(フレーム率:60Hz)に対して従来のJSVM−4.2を適用した場合の輝度成分のPSNRと、前記JSVM−4.2に本発明を適用した場合の輝度成分のPSNRを比較したグラフである。図13および図14を参照すれば、ビット率が高くなるほど本発明を適用したことによってさらに明確になったことが確認できる。適用されるビデオシーケンスによって差があるが、本発明の適用によるPSNRの改善値は概ね0.25dB〜0.5dB程度の範囲を有する。
以上添付された図面を参照し、本発明の実施形態について説明したが、本発明が属する技術分野における通常の知識を有する者は、本発明を、その技術的思想や必須の特徴を変更しない範囲で、他の具体的な形態において実施されうるということを理解することができる。したがって、上記実施形態はすべての面で例示的なものであり、限定的でないものと理解しなければならない。
1つのフレームまたはスライスを構成する複数の品質階層の概念を示す図である。 離散階層の係数を参照して第1 FGS階層のコーディングパスを選択した時、該当コーディングパスに対して0が発生する確率を示すグラフである。 離散階層および第1 FGS階層の係数を参照して第2 FGS階層のコーディングパスを選択した時、該当コーディングパスに対して0が発生する確率を示すグラフである。 1つのスライスを1つの基礎階層と2個のFGS階層で表現する過程を示す図である。 複数の品質階層をビットストリームに配置する例を示す図である。 複数の品質階層で空間的に対応される係数を示す図面である。 従来のSVC草案でのコーディングパス決定スキームを示す図である。 本発明によるコーディングパス決定スキームを示す図である。 JSVM−5によってQCIF Footballとして知られたQuarter Common Intermediate Format(QCIF)標準テストシーケンスをエンコーディングする時、第2 FGS階層の係数が有するコーディングパスによって0が発生する確率を示すグラフである。 本発明によりQCIF Footballシーケンスをエンコーディングする時、第2 FGS階層の係数が有するコーディングパスによって0が発生する確率を示すグラフである。 スキャン順であって1つのループを通し係数をエントロピコーディングする例を示す図である。 精製パスおよび重要パス別に該当係数を集めてエントロピコーディングを実行する例を示す図である。 本発明の一実施形態によるビデオエンコーダの構成を示すブロック図である。 図13のビデオエンコーダに含まれた無損失符号化部の細部的な構成を示すブロック図である。 本発明の一実施形態によるビデオデコーダの構成を示すブロック図である。 図15のビデオデコーダに含まれた無損失復号化部の細部的な構成を示すブロック図である。 CIF BUSシーケンスに対して従来技術を適用した場合の輝度成分のPSNRと、本発明適用した場合の輝度成分のPSNRを比較したグラフである。 4CIF HARBOURシーケンスに対して従来技術を適用した場合の輝度成分のPSNRと、本発明適用した場合の輝度成分のPSNRを比較したグラフである。
符号の説明
100 ビデオエンコーダ
110 フレームエンコーディング部
111 予測部
112 変換部
113 量子化部
114 品質階層生成部
120 エントロピ符号化部
121,221 コーディングパス選択部
122 精製パスコーディング部
123 重要パスコーディング部
124,224 MUX
125 パスコーディング部
200 ビデオデコーダ
210 フレームデコーディング部
211 品質階層組立部
212 逆量子化部
213 逆変換部
214 逆予測部
220 エントロピ復号化部
222 精製パスデコーディング部
223 重要パスデコーディング部
225 パスデコーディング部

Claims (24)

  1. 入力ビデオフレームから少なくとも1つの品質階層を生成するフレームエンコーディング部と、
    現在品質階層の第1係数と対応し、前記少なくとも1つの品質階層に含まれた前記現在階層に隣接する下位階層の第2係数を参照してコーディングパスを選択するコーディングパス選択部、および
    前記選択されたコーディングパスによって前記第1係数を無損失符号化するパスコーディング部と、を含む、ビデオエンコーダ。
  2. 前記少なくとも1つの品質階層は、
    1つの離散階層と少なくとも1つのFGS階層を含む、請求項1に記載のビデオエンコーダ。
  3. 前記少なくとも1つの品質階層が2以上のFGS階層で構成される場合、前記現在品質階層は、
    前記2以上のFGS階層よりさらに高いFGS階層である、請求項2に記載のビデオエンコーダ。
  4. 前記パスコーディング部は、
    前記第2係数が0ではない時、前記第1係数を精製パスによって無損失符号化する精製パスコーディング部、および
    前記第2係数が0である時、前記第1係数を重要パスによって無損失符号化する重要パスコーディング部と、を含む、請求項1に記載のビデオエンコーダ。
  5. 前記パスコーディング部は、
    前記第1係数を前記現在階層のブロック単位内で単一ループを用いて無損失符号化する、請求項1に記載のビデオエンコーダ。
  6. 前記ブロック単位は、
    4x4ブロック、8x8ブロックまたは16x16ブロック単位である、請求項5に記載のビデオエンコーダ。
  7. 入力ビットストリームに含まれた少なくとも1つの品質階層のうち1つである現在階層に属する第1係数と対応する位置にあり、前記現在階層に隣接する下位階層に属する第2係数を参照してコーディングパスを選択するコーディングパス選択部と、前記選択されたコーディングパスによって前記第1係数を無損失復号化するパスデコーディング部、および
    前記無損失復号化された第1係数から現在階層のイメージを復元するフレームデコーディング部と、を含むビデオデコーダ。
  8. 前記少なくとも1つの品質階層は、
    1つの離散階層と少なくとも1つのFGS階層を含む、請求項7に記載のビデオデコーダ。
  9. 前記少なくとも1つの品質階層が2以上のPGS階層で構成される場合、前記現在階層は、
    前記2以上のFGS階層よりさらに高いFGS階層である、請求項8に記載のビデオデコーダ。
  10. 前記パスデコーディング部は、
    前記第2係数が0ではない時、前記現在第1係数を精製パスによって無損失復号化する精製パスデコーディング部、および
    前記第2係数が0である時、前記第1係数を重要パスによって無損失復号化する重要パスデコーディング部と、を含む、請求項7に記載のビデオデコーダ。
  11. 前記パスデコーディング部は、
    前記第1係数を前記現在階層のブロック単位内で単一ループを用いて無損失復号化する、請求項7に記載のビデオデコーダ。
  12. 前記ブロック単位は、
    4x4ブロック、8x8ブロックまたは16x16ブロック単位である、請求項11に記載のビデオデコーダ。
  13. 入力ビデオフレームから少なくとも1つの品質階層を生成する段階と、
    現在階層の第1係数と対応する位置にあり、前記少なくとも1つの品質階層に含まれた前記現在階層に隣接する下位階層の第2係数を参照してコーディングパスを選択する段階、および
    前記選択されたコーディングパスによって前記第1係数を無損失符号化する段階と、を含む、ビデオエンコーディング方法。
  14. 前記少なくとも1つの品質階層は、
    1つの離散階層と少なくとも1つのFGS階層を含む、請求項13に記載のビデオエンコーディング方法。
  15. 前記少なくとも1つの品質階層が2以上のFGS階層で構成される場合、前記現在階層は、
    前記2以上のFGS階層よりさらに高いFGS階層である、請求項14に記載のビデオエンコーディング方法。
  16. 前記第1係数を無損失符号化する段階は、
    前記第2係数が0ではない時、前記第1係数を精製パスにより無損失符号化する段階、および
    前記第2係数が0である時、前記第1係数を重要パスにより無損失符号化する段階と、を含む、請求項13に記載のビデオエンコーディング方法。
  17. 前記第1係数を無損失符号化する段階は、
    前記現在階層のブロック単位内で単一ループを用いて実行される、請求項13に記載のビデオエンコーディング方法。
  18. 前記ブロック単位は、
    4x4ブロック、8x8ブロックまたは16x16ブロック単位である、請求項17に記載のビデオエンコーディング方法。
  19. 入力ビットストリームに含まれた少なくとも1つの品質階層のうち1つである現在階層に属する第1係数と対応する位置にあり、前記階層に隣接する下位階層に属する第2係数を参照してコーディングパスを選択する段階と、
    前記選択されたコーディングパスによって前記第1係数を無損失復号化する段階、および
    前記無損失復号化された第1係数から前記現在階層のイメージを復元する段階と、を含む、ビデオデコーディング方法。
  20. 前記少なくとも1つの品質階層は、
    1つの離散階層と少なくとも1つのFGS階層と、を含む、請求項19に記載のビデオデコーディング方法。
  21. 前記少なくとも1つの品質階層が2以上のFGS階層で構成される場合、前記現在階層は、
    前記2以上のFGS階層よりさらに高いFGS階層である、請求項20に記載のビデオデコーディング方法。
  22. 前記第1係数を無損失復号化する段階は、
    前記第2係数が0ではない時、前記第1係数を精製パスにより無損失復号化する段階、および
    前記第2係数が0である時、前記第1係数を重要パスにより無損失復号化する段階と、を含む、請求項19に記載のビデオデコーディング方法。
  23. 前記第1係数を無損失復号化する段階は、
    前記現在階層のブロック単位内で単一ループを用いて実行される、請求項19に記載のビデオデコーディング方法。
  24. 前記ブロック単位は、
    4x4ブロック、8x8ブロックまたは16x16ブロック単位である、請求項23に記載のビデオデコーディング方法。
JP2009502667A 2006-03-28 2007-03-27 エントロピ符号化効率を向上させる方法およびその方法を用いたビデオエンコーダおよびビデオデコーダ Pending JP2009531942A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78638406P 2006-03-28 2006-03-28
KR1020060058216A KR100834757B1 (ko) 2006-03-28 2006-06-27 엔트로피 부호화 효율을 향상시키는 방법 및 그 방법을이용한 비디오 인코더 및 비디오 디코더
PCT/KR2007/001474 WO2007111461A1 (en) 2006-03-28 2007-03-27 Method of enhancing entropy-coding efficiency, video encoder and video decoder thereof

Publications (1)

Publication Number Publication Date
JP2009531942A true JP2009531942A (ja) 2009-09-03

Family

ID=38803707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009502667A Pending JP2009531942A (ja) 2006-03-28 2007-03-27 エントロピ符号化効率を向上させる方法およびその方法を用いたビデオエンコーダおよびビデオデコーダ

Country Status (7)

Country Link
US (1) US20070230811A1 (ja)
EP (1) EP1999962A1 (ja)
JP (1) JP2009531942A (ja)
KR (1) KR100834757B1 (ja)
CN (1) CN101411191A (ja)
MX (1) MX2008012367A (ja)
WO (1) WO2007111461A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013526795A (ja) * 2010-05-10 2013-06-24 サムスン エレクトロニクス カンパニー リミテッド レイヤーコーディングビデオを送受信する方法及び装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100809301B1 (ko) * 2006-07-20 2008-03-04 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
US8848787B2 (en) * 2007-10-15 2014-09-30 Qualcomm Incorporated Enhancement layer coding for scalable video coding
CA2702488C (en) * 2007-10-15 2013-04-02 Qualcomm Incorporated Improved enhancement layer coding for scalable video coding
KR101708931B1 (ko) * 2010-04-28 2017-03-08 삼성전자주식회사 다중 안테나 시스템에서 데이터 전송률 할당장치 및 방법
US9456213B2 (en) * 2013-07-17 2016-09-27 Hangzhou Danghong Technology Co., Ltd. Method for simultaneously encoding macroblock groups of frame
US10735736B2 (en) * 2017-08-29 2020-08-04 Google Llc Selective mixing for entropy coding in video compression

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1183769C (zh) * 1996-05-28 2005-01-05 松下电器产业株式会社 图像预测编码/解码装置和方法以及记录媒体
US6873655B2 (en) * 2001-01-09 2005-03-29 Thomson Licensing A.A. Codec system and method for spatially scalable video data
US20020118742A1 (en) * 2001-02-26 2002-08-29 Philips Electronics North America Corporation. Prediction structures for enhancement layer in fine granular scalability video coding
US6944639B2 (en) * 2001-06-29 2005-09-13 Nokia Corporation Hardware context vector generator for JPEG2000 block-coding
US6785334B2 (en) * 2001-08-15 2004-08-31 Koninklijke Philips Electronics N.V. Method for transmission control in hybrid temporal-SNR fine granular video coding
US6944222B2 (en) * 2002-03-04 2005-09-13 Koninklijke Philips Electronics N.V. Efficiency FGST framework employing higher quality reference frames
CN1640146A (zh) * 2002-03-05 2005-07-13 皇家飞利浦电子股份有限公司 用于分层视频编码的方法和系统
KR100925627B1 (ko) * 2002-09-28 2009-11-06 주식회사 케이티 영상 분할에 기반한 신축적인 동영상 부호화/복호화 장치
US8824553B2 (en) 2003-05-12 2014-09-02 Google Inc. Video compression method
WO2005057935A2 (en) * 2003-12-09 2005-06-23 Koninklijke Philips Electronics, N.V. Spatial and snr scalable video coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013526795A (ja) * 2010-05-10 2013-06-24 サムスン エレクトロニクス カンパニー リミテッド レイヤーコーディングビデオを送受信する方法及び装置

Also Published As

Publication number Publication date
WO2007111461A1 (en) 2007-10-04
KR100834757B1 (ko) 2008-06-05
CN101411191A (zh) 2009-04-15
US20070230811A1 (en) 2007-10-04
KR20070097275A (ko) 2007-10-04
EP1999962A1 (en) 2008-12-10
MX2008012367A (es) 2008-10-09

Similar Documents

Publication Publication Date Title
KR100809301B1 (ko) 엔트로피 부호화/복호화 방법 및 장치
JP4589290B2 (ja) ある階層のフラグを階層間の連関性を用いて符号化する方法、前記符号化されたフラグを復号化する方法、及び装置
JP4834732B2 (ja) エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置
US8155181B2 (en) Multilayer-based video encoding method and apparatus thereof
KR100736104B1 (ko) 독립적 파싱을 지원하는 비디오 코딩 방법 및 장치
JP2008005504A (ja) フラグエンコード方法、フラグデコード方法、および前記方法を用いた装置
JP2006304307A5 (ja)
JP4837047B2 (ja) ビデオ信号をグループ別にエンコーディングおよびデコーディングする方法および装置
JP2006304307A (ja) エントロピーコーディングのコンテキストモデルを適応的に選択する方法及びビデオデコーダ
US20070177664A1 (en) Entropy encoding/decoding method and apparatus
JP2009523349A (ja) フラッグ符号化方法、フラッグ復号化方法、および前記方法を利用した装置
JP2009531942A (ja) エントロピ符号化効率を向上させる方法およびその方法を用いたビデオエンコーダおよびビデオデコーダ
WO2007035056A1 (en) Method and apparatus for entropy encoding and entropy decoding fine-granularity scalability layer video data
US20070133676A1 (en) Method and apparatus for encoding and decoding video signal depending on characteristics of coefficients included in block of FGS layer
KR100763192B1 (ko) Fgs 계층의 비디오 데이터를 엔트로피 부호화 및복호화하는 방법 및 장치
JP2009531941A (ja) ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111115