JP2009506710A - エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置 - Google Patents

エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置 Download PDF

Info

Publication number
JP2009506710A
JP2009506710A JP2008528961A JP2008528961A JP2009506710A JP 2009506710 A JP2009506710 A JP 2009506710A JP 2008528961 A JP2008528961 A JP 2008528961A JP 2008528961 A JP2008528961 A JP 2008528961A JP 2009506710 A JP2009506710 A JP 2009506710A
Authority
JP
Japan
Prior art keywords
coefficient
unit
grouping
layer
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008528961A
Other languages
English (en)
Inventor
リー,ベ−グン
ハン,ウ−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060003321A external-priority patent/KR100714706B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009506710A publication Critical patent/JP2009506710A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明はビデオ圧縮技術に関するものであって、より詳細には多階層基盤のコーデックにおいて、エントロピコーディングの性能を改善する方法および装置に関するものである。
本発明の一実施形態によるFGS階層の第1係数を無損失符号化する可変長符号化方法は、前記第1係数が属する所定の単位領域に含まれた0の比率を算出する段階と、前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する段階と、前記第1係数の絶対値を前記選択されたグループ化単位でグループ化する段階と、前記選択されたグループ化単位に相応するVLCテーブルを参照して前記グループ化された第1係数の絶対値をマッピングされるコードワードに変換する段階で成される。

Description

本発明はビデオ圧縮技術に関するものであって、より詳細には多階層基盤のコーデックにおいて、エントロピコーディングの性能を改善する方法および装置に関するものである。
インターネットを含む情報通信技術が発達するにともない文字、音声だけでなく画像通信が増加している。既存の文字中心の通信方式では消費者の多様な欲求を充足させるには足りず、これに伴い文字、映像、音楽など多様な形態の特性を受容できるマルチメディアサービスが増加している。マルチメディアデータはその量が膨大であり、大容量の保存媒体を必要とし伝送時に広い帯域幅を必要とする。したがって文字、映像、オーディオを含んだマルチメディアデータを伝送するためには圧縮コーディング技法を使用することが必須的である。
データを圧縮する基本的な原理はデータの重複(redundancy)要素を除去する過程である。イメージで同一な色やオブジェクトが反復されるような空間的重複や動画フレームにおいて隣接したフレームの変化がほとんどない場合やオーディオにおいて同じ音が継続して反復されるような時間的重複、または人間の視覚および知覚能力が高い周波数に鈍感であることを考慮した心理視覚重複を除去することによってデータを圧縮することができる。一般的なビデオコーディング方法において、時間的重複はモーション補償に基づいた時間的フィルタリング(temporal filtering)によって除去し、空間的重複は空間的変換(spatial transform)によって除去する。
データの重複を除去した結果は改めて量子化過程をとおし所定の量子化ステップにしたがって損失符号化される。前記量子化された結果は最終的にエントロピ符号化(entropy coding)をとおし、最終的に無損失符号化される。
現在、ISO/IEC(International Organization for Standardization / International Electrotechnical Commission)とITU(International Telecommunication Union)のビデオ専門家の集いであるJVT(Joint Video Team)で進行中のスケーラブルビデオ符号化(以下、SVCという)草案(draft)では、既存のH.264を基盤とした多階層基盤のコーディング技術に関する研究が活発に進行されている。
現在H.264標準で使用されるエントロピ符号化技術としては、CAVLC(Context−Adaptive Variable Length Coding)、CABAC(Context−Adaptive Binary Arithmetic Coding)、Exp_Golomb(exponential Golomb)等がある。
次の表(1)はH.264標準でコーディングされるパラメータごとに使用されるエントロピ符号化技法の分類を示す。
Figure 2009506710
前記表(1)によればentropy_coding_modeフラッグが0である場合には、該当マクロブロックがインター予測モードであるのかイントラ予測モードであるのかを表すマクロブロック類型(macroblock type)、マクロブロックを構成するサブブロックの形態を表すマクロブロックパターン(macroblock pattern)、量子化ステップ(quantization step)を決定するインデックスである量子化パラメータ(quantization parameter)、インター予測モードで参照されるフレームの番号を表す参照フレームインデックス、およびモーションベクタはExp_Golombによって符号化される。そして、元のイメージと予測イメージ間の差異を表す残差データ(residual data)はCAVLCによって符号化される。
反面、前記entropy_coding_modeフラッグが1である場合には、前記すべてのパラメータはCABACでコーディングされる。
CABACは高い複雑性(high complexity)を有するパラメータで良い性能を表す。したがって、CAVLCなどのVLC(Variable Length Coding)基盤のエントロピコーディングは基礎的なプロファイルとして設定される。
J RidgeおよびM.Karczewiczによって16番目のJVTミーティングで提出された文書“Variable length code for SVC”(JVT−P056、Poznan、16−th JVT meeting;以下JVT−P056という)にはSVCの特性を考慮したCAVLC技法を提示している。JVT−P056は、離散階層(discrete layer)では既存のH.264と同一な処理過程にしたがうが、FGS階層(Fine Granular Scalability layer)では別途の統計的特性にともなうVLC技法を使用する。
現在、JSVM(Joint Scalable Video Model)では、FGSエンコーディングのため、3種類のスキャニングパス(scanning pass)を支援しているが、それは重要パス(significance pass)、リファインメントパス(refinement pass)、および残余パス(remainder pass)である。それぞれのスキャニングパスに対し、その統計的特性によって互いに異なる方法が適用される。例えば、リファインメントパスではエントロピコーディングにおいて“0”値がより好まれるという事実に基づいて得られる一つのVLCテーブルを利用される。
JVT−P056ではFGS階層のためVLC技法を提示する。前記技法は離散階層では従来のCAVLC技法をそのまま使用するが、FGS階層での統計的特性を利用した別途の技法を使用する。ところで、JVT−P056は前記3つのスキャニングパスのうち、リファインメントパスでリファインメント係数(リファインメントビット)をコーディングするにおいて、4個のリファインメントビットを単位でグループ化(grouping)してシンボルを形成し、前記シンボルを一つのVLCテーブルを利用する符号化する技法を提示している。しかし、複数のFGS階層は階層別に互いに異なる“0”の分布を有していることを考慮すれば、固定された個数(4個)でグループ化されたシンボルを符号化することは効率的な方法であるとはいえない。
図1はリファインメントパスにおいて単一VLCテーブルを使用する場合にFGS階層別に0ではない係数の比率を表したのである。図1から見れば、FGS階層が増加するほどコーディングされるブロックのうち0ではない数は最大15%まで増加(0は最大15%まで減少)される特性がある。したがって、0の数が多いものと仮定して4個単位でリファインメント係数をグループ化する方法が、たとえ第1FGS階層では効率的に適用され得るとしても、その上位FGS階層でも相変らず効率的に適用され得ると期待しがたいものである。むしろ、各FGS階層ごとに互いに異なるグループ化単位(grouping unit)およびこれに適合したVLCテーブルを適応的に(adaptively)適用した方がコーディングの効率面でより有利であろう。
本発明は前記した必要性を考慮して考案されたものであって、スキャニングパスのうちリファインメントパス(refinement pass)において、各FGS格別特性にしたがって適応的にグループ化単位およびこれに相応するVLCテーブルを選択できるようにすることによって、エントロピコーディングの性能を向上させる方法および装置を提供することを目的とする。
本発明の目的は前記言及した目的に制限されず、言及されていないまた他の目的は次の記載から当業者に明確に理解され得るであろう。
前記した目的を達成するために、一つの離散階層と少なくとも一つ以上のFGS階層から成る係数のうち前記FGS階層の第1係数を無損失符号化する可変長符号化方法において、前記第1係数が属する所定の単位領域に含まれた0の比率を算出する段階、前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する段階、前記第1係数の絶対値を前記選択されたグループ化単位でグループ化する段階、および前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記グループ化された第1係数の絶対値をマッピングされるコードワード(codeword)に変換する段階を含む。
前記した目的を達成するため、入力されたビットストリームのうちFGS階層の第1ビットストリームを無損失復号化して前記FGS階層に対する第1係数を復元する可変長復号化方法において、前記第1係数が属する所定の単位領域に含まれた既復元された第2係数のうち0の比率を算出する段階、前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する段階、および前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記第1ビットストリームに含まれたコードワードから前記第1係数を復元する段階を含む。
前記した目的を達成するため、入力されたビットストリームのうちFGS階層の第1ビットストリームを無損失復号化して前記FGS階層に対するリファインメントビット(refinement coefficients)を復元する可変長復号化方法において、前記第1ビットストリームに所定の単位領域ごとに挿入されているグループ化単位に関する情報を判読する段階、前記グループ化単位に相応するVLCテーブルをローディングする段階、および前記ローディングされたVLCテーブルを参照し、前記第1ビットストリームに含まれたコードワードから前記第1係数を復元する段階を含む。
前記した目的を達成するため、一つの離散階層と少なくとも一つ以上のFGS階層から成る係数のうち前記FGS階層の第1係数を無損失符号化する可変長符号化装置において、前記第1係数が属する所定の単位領域に含まれた0の比率を算出する手段、前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する手段、前記第1係数の絶対値を前記選択されたグループ化単位でグループ化する手段、および前記選択されたグループ化単位に相応するVLCテーブルを参照して、前記グループ化された第1係数の絶対値をマッピングされるコードワードに変換する手段を含む。
前記した目的を達成するため、入力されたビットストリームのうちFGS階層の第1ビットストリームを無損失復号化して前記FGS階層に対する第1係数を復元する可変長復号化装置において、前記第1係数が属する所定の単位領域に含まれた既復元された第2係数のうち0の比率を算出する手段、前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する手段、および前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記第1ビットストリームに含まれたコードワードから前記第1係数を復元する手段を含む。
以下、添付された図面を参照して本発明の好ましい実施形態を詳細に説明する。本発明の利点および特性、そしてそれらを達成する方法は添付される図面と共に詳細に後述されている実施形態を参照すれば明確になるだろう。しかし本発明は以下で開示される実施形態に限定されるものではなく互いに異なる多様な形態で具現されるものであり、単に本実施形態は本発明の開示を完全にし、本発明が属する技術分野で通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は請求項の範囲によってのみ定義される。明細書全体にかけて同一参照符号は同一構成要素を指称する。
一般的に、複数のFGS階層のうち上位階層に行くほど、0の個数は増加し、同一なFGS階層内でもフレーム、スライス(slice)、マクロブロック、またはブロック別に前記0の個数の分布が同一なものであると見がたい。したがって、本発明は一つの単位領域(フレーム、スライス、マクロブロック、またはブロック)に含まれる0の個数を基準に、互いに異なるグループ化単位(grouping unit)およびこれに相応するVLCテーブルを選択することが可能であるようにする。前記グループ化単位とは、シンボル(symbol)を形成するリファインメントビットの数を意味する。
図2は量子化係数が一つの離散階層と複数のFGS階層に分離され表示される例を図示する図である。図2において、各階層は4×4単位の係数から成るブロックで表示されている。対応される位置にある数字は組み合わせられ一つの量子化係数を表す。ビット率を減らすためには、前記階層を上位階層から切り出せば(truncation)できる。もちろん一つの階層のうち一部の数字だけを切り捨てることもできる。
例えば、各階層で4×4ブロックのうち1行の2列に位置する係数は各々3、−1、1である。この位置に対応される量子化係数を正しく復元するためにはこれらの係数すべてが必要とされるが、状況によっては1または、1および−1は切り出され得て、デコーダ段では相対的に重要な下位階層の係数だけで前記量子化係数を復元するようになる(もちろん、損失が発生する)。
FGS階層は離散階層とはその特性が非常に相異なる。なぜなら、離散階層は多少ラフ(rough)であるが、元のイメージを表現していることに反して、FGS階層は差分(difference)概念を有する値で構成されているからである。また、離散階層では0、1、−1以外の他の値も表れる反面、FGS階層ではその特性上0、1、−1だけで表現されるのが一般的である。
重要パスでコーディングされるFGS階層の係数はその対応される離散階層の係数が0である時であり、リファインメントパスでコーディングされるFGS階層上の係数はその対応される離散階層の係数が0ではない時である。例えば、第1FGS階層で陰影で表示されたビット(リファインメントビット)はリファインメントパスでコーディングされる。
本発明による階層別適応的VLC技法は特に、前記リファインメントパスに適用するに適している。離散階層の係数をVLCコーディングする場合には、Level、Trailing Onesなどをすべて考慮してコーディングするのが好ましい。しかしリファインメント係数の場合にはこれらを考慮する必要がないため、より簡単なVLCコーディング技法が必要である。
図3は本発明の一実施形態によるリファインメント係数エンコーダ100の構成を図示するブロック図である。
選択部120は既コーディングされた単位領域のリファインメントビットを参照し、グループ化部110で使用されるグループ化単位を決定する。前記単位領域は前記入力リファインメントビットが属するフレーム、スライス、マクロブロック、またはブロックと成り得る。
一旦、現在リファインメントビットが属する単位領域が決まれば、選択部120は前記単位領域に属するビットのうち0の個数をカウントする。それで、前記ビットのうち0が占める比率が所定の臨界値を越えれば、従来のJVT−P056で提示したとおり、グループ化単位を4とする。しかし前記比率が前記臨界値を越えなければグループ化単位を3とする。
コーディングするビットのうち0の個数が多ければ、いくつかの0をまとめ一つの短いコードワードで表現することができるため、グループ化単位を大きくした方が有利である。反面、0の個数が小さければ相対的にグループ化単位を小さくした方が有利である。
本発明において、選択部120でグループ化単位を調節することは、このような点を考慮したものである。
以上の例では1個の臨界値および2個のグループ化単位を使用するものを例にあげたが、本発明はこれに限らない。一般的に、n(nは自然数)個の臨界値およびn+1個のグループ化単位を使用できることは当業者ならば十分に理解できるであろう。前記臨界値は経験的または実験的に決定され得る値として、例えば、7/8、3/4、2/3等で決定され得る。
選択部120はこのように、グループ化単位を決定すれば、テーブル保存部140に保存されたVLCテーブルのうちそれに相応するVLCテーブルをサイズコーディング部130に提供する。グループ化単位が異なればそれに応じてVLCテーブルも当然変わらなければならないからである。
グループ化単位が4である場合には従来のJVT−P056で提示した次の表(2)のようなVLCテーブルがサイズコーディング部130に提供され、グループ化単位が3である場合には本発明で例示する次の表(3)のようなVLCテーブルがサイズコーディング部130に提供される。表(2)および表(3)でシンボルは4個ずつグループ化されたリファインメントビット列の絶対値であり、コードワードは前記シンボルがマッピングされる結果値である。
Figure 2009506710
Figure 2009506710
一方、コーディングしようとする入力リファインメントビットはグループ化部110に入力される。グループ化部110は入力されたリファインメントビットを選択部120から提供されたグループ化単位でグループ化する。そして、グループ化されたリファインメントビットの絶対値(1または0)はサイズコーディング部130に提供し、その符号(sign)(0を除いたリファインメントビットの符号)は符号コーディング部150に提供する。
テーブル保存部140はVLCテーブルを保存し、選択部120で選択されたグループ化単位に対応されるVLCテーブルをサイズコーディング部130に提供する。テーブル保存部140はロム(ROM)、プログラマブルロム(PROM)、消去可能ロム(EPROM)、電気的消去可能ロム(EEPROM)、フラッシュメモリのような非揮発性メモリ素子またはラム(RAM)のような揮発性メモリ素子、ハードディスクのような保存媒体、またはその他該当分野で知られている任意の他の形態で具現され得る。
サイズコーディング部130はテーブル保存部140から提供されるVLCテーブルを参照し、グループ化部110から提供されるグループ化されたリファインメントビットの絶対値すなわち、シンボルをコードワードに変換する。
符号コーディング部150はグループ化部110から提供される符号を1ビットの符号コードでコーディングする。通常、前記符号コードは陽の符号の場合は0であり、陰の符号の場合は1である。
最後に、Mux(multiplexer;360)はサイズコーディング部130から出力されるコードワードの集合と、符号コーディング部150から出力される符号コードの集合を多重化(multiplexing)してビットストリームを生成する。
例えば、現在コーディングするリファインメントビットの集合が{−1、0、1、1、0、0、1、−1}とし、リファインメント係数エンコーディング過程を説明する。選択部120は単位領域のリファインメントビットのうち0が占める比率が所定の臨界値を越えない場合にはグループ化単位を3に選択する。この時、グループ化部110は前記リファインメントビットの集合を3個ずつグループ化し、その絶対値である101、100、および110(11の次に追加された0は単位を合わせるためのものである)はサイズコーディング部130に、その符号である{−+++−}は符号コーディング部150に提供する。
サイズコーディング部130はテーブル保存部140から前記表(3)のようなVLCテーブルを提起され、これを参照して前記101、100、および110を対応されるコードワードに変換する。変換した結果、サイズコーディング部130から出力されMux160に入力される値は1011001101となる。一方、符号コーディング部150は前記符号{−+++−}を10001に変換する。前記変換された10001に対して、ラン−レベル(run−level)コーディング方式を追加的に適用することも可能である。そうすれば、Mux160は前記1011001101および前記10001を結合して出力する。
一方、選択部120は単位領域のリファインメントビットのうち0が占める比率が所定の臨界値を越える場合にはグループ化単位を4と選択する。この時、グループ化部110は前記リファインメントビットの集合を4個ずつグループ化して、その絶対値である1011、および0011はサイズコーディング部130に、その符号である{−+++−}は符号コーディング部150に提供する。
サイズコーディング部130はテーブル保存部140から前記表(2)のようなVLCテーブルを提起され、これを参照して前記1011および0011を対応されるコードワードに変換する。変換した結果、サイズコーディング部130から出力されてMux160に入力される値は11110111000となる。一方、符号コーディング部150は前記符号{−+++−}を10001に変換する。前記変換された10001に対してラン−レベル(run−level)コーディング方式を追加的に適用することも可能である。そうすれば、Mux160は前記11110111000および前記10001を結合して出力する。
図4は図3のリファインメント係数エンコーダ100に対応されるリファインメント係数デコーダ200の構成を図示するブロック図である。入力されたビットストリームはDemux(demultiplexer;410)によってコードワードの集合と、符号コードの集合に分離される。前記コードワードの集合はサイズデコーディング部230に前記符号コードの集合は符号デコーディング部250に各々提供される。
前記エンコーダ100と同様に、選択部220は既復元された単位領域に含まれたリファインメントビットのうち0が占める比率を計算してそれが前記臨界値を越えるのかの可否にしたがって2個のグループ化単位のうち一つを選択する。もちろん、ここでも複数の臨界値を設定し、3個以上のグループ化単位のうち一つを選択することも可能である。
サイズデコーディング部230は前記選択されたグループ化単位に相応するVLCテーブル表(2)または表(3)をテーブル保存部240から読み込んだ後、前記VLCテーブルのコードワードと同一な値が表れる時まで、前記コードワードの集合を構成するビットを追加的に読み込む。もし、読み込んだいかなる個数の前記ビットが前記選択されたVLCテーブルに含まれたいかなるコードワードと一致すれば、前記一致したコードワードはそれに対応されるシンボルを復元する。
前記復元されたシンボルは符号デコーディング部250に提供される。符号デコーディング部250はDemux210から提供された符号コードを一つずつ読み込み、サイズデコーディング部230から提供されるシンボルのうち0ではない値(すなわち、1)に順に前記符号コードに値する符号を付与する。これで、前記ビットストリームから現在リファインメントビットが復元される。
例えば、デコーダ200に入力されるビットストリームが1111011100010001であると仮定しよう。Demux210は前記ビットストリームで11110111000および10001を分離し、前者はサイズデコーディング部230に提供し、後者は符号デコーディング部250に提供する。一方、選択部220は既復元された単位領域のリファインメントビットのうち0の個数が臨界値を越えることを確認し、テーブル保存部240をして表(2)のVLCテーブルをデコーディング部230に提供するようにする。
サイズデコーディング部230は前記11110111000を1ビットずつ読み込み、表(2)のコードワードのうち一致するコードワードがあるかを確認する。11110までは一致するコードワードがないため、その次に111101を確認するが、このコードワードが前記表(2)に存在するため、これと対応されるシンボル1011を復元する。同様に残りビット11000から0011を復元する。したがって、サイズデコーディング部230から出力されて符号デコーディング部250に入力される値は10110011である。
符号デコーディング部250は提供された10001に対応される符号である−+++−を復元した後、これを前記入力される10110011のうち0ではない値に付与する。その結果、最初にエンコーダ100に入力されたリファインメントビットの集合である{−1、0、1、1、0、0、1、−1}が復元される。
以上では、リファインメント係数デコーダ200においても前記エンコーダ100と同様の過程を経て複数のグループ化単位のうち一つを選択することで説明した。ところで、FGS階層はデコーダ200に伝達される時、一部が切られて(truncated)伝送されることもあるため、現在ブロックが含まれる単位領域内の周辺特性を利用する場合、エンコーダとデコーダ間に互いに異なるグループ化単位が選択される可能性がなくもない。
したがって、本発明の他の実施形態において、リファインメント係数エンコーダ100から選択されたグループ化単位をビットストリームに含み、リファインメント係数デコーダ200に伝達する。前記グループ化単位は単位領域、すなわちフレーム、スライス、マクロブロック、またはブロック単位で選択されるが、あまりにも細かい単位でVLCテーブルを選択する場合、伝送時オーバーヘッドが大きくなり得るため、前記単位領域はスライスまたはマクロブロックの程度が適当である。この場合前記選択されたVLCテーブルを指示するトークンはスライスヘッダーまたはマクロブロックヘッダーに含まれて伝送され得る。
前記トークンが含まれたビットストリームを受信したリファインメント係数デコーダ200は前記グループ化単位に該当するVLCテーブルをテーブル保存部240から直ちに持って来ることができるため、選択部220は省略され得る。
図5は図3でのようなエントロピエンコーダが適用され得る多階層基盤のビデオエンコーダ1000の構成を図示するブロック図である。
元来のビデオシーケンスは向上階層エンコーダ600に入力され、同時にダウンサンプリング部550によってダウンサンプリング(階層間に解像度の変化がある場合に限る)された後、基礎階層エンコーダ500に入力される。
予測部610は現在マクロブロックで所定の方法で予測されたイメージを差分することによって残差信号を求める。前記予測方法では方向的イントラ予測、インター予測、イントラベース予測、および残差予測などがある。
変換部620は前記求めた残差信号をDCT、ウェーブレット変換など空間的変換技法を利用して変換し、変換係数を生成する。
量子化部630は前記変換係数を所定の量子化ステップで量子化して(量子化ステップが大きいほどデータの損失ないし圧縮率が高い)量子化係数を生成する。
向上階層エンコーダ600と同様に、基礎階層エンコーダ500も同一な機能の予測部510、変換部520、および量子化部530を含む。ただし、予測部510はイントラベース予測や残差予測は使用することができないであろう。
エントロピエンコーダ640は前記量子化係数を無損失符号化して向上階層ビットストリームを出力し、同様にエントロピエンコーダ540は基礎階層ビットストリームを出力する。Mux650は向上階層ビットストリームと基礎階層ビットストリームを結合してビデオデコーダ段に伝送するビットストリームを生成する。
前記エントロピエンコーダ640は図3のリファインメント係数エンコーダ100を含み得る。リファインメント係数エンコーダ100として動作されるエントロピエンコーダ640は、FGS階層の量子化係数中でも対応される離散階層の係数が0である係数、すなわちリファインメントビットを無損失符号化する。この時、エントロピエンコーダ640は量子化部630から単位領域に含まれるリファインメントビットを提起される。
図6は図4でのようなエントロピデコーダが適用され得る多階層基盤のビデオデコーダ(2000)の構成を図示するブロック図である。
入力されるビットストリームはDemux860をとおし向上階層ビットストリームおよび基礎階層ビットストリームに分離され向上階層エンコーダ800および基礎階層デコーダ700に各々提供される。
エントロピデコーダ810はエントロピエンコーダ640と対応される方式で無損失復号化を遂行して量子化係数を復元する。
逆量子化部820は前記復元された量子化係数を量子化部630で使用された量子化ステップで逆量子化する。
逆変換部830は前記逆量子化された結果を逆DCT変換、逆ウェーブレット変換などの逆空間的変換技法を使用して逆変換する。
逆例側部840は予測部610で求めた予測イメージを同一な方式で求め、前記求めた予測イメージを前記逆変換された結果と加算することによってビデオシーケンスを復元する。
向上階層デコーダ800と同様に、基礎階層デコーダ700も同一な機能のエントロピデコーダ710、逆量子化部720、逆変換部730、および逆予測部740を含む。
前記エントロピデコーダ810は図4のリファインメント係数デコーダ200を含み得る。リファインメント係数デコーダ200として動作されるエントロピデコーダ810は、FGS階層の量子化係数中でも対応される離散階層の係数が0である係数、すなわちリファインメントビットを無損失符号化する。この時、エントロピデコーダ810は既エントロピデコーディングされた単位領域に含まれるリファインメントビットを利用する。
今まで図2ないし図6の各構成要素はメモリ上の所定領域で遂行されるタスク(task)、クラス(glass)、サブルーチン(sub−routine)、プロセス(process)、オブジェクト(object)、実行スレッド(execution thread)、プログラム(program)のようなソフトウェア(software)や、FPGA(field−programmable gate array)やASIC(application−specific integrated circuit)のようなハードウェア(hardware)で具現されることができ、また前記ソフトウェアおよびハードウェアの組合せで形成され得る。前記構成要素はコンピュータで判読可能な保存媒体に含まれることもあり、複数のコンピュータにその一部が分散されて分布され得る。
以上添付された図面を参照して本発明の実施形態を説明したが、本発明が属する技術分野で通常の知識を有する者は本発明がその技術的思想や必須の特性を変更せず、他の具体的な形態で実施され得ることを理解できるであろう。したがって以上で記述した実施形態はすべての面で例示的なものであり、限定的ではないものとして理解しなければならない。
前記した本発明の構成によれば、多階層基盤のビデオコーデックにおいてエントロピコーディングの性能を向上させることができる。これによって、与えられたビット内でより向上したビデオ画質を提供することができる。
単一VLCテーブルを使用する場合、0ではない係数の比率を各FGS階層別に示す図である。 量子化係数が一つの離散階層と少なくとも一つ以上のFGS階層で分離して表示される例を図示した図である。 本発明の一実施形態によるリファインメント係数エンコーダの構成を図示したブロック図である。 本発明の一実施形態によるリファインメント係数デコーダの構成を図示したブロック図である。 図3のようなエントロピエンコーダが適用され得る多階層基盤のビデオエンコーダの構成を図示したブロック図である。 図4のようなエントロピデコーダが適用され得る多階層基盤のビデオデコーダの構成を図示したブロック図である。

Claims (18)

  1. 一つの離散階層と少なくとも一つ以上のFGS階層から成る係数のうち前記FGS階層の第1係数を無損失符号化する可変長符号化方法において、
    前記第1係数が属する所定の単位領域に含まれた0の比率を算出する段階と、
    前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する段階と、
    前記第1係数の絶対値を前記選択されたグループ化単位でグループ化する段階、および
    前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記グループ化された第1係数の絶対値をマッピングされるコードワードに変換する段階を含む前記方法。
  2. 前記第1係数と対応される前記離散階層の係数は0ではない請求項1に記載の前記方法。
  3. 前記第1係数は、
    −1、0、または1のうちの一つの値を有する請求項2に記載の前記方法。
  4. 前記第1係数のうち0ではない係数の符号をコーディングする段階をさらに含む請求項1に記載の前記方法。
  5. 前記複数のグループ化単位の数は前記臨界値の個数に比べて1がより大きい請求項1に記載の前記方法。
  6. 前記変換されたコードワードから成るビットストリームに前記選択されたグループ化単位を挿入する段階をさらに含む請求項1に記載の前記方法。
  7. 前記単位領域は、
    フレーム、スライス、マクロブロック、およびブロックのうち一つである請求項1に記載の前記方法。
  8. 前記複数のグループ化単位は3および4を含む請求項1に記載の前記方法。
  9. 入力されたビットストリームのうちFGS階層の第1ビットストリームを無損失復号化して、前記FGS階層に対する第1係数を復元する可変長復号化方法において、
    前記第1係数が属する所定の単位領域に含まれた既復元された第2係数のうち0の比率を算出する段階と、
    前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する段階、および
    前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記第1ビットストリームに含まれたコードワードから前記第1係数を復元する段階を含む前記方法。
  10. 前記復元する段階は、
    前記コードワードに対応される前記第1係数の絶対値を復元する段階、および
    前記第1ビットストリームに含まれた符号コードから符号を復元し、前記復元された符号を前記第1係数の絶対値に付加することによって前記第1係数の符号を復元する段階を含む請求項9に記載の前記方法。
  11. 前記第1係数はリファインメントビットである請求項9に記載の前記方法。
  12. 前記第1係数は、
    −1、0、または1のうち一つの値を有する請求項9に記載の前記方法。
  13. 前記複数のグループ化単位の数は前記臨界値の個数に比べて1だけ大きい請求項9に記載の前記方法。
  14. 前記単位領域は、
    フレーム、スライス、マクロブロック、およびブロックのうち一つの請求項9に記載の前記方法。
  15. 入力されたビットストリームのうちFGS階層の第1ビットストリームを無損失復号化し、前記FGS階層に対するリファインメントビットを復元する可変長復号化方法において、
    前記第1ビットストリームに所定の単位領域ごとに挿入されているグループ化単位に関する情報を判読する段階と、
    前記グループ化単位に相応するVLCテーブルをローディングする段階、および
    前記ローディングされたVLCテーブルを参照し、前記第1ビットストリームに含まれたコードワードから前記第1係数を復元する段階を含む前記方法。
  16. 前記単位領域は、
    フレーム、スライス、マクロブロック、およびブロックのうち一つの請求項15に記載の前記方法。
  17. 一つの離散階層と少なくとも一つ以上のFGS階層から成る係数のうち前記FGS階層の第1係数を無損失符号化する可変長符号化装置において、
    前記第1係数が属する所定の単位領域に含まれた0の比率を算出する手段と、
    前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する手段と、
    前記第1係数の絶対値を前記選択されたグループ化単位でグループ化する手段、および
    前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記グループ化された第1係数の絶対値をマッピングされるコードワードに変換する手段を含む前記装置。
  18. 入力されたビットストリームのうちFGS階層の第1ビットストリームを無損失復号化して前記FGS階層に対する第1係数を復元する可変長復号化装置において、
    前記第1係数が属する所定の単位領域に含まれた既復元された第2係数のうち0の比率を算出する手段と、
    前記比率が所定の臨界値を越えるのかの可否にしたがって複数のグループ化単位のうち一つを選択する手段、および
    前記選択されたグループ化単位に相応するVLCテーブルを参照し、前記第1ビットストリームに含まれたコードワードから前記第1係数を復元する手段を含む前記装置。
JP2008528961A 2005-09-26 2006-09-25 エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置 Pending JP2009506710A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US71996705P 2005-09-26 2005-09-26
KR1020060003321A KR100714706B1 (ko) 2005-09-26 2006-01-11 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
PCT/KR2006/003812 WO2007035070A1 (en) 2005-09-26 2006-09-25 Method and apparatus for enhancing performance of entropy coding, and video coding method and apparatus using the entropy coding performance enhancing method

Publications (1)

Publication Number Publication Date
JP2009506710A true JP2009506710A (ja) 2009-02-12

Family

ID=37889075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008528961A Pending JP2009506710A (ja) 2005-09-26 2006-09-25 エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置

Country Status (3)

Country Link
EP (1) EP1929782A4 (ja)
JP (1) JP2009506710A (ja)
WO (1) WO2007035070A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009531990A (ja) * 2006-03-27 2009-09-03 クゥアルコム・インコーポレイテッド 映像圧縮におけるリファインメント係数符号化のための方法及び装置
JP2010507283A (ja) * 2006-10-12 2010-03-04 クゥアルコム・インコーポレイテッド リファインメント係数符号化のためのビデオブロックに基づいた可変長符号化テーブル選択
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
US8599926B2 (en) 2006-10-12 2013-12-03 Qualcomm Incorporated Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
US9319700B2 (en) 2006-10-12 2016-04-19 Qualcomm Incorporated Refinement coefficient coding based on history of corresponding transform coefficient values

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2335245B1 (en) 2008-09-28 2015-01-07 Ramot at Tel-Aviv University Ltd. Method and system for adaptive coding in flash memories
US8671327B2 (en) 2008-09-28 2014-03-11 Sandisk Technologies Inc. Method and system for adaptive coding in flash memories
GB2465809B (en) * 2008-12-01 2012-12-12 Advanced Risc Mach Ltd Dynamic selection of suitable codes for variable length coding and decoding
CN106254888B (zh) 2015-06-09 2020-06-02 同济大学 一种图像编码及解码方法、图像处理设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007039795A1 (en) * 2005-10-03 2007-04-12 Nokia Corporation Adaptive variable length codes for independent variables

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690307B2 (en) * 2002-01-22 2004-02-10 Nokia Corporation Adaptive variable length coding of digital video
US7099387B2 (en) * 2002-03-22 2006-08-29 Realnetorks, Inc. Context-adaptive VLC video transform coefficients encoding/decoding methods and apparatuses
US6646578B1 (en) * 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007039795A1 (en) * 2005-10-03 2007-04-12 Nokia Corporation Adaptive variable length codes for independent variables

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009531990A (ja) * 2006-03-27 2009-09-03 クゥアルコム・インコーポレイテッド 映像圧縮におけるリファインメント係数符号化のための方法及び装置
JP2010507283A (ja) * 2006-10-12 2010-03-04 クゥアルコム・インコーポレイテッド リファインメント係数符号化のためのビデオブロックに基づいた可変長符号化テーブル選択
US8325819B2 (en) 2006-10-12 2012-12-04 Qualcomm Incorporated Variable length coding table selection based on video block type for refinement coefficient coding
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
US8599926B2 (en) 2006-10-12 2013-12-03 Qualcomm Incorporated Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
US9319700B2 (en) 2006-10-12 2016-04-19 Qualcomm Incorporated Refinement coefficient coding based on history of corresponding transform coefficient values

Also Published As

Publication number Publication date
EP1929782A4 (en) 2012-03-21
WO2007035070A1 (en) 2007-03-29
EP1929782A1 (en) 2008-06-11

Similar Documents

Publication Publication Date Title
JP4834732B2 (ja) エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置
JP4589290B2 (ja) ある階層のフラグを階層間の連関性を用いて符号化する方法、前記符号化されたフラグを復号化する方法、及び装置
US11750841B2 (en) Methods and apparatuses for coding transform blocks
KR100714706B1 (ko) 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
KR100809298B1 (ko) 플래그 인코딩 방법, 플래그 디코딩 방법, 및 상기 방법을이용한 장치
JP2009506710A (ja) エントロピコーディングの性能向上方法および装置、前記方法を利用したビデオコーディング方法および装置
US7348903B2 (en) Method and apparatus for enhancing performance of entropy coding, and video coding method and apparatus using the entropy coding performance enhancing method
JP4540585B2 (ja) 符号化装置及び復号化装置
KR100736096B1 (ko) 비디오 신호를 그룹별로 인코딩 및 디코딩하는 방법 및장치
KR101041973B1 (ko) 플래그 부호화 방법, 플래그 복호화 방법, 및 상기 방법을이용한 장치
KR20070077059A (ko) 엔트로피 부호화/복호화 방법 및 장치
KR100772870B1 (ko) Fgs 계층의 블록에 포함되는 계수의 특성에 따라 비디오신호를 부호화하고 복호화하는 방법 및 장치
US20070071088A1 (en) Method and apparatus for entropy encoding and entropy decoding fine-granularity scalability layer video data
KR100834757B1 (ko) 엔트로피 부호화 효율을 향상시키는 방법 및 그 방법을이용한 비디오 인코더 및 비디오 디코더
KR100763192B1 (ko) Fgs 계층의 비디오 데이터를 엔트로피 부호화 및복호화하는 방법 및 장치
WO2007029945A1 (en) Method and apparatus for enhancing performance of entropy coding, video coding method and apparatus using the method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110502

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120322

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120330

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20120622