JP2019531026A - ピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスのコンテキスト適応型二進算術コード化のための方法及びデバイス - Google Patents

ピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスのコンテキスト適応型二進算術コード化のための方法及びデバイス Download PDF

Info

Publication number
JP2019531026A
JP2019531026A JP2019517817A JP2019517817A JP2019531026A JP 2019531026 A JP2019531026 A JP 2019531026A JP 2019517817 A JP2019517817 A JP 2019517817A JP 2019517817 A JP2019517817 A JP 2019517817A JP 2019531026 A JP2019531026 A JP 2019531026A
Authority
JP
Japan
Prior art keywords
context
size
block
picture
picture block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019517817A
Other languages
English (en)
Other versions
JP2019531026A5 (ja
JP7195251B2 (ja
Inventor
ルリアネック,ファブリス
ラス,ガガン
アーバン,ファブリス
Original Assignee
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターデジタル ヴイシー ホールディングス, インコーポレイテッド, インターデジタル ヴイシー ホールディングス, インコーポレイテッド filed Critical インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Publication of JP2019531026A publication Critical patent/JP2019531026A/ja
Publication of JP2019531026A5 publication Critical patent/JP2019531026A5/ja
Application granted granted Critical
Publication of JP7195251B2 publication Critical patent/JP7195251B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本原理は、ピクチャブロックに属するピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスをコンテキスト適応型二進算術コード化/復号するための方法デバイスに関する。上記方法が、バイナリシンボルのシーケンスのうちの各バイナリシンボルに対し、ピクチャブロックのサイズ及びコード化予定のバイナリシンボルに従ってコンテキストを決定すること(110)と、上記決定されたコンテキストを考慮して上記バイナリシンボルを算術コード化/復号すること(120)とを含む方法において、上記コンテキストを決定すること(110)が、上記ピクチャブロックのサイズが2の累乗である際は、上記ピクチャブロックのサイズに従ってコンテキストを決定すること(910)と、上記ピクチャブロックのサイズが2の累乗ではない際は、上記ピクチャブロックのサイズのすぐ上の又は下のブロックサイズに従ってコンテキストを決定すること(920)であって、上記ブロックサイズが2の累乗に等しい、決定すること(920)とを含むことを特徴とする。

Description

1.分野
本原理は、概して、ピクチャ/映像符号化に関する。具体的には、本原理の技術分野は、上記ピクチャデータの復号に必要な構文要素を表すバイナリシンボルのシーケンスのコンテキスト適応型二進算術コード化に関する。
2.背景
本項目は、以下で説明及び/又は特許請求される本原理の様々な態様に関連し得る当技術分野の様々な態様を読者に紹介することを意図する。この論考は、本原理の様々な態様をより理解し易くするために背景情報を読者に提供する際に役立つと考えられている。それに従って、これらの説明は、これを踏まえて読み進めるべきであり、先行技術を容認するものとして読み進めるべきではないことを理解すべきである。
以下では、ピクチャデータは、例えば、ピクチャの画素値に関するすべての情報や、ピクチャを視覚化及び/又は復号するためのディスプレイ及び/又は他の任意のデバイスによって使用することができるすべての情報を指定する特定の映像フォーマットの1つ又はいくつかのサンプルアレイ(画素値)を含む。静止ピクチャ(又は映像のピクチャ)は、第1のサンプルアレイの形状の少なくとも1つの成分(通常、ルマ(又は輝度)成分)を含み、場合により、少なくとも1つの他のサンプルアレイの形状の少なくとも1つの他の成分(通常、色成分)を含む。或いは、同等に、同じ情報は、従来の3色RGB表現など、1組のカラーサンプルアレイによって表すこともできる。
画素値は、C値のベクトルによって表すことができるピクチャデータであり、Cは、成分の数である。ベクトルの各値は、ビット数で表され、ビット数は、画素値の最大ダイナミックレンジを定義する。
一般的に言えば、ピクチャブロックは、ピクチャデータの要素又はピクチャデータに関する構文要素のセットを表す。例えば、ピクチャブロックは、ピクチャに属する画素のセットである。
映像コード化デバイスは、空間及び時間冗長性を利用することによってピクチャデータを圧縮することを試みることができる。例えば、映像エンコーダは、近隣のブロック(以前にコード化済みのブロック)に関してピクチャブロックをコード化することによって、空間冗長性を利用することができる。同様に、映像エンコーダは、以前にコード化済みのピクチャのデータに関してピクチャブロックをコード化することによって、時間冗長性を利用することができる。具体的には、映像エンコーダは、空間的な近隣のブロックのデータから又は以前にコード化済みのピクチャのデータから現在のピクチャブロックを予測することができる。次いで、映像エンコーダは、ピクチャブロックに対する実際の画素値とピクチャブロックに対する予測画素値との差として、ピクチャブロックに対する残差を計算することができる。それに従って、ピクチャブロックに対する残差は、画素(又は空間)領域におけるそれぞれの画素の差の値を含み得る。
次いで、映像エンコーダは、周波数領域における比較的小さな数値の変換済み係数への画素値のエネルギーの圧縮を行うための変換を残差の値に適用することができる。次いで、映像エンコーダは、変換済み係数を量子化し、量子化された変換済み係数を走査し、量子化された変換済み係数の二次元行列を、量子化された変換済み係数を含む一次元ベクトルに変換することができる。次いで、映像エンコーダは、走査済み係数をエントロピー符号化するためにエントロピーコード化プロセスを適用することができる。例示的なエントロピーコード化プロセスは、例えば、コンテキスト適応型可変長コード化(CAVLC)、コンテキスト適応型二進算術コード化(CABAC)、構文ベースコンテキスト適応型二進算術コード化(SBAC)、確率区間区分エントロピー(PIPE)コード化又は他のエントロピー符号化方法を含み得る。
映像デコーダは、映像エンコーダによって実行される符号化技法とは一般的には逆の技法を実行することができる。一般的には逆であるが、映像デコーダは、いくつかの例では、映像エンコーダによって実行されるものと同様の技法を実行することができる。
また、映像エンコーダは、ピクチャデータの復号において映像デコーダによって使用するために、符号化済みのピクチャデータと関連付けられた構文要素をエントロピー符号化することができる。次いで、映像デコーダは、受信されたビットストリームに含まれる構文要素又は他のデータ(映像エンコーダに関して説明されたデータを含む)に依存することができる。
構文要素のいくつかの例によれば、「最終有意係数座標」は、ピクチャブロックと関連付けられた走査順番によるピクチャブロックにおける最終非ゼロ係数の空間位置をデコーダに提供する構文要素である。次いで、ピクチャブロックにおける最終有意係数のx座標をデコーダに提供するために、「最終有意係数x座標」構文要素を符号化し、ピクチャブロックにおける最終有意係数のy座標をデコーダに提供するために、「最終有意係数y座標」構文要素を符号化することができる。「有意係数フラグ」は、ピクチャブロックにおける量子化された変換済み係数がゼロに等しいか否かを示す別の構文要素である。
量子化された変換済み係数のレベルをエントロピーコード化する場合、映像コーダは、量子化された変換済み係数の各々のレベルをエントロピーコード化することができる。例えば、映像コーダは、非ゼロの量子化された変換済み係数の各々の絶対値を二進形式に変換することができる。このように、非ゼロの変換済み係数の各々は、例えば、1つ又は複数のビット又は「ビン」を含む単項コードを使用して、「二進化」することができる。また、量子化された変換済み係数の符号に対するビットも符号化することができる。
それに加えて、映像デコーダがピクチャデータを復号できるようにするために、多くの他の構文要素を含めることができる。例えば、H.264/MPEG−4 AVC(“Advanced video coding for generic audiovisual Services”, SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Recommendation ITU-T H.264, Telecommunication Standardization Sector of ITU, February 2014)及び高効率映像コード化(HEVC)規格(ITU-T H.265 TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU (10/2014), SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Infrastructure of audiovisual services - Coding of moving video, High efficiency video coding, Recommendation ITU-T H.265)で説明されるように、構文要素は、動きベクトル残差、変換単位コード化フラグ、コード化グループコード化フラグ、量子化された変換済み係数の大きさ(1より大きい及び2より大きい)フラグ、SAOデータなどを表し得る。
映像コーダは、ピクチャブロックに対する量子化された変換済み係数又は構文要素(情報)に対応するかどうかにかかわらず、各バイナリシンボルに対する確率推定を使用して、ピクチャデータのブロックに対する各バイナリシンボル(又はビン)をエントロピーコード化することができる。確率推定は、所定の二進値(例えば、「0」又は「1」)を有するバイナリシンボルの尤度を示し得る。確率推定は、「コンテキスト」とも呼ばれる確率モデル内に含めることができる。次いで、映像コーダは、コード化予定のバイナリシンボルに対するコンテキスト(確率モデルを含む)を決定することができる。
構文要素を表すバイナリシンボルのシーケンスのうちのバイナリシンボルに対するコンテキストは、以前にコード化済みの近隣の構文要素の関連バイナリシンボルの値を含み得る。コンテキストは、コンテキストセットに属する場合があり、その場合、コンテキストは、上記コンテキストセット内の上記コンテキストを識別するコンテキストインデックスから得られる。
一例として、ピクチャブロックに属する量子化された変換済み係数に関する有意係数フラグに対するコンテキストは、上記ピクチャブロックのタイプ(例えば、ピクチャブロックサイズ、ルム又はクロマ要素)及びピクチャブロックと関連付けられた走査順番によるピクチャブロック内の上記量子化された変換済み係数の空間位置を含む。
別の例として、ピクチャブロックに対する二進化された残差変換係数の絶対値のバイナリシンボルに対するコンテキストは、絶対値を表す単項コードワード内のバイナリシンボルの空間位置及びピクチャブロックの以前にコード化済みの係数の値を含む。
他の例では、コード化済みブロックパターン(「CBP」)を表すバイナリシンボルのシーケンスのうちのバイナリシンボルに対するコンテキストは、以前にコード化済みの近隣の構文要素(例えば、現在の構文要素の上側及び左側のもの)の関連バイナリシンボルの値を含む。
本原理は、上記の例に限定されず、例えば、H.264/MPEG−4 AVC及び高効率映像コード化(HEVC)規格で定義されるものなどの任意の構文要素及びコンテキストまで拡張される。
いかなる事例においても、各コンテキストに対して異なる確率モデルが定義される。
バイナリシンボルをエントロピーコード化した後、最新の確率推定を反映させるために、コード化済みのバイナリシンボルの値に従って確率モデルを更新することができる。
ピクチャブロックと関連付けられたバイナリシンボルは、1つ又は複数のコード化「パス」においてコード化することができる。例えば、第1のパスの間、映像コーダは、有意係数フラグ及び最終有意係数座標をエントロピーコード化することができる。第2のパスの間、映像コーダは、量子化された変換済み係数レベルの第1のビンをエントロピーコード化することができる。映像コーダは、ピクチャブロックの量子化された変換済み係数と関連付けられたすべての情報がコード化されるまで、コード化パスの実行を続けることができる。
いくつかの例では、映像コーダは、コンテキスト適応型及び非コンテキスト適応型コード化の組合せを使用して、ピクチャブロックのビンをコード化することができる。例えば、1つ又は複数のパスに対し、映像コーダは、通常の算術コード化プロセスを迂回するか又は省略するためにバイパスモードを使用することができる。そのような例では、バイパスコード化済みのビンをコード化するために、固定等確率モデルを使用することができる。バイパスコード化済みのビンは、コンテキスト又は確率更新を含まない。
コンテキスト適応型コード化を実行する際、いくつかの例では、複数のフィードバックループに起因する比較的高い連続依存性が存在し得る。
例えば、バイナリシンボルをコード化するための特定の確率モデルを示すコンテキストは、以前にコード化済みのバイナリシンボル(例えば、以前にコード化済みの構文要素の関連バイナリシンボル)の値による影響を受ける場合がある。
それに加えて、バイナリシンボルをコード化するために使用される確率モデルは、以前にコード化済みのバイナリシンボルの値による影響を受ける場合もある。すなわち、確率モデルは、有限状態機械の状態として維持することができる。特定の状態の各々は、特有の確率値に相当し得る。確率モデルの更新に相当する次の状態は、現在のバイナリシンボル(例えば、現在コード化されているビン)の値に依存し得る。
それに加えて、上記で記述されるように、特定の確率モデルは、有限状態機械の状態として維持することができ、特定の状態の各々は、特有の確率値に相当し得る。確率モデルの更新に相当する次の状態は、現在のバイナリシンボルの値に依存し得る。状態更新と呼ぶことができるそのようなフィードバックループは、演算上のボトルネックを提示し得る。例えば、フィードバックループにおける依存性が原因で、スループットの増大が難しい場合がある。すなわち、あるバイナリシンボルは、以前のバイナリシンボルからの確率モデルが更新されるまで処理されない場合がある。いくつかの例では、同じコンテキストを高い頻度で連続的に(バイナリシンボルごとに)呼び出すことができる。
コンテキスト適応型二進算術コード化(CABAC)は、H.264/MPEG−4及びHEVCで使用されるエントロピー符号化の形態である。
CABACは、ロスレス圧縮技法であるが、CABACが使用される映像コード化規格は、典型的には、ロッシー圧縮用途のためのものである。
図1は、CABACで構文要素を符号化するための一般的なブロック図を示す。
基本的には、CABACは、3つの基本的なステップを含む。
ステップ100では、バイナライザは、所定の非二進値構文要素をバイナリシンボルのシーケンス(ビンストリング)にマッピングする。二進値構文要素が与えられている際は、この初期のステップは、図1に示されるように、迂回される。
ビンストリングの現在のビンの各々に対し又は二進値構文要素の各々に対し、コード化モードに応じて、1つ又は複数の後続のステップが続く場合がある。
いわゆる通常のコード化モードでは、コンテキストモデル化ステップ110に続いて、通常のコード化ステップ120が行われる。
コンテキストモデル化ステップ110では、コンテキストモデラは、コード化予定のビン(通常、いくつかのコンテキストモデルのセットの中からコンテキストモデルを識別するコンテキストインデックス)に従ってコンテキストモデルを選択し、現在のビンがコード化されている時に、同期的にエンコーダ側とデコーダ側の両方で利用可能なコンテキスト情報(以前に符号化済みの構文要素又はコード化済みのバイナリシンボルなど)を考慮して、上記選択されたコンテキストモデルからコンテキストを決定する。次いで、決定されたコンテキストは、現在のビンが特有の値(例えば、「0」)を有する条件付き確率を得るために使用される。
次いで、通常のコード化ステップ120では、決定されたコンテキスト(条件付き確率)及び現在のビンの値s(図1のビン値)は、上記決定されたコンテキストを考慮して現在のビンを算術コード化するエンジンに送られる。こうして、現在のビンのコード化済みの値が得られ、コンテキスト情報を更新するために使用される。これが、図1のコンテキストモデル更新フィードバックループである。コンテキスト情報を更新することは、ビンがコード化されている限り、各ビンに対してコンテキストを更新し、従って、ビンストリングの各ビンに対するコンテキストモデル化を徐々に改善できるようにすることを伴う。従って、CABACエンコーダは、通常の符号化済みのビンの各々の統計的挙動を徐々に学習する。
通常の符号化済みのビット(通常のコード化ステップ120の出力)は、出力ビットストリームに追加される。
或いは、いわゆるバイパスコード化モードは、図1のスイッチの右下のブランチによって示されるように、明示的に割り当てられた確率モデルを使用することなく、簡略化されたコード化エンジンによって符号化(及び復号)プロセス全体を加速させるようにビンをコード化するために選ばれる。バイパスモードは、単に、出力ビットストリームにビットを書き込み、そのように得られたビット値を現在のビンに割り当てるものである。このコード化モードは、単刀直入であり、従って、速いという利点を有する。このコード化モードは、典型的には効率的であり、従って、均一な統計的分布を有する(すなわち、「1」又は「0」に等しくなる確率が等しい)ビンに使用される。
図2は、バイナリシンボルのシーケンスがピクチャブロックに関する有意係数フラグを表す際のCABACコード化の例を示す。
本原理は構文要素を表すバイナリシンボルのいかなるシーケンスにも適用されるため、これは、非限定的な例である。
図2の例では、有意係数フラグ(フラグは、ピクチャブロックの量子化された変換済み係数の各々と関連付けることができる)のブロックを表すピクチャブロック(ここでは、バイナリシンボルの)が表されている。量子化された変換済み係数が0に等しい場合は、このフラグは0に等しく、そうでない場合は、1に等しい)。このピクチャブロックは、特有の走査順番に従って走査される。例えば、点線によって示される走査順番は、ピクチャブロックの右下隅から始まり、ピクチャブロックの左上隅へと進む。バイナリシンボルsをコード化すると想定すると、上記走査順番に従って、バイナリシンボルsに対して以前にいくつかの候補コンテキストCが定義され、各コンテキストCは、候補コンテキストセットの中からコンテキストCを識別したContValiというコンテキストインデックスと関連付けられる。
例えば、バイナリシンボルsに対して、2つの以前にコード化済みの構文要素x1及びx2(有意係数フラグ)から4つの候補コンテキストC(i=1、…4)が定義される。各コンテキストCは、x1及びx2の二進値に従って定義され、ContValiという特有のコンテキストインデックスは、コンテキストの各々に割り当てられる。
例として、図3に示されるように、コンテキストインデックスは、バイナリシンボルsの特有の二進値を表すvalMPS(いわゆる、優勢確率シンボル(MPS))というビットと、確率pを推測する対象となる確率p’(又は状態)を表すpStateIdxというビット(例えば、7ビット)とを含む。
例によれば、コンテキストモデル化ステップ110では、x1及びx2の値に従って、4つの候補コンテキストからコンテキストCsが選択され、ContValsという関連コンテキストインデックスがバイナリシンボルsに割り当てられる。
通常のコード化段階120では、ContValsというインデックスを有する選択されたコンテキストのコンテキストモデルの更新は、図4に示されるプロセスに従って、バイナリシンボルsがMPSに等しいか否かに応じて行われる。
transIdxMPS(バイナリシンボルsがMPSである場合)及びtransIdxLPS(バイナリシンボルsがMPSではない場合、すなわち、劣勢確率シンボル(LPS)である場合)の2つの表を通じてエボリューションが行われる。これらの表は、図5においてpStateIdxというエントリに対して提供されている。
この例に従い、バイナリシンボルsがMPSである確率pMPSは、0から127まで、8ビットで線形量子化される。それは、
pMPS=(p’+64)/127=(pStateIdx+64)/127
によって、選択されたコンテキストインデックスから推測され、シンボルsが1である確率pは、MPSの値に応じてpMPSから明白に推測される。
MPS=1の場合 p=pMPS
MPS=0の場合 p=1-pMPS
コンテキスト適応型コード化は、符号化済みのピクチャデータに関する異なる構文要素の統計に動的に従えるようにする強力なツールである。
従って、ピクチャデータ及び/又はピクチャデータに関する構文要素のエントロピーコード化のためのCABACの使用により、それらの統計をモデル化するために、HEVC/H265の多くのコンテキスト(最大で数百)が広範囲にわたって使用されるようになった。
コンテキストインデックスを選択することは、多くの物事に依存し、従って、構文要素の統計を捕らえるために莫大な数のコンテキストを使用することはよくあることであり、従って、CABACの性能が最適化される。しかし、バイナリシンボルの1つ又は複数のシーケンスのすべてのバイナリシンボルを符号化するため、コンテキストはメモリに格納されるものであるため、コンテキストの数の増加は、メモリ及び処理の複雑性の観点から要件を増加する。それが、構文要素を符号化するためにCABACを実装する映像デコーダの効率的なハードウェア実現可能性を保証するためにコンテキストの数の制限が重要である理由である。
従って、課題の1つは、コンテキストの数をそれほど増加することなく、CABACによって提供される圧縮能力を増大することで利益を得ることである。
図6は、図1の方法に従ってコード化されたビットを含む入力ビットストリームに与えられた構文要素のCABAC復号を描写する一般的なブロック図を示す。入力ビットストリームは、HEVC仕様に準拠し得る。
復号の何れの時点においても、どの構文要素を次に復号すべきかをデコーダは知っていることが想定される。このことは、標準化されたビットストリーム構文及び復号プロセスにおいて完全に指定されている。その上、復号予定の現在の構文要素がどのように二進化されるか(すなわち、ビンストリングとして表され、各ビンは、「1」又は「0」に等しい)及び、各ビンを符号化するために使用されたコード化モードは何か(通常のコード化又はバイパスモード)も想定される。
これらの情報は、考慮される映像圧縮規格H.264又はHEVCにおいて完全に指定されている。
従って、ステップ600では、パーサは、入力ビットストリームからコード化済みのビットを復号する(構文解析する)ことによって、一連のビットを得る。
復号予定の現在のコード化済みのビンの各々に対し、上記現在のコード化済みのビンをコード化するために使用されたコード化モードに応じて、1つ又は複数の後続のステップが続く場合がある。
現在のコード化済みのビンをコード化するためにバイパスコード化モードが使用された際は、バイパス復号ステップ610では、現在のコード化済みのビンの値は、現在のコード化済みのビンの復号済みの値である。
現在のコード化済みのビンをコード化するために通常のコード化モードが使用された際は、コンテキストモデル化ステップ110の後に通常の復号ステップ620が続く。
図1及び6のコンテキストモデル化ステップは、厳密には同じであり、図6の通常の復号ステップ620は、図1の通常のコード化ステップ110とかなり似ている。
通常の復号ステップ620では、現在のコード化済みのビンの復号済みの値は、コンテキストモデル化ステップ110によって与えられたコンテキストから得られる。上記コンテキスト(条件付き確率)及び現在のビットの値は、上記コンテキストを考慮して現在のビンを算術復号するエンジンに送られる。こうして、現在のビンの復号済みの値が得られ、コンテキスト情報を更新するために使用される。これが、図6のコンテキストモデル更新フィードバックループである。コンテキスト情報を更新することは、ビンが復号されている限り、各ビンに対してコンテキストを更新し、従って、各ビンに対するコンテキストモデル化を徐々に改善できるようにすることを伴う。従って、CABACデコーダは、現在のビンのオリジナルの値に等しい現在のコード化済みのビンの復号済みの値を徐々に得る(ロスレス圧縮)。
現在のビンの復号済みの値(バイパス復号ステップ610又は通常の復号ステップ620の出力)が得られる際、現在のビンの復号済みの値は、二進値構文要素又は非二進値構文要素に関するものである。これは、考慮される映像圧縮規格H.264又はHEVCによって指定することができる。次に、現在のビンの復号済みの値が二進値構文要素に関する場合は、CABAC復号は終了し、現在のビンの復号済みの値が非二進値構文要素に関する場合は、デコーダは、ビンの復号済みの値(ステップ620又は610の出力ビンストリング)から構文要素をどのように構築するかを知っている。
次いで、ステップ630では、変換器は、二進化(ステップ100)とは逆のプロセスを適用することによって、上記出力ビンストリングを非二進値構文要素に変換する。
映像圧縮では、ピクチャ全体を単一のピクチャブロックとして符号化することは最適ではなく、コード化木の各葉を符号化する前にピクチャ全体をサブブロックに再帰的に分割することでコード化効率が増大することはよく知られている。
例えば、HEVC規格では、符号化予定のピクチャは、典型的には正方形の形状(64×64、128×128又は256×256画素)を有するコード化木単位(CTU)に分割される。各CTUは、圧縮領域においてコード化木によって表される。コード化木は、CTUの再帰的分割を説明する。コード化木の各葉(コード化単位)は、四分木分割が使用される場合は、正方形の形状を有するが、葉のいくつかは、四分木プラス二分木(QTBT:Quad-tree Plus Binary Tree)分解が使用される際は、長方形の形状も有し得る。より正確に言えば、CTUのQTBT分解は、二段階で構成される(最初に、CTUが四分木形式で分割され、次いで、各四分木葉を二進形式でさらに分割することができる)。このことは、図7の右側に示されており、実線は四分木分解相を表し、破線は四分木葉に空間的に埋め込まれた二進分解を表す。コード化単位の分割は、エンコーダ側でレート歪み最適化手順を通じて決定され、レート歪み最適化手順は、最小レート歪みコストでCTUのQTBT表現を決定するものである。
HEVC規格では、コード化単位のサイズ(すなわち、幅及び高さ)は常に2の累乗であり、典型的には4〜128である。
本発明人は、コード化木がピクチャの空間構造とよりうまく整合し、それにより、より均質的なコンテンツがコード化単位に提供されるため、QTBT分解における非対称分割モードを可能にすることにより、コード化効率が増大されることを見出した。
非対称分割モードは、整数値mの倍数に等しいサイズ(幅及び/又は高さ)のコード化単位を、m・2に等しいサイズ(幅及び/又は高さ)の2つのサブコード化単位に分割するものであり、nは、整数値であり、mは、m・2が2の累乗に等しくならないように選ばれた整数値である。
図8は、mが3に等しい際の4つの非対称分割モードの例を示す。それらの例は、単なる例示のために与えられており、5、7、...などの他のmの値まで拡張することができる。mの倍数に等しいサイズ(幅w及び/又は高さh)のコード化単位の符号化において非対称分割モードを導入することにより、上記非対称分割モードのうちの1つを通じて上記コード化単位を分割することができる。例えば、図8の非対称分割モードHOR_UP(水平上側)に従って3の倍数に等しい幅w及び高さhのコード化単位を分割することにより、それぞれの長方形のサイズ

の2つのサブコード化単位がもたらされることになる。
非対称分割モードが使用される際は、いくつかのコード化単位は、m・2に等しいその幅及び/又はその高さを有する。次いで、2の累乗に等しいサイズのコード化単位の符号化用に最初に設計された通常のHEVCツールを、2の累乗に等しくないコード化単位のこれらの新しいサイズに適応させる必要がある。
本原理によって解決される問題の1つは、コード化設計の最小複雑性増大と共に良い圧縮効率(レート歪み性能)を提供するように、非対称コード化単位に含まれる量子化された変換済み係数をどのように効率的にエントロピー符号化/復号するかである。言い換えれば、課題の1つは、HEVCエントロピー符号化(CABAC)によって使用されるコンテキストの数を増加することなく、非対称分割モードを使用することによって提供される圧縮能力の増大から利益を得ることである。
3.概要
以下は、本原理のいくつかの態様の基本的な理解を提供するために、本原理の簡単な概要を提示する。この概要は、本原理の広範な要約ではない。本原理の重要な又は必須の要素を特定することは意図しない。
以下の概要は、単に、以下で提供されるより詳細な説明の前置きとして、簡略化された形態で、本原理のいくつかの態様を提示する。
本原理は、ピクチャブロックに属するピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスをコンテキスト適応型二進算術コード化/復号するための方法を用いて、先行技術の欠点の少なくとも1つを改善することを目指す。上記方法は、バイナリシンボルのシーケンスのうちの各バイナリシンボルに対し、
− ピクチャブロックのサイズ及びコード化予定のバイナリシンボルに従ってコンテキストを決定することと、
− 上記決定されたコンテキストを考慮して上記バイナリシンボルを算術コード化/復号することと
を含み、上記コンテキストを決定することが、
− 上記ピクチャブロックのサイズが2の累乗である際は、上記ピクチャブロックのサイズに従ってコンテキストを決定することと、
− 上記ピクチャブロックのサイズが2の累乗ではない際は、上記ピクチャブロックのサイズのすぐ上の又は下のブロックサイズに従ってコンテキストを決定することであって、上記ブロックサイズが2の累乗に等しい、決定することと
を含むことを特徴とする。
それらの態様の他の態様によれば、本原理は、上記の方法のステップを実行するためのデバイスと、このプログラムがコンピュータ上で実行される際に上記の方法のステップを実行するためのプログラムコード命令を含むコンピュータプログラム製品と、上記プログラムがコンピューティングデバイス上で実行される際に上記の方法のステップを実行するためのプログラムコードの命令を保持する非一時的な記憶媒体とに関する。
本原理の具体的な本質並びに本原理の他の目的、利点、特徴及び使用は、添付の図面と併せて取り入れられる例の以下の説明から明らかになるであろう。
4.図面の簡単な説明
図面では、本原理の例を示す。
CABACを使用して構文要素を符号化するための一般的なブロック図を示す。 バイナリシンボルのシーケンスが映像データのブロックに関する有意性マップを表す際のコンテキスト選択段階の例を示す。 コンテキストインデックスの例を示す。 コンテキストインデックスを更新するための一般的なブロック図を示す。 コンテキストインデックス更新に通常使用される周知の表を示す。 本原理の例による、バイナリシンボルのシーケンスのうちのバイナリシンボルsをコンテキスト適応型二進算術復号するための方法を示す。 バイナリシンボルsが、例えば、映像データのブロックに関する有意性マップの有意性フラグを表す際の、図6の方法の実施形態の例を示す。 mが3に等しい際の4つの非対称分割モードの例を示す。 本原理の例による、ピクチャブロックのサイズによるバイナリシンボルに対するいくつかのコンテキストのセットの中からのコンテキストの選択(ステップ110)を示すブロック図を示す。 8×8 TBの走査順番の例を示す。 「最終有意係数座標」構文要素の二進化のために使用される表を示す。 異なるTBサイズに従ってコンテキストインデックスのセットを与える表の例を示す。 異なるTBサイズに従ってコンテキストインデックスのセットを与える表の例を示す。 本原理の実施形態による、ctxIncrementというコンテキスト増分を演算する例を示す。 本原理の例による、デバイスのアーキテクチャの例を示す。
同様の又は同じ要素は、同じ参照番号で参照される。
5.本原理の例の説明
本原理は、本原理の例が示される添付の図を参照して、以下でより完全に説明する。しかし、本原理は、多くの代替の形態で具体化することができ、本明細書に記載される例に限定されるものと解釈すべきではない。それに従って、本原理は、様々な変更形態及び代替の形態が可能であるが、その具体的な例は、図面では例として示され、本明細書で詳細に説明する。しかし、本原理を開示される特定の形態に限定するという意図は全くなく、それどころか、本開示は、請求項によって定義されるような本原理の精神及び範囲内に収まるすべての変更形態、均等形態及び代替の形態を包含することを理解すべきである。
本明細書で使用される専門用語は、特定の例について説明するためだけのものであり、本原理を制限することを意図しない。本明細書で使用される場合は、「a」、「an」及び「the」の単数形は、文脈で明確に示されない限り、複数形も含むことを意図する。「含む(「comprises」、「comprising」、「includes」及び/又は「including」)」という用語は、この明細書で使用される際は、記述される特徴、整数、ステップ、動作、要素及び/又はコンポーネントの存在を指定するが、1つ又は複数の他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はそれらのグループの存在又は追加を除外しないことがさらに理解されよう。その上、ある要素が別の要素に「応答する」又は「接続される」ものとして言及されている際は、その要素は、他の要素に直接応答する又は接続することも、介在要素を存在させることもできる。対照的に、ある要素が他の要素に「直接応答する」又は「直接接続される」ものとして言及されている際は、介在要素は存在しない。本明細書で使用される場合は、「及び/又は」という用語は、関連リストアイテムのうちの1つ又は複数のありとあらゆる組合せを含み、「/」と短縮することができる。
「第1の」、「第2の」などの用語は、本明細書において様々な要素を説明するために使用することができるが、これらの要素は、これらの用語によって制限されるべきではないことが理解されよう。これらの用語は、ある要素を別の要素と区別するためだけに使用される。例えば、本原理の教示から逸脱することなく、第1の要素は、第2の要素と呼ぶことができ、同様に、第2の要素は、第1の要素と呼ぶことができる。
図のいくつかは、通信の主要な方向を示すために通信経路上に矢印を含むが、通信は、描写される矢印とは反対の方向でも起こり得ることを理解されたい。
いくつかの例は、ブロック図及び動作上のフローチャートに関して説明され、各ブロックは、指定された論理機能を実装するための1つ又は複数の実行可能命令を含む、回路素子、モジュール又はコードの一部分を表す。また、他の実装形態では、ブロックで記述される機能は、記述される順番以外でも起こり得ることにも留意すべきである。例えば、実際には、関与する機能性に応じて、連続して示される2つのブロックを実質的に同時に実行することも、場合により、ブロックを逆の順番で実行することもできる。
本明細書における「例によれば」又は「例では」への言及は、例と関係して説明された特定の特徴、構造又は特性を本原理の少なくとも1つの実装形態に含めることができることを意味する。本明細書の様々な場所における「例によれば」又は「例では」という記載の出現は、必ずしもすべてが同じ例を指すとは限らず、別個の又は代替の例が必ずしも他の例の相互排他的なものであるとも限らない。
請求項で見られる参照番号は、単なる例示であり、請求項の範囲への制限効果はないものとする。
明示的に説明されてはいないが、本例及び変形形態は、いかなる組合せ又は副組合せでも採用することができる。
本原理は、コンテキストセットの中からコンテキストを選択するための戦略が符号化予定のピクチャブロックのサイズに依存するCABACの修正バージョンを開示する。
図9は、本原理の例による、ピクチャブロックのサイズによるバイナリシンボルに対するいくつかのコンテキストのセットの中からのコンテキストの選択(ステップ110)を示すブロック図を示す。
ステップ900では、モジュールは、ピクチャブロックのサイズ(幅及び高さ)が2の累乗であるか否かをチェックする。
「はい」の場合、すなわち、上記ピクチャブロックのサイズが2の累乗である際は、ステップ910において、セレクタSL1は、上記ピクチャブロックのサイズに従ってコンテキストを決定する。
そうでない場合は、ステップ920において、セレクタSL2は、上記ピクチャブロックのサイズのすぐ上の又は下のブロックサイズに従ってコンテキストを決定し、上記ブロックサイズは、2の累乗である。
これらの本原理は、不均一な統計的挙動を有するピクチャデータに関するいかなる種類のピクチャ要素又は構文要素も符号化するために適用することができる。
以下では、これらの本原理の実施形態は、HEVC規格(ITU-T H.265 TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU (10/2014), SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Infrastructure of audiovisual services - Coding of moving video, High efficiency video coding, Recommendation ITU-T H.265)と関連して説明するが、ピクチャデータ又は構文要素を符号化するためのエントロピーコード化を必要とする他のいかなる映像符号化/復号スキームまでも拡張することができる。
HEVC規格及び関連付けられた加入調査モデル(“Algorithm Description of Joint Exploration Test Model 3”, Document JVET-C1001_v3, Joint Video Exploration Team of ISO/IEC JTC1/SC29/WG11, 3rd meeting, 26 May - 1 June 2015, Geneva, CH)では、変換ブロック(TB)と呼ばれるピクチャブロックに属する量子化された変換済み係数は、通常、CABACを使用してエントロピーコード化される。TBは、例えば、上記で説明されるような、得られたコード化木のコード化単位(葉)であり得るピクチャブロックである。
最初に、変換ブロックTBは、コード化グループ(CG)と呼ばれる量子化された変換済み係数のサブブロックに分割される。エントロピーコード化/復号は、いくつかの走査パスで構成され、いくつかの走査パスは、いくつかの可能な走査パターンの中から選択された走査パターンに従ってTBを走査する。
例として、図10に示されるように、8×8 TBは、4つの4×4コード化グループ(CG)に分割される。インター予測コード化単位の場合は、対角方向走査パターンが常に使用され、4×4及び8×8イントラ予測コード化単位の場合は、選択される走査パターンは、そのCUに対してアクティブなイントラ予測モードに依存する。
次いで、あるTBにわたる走査パスは、3つの走査順番(対角方向、水平方向、垂直方向)のうちの1つに従って各CGを順次処理することを含み、各CG内の16の量子化された変換済み係数は、考慮される走査順番に従って走査される。走査パスは、TB内の最終有意(非ゼロ)係数から始まり、CGの左上隅に位置する量子化された変換済み係数(通常、CGのエネルギーのほとんどを保持する)に至るまで、すべての量子化された変換済み係数を処理する。
従って、「最終有意係数x座標」及び「最終有意係数y座標」と呼ばれる2つの構文要素は、上記TBと関連付けられた走査順番によるTBの最終の非ゼロの量子化された変換済み係数の空間位置(x及びy座標)をデコーダに提供するために、各TBに対するHEVC準拠エンコーダの出力ビットストリームに追加される。
量子化された変換済み係数のエントロピーコード化は、最大で5つの走査パスを含み得、走査パスはそれぞれ、以下の構文要素の各々のコード化専用である。
・ significant-coeff-flag:これは、量子化された変換済み係数がゼロに等しいか否かを示すバイナリフラグである
・ coeff-abs-level-greater1-flag:これは、量子化された変換済み係数レベルの絶対値が1より大きいか否かを示すバイナリフラグである
・ coeff-abs-level-greater2-flag:これは、係数レベルの絶対値が2より大きいか否かを示す二進の量子化された変換済み係数である
・ coeff-sign-flag:これは、有意(非ゼロ)の量子化された変換済み係数の符号を示すバイナリフラグである
・ coeff-abs-level-remaining:この構文要素は、量子化された変換済み係数レベルの絶対値の残存値を表す(量子化された変換済み係数値が以前のパスにおいてコード化されたものより大きい場合)
上記の4つの第1のパスのサブセットを復号することによって係数の絶対値が分かった時点で、その絶対値に関して、残存パスにおけるその係数に対するさらなる構文要素のコード化は行われなくなる。符号コード化についても同じことが言え、coeff-sign-flagは、非ゼロ係数に対してのみ送信される。
すべての走査パスは、次のCGに行く前に、そのCGのすべての量子化された変換済み係数を再構成することができるまで、所定のCGに対してコード化される。
ビットストリームからのTBの全体的な復号は、デコーダに以下の構文要素を提供する上記ビットストリームの構文解析を含む。
1.「最終有意座標」構文要素
2.TBの最終有意係数を含むCGからTBの左上のCGまでの各連続CGに対し、
a.HEVC規格ではcoded_sub_block_flagと呼ばれるCG有意性フラグ
b.考慮されるCGの量子化された変換済み係数の各々に対する有意係数フラグ。これは、HEVC規格ではsig_coeff_flagという構文要素に相当する
c.考慮されるCGの非ゼロの量子化された変換済み係数に対し、
i.coeff_abs_level_greater1_flag:このフラグは、現在の係数の絶対値が1より高いか否かを示す。そうでない場合は、絶対値、1に等しい場合
ii.coeff_abs_level_greater2_flag:このフラグは、現在の係数の絶対値が1より高いか否かを示す。そうでない場合は、絶対値、1に等しい場合
iii.coeff_sign_flag:これは、非ゼロ係数の符号を示す
iv.coeff_bas_level_remaining:これは、絶対値が2より高い係数の絶対値を符号化する
本原理の以下の実施形態は、「最終有意係数座標」構文要素のコード化/復号及び「有意係数フラグ」構文要素のコード化/復号のみに焦点を置くが、その理由は、関連付けられた加入調査モデル(“Algorithm Description of Joint Exploration Test Model 3”, Document JVET-C1001_v3, Joint Video Exploration Team of ISO/IEC JTC1/SC29/WG11, 3rdmeeting, 26 May - 1 June 2015, Geneva, CH)において、それらのコード化/復号に使用されるコンテキストがTBのサイズに依存するためである。
本原理の第1の実施形態によれば、図9の方法は、コード化グループCGに関する「最終有意係数座標」構文要素のコンテキストベース算術コード化/復号に対して適用される。
「最終有意係数x座標」構文要素は、TBに属するCGに関するものであり、以下によって表されるロスレスである。
− (N+1)区間のセットの中から、コード化予定のx座標が含まれる整数値の区間を識別する区間インデックス(プレフィックス)(N=2×log2(T)-1であり、Tは、CGにおける変換済み係数を得るために使用される変換のサイズ(すなわち、正方形ブロックの事例では、幅又は高さ)である)、及び、
− 上記区間インデックスによって伝えられた区間内の最終有意係数のx座標を決定するオフセット(サフィックス)
方法は、上記区間インデックスによって識別された値の区間にx座標値が属するように上記区間インデックスを得て、「最終有意係数x座標」値が上記プレフィックス及びサフィックスによって表されるロスレスであるように、識別された区間内の上記オフセットを得る。
サフィックスは、図11に示されるように、通常、例えば、bビット(b=max(0,[prefix/2]-1))にわたる固定長コードを使用することによってバイパスモードでコード化される二進値構文要素である。コード化済みサフィックスは、出力ビットストリームに追加される。
区間インデックスを表すプレフィックスは、本原理の例(ステップ110、120)に従ってコンテキストベース算術コード化された非二進値構文要素である。次いで、プレフィックスは、出力ビットストリームに追加される。
「最終有意係数x座標」(「最終有意係数y座標」)構文要素を符号化する場合、最初に、ステップ100(図1)において、バイナライザは、T=32の際、図11によって示されるように、区間インデックスを切り捨て単項コードにマッピングする。1つの座標に対する切り捨て単項コード(コンテキストベースコード化済みのビンの数でもある)の最大長は、T=4、8、16、32に対してそれぞれ、3、5、7、9である。実際に、例えば、Tが4に等しい場合は、最終有意係数x座標は、0、1、2又は3に等しいものであり得る。これらの値はそれぞれ、切り捨て単項コード「0」、「10」、「110」、「1110」によって識別される。従って、Tが4に等しい場合は、最大で3つのビンが必要である。その上、Tが8に等しい場合は、最大切り捨てコードワードは、「111110」である。最終有意係数x座標は最大でも7であるため、デコーダは、「1」に等しい5つの連続ビンが復号された時点で、プレフィックスコードが「111110」であると推論することができる。これが、変換サイズが8である事例において、プレフィックスに対して、最大でも5つのビンを必要とする理由である。
次に、ステップ900(図9)において、TBサイズが2の累乗であるかどうかをチェックする。少なくとも1つのコンテキストセットは、2の累乗に等しい異なるTBサイズに従って得られ、各コンテキストセットは、特定の2の累乗に等しいTBサイズに対して得られる。
「はい」の場合は、ステップ910において、セレクタSL1は、TBサイズに従って、切り捨て単項コードの各ビンに対して、上記得られた少なくとも1つのコンテキストセットの中からコンテキストセットを選択する。
「いいえ」の場合は、ステップ920において、選択SL2 SL1は、TBサイズのすぐ上の又は下のブロックサイズに従って、切り捨て単項コードの各ビンに対して、上記得られた少なくとも1つのコンテキストセットの中からコンテキストセットを選択し、上記ブロックサイズは、2の累乗に等しい。
最後に、「最終有意係数x座標」構文要素を表す切り捨て単項コードの各ビンは、切り捨て単項コードにおけるビンのインデックスに従って、上記選択されたコンテキストセットの中から決定されたコンテキストを考慮して算術コード化される(ステップ120)。
図12は、異なるTBサイズに従ってコンテキストインデックスのセットを与える表の例を示す。図12の表の「ビンインデックス」は、切り捨て単項コードにおけるコード化予定のビンのインデックスを識別することに留意されたい。
この例によれば、TBサイズが2の累乗である(すなわち、T=2、4、8、16又は32)際は、コンテキストセットは、Tに従って得られる。例えば、T=8の際、コンテキストインデックスのセット(3、3、3、4、4、5)が選択される。最終的に決定されるコンテキストインデックスは、切り捨て単項コードにおける現在のビンのインデックスに依存する。例えば、切り捨て単項コードにおけるランク2のビンが現在のビンである場合は、コンテキストインデックス4が考慮される。
TBサイズが2の累乗ではない(すなわち、T=3、6、12又は24)際は、コンテキストセットは、TBサイズのすぐ下のブロックサイズに従って選択される。
例えば、TBサイズが12に等しい際は、8に等しいTBサイズに関するコンテキストインデックスのセットが選択される。決定されるコンテキストインデックスは、切り捨て単項コードの現在のビンのインデックスに依存する。例えば、切り捨て単項コードのランク2のビンが現在のビンである場合は、コンテキストインデックス4が考慮される。
図13は、異なるTBサイズに従ってコンテキストインデックスのセットを与える表の例を示す。図13の表の「ビンインデックス」は、切り捨て単項コードにおけるコード化予定のビンのインデックスを識別することに留意されたい。
この例によれば、TBサイズが2の累乗である(すなわち、T=2、4、8、16又は32)際は、コンテキストセットは、TBサイズに従って選択される。例えば、T=8の際、コンテキストインデックスのセット(3、3、3、4、4、5)が選択される。決定されるコンテキストインデックスは、切り捨て単項コードにおける現在のビンのインデックスに依存する。例えば、切り捨て単項コードのランク2のビンが現在のビンである場合は、コンテキストインデックス4が考慮される。
TBサイズが2の累乗ではない(すなわち、T=3、6、12又は24)際は、コンテキストセットは、TBサイズのすぐ上のブロックサイズに従って選択される。
例えば、TBサイズが12に等しい際は、16に等しいTBサイズに関するコンテキストインデックスのセットが選択される。決定されるコンテキストインデックスは、切り捨て単項コードの現在のビンのインデックスに依存する。例えば、切り捨て単項コードのランク2のビンが現在のビンである場合は、コンテキストインデックス7が考慮される。
「最終有意係数x座標」に関するプレフィックスをコード化する場合、本原理は、m・2(2の累乗とは異なる)に等しい現在のTBサイズのすぐ上の又は下の、2の累乗であるTBサイズと関連付けられたコンテキストを再利用する。
数学的に言えば、3・2(m=3)に等しいTBサイズ(幅又は高さ)の場合、TBサイズ2n+1(図12)又は2n+2(図13)に関するコンテキストセットが使用される。
従って、本原理は、2の累乗に等しくないサイズのピクチャブロックに対して新しいコンテキストを定義するよりむしろ、2の累乗に等しいサイズのピクチャブロックに対して既に使用されたコンテキストを再利用する(HEVC規格で又はHEVC規格と関連付けられた加入調査モデルで定義されるように)。これにより、格納する及び取り扱うコンテキストの数の増加が避けられ、従って、2の累乗に等しくないサイズの変換ブロック(TB)の符号化/復号の複雑性の著しい増大が避けられる。
実施形態によれば、「最終有意係数x座標」構文要素に関するプレフィックスを符号化する切り捨て単項コードのビンに対するコンテキストは、以下の通り、TBサイズに従って決定することができる(ステップ910又は920)。上記コンテキストは、少なくとも1つの以前に決定されたコンテキストセットの中から識別されたコンテキストセット自体の中からcurrCtxIdxというコンテキストインデックスによって識別される。
最初に、TBの幅からプレフィックスをコード化するために、「最終有意係数x座標」に対して、baseCtxIdxというベースコンテキストインデックスが演算される。
このベースコンテキストインデックスは、上記少なくとも1つの以前に決定されたコンテキストセットの中からコンテキストセットを識別する。
ベースインデックスは、ピクチャのクロマ成分に対しては、組織的にゼロに設定することができ、ルマ成分に対しては、TBの幅wの関数g_uiLastPrefixCtxとして計算することができる。
次に、ctxIdx_shiftXというコンテキストシフト値を以下の通り計算することができる。
或いは、

である。
次に、プレフィックスのビンに対して、baseCtxIdxというベースコンテキストインデックスの関数として、currCtxIdxというコンテンツインデックスが決定され、切り捨て単項コードにおけるコード化予定の現在のビンのprefixBinIdxというインデックスに従って、ctxIdx_shiftXというコンテキストシフト値が決定される。
currCtxIdx=baseCtxIdx+(prefixBinIdx≫ctxIdx_shiftX) (1)
プレフィックスの第1のビンに対するコンテキストインデックスは、baseCtxIdxというベースコンテキストインデックスに等しいものであり得ることに留意されたい。
図6の実施形態によれば、「最終有意係数x座標」(「最終有意係数y座標」)構文要素は、以下の通り、入力ビットストリームから復号される。
currCtxIdxというコンテキストインデックスは、以下の通り、方程式(1)によって演算される。ステップ110においてbaseCtxIdxというベースコンテキストインデックスが得られた時点で、デコーダは、入力ビットストリームから一連の復号済みのビンを生成する。復号予定の一連のビンの各ビンに対し、エンコーダ側(方程式1)と厳密に同じ方法で得られたベースコンテキストインデックスとコンテキスト増分値(prefixBinIdx≫ctxIdxshiftX)との総和として、currCtxIdxというコンテキストインデックスが演算される。そのように得られたcurrCtxIdxというコンテキストインデックスは、コンテキストモデル化ステップ110によって提供されるコンテキストモデルのインデックスに相当する。次いで、決定された識別子を有するコンテキストによって、復号予定の一連のビンの現在のビン値(1又は0)が算術復号される(図6のステップ620)。
次いで、復号予定の一連のビンの「0」ビン値が復号されるか又は考慮されるTBサイズに対して「1」ビンの最大数に達した時点で、これは、一連の復号済みのビンが図11の切り捨て単項二進化プレフィックスに相当することを意味する。次いで、デコーダは、バイパス復号予定のサフィックスビンの数bを知っており、それにより、上記復号済みプレフィックスによって伝えられた区間内の最終有意係数のx座標を決定するサフィックスが提供される。
最後に、以下の通り、復号済みプレフィックス及びサフィックス値に基づいて、最終有意係数x座標(以下の方程式では、lastと記述される)が再構成される。
prefix>3の場合 last=2b(2+(prefix%2))+suffix
それ以外の場合 last=prefix
「最終有意係数y座標」構文要素に対するコンテキストインデックスは、同様の方法で、TBサイズに従ってコンテキストセットの中から選択することができる。
本原理の第2の実施形態によれば、図9の方法は、TBに属するコード化グループCGに関する「有意係数フラグ」構文要素のコンテキストベース算術コード化/復号に対して適用される。
「有意係数フラグ」は、CGの量子化された変換済み係数に関する二進値構文要素である。
第1に、以下の通り、ステップ110において、ctxOffsetというベースコンテキストオフセットが計算される。
ctxOffset=isChroma?0:indexOnTBSize (2)
式中、indexOnTbSizeは、以下の通り演算された区間インデックスである。
indexOnTbSize=uiLog2BlockSize≦2?0:f(uiLog2BlockSize) (3)
式中、uiLog2BlockSizeは、TBのサイズ(エリア)に従って演算された値である。
第2に、最終係数から最低周波数係数に向けてCGの量子化された変換済み係数の各々が考慮される。量子化された変換済み係数の各々に対し、ctxIncrementというコンテキスト増分を、indexOnTbSizeという上記区間インデックスによって伝えられた整数値の区間内の最終有意係数のx座標を決定するctxOffsetというベースコンテキストオフセットに加えることによって、その有意性をコード化するためのcurrCtxIdxというコンテキストインデックスが演算される。
最後に、コンテキストインデックスと関連付けられたコンテキストを考慮して「有意係数フラグ」が算術コード化される(ステップ120)。
currCtxIdx=ctxOffset+ctxIncrement (4)
実施形態によれば、ctxIncrementというコンテキスト増分は、図14に示されるように、以下の通り演算される。
ctxIncrementというコンテキスト増分は、ローカルテンプレートによってカバーされた近隣の以前にコード化された量子化された変換済み係数の「有意係数フラグ」値の値に依存する。より具体的には、ctxIncrementというコンテキスト増分は、近隣の係数の有意フラグの総和に基づいて演算される。図14は、そのようなテンプレートの例を示す。この例によれば、現在の量子化された変換済み係数(白い円によって表されている)と関連付けられたコンテキスト増分は、以下の通り計算される。
ctxIncrement=sigCoeffFlag(x+1,y)+sigCoeffFlag(x+2,y)+sigCoeffFlag(x,y+1)+sigCoeffFlag(x,y+2)+sigCoeffFlag(x+1,y+1) (5)
式中、x及びyは、考慮されるTBにおける現在の係数の座標であり、sigCoeffFlag(x,y)は、位置(x,y)における量子化された変換済み係数が非ゼロである場合は、1に等しく、そうでない場合は、0に等しい。x0、x3、x1、x4、x2はそれぞれ、(x+1,y)、(x+2,y)、(x,y+1)、(x,y+2)、(x+1,y+1)のそれぞれの座標を有する近隣の係数であることに留意されたい。
異なる周波数における量子化された変換済み係数の特性を捕らえるため、TBは、最大で3つの領域に分割することができ、分割方法は、図14に示されるように、TBサイズにかかわらず固定される。コンテキストインデックスは、各領域に割り当てられる。
本原理の第2の実施形態によれば、ステップ900(図9)において、TBの幅w及び/又は高さhが2の累乗であるかどうかをチェックする。
「はい」の場合は、ステップ910において、セレクタSL1は、TBサイズに従って決定されたindexOnTbSizeというベースコンテキストインデックス自体に従ってコンテキストを決定する。
「いいえ」の場合は、ステップ920において、セレクタSL2は、TBサイズのすぐ上の又は下のブロックサイズに従って決定されたindexOnTbSizeというベースコンテキストインデックス自体に従ってコンテキストを決定し、上記ブロックサイズは、2の累乗に等しい。
実施形態によれば、indexOnTbSizeというベースコンテキストインデックスは、

によって得られ、式中、w及びhはそれぞれ、TBの幅及び高さであり、f(.)は、数学関数である。
変形形態によれば、

である。
indexOnTbSizeというベースコンテンツインデックスは、特定のTBエリアに関するコンテキストの特定のセットを識別する。これは、異なるエリアを有するTBの「有意係数フラグ」をコード化するために、コンテキストの分離されたセットを採用できることを意味する。
ctxOffsetというコンテキストオフセットは、ルマ成分の場合は、上記ベースコンテキストインデックスに等しくてもよく、クロマ成分の場合は、0に等しい。
図6の実施形態によれば、「最終有意フラグ」構文要素は、以下の通り、入力ストリームから復号される。
最初に、少なくとも「有意係数フラグ」と関連付けられたコンテキストインデックスは、エンコーダのコンテキストモデル化ステップと同一のコンテキストモデル化ステップ110)から得られる。
従って、コンテキストインデックスは、ctxOffsetというベースコンテキストオフセットとctxIndexIncrementというコンテキスト増分との総和として計算され、各々は、エンコーダ側と全く同じ方法で、方程式(4)及び(5)に従って計算される。
次に、上記計算されたコンテキストインデックス及び入力ビットストリームのビットを有するコンテキストモデルを考慮すると、算術復号ステップ620は、現在復号されているCGの現在の係数と関連付けられた「有意係数フラグ」を表すビン値を復号することができる。
図1〜14では、モジュールは、区別可能な物理ユニットと関係があってもなくともよい機能ユニットである。例えば、これらのモジュール又はそれらのいくつかは、特有のコンポーネント又は回路にまとめることも、ソフトウェアの機能性に寄与することもできる。それに反して、いくつかのモジュールは、別個の物理的実体から潜在的に構成することができる。本原理に適合する装置は、純粋なハードウェアを使用して、例えば、ASIC、FPGA若しくはVLSI(それぞれ、≪特定用途向け集積回路≫、≪フィールドプログラマブルゲートアレイ≫、≪超大規模集積≫)などの専用ハードウェアを使用して、或いは、デバイスに埋め込まれたいくつかの統合電子コンポーネントから、又は、ハードウェアコンポーネント及びソフトウェアコンポーネントの混合物から実装される。
図15は、図1〜14に関連して説明される方法を実装するように構成することができるデバイス1500の例示的なアーキテクチャを表す。
デバイス1500は、データ及びアドレスバス1501によってつながっている以下の要素、すなわち、
− 例えばDSP(又はデジタル信号プロセッサ)である、マイクロプロセッサ1502(又はCPU)、
− ROM(又は読み取り専用メモリ)1503、
− RAM(又はランダムアクセスメモリ)1504、
− アプリケーションから送信用のデータを受信するためのI/Oインタフェース1505、及び、
− バッテリ1506
を含む。
例によれば、バッテリ1506は、デバイスの外部のものである。言及されるメモリの各々では、本明細書で使用される「レジスタ」という用語は、小容量のエリア(数ビット)又は非常に大きなエリア(例えば、全プログラム又は大量の受信若しくは復号データ)に対応し得る。ROM 1503は、プログラム及びパラメータを少なくとも含む。ROM 1503は、本原理による技法を実行するためのアルゴリズム及び命令を格納することができる。電源を入れると、CPU 1502は、RAMにプログラムをアップロードし、対応する命令を実行する。
RAM 1504は、プログラム(CPU 1502によって実行され、デバイス1500の電源を入れた後にアップロードされる)をレジスタに含み、入力データをレジスタに含み、方法の異なる状態の中間データをレジスタに含み、方法の実行のために使用される他の変数をレジスタに含む。
本明細書で説明される実装形態は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は、信号で実装することができる。実装の単一の形態の文脈においてのみ論じられる(例えば、方法又はデバイスとしてのみ論じられる)場合であっても、論じられる特徴の実装形態は、他の形態(例えば、プログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア及びファームウェアで実装することができる。方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路又はプログラマブル論理デバイスを含む、例えば、一般に処理デバイスを指す装置(例えば、プロセッサなど)で実装することができる。また、プロセッサは、例えば、コンピュータ、携帯電話、ポータブル/携帯情報端末(「PDA」)、及び、エンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスも含む。
符号化又はエンコーダの例によれば、映像データのブロックBc、構文要素又はバイナリシンボルのシーケンスは、供給源から得られる。例えば、供給源は、
− ローカルメモリ(1503又は1504)(例えば、ビデオメモリ又はRAM(若しくはランダムアクセスメモリ)、フラッシュメモリ、ROM(若しくは読み取り専用メモリ)、ハードディスク)、
− 記憶装置インタフェース(1505)(例えば、大容量記憶装置、RAM、フラッシュメモリ、ROM、光ディスク又は磁気サポートとのインタフェース)、
− 通信インタフェース(1505)(例えば、有線インタフェース(例えば、バスインタフェース、広域ネットワークインタフェース、ローカルエリアネットワークインタフェース)又は無線インタフェース(IEEE802.11インタフェース若しくはBluetooth(登録商標)インタフェースなど))、及び、
− ピクチャ捕捉回路(例えば、センサ、例えば、CCD(若しくは電荷結合素子)又はCMOS(若しくは相補型金属酸化膜半導体)など)
を含むセットに属する。
復号又はデコーダの例によれば、復号済みデータは、送り先に送信される。具体的には、送り先は、
− ローカルメモリ(1503又は1504)(例えば、ビデオメモリ又はRAM、フラッシュメモリ、ハードディスク)、
− 記憶装置インタフェース(1505)(例えば、大容量記憶装置、RAM、フラッシュメモリ、ROM、光ディスク又は磁気サポートとのインタフェース)、
− 通信インタフェース(1505)(例えば、有線インタフェース(例えば、バスインタフェース(例えば、USB(若しくはユニバーサルシリアルバス))、広域ネットワークインタフェース、ローカルエリアネットワークインタフェース、HDMI(登録商標)(高解像度マルチメディアインタフェース)インタフェース)又は無線インタフェース(IEEE802.11インタフェース、WiFi(登録商標)若しくはBluetooth(登録商標)インタフェースなど))、
− ディスプレイ
を含むセットに属する。
符号化又はエンコーダの例によれば、ビットストリームは、送り先に送信される。例として、ビットストリームは、ローカル又はリモートメモリ(例えば、ビデオメモリ(1504)又はRAM(1504)、ハードディスク(1503))に格納される。変形形態では、ビットストリームは、記憶装置インタフェース(1505)(例えば、大容量記憶装置、フラッシュメモリ、ROM、光ディスク又は磁気サポートとのインタフェース)に送られる、及び/又は、通信インタフェース(1505)(例えば、ポイントツーポイントリンク、通信バス、ポイントツーマルチポイントリンク又は放送ネットワークとのインタフェース)上で送信される。
復号又はデコーダの例によれば、ビットストリームは、供給源から得られる。例示的には、ビットストリームは、ローカルメモリ(例えば、ビデオメモリ(1504)、RAM(1504)、ROM(1503)、フラッシュメモリ(1503)又はハードディスク(1503))から読み取られる。変形形態では、ビットストリームは、記憶装置インタフェース(1505)(例えば、大容量記憶装置、RAM、ROM、フラッシュメモリ、光ディスク又は磁気サポートとのインタフェース)から受信される、及び/又は、通信インタフェース(1505)(例えば、ポイントツーポイントリンク、バス、ポイントツーマルチポイントリンク又は放送ネットワークとのインタフェース)から受信される。
例によれば、デバイス1500は、図1〜14に関連して説明される方法を実装するように構成され、
− モバイルデバイス、
− 通信デバイス、
− ゲームデバイス、
− タブレット(又はタブレットコンピュータ)、
− ラップトップ、
− 静止ピクチャカメラ、
− ビデオカメラ、
− 符号化チップ、
− 静止ピクチャサーバ、
− 映像サーバ(例えば、放送サーバ、ビデオオンデマンドサーバ又はウェブサーバ)
− セットトップボックス、
− TVセット、
− ディスプレイ、及び、
− 復号チップ
を含むセットに属する。
本明細書で説明される様々なプロセス及び特徴の実装形態は、様々な異なる機器又はアプリケーションで具体化することができる。そのような機器の例は、エンコーダ、デコーダ、デコーダからの出力を処理するポストプロセッサ、エンコーダに入力を提供するプリプロセッサ、ビデオコーダ、ビデオデコーダ、ビデオコーデック、ウェブサーバ、セットトップボックス、ラップトップ、パーソナルコンピュータ、携帯電話、PDA、及び、ピクチャ若しくは映像を処理するための他の任意のデバイス、又は、他の通信デバイスを含む。明確であるべきだが、機器は、モバイルであり得、移動車両にインストールすることさえも可能である。
それに加えて、方法は、プロセッサによって実行されている命令によって実装することができ、そのような命令(及び/又は実装形態によって生成されたデータ値)は、コンピュータ可読記憶媒体上に格納することができる。コンピュータ可読記憶媒体は、コンピュータ可読プログラム製品の形態を取ることができ、コンピュータ可読プログラム製品は、1つ又は複数のコンピュータ可読媒体において具体化され、その上で具体化されたコンピュータ可読プログラムコードを有し、コンピュータ可読プログラムコードは、コンピュータによって実行可能である。コンピュータ可読記憶媒体は、本明細書で使用される場合は、情報をその中に格納するための固有の能力及びそこからの情報の回収を提供するための固有の能力が与えられた非一時的な記憶媒体と見なされる。コンピュータ可読記憶媒体は、例えば、これらに限定されないが、電子、磁気、光、電磁、赤外線若しくは半導体システム、装置若しくはデバイス、又は、前述の適切な任意の組合せであり得る。当業者であれば容易に把握できるように、以下、すなわち、ポータブルコンピュータディスケット、ハードディスク、読み取り専用メモリ(ROM)、消去型プログラム可能読み取り専用メモリ(EPROM若しくはフラッシュメモリ)、ポータブルコンパクトディスク読み取り専用メモリ(CD−ROM)、光学記憶装置、磁気記憶装置、又は、前述の適切な任意の組合せは、本原理が当てはまるコンピュータ可読記憶媒体のより具体的な例を提供する一方で、単なる例示であり、網羅的なリストではないことを把握されたい。
命令は、プロセッサ可読媒体上で有形に具体化されたアプリケーションプログラムを形成することができる。
命令は、例えば、ハードウェア、ファームウェア、ソフトウェア又は組合せにおけるものであり得る。命令は、例えば、オペレーティングシステム、別個のアプリケーション又はその2つの組合せで見つけることができる。従って、プロセッサは、例えば、プロセスを実行するように構成されたデバイスと、プロセスを実行するための命令を有するプロセッサ可読媒体(記憶装置など)を含むデバイスとの両方として特徴付けることができる。さらに、プロセッサ可読媒体は、命令に加えて又は命令の代わりに、実装形態によって生成されたデータ値を格納することができる。
当業者には明らかであるように、実装形態は、例えば、格納又は送信することができる、情報を伝えるようにフォーマットされた様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、又は、説明される実装形態のうちの1つによって生成されたデータを含み得る。例えば、信号は、本原理の説明される例の構文を書き込む又は読み取るための規則をデータとして伝えるように、或いは、本原理の説明される例によって書き込まれた実際の構文・値をデータとして伝えるように、フォーマットすることができる。そのような信号は、例えば、電磁波として(例えば、スペクトルの高周波部分を使用して)又はベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化すること、及び、符号化されたデータストリームで搬送波を変調することを含み得る。信号が伝える情報は、例えば、アナログ又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンク上で送信することができる。信号は、プロセッサ可読媒体上に格納することができる。
多くの実装形態について説明してきた。それにもかかわらず、様々な変更を行えることが理解されよう。例えば、他の実装形態を生成するために、異なる実装形態の要素を組み合わせることも、補足することも、変更することも、除去することもできる。それに加えて、当業者は、開示されるものの代わりに、他の構造及びプロセスを代用することができ、結果として得られる実装形態は、開示される実装形態と少なくとも実質的に同じ結果を達成するために、少なくとも実質的に同じ方法で、少なくとも実質的に同じ機能を実行することを理解するであろう。それに従って、これらの及び他の実装形態は、この出願によって企図される。

Claims (10)

  1. ピクチャブロックに属するピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスをコンテキスト適応型二進算術コード化/復号するための方法であって、前記バイナリシンボルのシーケンスのうちの各バイナリシンボルに対し、
    − 前記ピクチャブロックのサイズ及びコード化予定の前記バイナリシンボルに従ってコンテキストを決定すること(110)と、
    − 前記決定されたコンテキストを考慮して前記バイナリシンボルを算術コード化/復号すること(120)と
    を含む方法において、前記コンテキストを決定すること(110)が、
    − 前記ピクチャブロックの前記サイズが2の累乗である際は、前記ピクチャブロックの前記サイズに従ってコンテキストを決定すること(910)と、
    − 前記ピクチャブロックの前記サイズが2の累乗ではない際は、前記ピクチャブロックの前記サイズのすぐ上の又は下のブロックサイズに従ってコンテキストを決定すること(920)であって、前記ブロックサイズが2の累乗に等しい、決定すること(920)と
    を含むことを特徴とする、方法。
  2. ピクチャブロックに属するピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスをコンテキスト適応型二進算術コード化/復号するためのデバイスであって、前記バイナリシンボルのシーケンスのうちの各バイナリシンボルに対し、
    − 前記ピクチャブロックのサイズ及びコード化予定の前記バイナリシンボルに従ってコンテキストを決定するための手段と、
    − 前記決定されたコンテキストを考慮して前記バイナリシンボルを算術コード化/復号するための手段と
    を含むデバイスにおいて、前記コンテキストを決定することが、
    − 前記ピクチャブロックの前記サイズが2の累乗である際は、前記ピクチャブロックの前記サイズに従ってコンテキストを決定することと、
    − 前記ピクチャブロックの前記サイズが2の累乗ではない際は、前記ピクチャブロックの前記サイズのすぐ上の又は下のブロックサイズに従ってコンテキストを決定することであって、前記ブロックサイズが2の累乗に等しい、決定することと
    を含むことを特徴とする、デバイス。
  3. ブロックサイズ又は前記ピクチャブロックの前記サイズが、前記ブロックの幅又は高さのいずれかである、請求項1に記載の方法又は請求項2に記載のデバイス。
  4. 前記ピクチャブロックの前記サイズに従ってコンテキストを決定すること(110)が、
    − 2の累乗に等しい異なるピクチャブロックサイズに従って少なくとも1つのコンテキストセットを得ることであって、各コンテキストセットが、特定の2の累乗に等しいピクチャブロックサイズに対して得られる、得ることと、
    − 画像ブロックの前記サイズが2の累乗かどうかチェックすることと、
    − 前記ピクチャブロックの前記サイズが2の累乗である場合は、前記ピクチャブロックの前記サイズに従って、前記得られた少なくとも1つのコンテキストセットの中からコンテキストセットを選択することと、
    − そうでない場合は、前記画像ブロックの前記サイズのすぐ上の又は下のブロックサイズに従って、前記得られた少なくとも1つのコンテキストセットの中からコンテキストセットを選択することであって、前記ブロックサイズが2の累乗に等しい、選択することと、
    − 前記バイナリシンボルのシーケンスのうちの前記バイナリシンボルのインデックスに従って、前記選択されたコンテキストセットの中からコンテキストを決定することと
    を含む、請求項1若しくは3に記載の方法又は請求項2若しくは3に記載のデバイス。
  5. 前記ピクチャブロックが走査順番に従って走査される際、ピクチャデータに関連する前記構文要素が、前記ピクチャブロックに属する最終有意係数の空間座標のうちの1つを表し、前記方法又は前記デバイスが、
    − 前記最終有意係数の前記空間座標のうちの1つが属する少なくとも1つの区間インデックスのセットの中から、整数値の区間を識別する区間インデックスを選択するためのステップ又は手段、
    − 前記選択された区間インデックスを二進化することによって前記バイナリシンボルのシーケンスを得るためのステップ又は手段(100)
    のそれぞれをさらに含み、
    − 前記バイナリシンボルのシーケンスの各ビンがコード化される(110、910、920)、請求項4に記載の方法又はデバイス。
  6. 前記方法が、前記最終有意係数の前記空間座標のうちの1つが前記区間インデックス及び前記オフセット値によって表されるロスレスであるように、前記選択された区間内のオフセット値を得ることをさらに含む、請求項5に記載の方法又はデバイス。
  7. 前記ピクチャブロックが、少なくとも2つのピクチャサブブロックに分割され、ピクチャデータに関連する前記構文要素が、前記少なくとも2つのピクチャサブブロックのうちの1つの係数に関する有意係数フラグを表し、前記コンテキストを決定すること(110)が、
    − 画像ブロックの前記サイズが2の累乗かどうかチェックすることと、
    − 前記ピクチャブロックの前記サイズが2の累乗である場合は、前記ピクチャブロックの前記サイズに従って、ベースコンテキストインデックスを決定することと、
    − そうでない場合は、前記ピクチャブロックの前記サイズのすぐ上の又は下のブロックエリアサイズに従って、ベースコンテキストインデックスを決定することであって、前記ブロックエリアサイズが2の累乗に等しい、決定することと
    を含み、
    − 前記コンテキストインデックスが、前記ベースコンテキストインデックスを、近隣の係数の有意変換係数フラグから得られたコンテキスト増分に加えることによって決定される、請求項1若しくは3に記載の方法又は請求項2若しくは3に記載のデバイス。
  8. 前記ピクチャブロック又はサブブロックの前記サイズが、前記ピクチャブロック又はサブブロックの幅及び/又は高さであり、前記方法が、2の累乗による整数値の積に等しいその高さ及び/又はその幅を有するピクチャブロック又はサブブロックを得ることであって、前記積が2の累乗ではない、得ることをさらに含む、請求項1、3〜7の何れか一項に記載の方法又は請求項2〜7の何れか一項に記載のデバイス。
  9. 画像ブロックを得ることが、親ブロックを、2の累乗による前記整数値の積に等しいその高さ及び/又はその幅を有する2つのサブブロックに分割することを含む、請求項7に記載の方法又はデバイス。
  10. 請求項1、2〜9の何れか一項に記載の方法の命令に従って符号化されたピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスを有する非一時的な記憶媒体。
JP2019517817A 2016-10-05 2017-08-31 ピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスのコンテキスト適応型二進算術コード化のための方法及びデバイス Active JP7195251B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16306307.6 2016-10-05
EP16306307.6A EP3306924A1 (en) 2016-10-05 2016-10-05 Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to picture data
PCT/EP2017/071847 WO2018065154A1 (en) 2016-10-05 2017-08-31 Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to picture data

Publications (3)

Publication Number Publication Date
JP2019531026A true JP2019531026A (ja) 2019-10-24
JP2019531026A5 JP2019531026A5 (ja) 2020-10-01
JP7195251B2 JP7195251B2 (ja) 2022-12-23

Family

ID=57153426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019517817A Active JP7195251B2 (ja) 2016-10-05 2017-08-31 ピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスのコンテキスト適応型二進算術コード化のための方法及びデバイス

Country Status (6)

Country Link
US (1) US11006116B2 (ja)
EP (2) EP3306924A1 (ja)
JP (1) JP7195251B2 (ja)
KR (1) KR102416958B1 (ja)
CN (1) CN109923861B (ja)
WO (1) WO2018065154A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509347B1 (ko) * 2017-04-13 2023-03-14 엘지전자 주식회사 비디오 신호를 인코딩, 디코딩하는 방법 및 장치
US10798382B2 (en) * 2018-04-26 2020-10-06 Tencent America LLC Sub-block transform
AU2019345211B2 (en) 2018-09-23 2023-02-02 Lg Electronics Inc. Method for encoding/decoding video signals and apparatus therefor
KR20230154085A (ko) * 2018-12-17 2023-11-07 엘지전자 주식회사 고주파 제로잉을 기반으로 변환 계수 스캔 순서를 결정하는 방법 및 장치
US11477486B2 (en) * 2019-01-02 2022-10-18 Qualcomm Incorporated Escape coding for coefficient levels
WO2020180102A1 (ko) 2019-03-04 2020-09-10 엘지전자 주식회사 영상 코딩 시스템에서 컨텍스트 코딩된 사인 플래그를 사용하는 영상 디코딩 방법 및 그 장치
CN114071140B (zh) * 2019-12-03 2022-12-23 杭州海康威视数字技术股份有限公司 解码方法、编码方法、装置、设备及机器可读存储介质
WO2022179404A1 (en) * 2021-02-23 2022-09-01 Beijing Bytedance Network Technology Co., Ltd. Residual coding on non-dyadic blocks
CN113382265B (zh) * 2021-05-19 2023-03-24 北京大学深圳研究生院 视频数据熵编码硬件实现方法、设备、介质及程序产品
WO2023082484A1 (en) * 2021-11-10 2023-05-19 Beijing Bytedance Network Technology Co., Ltd. Array based residual coding on non-dyadic blocks

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012169184A1 (ja) * 2011-06-10 2012-12-13 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置
JP2013509788A (ja) * 2009-10-30 2013-03-14 サムスン エレクトロニクス カンパニー リミテッド ピクチャ境界の符号化単位を符号化/復号化する方法及びその装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6900748B2 (en) 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7161507B2 (en) 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
US20070071090A1 (en) 2005-06-21 2007-03-29 National Chiao Tung University Method for performing context adaptive binary arithmetic coding with stochastic bit reshuffling for fine granularity scalability
US7545293B2 (en) * 2006-11-14 2009-06-09 Qualcomm Incorporated Memory efficient coding of variable length codes
US8265144B2 (en) * 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US9648325B2 (en) * 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
KR20090004658A (ko) * 2007-07-02 2009-01-12 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
AU2015202670B2 (en) 2009-08-17 2016-09-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding video, and method and apparatus for decoding video
US20110176743A1 (en) 2010-01-21 2011-07-21 Sankar Pathamadi V Data compression methods
US8934540B2 (en) * 2010-07-20 2015-01-13 Cisco Technology, Inc. Video compression using multiple variable length coding methods for multiple types of transform coefficient blocks
US8913666B2 (en) * 2010-10-01 2014-12-16 Qualcomm Incorporated Entropy coding coefficients using a joint context model
PL3280144T3 (pl) * 2011-06-14 2021-06-14 Lg Electronics Inc. Sposób kodowania i dekodowania informacji o obrazie
US9807426B2 (en) * 2011-07-01 2017-10-31 Qualcomm Incorporated Applying non-square transforms to video data
US9392301B2 (en) * 2011-07-01 2016-07-12 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
US9143802B2 (en) * 2011-10-31 2015-09-22 Qualcomm Incorporated Fragmented parameter set for video coding
US9462275B2 (en) 2012-01-30 2016-10-04 Qualcomm Incorporated Residual quad tree (RQT) coding for video coding
US9237344B2 (en) * 2012-03-22 2016-01-12 Qualcomm Incorporated Deriving context for last position coding for video coding
US9264706B2 (en) * 2012-04-11 2016-02-16 Qualcomm Incorporated Bypass bins for reference index coding in video coding
CN102769744B (zh) * 2012-06-19 2014-07-16 南京信息工程大学 一种卫星图像的编码方法
JP6005865B2 (ja) * 2012-09-28 2016-10-12 インテル・コーポレーション スケーラブルビデオ符号化のためのエンハンスド参照領域の利用
US10979705B2 (en) 2014-08-08 2021-04-13 Qualcomm Incorporated Method for video coding with spatial prediction mode for multi-mode video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013509788A (ja) * 2009-10-30 2013-03-14 サムスン エレクトロニクス カンパニー リミテッド ピクチャ境界の符号化単位を符号化/復号化する方法及びその装置
WO2012169184A1 (ja) * 2011-06-10 2012-12-13 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of movi", RECOMMENDATION ITU-T H.265 (04/2015) HIGH EFFICIENCY VIDEO CODING, JPN6021036832, 9 July 2015 (2015-07-09), pages 104 - 107, ISSN: 0004753382 *
SOLE, JOEL ET AL.: "Transform Coefficient Coding in HEVC", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. Vol. 22, Issue. 12, JPN6021036830, 5 October 2012 (2012-10-05), pages 1765 - 1777, ISSN: 0004753381 *

Also Published As

Publication number Publication date
EP3306924A1 (en) 2018-04-11
CN109923861B (zh) 2021-10-08
EP3523965B1 (en) 2023-12-13
US20200045316A1 (en) 2020-02-06
KR102416958B1 (ko) 2022-07-05
CN109923861A (zh) 2019-06-21
US11006116B2 (en) 2021-05-11
WO2018065154A1 (en) 2018-04-12
KR20190058609A (ko) 2019-05-29
EP3523965A1 (en) 2019-08-14
JP7195251B2 (ja) 2022-12-23

Similar Documents

Publication Publication Date Title
JP7195251B2 (ja) ピクチャデータに関連する構文要素を表すバイナリシンボルのシーケンスのコンテキスト適応型二進算術コード化のための方法及びデバイス
US10616604B2 (en) Coefficient level coding in video coding
JP6728240B2 (ja) 高度算術コーダ
JP6199311B2 (ja) 映像コード化における係数のコード化
ES2700523T3 (es) Optimización de contexto para la codificación de la posición del último coeficiente significativo
CN108810539B (zh) 从视频数据的位流解码多个编码单位的方法
CN112514386B (zh) 网格编解码量化系数编解码
US11695962B2 (en) Encoding and decoding methods and corresponding devices
JP2015508617A5 (ja)
CN112673639B (zh) 用于对变换系数位阶值进行编码的系统和方法
KR102380579B1 (ko) 비디오 데이터에 관련된 신택스 엘리먼트를 나타내는 이진 심볼들의 시퀀스의 컨텍스트-적응적 이진 산술 코딩을 위한 방법 및 디바이스
JP2022516132A (ja) 係数レベルのためのエスケープコーディング
US20230291922A1 (en) Encoding and decoding methods and corresponding devices

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200818

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210921

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210929

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20211117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221213

R150 Certificate of patent or registration of utility model

Ref document number: 7195251

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150